20世纪70年代后,美国的基金业迅速发展,基金业绩评价引起理论界及实务界的高度重视,相关成果大量涌现。
该方面研究大致从20世纪60年代开始,分为三个阶段。
第一阶段:1965年之前,基金的评价指标停留在较为原始的水平上,主要指标有净值收益率、年收益率、算术平均收益率、加权时间收益率等。
第二阶段:1965年之后至20世纪80年代,这个阶段风险因素被纳入评价体系中,经过风险调整后的指标得以快速发展。Sharpe等人(1964)在Markowitz(1952)建立的现代资产组合理论的基础上发展出基本资产定价模型(CAMP)。随后Treynor(1966)将系统风险因素(β)引入评价指标当中,并提出经过系统风险调整的基金业绩评价指标Treynor指数。Sharpe(1966)在资产组合能够完全消除系统风险的假设下,将标准差作为衡量基金风险的指标,将单位系统风险的超额收益作为基金业绩的评价指标,进而提出Sharpe指数,且通过计算发现基金的平均α值(平均业绩)比道琼斯指数低0.34%。Jensen(1968)则利用资本定价模型,通过风险调整计算了各基金的α值(被称为Jensen指数),实现了对共同基金的实际收益与预期收益的计算;Jensen在与道琼斯指数对比中发现Jensen 指数均值为-1.10%。至此,基金业绩评价的三大经典指标正式形成,至今仍是国际上较为成熟并被广泛采用的量化指标体系。
第三阶段:1970年前后,三大经典标准被接受之时,Friend等(1970)、Carlson(1970)、McDonald(1974)等对Jensen与Sharpe的成果进行进一步研究的时候,却得出了α值为正这一完全相反的结论。随后Roll(1978)与Grinblatt等(1989)开始批评三大经典指标所使用的方法。这些批评集中于CAPM的有效性及基准组合的选择问题。批评者认为CAPM不一定是一个正确定价模型,因为它只考虑到了市场这一个影响证券收益与风险的因素,而实际上这些因素是多方面的;对于基准组合的选择问题,批评者则认为利用普遍意义的指数作为基准组合其收益率是偏高的,其原因在于构成指数的证券组合经常变动。
对于这些争议的研究随后展开,Grinblatt与Titman(1989)提出使用基金过去的证券组合权重为基准组合衡量基金的投资业绩,并通过检验解释了α为负的问题。而针对CAPM模型的缺陷,Fama与French(1989)将市场因素、规模因素、账面—市场价值因素纳入模型中,建立了三因素模型。在此基础上,Carhart(1997)引入证券收益率态势变量,建立了四因素模型。这些对指标的研究推进了对于影响基金绩效因素的研究。
同时,对于不依赖CAPM模型的评价指标的完善也一直在进行。由于Sharpe指数难以对其提出直观的经济解释,Franco Modigliani与Leah Modigliani(1997)提出M 2 测度,使调整风险时得到更为直观的经济解释。而Michael Stutzer(2000)则构建了衰减度这一新的指标,它修正了Sharpe理论中基金收益率服从独立、一致的正态分布这一假设。由于这一指标允许基金收益率收敛于各种分布,并根据分布的峰度与偏度修正指标,因此适用性与合理性优于Sharpe指数。Lahmann与Modest(1987)首次使用APT模型对基金进行业绩评价的研究并得出基准市场组合与基金业绩度量方法的选取对基金超额收益表现的度量结果会产生重要影响。Mertens(2005)建立了Sharpe指数与基金收益率峰度、偏度之间的关系,用以修正Sharpe指数在实际应用中的部分缺陷。
20世纪80年代初,基金业绩评价的重点从20世纪六七十年代整体业绩的研究转移到基金业绩的分解部分——证券选择能力与市场时机选择能力上来。在这些研究当中,利用时间序列分析法对这两项能力的分析则占到了绝大多数。
Treynor与Mazuy(1966)首次对基金经理的择时能力进行了定量分析,并在CAPM理论的基础上将二次项引入模型,由此提出了T-M模型,并利用模型得出证券投资基金不具备良好选股择时能力的结论。
Henriksson与Merton(1981)则在T-M模型的基础之上引入代表市场环境的虚拟变量,由此提出H-M模型。Henriksson与Merton对美国116只开放基金在1968年到1980年的月度数据进行了分析,其结果高达62%的基金显示市场时机选择能力的二项式参数c值显著为负,即基金整体不具备明显选股择时能力。
Alexander与Stover(1980)利用T-M模型对49只基金(1966—1971)进行了实证分析,得出基金整体具有一定选股能力而不具备明显择时能力的结论。而Kon(1983)利用T-M、H-M模型对37只基金(1960—1976)进行的实证分析,以及Hallahan与Faff(1999)利用T-M、H-M模型对澳大利亚65只基金进行的实证分析,均得出基金整体有一定择时能力而选股能力并不显著的结论。
Bhattacharya与Pfleiderer(1983)对T-M模型进行了进一步的改良,调整了市场整体收益率的预测值,减小了预测误差的波动。在这一方法的指导下,Bhattacharya与Pfleiderer通过对1970年到1980年73只具有代表性的基金的数据分析,同样得出证券投资基金整体不具备明显的选股择时能力的结论。
Chang与Lewellen(1984)在H-M模型的基础上,将市场环境划分为上升期与下降期,并对市场风险进行分类,分别根据不同风险系数探索在不同市场经济背景下基金经理人的选股择时能力,进一步提出C-L模型。其优越性在于即使实证检验结果不支持基金整体具有显著选股择时能力(两人的研究结果确实也是如此),研究者也能检验基金在不同的市场背景下的特点。
20世纪80年代,对于CAPM模型的批评延伸到其在选股择时能力评价的应用上来,由于基于CAPM模型所建立的T-M与H-M模型的预测结论缺乏显著的数据支持,理论界对其的反思也同步展开。
Lehmann与Modest(1987)利用套利定价模型将指数收益率、公司账面市值比、股票市值规模等因素纳入模型中来,弥补了CAPM模型收益率仅与市场系统风险相关的缺陷。Fama与French(1989)提出了包含三个因素(市场因素、规模因素、账面—市场价值因素)的FF-3模型,并在这个基础之上将其与T-M、H-M模型结合,发展出T-M-FF-3与H-M-FF-3模型。而Carhart(1997)在FF-3的基础之上增加证券收益率态势变量,建立了所谓四因素模型,并通过实证检验发现这一改良有效降低了平均定价误差。
Busse(1999)则开创性地提出利用波动性分析研究基金经理的选股择时能力。他摒弃了传统的CAPM理论体系下的模型,提出Busse模型。在此模型的指导下,他得出时间频率越短,检验出的择时能力越显著,且当市场剧烈波动时,基金经理具有调整投资组合以降低市场波动风险的时机选择能力。此后Busse选时模型与非参数研究法逐渐兴盛起来。
20世纪60年代前后,随着Markowitz(1952)的投资组合选择理论与CAPM模型等一系列具有重大影响的理论取得突破性进展,学术界对投资组合业绩展开评价。由于基金业绩的持续性是基金评价的前提,因此相关研究工作也在同步进行。早期的研究围绕着“市场有效假说”展开,通过验证基金能否获得持续的超额回报来验证基金业绩的持续性;而随着研究基金业绩持续性方法的增加,相关研究逐步聚焦于持续性来源的研究。
Sharpe(1966)是最早对基金业绩持续性展开研究的学者。他在对1944—1953年及1954—1963年的34只开放式基金进行排序时发现前期排名在一定程度上可以预测后期排名,由此便产生了基金业绩持续性的问题。
Jensen(1968)对基金业绩评价研究后指出,基金管理者不具有预测能力,因此认为开放式基金不存在业绩的持续性。
而到了20世纪80年代之后,随着有效市场假说被不断批评,而股票的股价与时间的关联性被不断发现,关于基金业绩持续性的讨论重新被重视起来(因为当时的研究发现并不是所有的信息都被市场反映到股价上)。
Grinblatt与Titman(1992),以及Goetzmann与Ibbotson(1994)相继发现基金若能获得超额收益,则未来一段时间内这只基金仍将表现良好。
随后,Malkiel(1995)及Brown与Goetzmann(1995)均采用非参数方法(列联表检验法)通过实证分析验证了基金业绩持续性的存在。
目前国外对基金业绩持续性是否存在的研究所使用的主流方法是横截面回归法、列联表检验法,其他的方法如马尔科夫检验、K-S检验等也有使用,但并不广泛。
目前国外学界对基金业绩持续性来源这一问题尚存较大争议,大致上来源分为三类:业绩比较基准的选择、数据质量问题、股票动量效应。
针对业绩比较基准的选择,Grinblatt与Titman(1994)经过研究后认为,业绩基本上能够影响业绩持续性,在传统的影响基金业绩的指标中,换手率与持续的超额收益存在显著的正相关关系。
关于数据质量,由于金融市场上表现不好的基金产品会被合并、清盘,从而导致存续至今的基金业绩评价要高于市场上基金的实际业绩水平。针对这一问题,Malkiel(1995)通过1982—1990年对存续与清盘的基金的研究,证实了这种差异的存在。Carhart等人(2002)则得出这种存活偏差无法避免,而且评价期越长,存活偏差对于业绩持续性的削弱作用越大。基于此,Baquero等人(2005)建立了基金清盘模型,分析基金表现与清盘之间的关系,并在此基础之上对基金业绩加权处理,以此修正存活偏差。
关于股票动量效应的问题,Jegadeesh与Titman(1993)发现了股票市场一年期的“动量效应”。Carhart(1997)则在FF-3模型的基础上将动量因子引入模型,这一模型的规模因子与动量因子很好地解释了CAPM模型中风险值相近而收益率差异明显的问题,并表明投资者可以通过卖出前期表现差的产品,买入前期表现好的产品,以此获得超额收益。这一结论在一定程度上证明了优秀基金的业绩是可以具有一定持续性的。
目前,国外逐渐流行起来的许多基金业绩评价方法衍生自较为高级的数学方法,如神经网络、灰色系统、模糊数学、数学规划、遗传算法、混沌理论等。这些方法多从系统、整体的角度出发,避免直接分析多个自变量与因变量之间复杂的逻辑关系,为基金的业绩评价开辟了崭新道路,拓展了研究者的理论视野,具有启发性。