在讨论MVO的“六宗罪”时我们谈到,如果不对权重做任何约束,任由其“裸奔”,得出来的结果可能千奇百怪。例如,出现极端值和过度集中,导致不符合实际的应用逻辑。其实不只是MVO,其他目标函数也面临同样的问题。因此,在进行组合优化时,除了选择合适的目标函数,各种各样的权重约束也必不可少。例如,限制卖空、上限/下限和全资金投入。Michaud(1989)在讨论MVO的缺陷时认为,一般来说引入有意义的权重限制,如机构投资者常面对的卖空约束,确实能改善组合优化的结果,至少会使结果更稳健。
另一个有趣的研究,可以参考Behr、Guettler和Miebs(2013),其从权重约束的角度对最小方差组合进行了改进。由于最小方差模型持仓过于集中,换手率高,Behr et al.尝试进行了改进,一方面试图超越1/ N 组合,另一方面降低换手率。具体来说,通过最小化协方差矩阵的MSE得到上限和下限,即将样本协方差向一个特定的协方差压缩,这个特定的协方差由上限和下限决定。在获得权重上限和下限后,再代入最小方差组合求解最小方差解。利用5个数据集,评估权重约束最小方差组合的表现。结果发现,权重约束最小方差组合的夏普比比等权重组合高30%,比市值加权高60%,相较于简单的卖空约束组合和单因子协方差组合也实现了更高的夏普比;与Demiguel et al.(2009)提出的PMV相比,同样是少数跑赢1/ N 组合的方案,权重约束最小方差组合的换手率更低。
一旦涉及参数估计,就会存在估计误差。在讨论MVO时,均值的估计误差比方差和协方差大得多,因此出现了BL模型和BS模型,从收益率的角度进行改进,尽量减少这个“磨人小妖精”带来的干扰。对于最小方差等只需要方差协方差的优化模型,虽然暗自庆幸逃过了均值估计的干扰,但并不是就能高枕无忧,因为方差协方差也不是“省油的灯”,虽然其估计误差比均值小,但终究不可忽略。
Hoffstein(2013)在讨论均值、方差和相关系数的估计稳健性时,画了一个非常精致的图。其中横轴表示样本长度,纵轴可以理解为估计误差。可以看到,在相同样本长度的情况下,均值的估计误差远高于相关系数,相关系数高于方差;在样本长度很短的情况下,三个估计值之间的差距尤其明显;随着样本长度的增加,估计误差也逐渐降低,但依然维持在一定的水平,并不会消失。
方差协方差的改进方法很多,常见的有三种:采用压缩估计、因子模型和高频数据。
压缩估计,即将样本方差协方差矩阵 S 向一个已有的先验矩阵 F 进行压缩,经典的研究可以参考Ledoit和Wolf(2003)。样本方差协方差理论上是无偏估计,但是存在较大的估计误差; F 是一个事先设定的矩阵(例如假设所有成分间的相关系数相同),没有估计误差但存在模型设定误差,是一个有偏估计。压缩估计可以表达为Σ shrink =(1- k ) F + k · S ,直观上来看即在估计误差和设定误差之间权衡,为样本估计和先验矩阵的加权结果,权重由压缩强度 k 决定。
建立多因子模型,将证券的风险来源降维到少数因子上,通过估计因子之间的方差协方差矩阵,从而间接推出证券的方差协方差矩阵,是近年来越来越时髦的方式。在股票和债券等投资领域,由于证券数量众多,传统基于历史样本的估计方法越来越差强人意,因此多因子模型开始受到人们的欢迎。目前已经有很多公司提供专业的因子模型解决方案,如国外的Barra和国内的RiceQuant。以Barra的CNE5为例,其将A股收益分解为1个国家因子、10个风格因子和32个行业因子,从而将参数估计的数量大幅减少,减小了方差协方差的估计误差。
学术研究喜欢用月度收益率估计方差协方差矩阵,数据易得并且没有日历对齐问题。相对低频数据,高频数据的样本量更加丰富,蕴含的信息量也更多,近年来在方差协方差估计上越来越常见。如果熟悉Barra,应该对此并不陌生,在其最新版本的风险模型中,已经完全用日度数据代替月度数据。Gosier、Madhavan、Serbin和Yang(2005)的研究也详细讨论过这个问题,使用日频数据估计出的波动率,要比月频结果更加稳健和精确。
DeMiguel et al.(2009)在比较各个优化器时,提出可以将多个优化器进行结合。例如,最终的目标配置,可以同时考虑等权重和最小方差组合,将两者按照一定方式进行加权:
虽然DeMiguel et al.的结论并不支持多优化器一定更好,但从直觉上讲,综合考虑多个优化器时,确实能弥补单一优化器的不足,使得结果更加稳定。无论如何,这是一个值得探索的方向。