最简单的预测模型是假设未来 N 天的波动率与前 N 天相同。数学公式如下:
这有两个主要问题。首先是“窗口效应”,即一个大的单一回报会影响 N 天的波动率计算,慢慢地该回报会从样本中移出。这就造成了波动率测量的跳跃性,从而造成预测的跳跃。图3-1给出了一个示例,我们计算了2019年6月15日~2019年9月30日Maximus公司(MMS)连续30天的收盘波动率。
该股票通常的日波动约为0.7%,但在2019年8月8日,它因公司盈利而跳涨12%。这导致30天波动率从17.8%跃升至39.3%。30天后,该盈利日不再计算在内,波动率再次下降到23.3%。如果我们知道哪些事件是异常值,我们可以通过从数据中剔除它们来避免这个问题。我们可以直接把盈利日的当日收益率剔除。
图3-1 Maximus公司连续30天的收盘波动率
更大的问题是,这种方法没有考虑波动率聚类。波动性极高或极低的时期将仅持续很短的时间。指数加权移动平均值(EWMA)模型考虑了这一点。由此,方差逐步演变为:
λ 的取值通常在0.9~1。
GARCH模型族扩展了这一思想,允许均值回归到长期方差,GARCH(1,1)模型(这样称它是因为它只包含一阶滞后项)是
α 、 β 以及 γ 总和为1, γV 是长期方差。
GARCH一方面改进了未来的波动率和过去一样的简单假设,但在另一方面作为一种预测方法它也被高估了。GARCH模型捕捉到了波动率的本质特征:明天的波动率可能会接近今天的水平,而长期的波动率可能会与历史长期平均水平持平。一切介于两者之间的都是插值(interpolation),GARCH模型族因插值不同而各有不同。例如,图3-2显示了利用GARCH(1,1)和GJR-GARCH(1,1)计算的2019年8月1日SPY预期波动率的期限结构,这也解释了正收益和负收益的不对称性。这两个模型都是根据过去四年的日收益,利用最大似然估计(MLE)算出来的。
图3-2 使用GARCH (1,1)(实线)和GJR-GARCH(虚线)预测SPY波动率的期限结构
从实践的角度来看,这种差异是可以忽略不计的。这就是导致GARCH模型泛滥的原因。模型都大致相同,没有一个模型明显优于其他模型。在任何情况下,如果有许多竞争性的理论,那么说明所有理论都是不好的。薛定谔方程仅有一个,它表现得很好。GARCH模型有成千上万的变形,没有一个表现得很好。
实际上,事实表明GARCH模型的预测效果并不会比简单的EWMA模型更好,并且大多数专业交易员不愿意使用GARCH模型。部分原因在于最大似然估计参数的不稳定性,这些参数每周都会有很大的变化。此外,最大似然估计需要大约1000个数据点才能得到一个好的估计。这意味着,如果我们选择使用每日数据,我们的预测将使用4年前的信息,这并不是好事。
但是有一种实用的方法可以将EWMA的稳健性和GARCH所允许的长期均值回归结合起来。当交易员使用EWMA时,他们随意选择衰减参数,而不是根据历史数据进行拟合,并使用最大似然估计。我们可以用GARCH做同样的事情。选择一个模型,选择参数,并持续使用它。这意味着,最终我们可以培养出直觉,通过模型来“观察”市场。对于指数,选择0.9范围内的 α 和在0.02~0.04的 β 似乎是可行的。