我们通过划分平均斯坦(薄尾)和极端斯坦(厚尾)这两个类别来介绍厚尾的概念,由此展开对厚尾和极端值的关系的研究。
·在平均斯坦中,随着样本量逐渐扩大,没有任何单一的观测可以真正改变统计特性。
·在极端斯坦中,尾部(罕见事件)在决定统计特性方面发挥了极大的作用。
另外一种视角:
假设有一个很大的偏离X。
·在平均斯坦中,随机变量连续两次大于X的概率大于单次大于2X的概率。
·在极端斯坦中,随机变量单次大于2X的概率大于连续两次大于X的概率。
接下来,我们在平均斯坦中随机选择两个人,假设两人身高之和为4.1米(一个极小概率的尾部事件)。根据高斯分布(或者类似特性的单尾分布),最可能的情况是,两人的身高均为2.05米,而不是10厘米和4米。
简单来说,出现3个标准差之外事件的概率是0.001 35,出现6个标准差(翻了一番)之外事件的概率为9.86×10 −10 ,而连续两次出现3个标准差之外事件的概率为1.8×10 −6 。因此,连续两次出现3个标准差事件的概率远大于一次出现6个标准差事件的概率,这也是非厚尾分布带来的结果。
在图3.1中,我们从出现两个3倍标准差事件的概率除以6倍标准差事件的概率出发,扩展到计算出现两个4倍标准差事件的概率除以一个8倍标准差事件的概率,等等。越往尾部延展(图3.1的右侧),我们会看到大偏差更可能来自多个中等偏差的和。换句话说,如果发生了一个很糟糕的事件,那么它应该来自一系列不太常见的事件,而不是来自单次极端事件,这正是平均斯坦遵循的逻辑。
图3.1 在高斯分布*下,出现两次K和一次2K标准差事件之间的比值。K越大,即越处于尾部,极端事件来自两次独立K事件的可能性越大,即P(K) 2 ,而来自一次2K事件的可能性越小。
*这是为教学而做的简化。更严谨的方法是比较出现两次K和一次2K+1标准差事件的比值——但上图的最终结果不变。
接下来我们转到极端斯坦,同样随机选取两个人,且他们的财富之和为3 600万美元。这时最可能的情况不是两人都有1 800万美元,而是一人拥有35 999 000美元,另一个人拥有1 000美元。
这个例子清晰地展示了两个大类之间的差异,对于亚指数类分布来说,破产更可能来自某次极端事件,而不是一系列糟糕事件的累积。这一逻辑在20世纪早期由精算学家菲利普·伦德伯格提出 [155] ,到20世纪30年代由哈拉尔德·克拉默整理完善 [51] ,对传统风险管理理论形成了巨大挑战。但如今,很多经济学家完全忽视了这一点。从保险的角度讲,分散化有效的前提是,损失更可能来自一系列事件而不是单个事件。
这一点也说明,保险只能在平均斯坦中起作用,在存在巨灾风险的情况下,永远不要出售一种损失无上限的保险,这一点被称为灾难原则。
正如我们之前所见,偏离中心很远的极端事件扮演了非常重要的角色。黑天鹅的核心并非“频繁出现”(这个词经常被这样误用),而在于出现时的影响更大。最肥的肥尾分布只会有一次非常大的极端偏离,而不是多次较大的偏离。下一章的图4.4显示,如果我们采用像高斯那样的分布并开始逐渐增肥尾部,那么超过给定标准差的样本数量就会下降。事件落在一个标准差范围内的概率是68%。随着尾部增肥,以金融市场的回报为例,一个事件落在一个标准差内的概率会上升到75%至95%。所以请注意,尾部增肥会让峰度更高,肩部缩小,发生大偏差的概率会增加。这是因为,概率之和为1(哪怕在法国也是如此),概率密度在某一区域的升高会导致另一区域密度的降低。