罪犯假扮诚实的普通人要比普通人假扮罪犯容易得多。同样,肥尾分布伪装成薄尾分布也远远比薄尾分布伪装成肥尾分布更容易。
我们不观察概率分布,只观察事件的结果。
概率分布无法告诉你某事件的结果是否属于它。
你需要一个元概率分布来讨论尾部事件(比如变量属于某个给定分布的条件概率)。
现在,让我们检视一下非对称推理在认识论领域产生的效应。图3.15显示了伪装问题(或推断中的中心非对称性)。左边是一个退化后的随机变量,取近似常量的值,直方图会以狄拉克细柱的形式显示。
图3.15 伪装问题(或推理的中心非对称)。左边是一个退化后的随机变量,近似常量值,直方图以狄拉克细柱的形式显示。我们无法以此排除非退化的概率。右边的图出现了不止一种结果,这时就可以排除退化特征。我们可以抽象出这种中心非对称性,并给出诸如“无法拒绝原假设”之类的陈述,其中“拒绝”的定义需要稍加修正。此类非对称性可以被用来创造真正严谨的检验规则。
至少从塞克斯都·恩披里柯经验主义开始,我们就知道退化性无法被排除,但在某些情况下,我们可以排除非退化性。如果看到一个没有随机性的分布,我们不能说它一定不是随机的,也就是说,我们不能否定黑天鹅的存在。现在,加入一个观测值,我可以看到它是随机的,我可以排除退化性,我可以说它不是“非随机的”。在右图中,我们看到了一只黑天鹅,因此关于没有黑天鹅的说法是错误的。这正是西方科学的反向经验主义的基础,当收集信息时,我们可以逐渐排除一些可能性。右图的分布可以伪装成左图的分布,但左图的分布无法伪装成右图的分布。这为我们提供了一种非常简单的处理随机性的方法。图3.16总结了我们可以如何排除分布。
图3.16 “概率面纱”,塔勒布和皮佩尔 [245] 从认识论的角度阐述了“面纱”效应。通过实验,观察者可以获得一系列数据(由“完美统计信息”的所有者生成,即从相应的时间序列生成器产生数据)。观察者不知道数据的生成过程,只根据手里的数据获取信息,同时必须对数据的统计特性(概率、均值、方差、风险值等)做出估计。显然,观察者只有数据生成器的部分信息,并且没有可靠的理论来反推数据源,因此在做出估计时总是会犯错误,但错误存在一定的范式。这也是风险管理领域的核心问题。
如果看到一个20倍标准差的事件,我们就可以直接排除薄尾分布。但如果没有看到大的偏差,就无法排除厚尾分布,除非我们对分布背后的整个过程了如指掌。这就是我们对分布排序的方法。如果重新考虑图3.6,我们可以看到,随着偏差逐步出现,我们可以从底部向上逐步排除分布类型。排序的依据是分布产生尾部事件的能力。排序(为了逆向推理而设定的顺序或优先级)的方法非常简单,考虑如下逻辑:如果有人告诉你出现了一个10倍标准差事件,那么一般来说更可能是你估计的分布错了,而不是真的出现了一个10倍标准差的事件(在本章后面我们会继续完善该论点)。同样,正如我们看到的,厚尾分布并不会频繁出现远离均值的大偏差,但偶尔会出现一个极大的偏差。所以,只要出现大偏差,我们就可以排除不是平均斯坦的情况。我可以说,通过排除,这个分布是厚尾的,但我不能通过类似的方法证明它是薄尾的,这就是黑天鹅问题。
伪装问题的应用:2019年8月12日前后的阿根廷股市。 考虑一下2019年8月12日大幅下跌前后的阿根廷股市(见图3.21),它可以说明分布参数推理的非对称性,或者一个分布是如何伪装自己使尾部看起来更薄的。通过这样的推理,尾部参数未来的不确定性只会使尾部更肥而不是更薄。拉法尔·维隆 [264] 论证了在拟合稳定分布时我们会倾向于高估尾部指数(低尾部指数意味着更肥的尾部)。
图3.17 波普尔的推导方法论同样是非对称的:实证经验主义正是从反面出发,着眼于“排除”不成立的部分。我们将这一方法延伸至统计推理,通过不断排除分布类型来处理“概率面纱”。
如今,我们可以相信有关统计概率的数学表达,并规避模型误差导致的计算谬误,这主要归功于俄罗斯统计学派对非对称性的深刻认识,这里的非对称性指的是波普尔思想在数学空间中的表现。
该学派横跨三代统计学家:P.L.切贝绍夫,A.A.马尔可夫,A.M.利亚普诺夫,S.N.伯恩斯坦,E.E.斯卢茨基,N.V.斯米尔诺夫,L.N.布尔雪夫,V.I.罗曼诺夫斯基,A.N.科尔莫戈罗夫,Yu.V.林尼克,以及新生代的V.彼得罗夫,A.N.纳加耶夫,A.希拉耶夫等人。
他们在科学思想史上有着相当强大的影响力:他们以不等式而非等式的方式思考(最著名的是马尔可夫、切贝绍夫、伯恩斯坦、利亚普诺夫)。他们在研究中使用边界而非估计值。甚至他们的中心极限定理版本也是一个边界问题,后面我们会通过观察 边界之外 的行为来进一步研究这个问题。他们与新一代统计学者有着截然不同的思路。新一代统计学者会以精确概率的思维,甚至更糟糕的机械主义社会科学的方式进行思考。他们的方法中包含了怀疑主义和单边认知:A大于x,AO(x)[大O:趋于x],而非A=x。
在风险管理领域,上述思维为实现数学严谨性提供了很好的理论依据。我们只知道某一边的信息,而不知道另一边的。我们只知道我们愿意为保险支付的最低价值,而不是最高价值(反之亦然)。 [1]
图3.18 归纳问题。枚举归纳的哲学问题可以表示如下:“你需要看到多少只白天鹅才能排除未来出现黑天鹅的可能性?”这一描述和我们应用大数定律时遇到的问题非常类似:“你需要多大量的数据才能在可接受的误差范围内论证某概念?”事实证明,统计推理的本质在于对数据的明确定义和推导的定量衡量机制。而恰巧在厚尾条件下我们需要大量数据。我们会在第七章和第八章中看到,有一种方法可以衡量推理机制的相对速度,哪怕最终问题依然无法被归纳法完美解决。而归纳法的问题通常被错误地甩给了休谟 [227] 。
图3.19 这是一篇表明怀疑论哲学对科学具有重大意义的论述,作者为弗朗索瓦·德拉莫特·勒瓦耶(1588—1672),它显然是休特主教的参考文献。每次当我发现某个“民间思想家”找到了黑天鹅问题的解决方法时,结果很可能是他在模仿前人——这里并无恶意,但我们常常忘记应该先向前追溯。我们坚定地认为,“休谟问题”与休谟并没有多大关系,休谟将皮埃尔·培尔(他的前人)厚重的辞典传遍整个欧洲。一开始,我也以为来源是休特主教,不过随着不断向前追溯,我找到了更早的开拓者。
图3.20 想要“证明”薄尾分布是不可能的,但是想要证伪薄尾分布很容易。一个分布随时可能会出现跳跃,而那些平静的日子并不能帮助排除这种尾部事件。
图3.21 单日回报展示分布的真实尾部,例如2019年8月12日前后的阿根廷股票市场。你可能会突然需要修正尾部参数来适应更厚的尾部(尾部指数α更小),而不会反过来,事件的发生可能需要等待很长的时间。感谢迭戈·兹维奥维奇提供的数据。
[1] 将非对称性和鲁棒性联系起来的方法如下,鲁棒性指的是概率分布在参数扰动中不发生变化。如果发生了变化,但具备非对称性,即对此类扰动有着凹性或凸性反应,则分别对应脆弱和反脆弱,参见 [223] 。