肥尾效应最新章节_纳西姆·尼古拉斯·塔勒布著

3.5　认识论与非对称推理

定义3.1（分布的非对称性）

罪犯假扮诚实的普通人要比普通人假扮罪犯容易得多。同样，肥尾分布伪装成薄尾分布也远远比薄尾分布伪装成肥尾分布更容易。

法则3.1（认识论：驱动机理不可见）

我们不观察概率分布，只观察事件的结果。

概率分布无法告诉你某事件的结果是否属于它。

你需要一个元概率分布来讨论尾部事件（比如变量属于某个给定分布的条件概率）。

现在，让我们检视一下非对称推理在认识论领域产生的效应。图3.15显示了伪装问题（或推断中的中心非对称性）。左边是一个退化后的随机变量，取近似常量的值，直方图会以狄拉克细柱的形式显示。

图3.15　伪装问题（或推理的中心非对称）。左边是一个退化后的随机变量，近似常量值，直方图以狄拉克细柱的形式显示。我们无法以此排除非退化的概率。右边的图出现了不止一种结果，这时就可以排除退化特征。我们可以抽象出这种中心非对称性，并给出诸如“无法拒绝原假设”之类的陈述，其中“拒绝”的定义需要稍加修正。此类非对称性可以被用来创造真正严谨的检验规则。

至少从塞克斯都·恩披里柯经验主义开始，我们就知道退化性无法被排除，但在某些情况下，我们可以排除非退化性。如果看到一个没有随机性的分布，我们不能说它一定不是随机的，也就是说，我们不能否定黑天鹅的存在。现在，加入一个观测值，我可以看到它是随机的，我可以排除退化性，我可以说它不是“非随机的”。在右图中，我们看到了一只黑天鹅，因此关于没有黑天鹅的说法是错误的。这正是西方科学的反向经验主义的基础，当收集信息时，我们可以逐渐排除一些可能性。右图的分布可以伪装成左图的分布，但左图的分布无法伪装成右图的分布。这为我们提供了一种非常简单的处理随机性的方法。图3.16总结了我们可以如何排除分布。

图3.16　“概率面纱”，塔勒布和皮佩尔 ^[245] 从认识论的角度阐述了“面纱”效应。通过实验，观察者可以获得一系列数据（由“完美统计信息”的所有者生成，即从相应的时间序列生成器产生数据）。观察者不知道数据的生成过程，只根据手里的数据获取信息，同时必须对数据的统计特性（概率、均值、方差、风险值等）做出估计。显然，观察者只有数据生成器的部分信息，并且没有可靠的理论来反推数据源，因此在做出估计时总是会犯错误，但错误存在一定的范式。这也是风险管理领域的核心问题。

如果看到一个20倍标准差的事件，我们就可以直接排除薄尾分布。但如果没有看到大的偏差，就无法排除厚尾分布，除非我们对分布背后的整个过程了如指掌。这就是我们对分布排序的方法。如果重新考虑图3.6，我们可以看到，随着偏差逐步出现，我们可以从底部向上逐步排除分布类型。排序的依据是分布产生尾部事件的能力。排序（为了逆向推理而设定的顺序或优先级）的方法非常简单，考虑如下逻辑：如果有人告诉你出现了一个10倍标准差事件，那么一般来说更可能是你估计的分布错了，而不是真的出现了一个10倍标准差的事件（在本章后面我们会继续完善该论点）。同样，正如我们看到的，厚尾分布并不会频繁出现远离均值的大偏差，但偶尔会出现一个极大的偏差。所以，只要出现大偏差，我们就可以排除不是平均斯坦的情况。我可以说，通过排除，这个分布是厚尾的，但我不能通过类似的方法证明它是薄尾的，这就是黑天鹅问题。

伪装问题的应用：2019年8月12日前后的阿根廷股市。 考虑一下2019年8月12日大幅下跌前后的阿根廷股市（见图3.21），它可以说明分布参数推理的非对称性，或者一个分布是如何伪装自己使尾部看起来更薄的。通过这样的推理，尾部参数未来的不确定性只会使尾部更肥而不是更薄。拉法尔·维隆 ^[264] 论证了在拟合稳定分布时我们会倾向于高估尾部指数（低尾部指数意味着更肥的尾部）。

图3.17　波普尔的推导方法论同样是非对称的：实证经验主义正是从反面出发，着眼于“排除”不成立的部分。我们将这一方法延伸至统计推理，通过不断排除分布类型来处理“概率面纱”。

俄罗斯统计学派对科学严谨性和非对称性的论述

如今，我们可以相信有关统计概率的数学表达，并规避模型误差导致的计算谬误，这主要归功于俄罗斯统计学派对非对称性的深刻认识，这里的非对称性指的是波普尔思想在数学空间中的表现。

该学派横跨三代统计学家：P.L.切贝绍夫，A.A.马尔可夫，A.M.利亚普诺夫，S.N.伯恩斯坦，E.E.斯卢茨基，N.V.斯米尔诺夫，L.N.布尔雪夫，V.I.罗曼诺夫斯基，A.N.科尔莫戈罗夫，Yu.V.林尼克，以及新生代的V.彼得罗夫，A.N.纳加耶夫，A.希拉耶夫等人。

他们在科学思想史上有着相当强大的影响力：他们以不等式而非等式的方式思考（最著名的是马尔可夫、切贝绍夫、伯恩斯坦、利亚普诺夫）。他们在研究中使用边界而非估计值。甚至他们的中心极限定理版本也是一个边界问题，后面我们会通过观察 边界之外 的行为来进一步研究这个问题。他们与新一代统计学者有着截然不同的思路。新一代统计学者会以精确概率的思维，甚至更糟糕的机械主义社会科学的方式进行思考。他们的方法中包含了怀疑主义和单边认知：A大于x，AO（x）[大O：趋于x]，而非A=x。

在风险管理领域，上述思维为实现数学严谨性提供了很好的理论依据。我们只知道某一边的信息，而不知道另一边的。我们只知道我们愿意为保险支付的最低价值，而不是最高价值（反之亦然）。 [1]

图3.18　归纳问题。枚举归纳的哲学问题可以表示如下：“你需要看到多少只白天鹅才能排除未来出现黑天鹅的可能性？”这一描述和我们应用大数定律时遇到的问题非常类似：“你需要多大量的数据才能在可接受的误差范围内论证某概念？”事实证明，统计推理的本质在于对数据的明确定义和推导的定量衡量机制。而恰巧在厚尾条件下我们需要大量数据。我们会在第七章和第八章中看到，有一种方法可以衡量推理机制的相对速度，哪怕最终问题依然无法被归纳法完美解决。而归纳法的问题通常被错误地甩给了休谟 ^[227] 。

图3.19　这是一篇表明怀疑论哲学对科学具有重大意义的论述，作者为弗朗索瓦·德拉莫特·勒瓦耶（1588—1672），它显然是休特主教的参考文献。每次当我发现某个“民间思想家”找到了黑天鹅问题的解决方法时，结果很可能是他在模仿前人——这里并无恶意，但我们常常忘记应该先向前追溯。我们坚定地认为，“休谟问题”与休谟并没有多大关系，休谟将皮埃尔·培尔（他的前人）厚重的辞典传遍整个欧洲。一开始，我也以为来源是休特主教，不过随着不断向前追溯，我找到了更早的开拓者。

图3.20　想要“证明”薄尾分布是不可能的，但是想要证伪薄尾分布很容易。一个分布随时可能会出现跳跃，而那些平静的日子并不能帮助排除这种尾部事件。

图3.21　单日回报展示分布的真实尾部，例如2019年8月12日前后的阿根廷股票市场。你可能会突然需要修正尾部参数来适应更厚的尾部（尾部指数α更小），而不会反过来，事件的发生可能需要等待很长的时间。感谢迭戈·兹维奥维奇提供的数据。

[1] 将非对称性和鲁棒性联系起来的方法如下，鲁棒性指的是概率分布在参数扰动中不发生变化。如果发生了变化，但具备非对称性，即对此类扰动有着凹性或凸性反应，则分别对应脆弱和反脆弱，参见 ^[223] 。

3.5 认识论与非对称推理

定义3.1（分布的非对称性）

法则3.1（认识论：驱动机理不可见）

俄罗斯统计学派对科学严谨性和非对称性的论述

3.5　认识论与非对称推理