购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

5.1 尺度和幂律(第三层)

下面我们进入肥尾的硬核部分。

为什么会出现幂律分布? 很多理论都描述了为什么自然界会存在幂律分布,并将其作为概率分布的一个特例来看。但大家似乎从未反过来思考:幂律才是常态,而高斯分布是一个特例 [223] 。这也是《反脆弱》和数量化不确定性系列后续要描述的内容,高斯分布主要来自事物的凹凸响应(抑制脆弱性和反脆弱性,增强鲁棒性,从而导致尾部变薄)。

5.1.1 有尺度和无尺度,对肥尾更深层的理解

到目前为止,我们对肥尾的理解还停留在有限矩的范围内,对那些无限矩的分布类来说, 依赖于n和K。对无尺度的分布来说,如果在尾部选择足够大的K,那么 只依赖于n。这类分布不存在特征尺度,从而具备帕累托尾部。比如,对足够大的x, α是尾部指数,C为常数。

注意 我们可以看到,学生T分布和帕累托分布的尺度差异,常规帕累托分布的定义更一般地被表示为 这里的L(x)是“缓变函数”,即对于所有常数t>0满足下列性质:

图5.2 三种不同的分布,当我们研究尾部的时候,学生T分布会保持尺度不变,而标准对数正态分布会存在一个中间过渡状态,最后在log-log图上以无限斜率收尾。不过处理对数正态分布时要小心一些,因为它可能会有一些意想不到的性质(见第八章)。

表5.2 比较正规变化函数/幂律分布和其他分布的尺度性质

对于足够大的x, 会收敛到常数,也即尾部指数−a。随着x→∞,存在尺度的分布会在log-log图上展现出α的尾部斜率。对于高斯分布(标准差σ,均值µ),不用计算超越概率,直接通过PDF就可以2看到 也即在±x→∞时会比−log(x)更快地趋向−∞。

到目前为止,我们可以直观感受到不同类型分布的差异。分布只有存在尺度才会有“真正的肥尾”,而其他的分布都会在求和的过程中逐渐高斯化。另外,尾部指数是渐进的,我们可能永远无法到达极限,能看到的都是某种中间状态。最后,上面所有的图表展示的都是柏拉图式的理想分布,现实世界的过程要更加复杂和混乱,我们也会随着大偏差的出现不断调整尾部指数。

定义5.1( 类分布)

满足 类幂律分布(正规变化)的随机变量X可定义为:

5.1.2 灰天鹅

为什么用学生T分布来模拟对称幂律分布? 只是为了方便,我们并不认为幂律的产生机理是学生T分布,因为分布的中间部分对决策来说并不重要,只需要关注尾部特性即可。

图5.3 这是英镑的log-log图,可以看到英国脱欧带来的“灰天鹅”(公投结果超预期导致的货币市场跳空)。但如果从幂律的角度看,这样的巨大跳跃依然和统计性质相匹配。

尾部指数数值越小,分布的中间部分就越不重要。尾部指数数值越大,学生T分布就越像高斯分布,使用学生T分布作为近似的合理性就越强。

为刻画不对称幂律分布,可以使用列维定理这类更高级的方法。但实际上,我们无须过度复杂化,简单采用两个不同参数的单尾帕累托分布即可(设置不同的左尾和右尾α)。

参数估计问题 要注意,有很多种通过数据来估计尾部指数α的方法,也即“参数拟合”。但是要准确估计尾部指数非常难,因为尾部事件数据量不足,拟合本身会面临极大误差。总的来说,已有数据会显示出比真实情况更薄的尾部。

在后续章节中,我们将更深入地讨论这个问题。

图5.4 书籍销量:我们可以很好地拟合书籍销售量分布的尾部,其鲁棒性也很好,只要不妄图计算总体期望或者高阶矩就行。

图5.5 火鸡问题,从过去的数据中完全推断不出未来跃变的可能性。 sayHQnVOBQAGJDJ5oLgRr4DGeZujeV5YKrTR3vJa0BNL/QwGbyhvPrdjQ0FtM56j

点击中间区域
呼出菜单
上一章
目录
下一章
×