假设我们有区域 边界定义为 随着范数提升,我们可以计算如下高维球面:
图4.13和图4.14分别展示了两种效应。
第一种效应是范数提升直观上会占据更多空间。
在第二种效应中,我们可以看到维数灾难,这一条非常有用(主要用于模型误差估计)。对比图4.13和图4.14就会发现,在第一种情况下,d=2,p=1时会占据正方形的一半,p=∞时会占据全部空间,范数的比值为 。但当d=3,p=1时占据 的空间(p=∞时占据全部空间)。高阶矩对低阶矩的比值会随着维数的增加呈现出爆炸性提升,如图4.15所示。
图4.15 维数灾难在统计领域尤其是在高维模型误差上有着大量应用。随着维数d升高,V 1 和V ∞ 的比值大幅上升,当d=2时该比值为2,但当d=9时该比值就达到了六位数。
拓展阅读: 我们先讨论到这里,为读者推荐一些统计图书。如果想对概率有更多直观的理解,建议必读的是博雷尔 [85] 、科尔莫戈罗夫 [145] 、勒夫 [154] 、费勒 [91] [92] ,测度论可以读一下比林斯利 [20] 。
亚指数性 皮特曼 [196] ,恩布列切和戈尔迪(1982) [83] ,恩布列切(1979,看上去和他的博士论文很接近) [84] ,奇斯佳科夫(1964) [43] ,戈尔迪(1978) [112] 和泰格尔(Teugels) [248] 。
极值分布 恩布列切等人 [82] ,德哈恩和费雷拉 [116] 。
稳定分布 乌柴金和佐洛塔廖夫 [257] ,佐洛塔廖夫 [271] ,萨莫林斯基和塔克 [209] 。
随机过程 卡拉萨斯和施里夫 [141] ,奥克森达尔 [182] ,瓦拉丹 [261] 。