维多利亚·施托登(Victoria Stodden)
计算机法学学者,哥伦比亚大学统计学助理教授。
我 们如何区分小说和事实?我们时常被看似不寻常的巧合所影响。想象一下,你在早上读报时看到描述一条鱼的一段话,接着午餐时你吃了一条鱼,话题转到了“四月鱼”(或是四月愚人节)。那天下午,同事给你看了几张鱼的照片,晚上你又得到了一份鱼形海怪的刺绣礼物。第二天早上,同事告诉你,她昨晚梦见鱼了。一开始你可能会感觉这些事件有些怪怪的,但事实证明,我们不应觉得有什么古怪。这里的原因有着很长的历史,这导致了随机性通过概率的分布,直接构建到我们对自然理解的非直观洞悉当中。
机会是无知
俄国小说家托尔斯泰曾经质疑我们对机会的理解。他举出了一个羊群的例子,有一只羊被选出来要被宰掉。这只羊被单独喂食了额外的食物,托尔斯泰设想那群羊在不知道未来要发生什么事情的情况下,一定会认为持续变肥的那只羊是那么的与众不同。托尔斯泰认为这群羊以其有限的观点,笃定地认为这是机会使然。托尔斯泰给这群羊提供的解决方案是,羊群就此停止认为事情仅仅是为了“实现羊的目的”而发生的,同时要意识到,其中必然存在蹊跷的目的才能够完美地解释这一切,因而没有必要依靠机会这个概念。
机会是看不见的力量
在83年后,卡尔·荣格(Carl Jung)在他著名的论文《同步性,一个非因果联结的原理》( Synchronicity, An Acausal Connecting Principle )中表达了相似的看法。他假设,这些看似没有因果关系、但又似乎有关的事件,事实上是受到了某个隐藏的力量影响。本文开始的“六条鱼”的故事就来自荣格的书。他发现这一系列的事件非同一般,甚至它们相互之间存在非比寻常的关系,所以不能将其原因简单地归于机会。荣格认为某种其他的事物必定会发生,他将其称为非因果联结原理。
佩尔西·迪亚科尼斯(Persi Diaconis)是斯坦福大学统计与数学教授,也是我以前的老师,他对荣格的例子进行了批判性的思考:假设我们平均每天遇到鱼的概念一次,根据统计学家所谓的泊松过程,这个用来计数的标准数学模型,它假定观察出现的平均值有某个固定值,否则就是随机的。所以,我们可以对荣格的例子进行思考,以24小时为周期观察其长期平均频率,并计算在24小时中看到六次鱼或以上的概率。结果迪亚科尼斯发现,此概率高达22%。从这个角度看,荣格不应对这一系列事件感到惊诧才是。
统计革命:产生于数据生成模型中的机会
仅仅在托尔斯泰写到羊的故事之后的20年,英国数学家卡尔·皮尔逊(Karl Pearson)通过观察结果如何而来的新思路(和戴康尼斯计算概率使用了同样的想法),带来了科学思维的统计革命。皮尔逊认为,大自然遵循未知的分布模式来提供数据,但又带来某些随机性。他的观点是,这与观测结果实际记录的额外增加测量误差是不同的概念。
在皮尔逊之前,科学应对的是“真实的”事物,例如描述行星如何运行的定律,或者马匹体内血流动的定律。皮尔逊促成了世界的概率概念。即便有着测量的误差,行星还是没有按照定律精密且准确地运行。每匹马体内确切的血流途径各不相同,但马的循环系统不都是随机的。估计这些分布并非现象本身,因而我们能提炼出更为精准的世界画面。
由概率分布所描绘的机会
认识到测量本身具有概率分布的特征,是个显著的转变,从此我们就不会再将随机局限性视为测量错误。皮尔森的概念能够发挥作用,是因为该概念允许我们在分布的假设前提下,我们所作出的估计是否具备可能性。在当今,这个论证已经成了我们判断一个阐释是否可能正确的主要工具。
举例说明,我们能够量化药效的可能性,或是在高能物理学中判定是否能够进行粒子探测。药物治疗在控制组和对照组内的平均反应差分布是否集中在零?如果这看起来很有可能,就可以怀疑药物的有效性。与目前为止已知的粒子的型号分布截然不同的可能信号,是否一定代表不同的分布方式,从而代表着一种新型粒子?检测希格斯玻色子需要对这些数据有概率性的理解,才能够从其他事件中区别出希格斯信号。所有这些案例的关键所在,在于我们想知道产生有效现象的潜在分布特点。
皮尔逊直接将随机性与概率分布合二为一,从而使我们对可能性谨慎思考,并量化我们对特殊阐释的信心,因而我们可以对事物是否具有特殊意义作出更好的评估,这样我们就能够更好地达成“人类目标”。