概率论起源于赌场。吉罗拉莫·卡尔达诺(Gerolamo Cardano)是文艺复兴的终极代表。他是一名哲学家、数学家、物理学家、天文学家、占星家、发明家、化学家、生物学家、内科医生。同时,卡尔达诺赌瘾极大,他承认自己连续25年每天都会赌博。他写了一篇有关概率论的短文,尝试去了解这些年有多少钱从他指缝中溜走。赌徒们已经知道扑克、骰子和轮盘的游戏规则了,他们需要知道的是概率:怎样计算抽到两张A、掷两枚骰子得到7,或是反复转到红色轮盘的可能性。卡尔达诺与他的法国继承者皮埃尔·德·费马(Pierre de Fermat)和布莱士·帕斯卡(Blaise Pascal)早在贝叶斯之前就提供了这些问题的解决方法。
贝叶斯主要研究了这些问题的反面:逆向概率(Inverse Probability),也称作原因概率。假如我们已经知道了结果(已经拿到手上的这副牌),我们能否反推出一些导致这个结果的原因(荷官是否作弊了)呢?这对于任何一个认真的赌徒来说都是个迫切的问题。
如果这个荷官为了不发到A而耍花招,那这将影响到我会抽中什么牌。贝叶斯定理为此类问题的推理提供了数学框架。从一个先验概率开始,比如从一副无偏差的扑克牌里抽出一张A的概率是1/13。每发一张牌,我都可以将这个概率向上或向下调整,它不但反映出这副牌不断改变的构成,也体现了在和荷官一来一回的交手中,我对对方了解的深入。这一系列调整产生的后验概率,是在新证据的基础上更新先验概率之后得到的。
如果发现自己抽到A的次数一直少于从一副无偏差扑克牌中应该抽到A的次数,那我可以推测它的成因:我面前是一个作弊的荷官或是这副扑克牌缺了A。这个推测绝不是100%确定的,譬如也有可能是我一直非常倒霉。但是,荷官作弊的可能性会随着我一直“倒霉”而增加。虽然我们生活在一个什么都不确定的世界上,但是一个理智的赌徒应该果断放弃那个可能被荷官操纵的赌局。
贝叶斯的《机会的学说概论》被公认是一篇提出了极佳概念却写得一塌糊涂的数学论文。他的阐述被认为是有漏洞的,论证不够清晰且没有真正解决问题——贝叶斯在该文中大量使用晦涩难懂的类比,理解这些类比,比理解它们想要阐明的观点还难。普莱斯的序言给论文加上了贝叶斯本人没能提供的导向性陈述。普莱斯形容这篇论文是一个警示,帮助信徒们信靠他们的终极目标上帝:“这篇文章的目的是解释我们凭什么相信这个世界是某种智慧和超自然力量的产物,以此来证实从最根本原因得出的神存在的论点。” 7
普莱斯的观点如今也被称为设计论证 。简单来说就是,由于我们已知宇宙像是一台精心打造的时钟,那么我们就可以反过来推论存在一个神圣的钟表匠设计了这台时钟。
不过,贝叶斯的论文纯粹就是一篇数学论文。他的论点从许多方面来说都算是基本常识。下面我们将介绍一些简短精要的贝叶斯哲学。
第一点,“非凡的观点需要非凡的证明”,用这句当代怀疑主义的箴言当作贝叶斯思想的介绍再合适不过了。以休谟举的例子来说,《圣经》里说,耶稣是木匠的儿子,他在很小的时候就用智慧折服了众人。他曾在一座山上对众人布道,也曾在被本丢·彼拉多(Pontius Pilate)下令把他钉在十字架上之前和他的信徒一起吃晚饭。《新约全书》是以上这些言论唯一的来源,大家普遍认为它是真的,但《新约全书》里的神迹却不被非基督徒承认。为什么呢?有一种说法是《新约全书》里四福音书的作者都不可靠。如果真的是这样的话,那《圣经》里的每一件事都很可疑啰? 8
这倒不一定。不过,神迹确实是非凡的一种说法,所以需要更严谨的证明。根据我们对世间其他事物的了解,我们会认为神迹这种只发生一次的事件的先验概率非常低。《圣经》手稿里的证据(通常以传记、传说和寓言的方式呈现)并不足以让这个概率上升多少。但是像“耶稣是木匠的儿子”这样的细节会让整个事情听起来更像是真的,以至于连非基督徒都对《圣经》故事将信将疑了。
贝叶斯和普莱斯都是有信仰的人。普莱斯在他的评述中写道,贝叶斯定理并没有否认神的存在,这就给启蒙运动中的基督徒留下了继续相信神迹的理由。 9 如果能证明神迹发生的人越来越多,那么慢慢地人们就会对神迹的存在确信不疑。
这就是人们对贝叶斯定理最不满的地方,它把可能性究竟是多少留给使用它的人自行判断。的确,贝叶斯定理是有这个问题,但所有用在我们这些凡人身上的规则、法律和信条不都有这个问题吗?
第二点,其实,缺少信息这件事本身也可以透露很多信息。在阿瑟·柯南道尔(Arthur Conan Doyle)的短篇故事《银斑驹》( The Adventure of Silver Blaze )里,福尔摩斯正在调查一起驯马师谋杀案,他发现没有一位目击证人说他们听到了这个马厩看门狗的吠声。如果凶手是陌生人的话,狗是一定会叫的。因此,福尔摩斯推断凶手是看门狗和死者都熟悉的人。
柯南道尔也认同贝叶斯这个颠覆性的想法,即没有证据(看门狗没有叫)和有一个确定性的证据一样可以揭露真相。贝叶斯定理认为,问题的关键是概率的比率。一只狗很可能不会冲着熟悉的人叫,但不可能不冲着陌生人叫。因此,我们会选择相信作案者是一个熟人。
第三点,“当你听到蹄声的时候,应该是马来了,而不是斑马来了”。 10 在所有条件一样的情况下,我们一般会选择更常见的解释。
再举一个例子,“三年级的时候,我获得了一个足球奖杯”,以下哪种情况更可能是真的?
·因为我是整个三年级学生里足球踢得最好的,所以我获得了奖杯。
·这是一个参与奖(所有参加了足球比赛的小朋友都会得到,以示鼓励)。
在第二种情况下我肯定会得到这个奖杯,它不是什么以一敌百的巨大胜利。因此,我们觉得第二种情况更合情合理。就像约翰·莱斯利说的:“一件事情可以被视为普通事件时,不要把它看成是多么特别的。” 11 我们不应该轻易将现实归因于侥幸、偶然或神奇的巧合。