购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

引言
一个近乎“万物理论”的理论

精神病学领域有一条通用准则:如果你认为自己找到了可以解释万物的终极理论,那你应该是患上了妄想症,快去医院看看吧。

——斯科特·亚历山大

我们能预测未来吗?当然可以!

可以肯定的是,接下来的几秒钟内你必然会吸进一口气,再把它呼出去。你还可以自信地预测,你的心脏会继续跳动,每秒一到三下;明早太阳会照常升起,尽管具体时刻取决于你所处的纬度和时节,但精准的数据并不难找。

你还可以预测火车到站的时间,预测你的朋友会准时抵达事先说好的饭店,尽管你在做出这些预测时的自信程度会受到具体是哪家铁路公司、哪位朋友的影响。

此外,你还可以预测,世界人口将持续增长至21世纪中叶,然后开始下降;2030年的全球平均地表温度将高于1930年。

未来并非无法窥测,我们有能力拨开迷雾一探究竟。有些东西很好预测,比如根据传统力学预测几千年之内的行星轨迹;有些东西则很难预测,比如在混沌理论的背景下预测天气——能预测几天就很了不起了。但不管怎么说,我们总能掀开帷幔,或多或少地看到一些未来。

大众口中的“预测未来”通常指的是一些极为神秘的、涉及超自然力量的、神一般的预言。但本书提到的“预测未来”并不是这个意思,我们很难有这种通天之术(后文会提到一位科学家,他认为我们的确有这种能力,读完之后你就会明白,他肯定是错的)。事实上,我们根本不需要那种夸张的能力就能做出预测。我们这一生从来就没有停止过对未来的预测,预测和生命是密不可分的。有些预测是很基本的,比如每次吸气时,我们都会下意识地预测“空气一直是可吸入的”。有些预测是较为复杂的,比如“街角的商店里会有欧倍牌麦片,我走进去就能买到”,每个决策都伴随着类似的预测。我们做出这些预测并非基于超能力,而是基于我们的经验。

所有预测都存在一个问题,即结果的不确定性。我们不清楚这个世界到底是建立在决定论之上的,还是建立在非决定论之上的。倘若我们可以像全知全能的上帝一样,知晓宇宙中每个粒子的位置、动量、性质,那我们或许就能完美地预测世间万物,比如每只麻雀的死亡 。可惜我们并非全知全能,我们能够掌握的信息很有限 。我们没有完美的感知能力,所以我们无法看到宇宙的每个细节,但我们可以利用有限的信息做出不完美的预测,比如我们可以大体预测出不同事物的活动方式:像人一样的事物会倾向于寻找食物、组建团队,像岩石一样的事物往往只能静止不动。

生命不是一局国际象棋,而是一场扑克游戏,因为前者的信息是完全的,理论上我们可以“应对”任何状况;而后者的信息是有限的,我们只能尽量根据掌握的信息做出最佳决策。

本书的主要内容就是帮你学会做出最佳决策的“公式”。

《时间简史》出版之后,史蒂芬·霍金曾说过这样一句话:“有人对我说,书里每多出一个公式,它的销量就会减少一半。” 可我这本书的核心内容就是一个公式,想要一个公式都没有也太困难了。

这个公式就是著名的贝叶斯定理,它是一个极为简洁的等式:

说来实在惭愧,其实我也讨厌看到数学公式。虽然硬要我去使用公式的话,我也不是做不到,但我实在感到乏味无趣。可你知道吗,最尴尬的是,虽然我已经写了3本书,且每本书都和数学密切相关,但在看到Σ这个符号的时候,我的大脑仍会频频宕机。我想大多数读者都和我有着类似的感受,这或许就是出版社警告霍金尽量不要在书中列出公式的原因。

不过我们也没必要谈公式色变,公式并不是什么晦涩难懂的咒语或密码,它只是一种简便的书写方式,每个小符号都代表一个简单的步骤(我常常这样安慰自己)。

贝叶斯定理也是如此,它只是一个概率公式,它可以根据已知信息算出某件事发生的概率。具体来说,它是一种条件概率。公式中的竖线“|”是“在此情况下”或“以此为前提条件”的简写, P A | B )则指的是“在事件 B 已经发生的情况下,事件 A 发生的概率”。

这里我们给出一个条件概率的简例。你手中有一副去掉大小王的扑克牌,你想知道从中抽到红桃的概率。已知扑克牌一共有52张,红桃有13张,我们可以据此算出其概率——记作 P (♡)——等于13/52,或1/4,用数学语言表示就是 p =0.25。然后我们假定你抽了一张牌,是梅花,那么此时抽到红桃的概率是多少呢?我们知道牌堆中仍然有13张红桃,但牌的总数变成了51,所以此时概率变成了13/51,或者说 p ≈0.255。这就是你已经抽出一张梅花的情况下,再抽到一张红桃的概率,即 P (♡| ♧)。

再举一例:伦敦某天下雨的概率是多少?答案是0.4左右,因为伦敦每年大约有150天在下雨。现在你往窗外瞥了一眼,发现乌云密布,那么此时下雨的概率是多少?我也不知道确切答案,但我知道,阴天下雨的概率肯定更高。

贝叶斯定理其实也是这个意思,只不过它的适用场景更为广泛。用通俗的语言来解释公式的四个部分,就是这个样子:(事件 B 已经发生的情况下,事件 A 发生的概率)=(事件 A 已经发生的情况下,事件 B 发生的概率)×(事件 A 单独发生的概率)÷(事件 B 单独发生的概率)。

现在假设我们的社会出现了一种大规模传播的疾病(可以参考刚刚经历的新冠疫情)。

为了弄清自己到底有没有染上这种病,你做了一个测试。测试的指导手册上写着这样一句话:“本测试的灵敏度和特异度均为99%。”也就是说,如果你真的染上了这种病,那么这个测试有99%的概率可以准确地告诉你,你确实染上了这种病;如果你没有染上这种病,那么它也有99%的概率可以准确地告诉你,你没有染上这种病。另外我们还可以这样理解:该测试的“假阴性率”和“假阳性率”都是1%。

现在假定你的试纸上出现了两条红线,也就是说测试结果呈阳性。这意味着什么呢?你可能会自然而然地认为,自己有99%的概率被传染了。

但贝叶斯定理会告诉我们,事实并非如此。

贝叶斯定理是一个非常奇怪的定理。它的表达式十分简洁,写出来不占什么篇幅,涉及的运算只有乘法和除法,就连8岁小孩都会算。它的提出者也只是一个生活在18世纪的普通富绅,这位富绅白天会在坦布里奇韦尔斯担任牧师,但他并不信奉英格兰国教 ,研究数学也只是业余爱好。尽管如此,贝叶斯定理仍旧产生了极为深远的影响——它可以解释为什么即便癌症测试呈阳性的人中有99%都没有癌症,测试的准确率仍然可以高达99%;为什么DNA(脱氧核糖核酸)鉴定只有两千万分之一的概率匹配错,但它仍有很大概率导致冤假错案;为什么一个科学结论明明具有“统计显著性”,但它仍旧有很大概率是错的。

贝叶斯定理还涉及迷人的哲学思辨。“概率”是真实存在的吗?我们说掷色子有六分之一的概率掷出1,这到底是什么意思?它是宇宙中确切存在的事实,还是我们对这个世界所持有的一种信念?一次性事件也有概率吗?如果我告诉你,曼城队有90%的概率成为2025年的英超冠军,那这到底意味着什么呢?

每次我们面对不确定的事物做出决策时——一直以来我们都是这样做的——都可以利用贝叶斯定理来判断该决策在多大程度上算是个好决策。事实上,无论是怎样的决策过程,无论你为了实现某个目标对世界产生了多大的影响,无论你掌握的信息多么有限,无论你是正在寻找高浓度葡萄糖环境的细菌,是正在利用复制行为传播遗传信息的基因,还是正在努力实现经济增长的政府,只要你想把事情干好,你就离不开贝叶斯定理。

AI(人工智能)本质上也是贝叶斯定理的一个具体应用。从最基本的层面来说,AI所做的事情就是“预测”。一个可以分辨猫狗图像的AI应用,本质上就是在根据过往的训练数据和当前的图像信息去“预测”人类对图片的判断。DALL-E 2、GPT-4、Midjourney等各种优秀的AI应用,正在以令人应接不暇的速度一次次冲击人们的认知,我写下这段话的时候可能就刚好有一个震撼世界的AI应用横空出世。不过,这些和你谈笑风生、为你生成高质量图像的AI,本质上也是在做预测,只不过它们预测的是人类作家、人类艺术家面对这些提示词时会如何作答。这些预测行为的基础都是贝叶斯定理。

大脑的工作也离不开贝叶斯定理,这就是人类容易产生视错觉、致幻剂可以致幻的原因,同时也是思想意识的工作原理。

贝叶斯定理可以让我们明白,为什么阴谋论的观点难以转变;为什么两个人可以根据同样的证据得出完全相反的结论。比如,为什么那些科学事实能够让我相信疫苗安全有效,却无法说服一个怀疑论者呢?答案就是,根据贝叶斯定理,一个人对新信息的判断会受到既有认知的影响。这并不是说那些怀疑疫苗的人、那些阴谋论者是大脑运转方式与众不同的外星人,而是说他们也是完全理性的人,只不过他们的行为建立在固有思想之上。贝叶斯定理可以很好地解释这一点。

由此可见,虽然贝叶斯定理不是万物理论,但实际上也差不多了。一旦你开始站在贝叶斯定理的视角去看待问题,你就会发现贝叶斯定理真的是无处不在。我写这本书的目的就是帮你做到这一点。

通常人们会用医疗检测来解释贝叶斯定理,本书也不例外。这里我们给出一些比较可靠的数据:假定你正准备进行乳腺癌的筛查检测,且已经知道,如果某位女性的确患有癌症,那么乳房X光在80%的情况下可以正确识别出癌症(灵敏度为80%),在另外20%的情况下会发生漏诊,即假阴性;如果某位女性没有癌症,那么乳房X光在90%的情况下可以正确排除癌症(特异度为90%),在另外10%的情况下会发生误诊,即假阳性。

假定你的检测结果呈阳性,那是不是说明,你有90%的概率患上了乳腺癌?不是的。事实是,根据上面给定的这些信息,你根本无法判断自己患上乳腺癌的概率到底有多大。

你还需要额外掌握一个信息,那就是在参加检测之前,你对自己患上乳腺癌的概率的预估。最简单的预估方式就是找出特定时期内,与你同龄的女性中的乳腺癌患者的比例。我们假定这一比例为1%。

为了让案例更加具体,我们进一步假定共有10万名女性参加了检测,那么按照1%的患病比例来看,这些人中一共有1000名乳腺癌患者。在这1000名患者当中,乳房X光只能正确检测出800名,另外200名将会出现漏诊;剩下的99000人没有患乳腺癌,在这些健康人当中,乳房X光只能正确判断出89100人,这意味着会有99000-89100=9900人被误诊为乳腺癌。下面我们把数据整理成表格:

现在你明白了吧,得到阳性结果的女性一共有10700名,其中只有800人真的患有乳腺癌。换句话说,假定你的检测结果呈阳性,那么你真正患有乳腺癌的概率是800/10700≈0.07,即7%。

具体结果完全取决于检测前人群中患有乳腺癌者的比例。假如检测对象是高风险人群,比如具有家族癌症史的老年妇女,那么这一比例可能高达10%,此时计算结果会发生翻天覆地的变化。

现在真阳性的人数从800涨到了8000,假阳性的人数下降至9000。此时一个拿到阳性结果的人真正患乳腺癌的概率变成了8000/17000,结果约为47%。知道这一点后,拿到阳性结果的人会比刚才更加忧虑。整个检测方法没有任何变化,发生变化的只有先验概率。

换句话说,贝叶斯定理可以告诉你结果的可靠程度。可是要做到这一点,你必须对这件事有一个先验预估。

现在我们再来看看这个公式(本书的销量该不会又减半了吧……毕竟这个公式刚才已经出现过一次)。

经过一系列计算之后,我们得到的结果就是 P A | B ),即事件 B 已经发生的情况下,事件 A 发生的概率。癌症检测与之类似,我们想知道的是,在检测结果呈阳性的情况下,该患者真正患癌的概率。

可是“灵敏度80%”并没有给出 P A | B ),反而给出了与之相反的 P ( B | A ),即事件A已经发生的情况下,事件 B 发生的概率。也就是说,它可以告诉我们,一个真正患有乳腺癌的人,有多大概率取得阳性结果。

乍一看好像没什么不同,实际上这两者的区别就像“某个人刚好是教皇的概率仅有八十亿分之一”和“教皇刚好是个人类的概率仅有八十亿分之一”的区别一样大。

为了得到想要的数据,我们需要更多信息。在癌症检测的例子中,我们需要的额外信息是乳腺癌患者在人群中的比例。在医学中,我们将其称为发病率,或背景发生率;在贝叶斯定理中,这种额外信息一般被称为先验概率。

医学中的先验概率比较容易获得,也很容易定义。比如你想知道某人患上亨廷顿病的风险,那你可以去查询全科诊所的诊疗记录 ,然后据此算出平均每10万人当中约有12.3人患有该疾病。

其他情况则要复杂得多。如果几年前你想计算俄乌爆发冲突的概率,那这个先验概率该怎么算?先算一下俄乌每年爆发冲突的频次?还是先统计一下所有冲突爆发的频次?或是先调查一下,看看两国边境突然增派大量坦克的时候,双方爆发冲突的概率?

再举一例。假定我提出了一个科学假说,做了一次相关实验,且取得了不错的数据,此时该假说是一个正确假说的概率有多高?我们进一步假定,如果该假说是错误的,那每20次实验中只有1次能取得这种数据。这是不是意味着,我的假说大概率是正确的?不是这样的,因为它还和另一个概率有关——我开始做实验之前,该假说为真的概率,即先验概率。可我该上哪儿去搞到这个数据呢?

法庭辩护中也有一个经典案例。在已经取得某些法庭证据的情况下,该嫌疑人有罪的概率是多少?假定嫌疑人的DNA恰好出现在现场的概率只有百万分之一,那是不是说明警察只有百万分之一的概率抓错了嫌疑人?不是这样的,因为这还取决于一开始警察就抓到了正确嫌疑人的概率有多大。可问题是,这项数据上哪儿去找呢?

放心,这些问题本书都会一一作答(有很多数学家研究过相关问题)。需要牢记的是,必须先得到一个先验概率,我们才能进一步应用贝叶斯定理。缺失了先验概率,我们只能得到一些不靠谱的结论。

大多数人第一次听说贝叶斯定理都是在医学领域,所以我们的旅程也从医学领域开始。

这么多年来,我逐渐爱上了贝叶斯定理。第一次听说贝叶斯定理,是在本·戈尔达克瑞于21世纪初在《卫报》上开设的《小心坏科学!》专栏当中。自那时起,我就对贝叶斯定理越来越着迷。包括本书在内,我已经出版了3部作品,其中每本书都或多或少地提到了贝叶斯定理。该定理常常能够得出一些反直觉的结论,令人连连称奇。比如,某项测试的准确率为99%,并不意味着该测试在99%的情况下是正确的。这到底是什么鬼话?虽然只要按部就班地推导,就能逐渐理解这一事实,但类似的结论总是能够让人感到不可思议,刷新认知(至少我的感受是这样的)。

过去4年当中,也就是2020年年初全球暴发新冠疫情之后,贝叶斯定理推导出的那些结论变得越来越重要了。早在2020年4月,大部分人还处于居家隔离状态的时候,英国前首相托尼·布莱尔等人就呼吁政府向那些已经感染过新冠病毒、体内已有抗体的人发放免疫证明,允许他们外出活动(当然这发生在人们意识到各种变异病毒会导致患者很容易复阳之前)。

抗体测试问世没多久,美国政府就紧急批准了一种抗体检测方法,该方法的灵敏度和特异度大约都是95%。

听上去挺靠谱。事实上,2020年4月,英国大约有3%的人口感染了新冠病毒,这一比例就是所谓的先验概率。如果有100万人参加检测,那么其中大约会有3万人是新冠病毒感染者。在这3万名患者当中,会有28500人的检测结果呈阳性;剩下的97万健康人当中,则会有48500人的检测结果被错误标记为阳性。

由此可见,在全部77000个阳性结果当中,只有三分之一多一点的检测者的确感染了新冠病毒(这就是后验概率)。英国人口一共有6800万,假如政府真的让所有人都参加了这项检测,并向那些结果呈阳性的人发放免疫证明,就会导致约300万根本没有感染过新冠病毒的人可以自由地走街串巷,甚至去拥抱免疫力低下的爷爷奶奶,而事实上这些人根本不安全。不弄懂贝叶斯定理的话,你就没法搞清楚这件事。

当时英国有一群所谓的“权威人士”对居家隔离政策持怀疑态度,其中有一部分人已经察觉到检测数据有些不对劲,从而引发了一场和贝叶斯定理相关的巨大争论。这些人当中最著名的应该就是威尔士地方政府前首席大臣约翰·雷德伍德,他认为那些错误的检测结果会歪曲新冠疫情的真相,并强烈要求政府顾问尽快给出一个制止这种现象的方案。

这些怀疑论者之所以会觉得检测数据不对劲,是因为他们误解了统计学教授戴维·斯皮格霍尔特爵士在一个访谈节目中的言论。戴维·斯皮格霍尔特经常积极地在各种电视节目和广播频道中向公众耐心解释什么是检测的准确度,什么是疫苗的有效性。大家已经明白,检测的假阳性率为1%,并不意味着只有1%的阳性结果是误诊。当时社会正处于第一波疫情和第二波疫情之间的缓冲期,此时人们只要一打喷嚏就得做PCR(聚合酶链式反应)检测。从数据上来看,当时英国的新冠病毒感染者非常少,隔离政策似乎的确降低了感染率,可整体上来看,感染率似乎又有一种上升趋势。

那些持怀疑论的“权威人士”认为,感染率上升只是一种假象,贝叶斯定理可以解释个中玄机。具体来说,当时有0.1%的人感染了新冠病毒。如果我们随机对人群进行检测,且该检测方式可以在99%的情况下正确识别出那些没有感染新冠病毒的健康人,在90%的情况下正确识别出那些的确感染了新冠病毒的患者,那么最终将有超过90%的人得到假阳性结果。

这个结论的确没错,问题在于他们对贝叶斯定理的理解不够深刻。首先,先验概率真的是0.1%吗?这一概率成立的前提是,参与检测的人员都是从整个人口当中随机挑选出来的,但事实并非如此:参与检测的要么是已经表现出一定症状的人,要么是接触过确诊病例的人,这些人感染新冠病毒的概率要比其他人高得多。虽然我们不知道具体高多少,但我们知道,即便先验概率只有1%,假阳性的比例也会大幅下降至50%;如果先验概率为10%,那么大约有90%的阳性结果是真阳性。

那么,我们假定假阳性率为1%,会不会有点太夸张了呢?事实上,2020年夏天新冠疫情开始减弱的时候,检测结果呈阳性的比例只有0.05%,其中包括了真阳性和假阳性,所以假阳性率不可能比这一数值还高。如此一来,在新冠病毒感染率为0.1%的前提下,假阳性率将下降至35%。感染率越高,假阳性率就越低。

其实不仅仅是新冠疫情,几乎任何形式的医学检测都会涉及贝叶斯定理。

英国的国家医疗服务体系(NHS)提供3种常规的癌症筛查,即乳腺癌、宫颈癌、结肠癌。虽然前列腺检查不在常规检查之内,但50岁以上的男性如果有需求,也可以把这项检查加进去。

为什么前列腺检查没有加进常规的癌症筛查呢?毕竟癌症筛查听上去就是件有益无害的事,越早发现越容易治疗嘛。难道前列腺检查有什么坏处吗?

就像本书中的其他问题一样,贝叶斯定理可以给出答案。

前列腺癌的筛查是通过PSA(前列腺特异性抗原)检测来进行的。医护人员会检验测试者的血液,如果血液中的PSA指数过高——正常值是3~4纳克每毫升——测试者就有必要接受进一步的检查,比如扫描或活检。需要注意的是,PSA过高既有可能是前列腺癌的信号,也有可能是感染、炎症的征兆,还有可能是年迈导致的自然现象。

PSA检测没有前面提到的那些检测方法那么精准。根据英国医疗咨询机构——国家卫生与临床优化研究所(NICE)提供的数据 ,如果以3纳克每毫升的标准对患者进行PSA检测,那么该检测将成功识别出32%的患者(灵敏度),以及85%的健康人(特异度)。

另外我们知道,50岁以上的男性患者中,大约有2%患有前列腺癌。 假如参加PSA检测的人数共计为100万,那其中大约会有2万人确实患有前列腺癌。可是这项检测只能正确识别其中的6400名患者。剩下的98万健康人当中,将有147000人需要进行额外的后续检查。如果一名50多岁的男性在该检测中得到了阳性结果,那他实际上只有4%的概率真正患有前列腺癌。

4%的概率需要我们认真对待吗?或许吧,但可以肯定的是,阳性患者需要进行额外检测:有些会造成创伤,有些会令身体不适,有些甚至还具有一定风险。当然,英国的国家医疗服务体系还要为这些数以万计的核磁扫描、活体检测支付数百万英镑,而这些钱本可以用来支付他汀类药物、肾移植费用或是护士的工资。此外,前列腺癌的检测还有很多问题,比如很多情况下前列腺癌细胞的扩散极为缓慢,以至于很多患者根本无法意识到自己得了前列腺癌;有时,直到尸检这一步,人们才发现患者患有前列腺癌,但他们的死因却和前列腺癌毫不相干。

当然,这里面还有一个问题,那就是32%的灵敏度、85%的特异度这两个数值,其实是3纳克每毫升这项检测标准造成的。如果我们把检测标准提高到4纳克每毫升,会发生什么?

答案就是,特异度会从85%升到91%,也就是说该检测能够正确识别出更多健康人。但代价是灵敏度会从32%降至21%,也就是说该检测正确识别癌症患者的能力下降了。假如这次也有100万人参加了检测,那么假阳性人数会下降至88200,但与此同时真阳性人数也变少了——20000名患者当中只能正确识别出4200人。这种情况下,如果一名50多岁的男性在该检测中得到了阳性结果,那他实际上只有4.5%的概率真正患有前列腺癌,并没有比之前高多少。

我们无法规避这些数据之前的关联性。我们可以继续提高检测阈值,比如把标准设定为5纳克每毫升,那么假阳性的数量会进一步下降,但代价是假阴性的数量会进一步上升。如果降低检测阈值,那么假阴性的数量会下降,但代价是假阳性的数量会上升。二者互相拖后腿的现象是不可避免的。想要真正解决这一矛盾,我们只能在医学上寻求另一种更优秀的检测方式(这有点像“统计显著性”问题,在后文中我们还会具体分析)。

虽然乳腺癌和结肠癌的筛查更为精准,但即便是在这两个领域,其准确性也高度依赖于患者人数在全部人口中的比例。一项大型调查发现 ,在连续10年、每年都进行乳房X光检查的女性当中,有60%的人得到过一次或多次的假阳性结果,继而参加了活检等形式的额外检查,这些烦琐的检查令她们感到“焦虑、痛苦,总是担心自己真的得了乳腺癌”。这一切真的值得吗?答案取决于该疾病在人群中的发病率,即先验概率。年轻人很少得乳腺癌,如果我们对40岁以下的女性进行乳腺癌筛查,那么即便灵敏度和特异度都很高,也会出现较高的假阳性率,所以对大龄女性进行乳腺癌筛查会更有价值。英国国家卫生与临床优化研究所认为,只有对50岁以上的女性进行乳腺癌筛查,才具有成本效益。 如果不懂贝叶斯定理,我们就无法得出这一结论。

各位准父母最好也了解一下贝叶斯定理。市面上有一种叫作“无创产前筛查”(NIPT)的技术,这种技术会利用孕妇的血液样本来分析胎儿的染色体状况。在英国,国家医疗服务体系会向高风险孕妇提供这一服务。当然你也可以去私人诊所,其价格在500英镑左右。

虽然该筛查的准确率高达99%,但就像前面的例子一样,其准确率无法帮助我们判断手中的检测结果到底在多大程度上是准确的。唐氏综合征、13三体综合征、18三体综合征都是这项检测的目标疾病,这些疾病不仅非常罕见,而且相当严重。患有唐氏综合征的孩子,幸运的话可以活几十年,大多需要终生陪护;而患有13三体综合征、18三体综合征的孩子通常会在出生后的数月、数年之内夭折。显然,检测结果是否准确对父母来说非常重要。

调查发现 ,如果参加无创产前筛查的人不是高危孕妇,而是一群普通孕妇,那么检测结果往往会呈现假阳性。唐氏综合征的“阳性预测值”,即阳性检测结果为真阳性的概率为82%,13三体综合征的为49%,18三体综合征的为37%。

如果参加无创产前筛查的是一群高危孕妇,那么这些疾病的阳性预测值会大幅上升——18三体综合征的阳性预测值会跃升至84%。也就是说,如果对所有孕妇进行无差别检测,那么每3份阳性结果中就有2份是假的;如果只对高危孕妇进行检测,那么得到假阳性结果的概率还不到六分之一。

这背后仍然是贝叶斯定理。手中刚拿到的检测结果并不能反映整个事实,我们必须想办法得到先验概率,而这既不是什么理论假说,也不是什么学术难题。如果你已经怀上了宝宝,并参加了这些测试,且拿到了阳性结果,那贝叶斯定理将会成为你应该采取何种行动的关键。而且,正如后文所说,你的医生也不一定能帮到你,因为大部分医生也和普通人一样,认为99%的准确率就等同于检测结果在99%的情况下都是正确的。

和医学界类似,法律界也有一个叫作“检察官谬误”(prosecutor’s fallacy)的案例,该案例就犯了没有认真考虑贝叶斯定理的错误。该案例是这样的:假定你正在犯罪现场做犯罪调查,在凶器上采集到了DNA样本,且该样本与数据库中某人的DNA样本匹配。要知道,DNA匹配的精度极高——平均每300万个样本中才能有1个拥有如此高的匹配度。

这是否意味着,嫌疑人只有三百万分之一的概率是无辜的?读到这里你应该已经有能力意识到,事实并非如此。

你还需要一个信息,即先验概率。你是因为掌握了确切证据,才确定了嫌疑人的吗?还是说你只有DNA匹配这一个理由去怀疑他,而且该DNA数据库是从英国全国人口中随机挑选出来的?如果是后者,那么该嫌疑人的确是罪犯的先验概率只有六千八百万分之一:因为英国人口为6800万,而此起案件的罪犯只有一名。如果你对英国人口进行DNA检测,你会得到大约20份匹配结果,运气好的话,罪犯也会在里面。在这种情况下,刚好抓到罪犯的概率大约为5%。

但如果你事先能把嫌疑人的范围缩小至10人,比如你就是神探赫尔克里·波洛,犯罪现场只有10个疑犯,他们被暴风雪困在一幢乡间别墅里,那情况就完全不同了。此时的先验概率是10%,如果10人当中有人和现场遗留的DNA匹配上了,那该结果为假阳性的概率只有大约三十万分之一。

这不是夸大其词,也不是故弄玄虚,因为法庭上真的有法官曾以类似的细节给嫌疑人定罪。1990年,一个叫安德鲁·迪恩的男性被法庭判有强奸罪,证据之一就是DNA匹配。当时有位专家证人跟法官说,DNA来自其他人的概率只有三百万分之一。但安德鲁·迪恩的罪名还是被推翻了(尽管重审之后还是判他有罪),原因就像某位统计学家所解释的那样 ,“如果某人是无辜的,他的DNA有多大概率和犯罪现场的DNA匹配?”和“如果某人的DNA和犯罪现场的DNA匹配,他有多大概率是无辜的?”是两个不同的问题,正如“某人是教皇的可能性”和“某教皇是人的可能性”是不一样的。

有时谬误也会反过来。奥伦塔尔·詹姆斯·辛普森是美国橄榄球巨星,曾被指控谋杀自己的妻子妮科尔·布朗·辛普森。在该案的审判过程中,检方指出辛普森曾对自己的妻子施暴,而辩方表示:“那些打过妻子耳光或殴打过妻子的男性当中,只有不到两千五百分之一的人会在一年之内谋杀妻子,这一概率可以说是微乎其微。”

这一谬误与检察官谬误刚好相反。一年之内不仅殴打妻子,还进一步谋杀妻子的概率,或许真的“只有”两千五百分之一。但这并不是我们想问的问题。我们想知道的是,如果一个男性殴打妻子,而妻子又被谋杀了,那凶手是她丈夫的概率是多少?

德国心理学家、风险理论专家格尔德·吉仁泽表示,如果两千五百分之一这个数字是正确的,那么每10万名遭受家暴的女性中就有40人会被谋杀。 而在整个美国社会中,女性被谋杀的比例为十万分之五。

由此可见,虽然遭受家暴的美国妇女被丈夫杀害的先验概率约为每年两千五百分之一,但我们现在可以利用新掌握的信息——已知该妇女是被谋杀的——来修正这个概率。

现在我们把数据代入贝叶斯公式。假如某一年有10万名妇女遭受家暴,那么其中大约会有99955人没有被谋杀。在被谋杀的45名妇女中,有40名是被她们的丈夫谋杀的。所以我们说,辩方的谬误与检察官谬误刚好相反:他们只使用了先验概率,而忽视了新出现的信息。

贝叶斯定理不仅能够帮助我们分辨推理中的谬误,还能告诉我们某些更深刻的东西。借用刚才的一个词,“相反”往往是问题的关键。通常,统计学与概率学会告诉我们出现某个结果的概率有多大。如果色子没被动手脚,那“掷3个色子全是数字6朝上”这件事,每掷216次才会发生1次。如果我从未去过犯罪现场,那么我的DNA和现场样本匹配的概率只有三百万分之一。

不过我们想知道的往往并不是这些。如果我们怀疑一起玩色子的某人是个老千,那我们可能想知道“如果他掷出了3个6,那这些色子没被动手脚的概率有多大”。如果某人的DNA和犯罪现场的样本匹配上了,那我们或许想知道这是一个巧合的概率有多大。这些问题往往都是一些“相反”的问题。

在相当长的时间里,概率论所关心的都是前面那一类问题。但是在托马斯·贝叶斯(后面我们会介绍他的故事)于18世纪提出后面的第二类问题之后,类似的“反概率”便逐渐引起了世人的注意。

正如你将在本书中看到的那样,第二类问题总是能够引发大量争论。贝叶斯定理不仅有大量“信徒”,也有很多“敌人”,从没有哪个简短的公式能够像它一样引发如此广泛的争议。想想看,你在网上见过有人因为球面面积公式或欧拉恒等式而吵得不可开交吗?

我认为之所以会出现这种现象,是因为贝叶斯定理几乎影响着一切事物。在已经取得某些研究结果的情况下,某科学假说为真的概率有多大?好吧,我可以告诉你在该假说为假的情况下,你取得这些研究结果的概率有多大,可二者并不是一回事。为了研究前者——已经有越来越多的科学家认为这才是统计学该研究的事情——我们需要贝叶斯定理,需要先验概率。

不仅如此,其实所有在不确定的情况下做出最终决策的行为,都离不开贝叶斯定理。更准确地说,贝叶斯定理代表了理想决策,决策人在多大程度上遵循贝叶斯定理,决定着该决策在多大程度上是一个正确决策。苏格拉底凭借“所有人都会死,苏格拉底是人,所以苏格拉底也会死”建立了完整的形式逻辑,而这其实也只是贝叶斯定理在“非此即彼”这种极端情况下的一个特例而已。

人类似乎就是一台贝叶斯机器,这一结论在相当深的层面上是正确的:虽然人类在计算贝叶斯定理的时候表现得像个垃圾,但我们在日常生活中所做出的那些决定,实际上和一个理想的贝叶斯决策者所做出的决定几乎一致。可惜这并不意味着所有人的决定会达成一致——如果我和你对某件事的先验概率的判断大相径庭,那么即便掌握的证据相同,我们也会得出完全不同的结论。这就是我们在面对气候、疫苗等证据确凿的问题时,仍会发自内心地出现重大分歧的原因。

在更深的层次上,我们仍然是贝叶斯定理的执行者。我们的大脑、感知,似乎都是通过“预测世界—先验概率—通过感官获取新数据—更新自己的预测”这种方式工作的。我们对世界的意识体验似乎就是最佳的先验概率。正所谓,我预测,故我在。 50ZnOQDLm4Dxf2RS0Y251vHgsojGC4+Xn4wpYSObCaRM7JRh07+cpwlnzhyPoHdP

点击中间区域
呼出菜单
上一章
目录
下一章
×