购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

忽略P(D/~H)

通过之前的部分我们已经知道,不能将诊断性证据和基础比率综合起来进行考虑,是人们在贝叶斯推理中经常会犯的一个错误。在这一部分中,我们还将看到,有时基础比率方面并没有问题,而是在处理应当帮助人们完成信念更新的数据过程中出现了问题。

为了说明这种思维错误,下面将使用一种不同形式的贝叶斯规则——通过简单的数学变形即可得到。之前出现的公式是针对给定一些新数据(D)后,焦点假设(H)成立的后验概率。当然也可将公式改写成,给定一些新数据(D)后,非焦点假设(~H)成立的后验概率

将这两个公式相除,我们可以得到贝叶斯公式在理论上最清晰的形式(Fischhoff&Beyth-Marom,1983),一种所谓的胜率形式(odds form)

在这个比值或者说胜率形式中,从左向右,三个比值项依次代表:获得新数据(D)后,支持焦点假设(H)成立的后验胜率;被称为似然比(LR)的一项,即焦点假设成立时获得该数据的概率除以备择假设成立时获得该数据的概率;以及支持焦点假设成立的先验胜率。特别地

后验胜率=P(H/D)/P(~H/D)

似然比=P(H/D)/P(D/~H)

先验胜率=P(H)/P(~H)

这个公式告诉我们,要计算获得数据后支持焦点假设(H)的胜率,可以通过将另外两项(即似然比和支持焦点假设的先验胜率)相乘得到

支持焦点假设的后验概率=LR×先验胜率

研究发现,人们的推理过程可以在多种方式上偏离贝叶斯规则的要求,但在这一部分中,我们将仅关注其中的一种:人们经常在评价证据对假设的诊断性时[即似然比=P(D/H)/P(D/~H)],未能考虑到分母中[P(D/~H)]这项也与判断相关。他们都忽略了考察焦点假设不成立时,获得该数据的可能性这一必要条件。

对焦点假设不成立时获得数据情况的忽略,是人们经常犯的严重推理问题——未能“考虑相反情况”——产生的真正原因。已有大量的研究证实,人们表现出的这种倾向,即忽略非焦点假设成立时证据出现的概率[P(D/~H)],是一种普遍存在的心理倾向。例如,多尔蒂和迈纳特(Doherty&Mynatt,1990)的实验采用了一个简单的范式:让被试想象他们自己是医生,在检查一个有红疹的病人。为了确定病人是否还患有“Digirosa”这种疾病,被试需要从四条证据中选出他们认为有用的信息,这四条信息是:

有Digirosa这种病的人的比例。

没有Digirosa这种病的人的比例。

有Digirosa这种病的人患有红疹的比例。

没有Digirosa这种病的人患有红疹的比例。

这些信息与贝叶斯公式中的四项分别对应:P(H),P(~H),P(D/H)和P(D/~H)。因为P(H)和P(~H)是互补项,要计算后验概率,只需要三条信息就足够了。但是,P(D/~H),未患Digirosa这种疾病的人中有红疹的比例,这一项作为贝叶斯公式中似然比的重要组成部分,显然是应被选择的。然而,在多尔蒂和迈纳特(1990)实验中,48.8%的被试并没有选择P(D/~H)这张卡片。可见,对于许多面对这道问题的被试来说,有红疹但无Digirosa这项疾病的人似乎与诊断是不相关的,这一信息被他们错误地认为是无关紧要的。

P(D/~H)的重要性经常是有悖人们直觉的。除非特意告知人们这类信息是重要的,否则他们的默认判断就很可能忽略这类情况。例如,请你考虑下面这个问题。即便你已经充分地知晓了P(D/~H)的重要性,它在这里的影响可能仍会让你诧异。

假设你遇到了一名叫戴维·麦克斯韦尔的人。你的任务是基于你将得到的信息,评估他是一名大学教授的概率。判断通过两步完成,每一步你都将得到一些对你的估计可能有用也可能无用的信息。给出每一条信息后,你都会被问对戴维·麦克斯韦尔是一名大学教授的概率估计值。每当对此回答时,请考虑所有你认为相关的信息。

第1步: 你被告知戴维·麦克斯韦尔出席了一个有100人参加的聚会,其中有25名男性大学教授和75名男性企业经理人员。问题:你认为戴维·麦克斯韦尔是一名大学教授的概率有多大?_______%

第2步: 你被告知戴维·麦克斯韦尔是熊俱乐部的一名成员。在第1步的聚会中,70%的男性大学教授是熊俱乐部的成员,90%的男性企业经理是熊俱乐部的成员。问题:你认为戴维·麦克斯韦尔是一名大学教授的概率有多大?_______%

这个问题在评定人们是否能够正确地处理或者确实处理了P(D/~H)信息的研究中受到了广泛的应用(Beyth-Marom&Fischhoff,1983;Stanovich&West,1998d)。第1步很简单。焦点假设的成立概率是0.25,因为100人中的25个是大学教授。第2步则是问题的困难所在。人们可能会因为题中所说,70%的大学教授是熊俱乐部的成员,这个比例高于50%,而认为戴维·麦克斯韦尔是大学教授的概率应当增加(即现在判定的概率应该比基础比率25%高),但这就犯了忽视P(D/~H)的错误。事实上,企业经理是熊俱乐部成员的概率更高。是熊俱乐部成员这一条件,更符合企业经理而非大学教授的特征,因此它实际上降低了后者的概率。这里的似然比要小于1(0.70/0.90),因而在得知关于熊俱乐部这一信息后,胜率更不倾向于戴维·麦克斯韦尔是大学教授了,从1:3(0.25/0.75)降到

后验胜率=似然比×先验胜率

后验胜率=(0.70/0.90)×(0.25/0.75)

后验胜率=0.175/0.675=1:3.86

就贝叶斯规则概率的形式来看,正确的贝叶斯调整是从第1步的0.25变为第2步的0.206[(0.70×0.25)/(0.70×0.25+0.70×0.25+0.90×0.75)]。然而,本书作者的研究团队采用这个问题做的一个实验(Stanovich&West,1998d)发现,只有42%的被试对概率的估计指向了正确的方向(在接收证据后把概率从0.25调低了)。许多被试在收到这一信息后都反而将概率调高了,这意味着他们把注意都放在了相对较高的P(D/H)值0.70上,并且他们都未能将这个条件概率与其实更高的P(D/~H)值一起考虑。

这里还有一个类似的容易出错的问题,但是稍有区别,它能够再次检验读者是否真正理解了似然比的影响,或者更确切地说,P(D/~H)的重要性。

同样,假设你遇到了一名叫马克·史密斯的人。你的任务是基于你将得到的信息评估他是一名大学教授的概率。

第1步: 你被告知,马克·史密斯出席了一个有100人参加的聚会,其中有80名男性大学教授和20名男性企业经理人员。问题:你认为马克·史密斯是一名大学教授的概率有多大?_______%

第2步: 你被告知马克·史密斯是熊俱乐部的一名成员。在第1步的聚会中,40%的男性大学教授是熊俱乐部的成员,5%的男性企业经理是熊俱乐部的成员。问题:你认为马克·史密斯是一名大学教授的概率有多大?_______%

在这个问题中,基于第1步基础比率的估计值应为0.80。第2步的题目被专门构造成虽然似然比明显大于1(0.40/0.05)但P(D/H)小于0.50的形式。这对于那些忽略P(D/~H)(其实比P(D/H)要小)的人来说,这些数据应当降低戴维是大学教授的概率。而事实上,对概率正确的贝叶斯调整是从第1步的0.80变为第2步的0.97[(0.40×0.80)/(0.40×0.80+0.50×0.20)]。从第1步到第2步,被试若将概率向上调整,就说明其确实注意到了P(D/~H)。要想显示出自己是贝叶斯式思考者,只需能够做到将概率向正确的方向调整就可以了。然而,本书作者的研究团队使用此问题进行的实验(Stanovich&West,1998d)发现,只有30%的样本将他们对概率的估计值朝正确的方向移动了(在接到证据后将其从0.80调高)。

这种在收到证据后未能注意到备择假设,即似然比的分母的现象,绝不是一个无足轻重的错误。了解观察到的现象在备择假设下出现的概率,是医学及其他许多应用科学里临床判断的一个重要组成部分,这也是我们使用控制组的一个重要原因。知道在我们感兴趣的变量未发生改变时可能出现的情况,显然是必不可少的。如果只有处理组的信息,那么不论临床还是科学上,相应的推论都会大打折扣。

能够反映人们在处理P(D/~H)时遇到困难的还有一个例子,这个例子是迈纳特、多尔蒂和德拉甘(1993)研究人们在寻找证据时是否采取了理性的寻求策略中使用到的。题目如下所示:

你的姐姐有一辆几年前买的轿车。是轿车X或轿车Y中的一种,但你记不起来是到底哪一种了。不过你记得她的车1加仑 汽油能跑超过25英里 ,并且在她购买后的两年中并没有出现大的机械故障。你还知道下面这个信息:

65%的轿车X每加仑汽油能跑超过25英里。

另外还有三条信息也是可获得的:

1.轿车Y每加仑汽油能跑超过25英里的比例。

2.轿车X在购买后最初两年未出现重大机械事故的比例。

3.轿车Y在购买后最初两年未出现重大机械事故的比例。

给被试的问题如下:假设你只能得到三条信息(1、2或3)中的一条,要确定你姐姐的车是哪种,你还想要获得哪条信息?

问题的结构如下所示。有两个假设——轿车是X牌的(H1)及轿车是Y牌的(H2),这两个假设是互斥的。有两种可能的诊断性指标——汽车每加仑能跑超过25英里(D1)的概率,以及汽车在购买后初始两年未出现重大机械事故(D2)的概率。你已经有了一条与所有的X牌轿车有关的信息P(D1/H1)——多大比例的X牌轿车每加仑能跑超过25英里。有两个可能的似然比

P(D1/H1)/P(D1/H2)和P(D2/H1)/P(D2/H2)

但是,你不能同时得到这两条信息,因为在P(D1/H1)这条信息之外,你只被允许再获得一条信息。显然,选择是P(D1/H2),这样你至少能够得到一个似然比——X牌轿车每加仑汽油能跑超过25英里的比例,与Y牌轿车每加仑汽油能跑超过25英里的比例相比较的值。选项看起来是很明显的,但这实际上却并不是未经训练的被试最终做出的选择。迈纳特等人(1993)发现,大多数被试(60.4%)选择考察轿车X未出现重大机械事故的比例[P(D2/H1)]。要知道,这条信息是完全无用的,因为被试无法获得P(D2/H2)的值。在不知道Y牌相较X牌在机械事故上是否有较高或较低的发生率时,知道一定比例的X牌车会出现事故是根本无用的。

令人忧虑的是,克恩和多尔蒂(1982)发现,在由俄亥俄州立大学已经开始临床实习的大四医学生参加的、一个题目结构相似的医疗诊断任务中,被试的表现也并未有所改善。这些医学生试图在一名病人身上诊断出是否存在A型或B型热带病。已知一个疾病的症状发生信息P(症状1/疾病A),他们面临其他三条与迈纳特等人(1993)实验中相似的信息,也是只能选择其中任一个:P(症状1/疾病B)、P(症状2/疾病A)、P(症状2/疾病B)。显然,只有第一个选项能够产生一个有用的似然比。然而,这项实验中69.3%的医学生在与此题类似的两个问题中都未能选出有用的信息。看来,医学生也会固执地选出在诊断上其实无用的信息。

心理学家对人们这种忽略必要对照(控制组)信息的倾向开展了大量的研究。例如,在一个已经反复研究过的共变探测范式(covariation detection paradigm)中(Levin,Wasserman&Kao,1993;Shanks,1995;Wasserman,Dorner&Kao,1990),被试面对一个2×2的表格,其中给出了检验某一治疗手段与病人治疗反应间关系的一项实验的全部信息:

表格中的数字代表了每个单元中的人数。具体描述为:200人进行了这项治疗并且状况得到改善;75人进行了此项治疗但状况未得到改善;50人并未进行此项治疗,而状况改善了;15人并未进行此项治疗,状况也未改善。在共变探测实验中,被试被要求指出这项治疗是否有效。他们首先关注的是施加治疗后状况得到改善的人数(200);其次,他们注意到相比治疗后未得到改善的人数(75),更多的人得到了改善(200)。因为这个比例(200/275=0.727)看起来很高,被试会被诱导而认为这项治疗是有作用的,而这就犯了理性思维的一类错误。

这种错误忽略了未施加治疗的情况下病人状况改善的概率大小。由于这个概率甚至更高(50/65=0.769),因而该实验所检测的这种治疗方法可以被判定为完全无效。忽略未治疗单元的结果,以及关注治疗/改善单元的大量人数这种倾向,诱导了许多人将这个治疗看成是有效的。更令人忧虑的是,这种不太好的对待证据的方式,甚至在那些专门从事临床诊断的人身上也有所体现(例如,在医疗人员中,参见Chapman&Elstein,2000;Groopman,2007;Wolf,Gruppen&Billi,1985)。

这种忽略备择假设的倾向在一个著名的效应中同样得到了例证,这一效应已被心理学家研究了50多年(Dickson&Kelly,1985;Forer,1949;King&Koehler,2000;Marks,2001),即所谓的巴纳姆效应。这个效应的得名来自巴纳姆,一位著名的狂欢节和马戏团表演者,他发表了一句著名言论“每分钟都有人受骗”。该效应的一个实际例子来自一项在心理学概论课上广泛使用的课堂演示。具体操作是,首先,指导者收集所有上课的学生的笔迹样例,一周后发回给大家,并基于自己对笔迹学的知识附上对每个人的“个人性格描述”。在阅读了对自己“个人化的”报告后,学生们一致认为对他们的描述是非常准确的,在关于准确度的10点量表中打出了7~9的分数,甚至还有人想要学习这类通常被认为是伪科学(如笔迹学)的知识。然而,当他们互相看了下邻桌的报告后,却发现所有人的性格描述都完全一致,学生们这才明白自己上了当。这些发给学生的性格描述,有大段类似“有时你是外向、友善、好交际的,但另一些时候你很谨慎和保守”的语句。

巴纳姆效应的这一例证基于这样一个事实:对于某些特定的语句或短语组合,大多数人都会认为其符合对自身的描述。心理学家研究了许多此类语句,结果发现,任何人都可以把这些语句当作一种个体的心理“分析”,适用于描述任一“委托人”。对方通常都会对这一“性格解读”的个体化精准度非常满意,却不知道其实每个人得到的都是相同的解读。可想而知,巴纳姆效应也是手相占卜者和占星师能够使人信服的基础。

如果我们仔细研究一下问题的根源是什么就会发现,仍旧是前述的未能考虑P(D/~H)的问题。被巴纳姆效应欺骗的学生评估了“有时你是外向、友善、好交际的,但另一些时候你很谨慎和保守”这一叙述适用于他们的概率,发现这个值是很高的。用更专业的表述来说,学生们认为下面这项概率很高

P(外向、友善、谨慎……/这个描述特别适用于我)

但显然这并不是似然比。它只是P(D/H)。要计算出正确的后验概率,我们需要考虑似然比的分母——P(D/~H)。这一项在本例中是什么?就是“有时你是外向、友善、好交际的,但另一些时候你很谨慎和保守”这一叙述适用于任何人的概率。显然,我们会发现这一项的数值也是很高的。“有时外向、友善、好交际的,但另一些时候谨慎和保守”这一叙述非常狡猾,并且可以进行多种解读,几乎任何人都会认为它能在很大程度上适用于自己。所以就似然比而言,虽然分子可能是0.90(确实适用于我),分母可能也差不多是0.90(适用于几乎所有其他人)。

所以,这个例子中的似然比(LR)是两个很高数值的比率。似然比是

P(外向、友善、谨慎……/这个描述适用于我)除以P(外向、友善、谨慎……/这个描述特别适用于任何人)

因为分母是一个很大的数字(可能有0.90左右),那么即使分子更大,似然比也不可能是一个非常大的数字(即使分子被评定为1.0,LR也比1高不了多少)。现在,再来看一下公式

后验胜率=似然比×先验胜率

无论“数据”收集前胜率是多少,由于似然比接近1.0,它们都不会改变多少。发给学生们的所谓有预测准确度的证据,其实都是假证据,它们并没有诊断性,并且一旦人们注意到了P(D/~H),就会发现这些证据其实是毫无价值的。 CVhXXWG8ZnBBtkeeL6da8xHQhWV6ceSB3sQoE/mfH80nIV7J3f0kYTtaYfNOJKiA

点击中间区域
呼出菜单
上一章
目录
下一章
×