购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

概率推理的其他问题

合取谬误

让我们再来看下认知心理学文献中提到的另一个著名问题,即所谓的“琳达问题”。琳达问题由特沃斯基和卡尼曼(1983)第一次发起研究。同本书中提到的其他问题一样,目前这一领域也有大量相关文献研究(如,Dulany&Hilton,1991;Girotto,2004;Mellers,Hertwig&Kahneman,2001;Politzer&Macchi,2000)。琳达问题如下所示:

琳达31岁,单身,性格直率,并且很聪明。她大学的专业是哲学,在学生时期她非常关心歧视现象以及社会公正问题,还参加了反核游行。请对下列叙述依据其可能性进行排序,1表示最可能发生,8表示最不可能发生。

a.琳达是一名小学老师______;

b.琳达在书店工作,并且上瑜伽课______;

c.琳达在女权运动中很活跃______;

d.琳达是一名精神病学社会工作者______;

e.琳达是妇女选民联盟中的一员______;

f.琳达是一名银行出纳______;

g.琳达是一名保险推销员______;

h.琳达是一名银行出纳并且在女权运动中表现活跃______。

大多数人都在这个问题上犯了“合取错误”。由于选项h(琳达是一名银行出纳并且在女权运动中表现活跃)是选项c和选项f的结合,因此选项h的可能性不可能大过选项c(琳达在女权运动中很活跃)或选项f(琳达是一名银行出纳)。所有的女权主义的银行出纳都仍然是银行出纳,所以选项h不可能比选项f有更大的可能性。然而,研究中经常有超过80%的被试将选项h评为比选项f更有可能的,这就表现出了合取错误。被试在回答这个问题时产生的错误,经常是由于他们犯了属性替换的错(Kahneman&Frederick,2002,2005)。属性替换发生的情景是:个体需要评定属性A,却发现评定属性B(与A相关)在认知上更容易,因此使用了B作为替代。更简单地说,属性替换就等于用一个相对容易的问题来替代一个更难的问题。由于属性替换的发生,本题中的被试并未进行仔细思考,未能看出这其实是一个概率情境的问题,反而基于一种更简单的、用相似性的评定进行了回答(一个女权主义的银行出纳相比另一个选项“银行出纳”,看起来与题目中对琳达的描述更加相符)。尽管在评定概率时,从逻辑上说,这种子集(女权主义的银行出纳)与母集(银行出纳)的关系显然应当优先于对相似性的评定。

条件概率的颠倒

对现实决策有深远影响的概率思维错误还有一种,即条件概率的颠倒(Gigerenzer,2002)。概率推理中的这种颠倒性错误指的是,认为给定B出现A的概率,同给定A出现B的概率是一致的。这两个概率并不相同,却经常被人们当作一样的来对待。因为问题的内容不同,有时这两者之间的区别很容易看出,例如,性行为发生后会怀孕的概率,很明显同已知怀孕情况下性行为发生过的概率是不同的。然而,有时问题内容的差异却无法这么轻易地进行区分。

回忆一下之前讨论中提到过的,每一种条件概率的值都取决于条件事件发生的概率,公式表示如下

P(A/B)=P(A和B)/P(B)

P(B/A)=P(A和B)/P(A)

当条件事件A比条件事件B更有可能发生时,P(A/B)会比P(B/A)大很多。例如,道斯(1988)描述了加利福尼亚报纸中的一篇文章,这篇文章的标题指出,一份学生调查表明,大麻的使用导致了毒品的滥用。这个标题暗含的信息是,这项调查是关于已知学生吸大麻的前提下,其使用毒品的情况。然而,实际上,这篇文章调查的正是与此相反情况的概率:已知学生在使用毒品的情况下,其吸过大麻的概率。这两个概率是非常不同的。已知学生吸过大麻的条件下他们也使用毒品的概率,要远远小于已知学生在使用毒品的条件下他们也吸过大麻的概率。原因就是大部分吸过大麻的人其实并未使用过毒品,而大部分使用了毒品的人都尝试过大麻。条件事件“吸过大麻”,要比条件事件“使用过毒品”更有可能,因此也就使得P(吸过大麻/使用过毒品)比P(使用过毒品/吸过大麻)更大。考虑下面这个表格中的情况:

只有非常少的人(3010人中有60人,小于2%)使用过毒品,但几乎33%的人都吸过大麻。已知某人使用了毒品,其吸过大麻的概率非常高

P(吸过大麻/使用过毒品)=50/60=0.83

然而,已知某人吸过大麻,他使用过毒品的概率仍然很低

P(使用过毒品/吸过大麻)=50/1000=0.05

这种条件概率颠倒的情况在医疗诊断这个重要领域中时有发生(Eddy,1982;Groopman,2007;Schwartz&Griffin,1986)。研究发现,病人和医护人员有时会颠倒概率,他们错误地认为,已知患者有某种特定症状后其患有某疾病的概率,同已知患有该疾病可能会出现该症状的概率是相同的(作为病人,我们会更关心前者)。例如,如果你得知自己的癌症检测结果是阳性,会感觉怎样?更进一步,如果你得知这个检测的准确率是90%,也就是说,患有癌症的人进行这个检测,90%的情况下结果都是阳性的,你又会感觉怎样?很可能会感到极度沮丧。但是,事实上,你患有癌症的概率其实只有不到20%,并没那么严重。既然这个检测有90%的诊断准确率,为什么检测结果是阳性的你患癌症的概率又会不到20%?为对此进行说明,我们假设有一个对这项检测的研究,共在1000名病人上实施了检测,他们中的100人确实患有癌症。检测结果如下所示:

在这个表中,我们可以看到,检测的诊断准确率是90%,100个患有癌症的人中,90人都检测出了阳性结果。但你很快就能发现,这个概率其实是与你无关的。90%这个数字是针对有癌症的人,检测结果是阳性的概率,即P(检测阳性/癌症)。但你感兴趣的其实是颠倒项:检测结果是阳性的情况下,患有癌症的概率,也即P(癌症/检测阳性)。而这个概率只有15.3%(90除以590)。

不幸的是,这个例子并不只是凭空想象。道斯(1988)在研究中提到过一个推荐某种癌症预防措施的医生,这位医生就混淆了给定诊断指标情况下患有癌症的概率,同给定病人患有癌症情况下出现某种诊断指标的概率。而这种预防措施竟是乳房切除这一重大手术,可见这种概率推理错误的严重性了。

确定效应

卡尼曼和特沃斯基(1979)在他们的一篇介绍前景理论(对决策的描述理论)的著名文章中,给出了有关确定效应(certainty effect)的几个例子:相比于有可能出现的结果,人们会倾向于对确定的结果赋予更高的权重。下面是其中一个例子。

假设你必须在下面两个选项中做一选择。请选出你更偏好的一项:

A.0.33的概率获得2500美元,0.66的概率获得2400美元,0.01的概率得不到奖励

B.确定获得2400美元

再想象下你必须在下面两个选项中做一选择。请选出你更偏好的一项:

C.0.33的概率获得2500美元,0.67的概率得不到奖励

D.0.34的概率获得2400美元,0.66的概率得不到奖励

卡尼曼和特沃斯基发现,82%的被试都在第一个选择中倾向于选项B。这个选择本身并没有错,问题是,83%的被试又在第二个选择中更倾向于选项C。两点综合起来看就会有很大的问题,因为第二个选择与在第一个选择中对B的偏好非常不一致。原因如下:

第一个选择中对B的偏好意味着,2400美元的效用要大于0.33概率获得2500美元加上0.66的概率获得2400美元的效用。用符号表示如下

u(2400美元)>0.33u(2500美元)+0.66u(2400美元)

两侧同时减去0.66u(2400美元),得到

0.34u(2400美元)>0.33u(2500美元)

现在看一下第二个选择,我们可以明显看到这就是选项C和D所反映的情况,而大多数人却选择了C,这意味着一种与第一个选择截然相反的倾向

0.33u(2500美元)>0.34u(2400美元)

卡尼曼和特沃斯基(1979)认为,出现这种不一致的原因就是,人们会对接近确定情况的概率赋予更高的权重。在第二个问题中(C对D),多出的0.01概率可以获得2400美元只是将该概率从0.33提高到了0.34,而在第一个问题中,多出相同的0.01概率却将获得奖励的概率从0.99提高到了完全确定。这种偏好的不一致显示了,相比于在其他概率数值上进行的相同概率增加,把某个选项发生的概率从可能提高到完全确定时的概率增值,被赋予了更高的权重。类似地,卡尼曼和特沃斯基也发现,0值附近的概率增值也被赋予了更高的权重,从不可能到可能的概率变化也有突出的显著性。综上所述,人们不会按照客观要求的方式(依照实际值的线性关系)来看待概率,而是依照一种与卡尼曼和特沃斯基提出的前景理论相似的权重函数来对待概率,如图3-1所示。这个例子也给我们提供了一种定量的视角,即概率的权重,来思考第2章探讨过的阿莱悖论(与此类似)产生的原因。

图3-1 基于前景理论的概率权重函数

概率判断中不能展开析取项的问题

前面我们已经看到,人们在处理合取问题时会产生的误区。然而,在琳达问题中,这种合取情况可能其实并未被人们直接感受到。由于属性替换的产生,人们并未真正地按照概率形式来思考这一问题(Kahneman&Frederick,2002,2005)。被试并没有将琳达问题看作概率情境,取而代之的是基于一种更简单的相似性评定来回答问题(一个女性主义的银行出纳似乎比单纯的“银行出纳”这一选项与题目描述重合更多)。合取问题并不是人们面临的唯一困境,人们在处理析取问题时也有困难,尤其是当析取问题比较隐蔽时。

特沃斯基和凯勒(1994)报告了这样一个研究,让一组被试估计美国死亡人口中自然死亡人口所占的比例,得到的结果是58%;另一组被试则分别评定死于癌症、心脏病,以及“其他自然原因”的概率,这组对这几项的概率评定分别是18%、22%和33%。显然,死于癌症、心脏病及“其他自然原因”的人数加在一起,就等同于自然原因死亡的总人数。但这里所反映的数字却并不相等,第二组对所有自然原因死亡人数的估计值加在一起是73%(18%+22%+33%),明显要高于直接针对这个类别估计而不进行特别拆分的结果(58%)。

这个“自然原因死亡率”的例子是隐含性析取问题的一个典型例证。当评价析取问题(所有自然原因导致的死亡率)时,被试是次可加性的(subadditive)——对总体类别的估计值,通常要比分别对类别中每个成分进行估计的总和要小。人们在进行析取判断时,倾向于减少为认知付出的努力。因此,他们并不会清晰地展开判断所包含的每个成分的情况。而如果他们依此要求展开包含的项目,并且依次关注其中每个亚成分的话,每一个成分都会刺激大脑提取涉及其发生概率的证据信息。可见,分开思考每个成分与对整体进行思考相比,我们会提取到更多的有关线索。

赌徒谬误

请回答下面这两个问题:

问题A: 想象我们在掷一枚硬币(有50/50概率朝上或朝下的硬币),并且之前的五次都是正面朝上。第六次投掷时,你认为:

______更可能是反面朝上;

______更可能是正面朝上;

______第六次投掷时反面或正面朝上的概率相等。

问题B: 玩老虎机时,人们通常在10次中会有1次获胜,然而朱莉却在头三次玩时都获胜了。你认为她在下一局也会获胜的概率有多大?______分之______

这两个问题可以检验出人们是否容易犯一种所谓的“赌徒谬误”,即人们倾向于把过去事件和未来事件联系起来考虑,尽管实际上两者是独立的(Ayton&Fischer,2004;Burns&Corpus,2004;Croson&Sundali,2005)。如果一个事件的发生不会影响另一个事件发生的概率,这两个结果间就是独立的。大多数采用了标准设备的投机游戏都有这种属性。例如,旋转一个赌场中常用的轮盘赌,其每次出现的数字同上一次的结果间就是独立的。轮盘赌上有一半的数字是红色,另一半是黑色(出于简化考虑,我们忽略了其中绿色的0及00格),所以任一次旋转出现红色的概率都是对半值(0.5)。然而,在连续出现5次或6次红色之后,许多下注者转投黑色,认为现在黑色更有可能出现。这就是赌徒谬误:他们表现出认为先前的结果似乎会影响下一个结果的出现,而实际上两者间是完全独立的。在这种情况下,下注者产生了错误的信念。轮盘赌并没有对先前发生的情况的记忆,即使已经连续出现了15次红色,下一次旋转会出现红色的概率仍然是0.5。当然,这里要强调的是,这种情况的前提是事件间确实是独立的(不是歪的轮盘赌、灌铅的骰子或是假硬币等)。

在上述问题A中,有的人认为5次正面之后正面或是反面更有可能出现,这样想也是犯了赌徒谬误。正确的答案是,在第6次投掷时,正面或反面的出现具有相同的可能性。同样,在问题B中,任何不是1/10的回答也都反映出了赌徒谬误。

赌徒谬误并不限于无经验的人。研究发现,即使是对于惯常性的赌徒(一周在投机游戏上花费超过20小时),他们仍然会表现出赌徒谬误(Petry,2005;Wagenaar,1988)。事实上,研究发现接受病态赌博问题治疗的人,比控制组更倾向于相信赌徒谬误(Toplak,Liu,Macpherson,Toneatto&Stanovich,2007)。

需要注意的是,赌徒谬误并不仅仅局限于投机游戏中,它在任何概率有重要作用的领域都会发生,而这几乎包含了所有的事。婴儿的基因构成就是其中一个例子。心理学家、医生以及婚姻咨询家经常都会遇到一对夫妇在生了两个女孩之后,想要生第三个孩子,因为“我们想要男孩,这次肯定会是男孩”。当然,这也是一种赌徒谬误。在生了两个女孩之后生男孩的概率(大约50%),同一开始时(大约50%)是完全一样的,之前生的两个女孩不会让第三个孩子是男孩的概率增加。

赌徒谬误涉及人们在思考概率事件的概率时会犯的多种错误。其中一种信念就是,认为如果一个过程确实是随机的,不会有序列——即使是很小的序列(比如六次硬币的投掷)——出现连串或模式情况。人们经常性地低估了连串(正正正正)和模式情况(正正反反正正反反正正反反)在随机序列中出现的概率。因为这个原因,人们即使试图这么做,也不能产生真正的随机序列,他们产生的序列通常只有很少的连串和模式情况。在产生这种随机序列时,人们过多地以一种错误地方式更改了他们的选择,以减少可能出现的各种规律性结构(Nickerson,2002;Towse&Neil,1998)。

人们的这种倾向,可以轻易被那些声称自己有某种精神力量的人所利用。以一个经常在心理学课上进行的展示为例进行说明。

学生们被要求从数字1、2、3中多次随机选取组成一个200个数字的列表。完成后,这列数字不让教师看到。这时,教师让学生们看他们列表中的第一个数字,由教师尝试猜测这个数字是多少。教师猜测后,学生再告诉其他同学和教师正确答案。教师每次的猜测是否正确会被记录下来,这个过程一直持续直到200个匹配或不匹配结果记录完全。在这个程序开始前,教师宣称他会在实验中读取学生的思想,展示出一种“精神力量”,并询问大家什么程度的表现,即猜中率,可以作为有精神力量存在的一个有力证明。通常学过统计课程的学生会提出,因为纯粹从概率上考虑,大约会有33%的猜中率,教师要想让大家相信他所拥有的精神力量,就需要产生一个更高的比例,一般至少要大于40%。其他学生通常也会理解并认同这个观点。演示就此开始,最终,一个超过40%的结果产生了,大多数学生对这一结果都感到惊讶。

之后的课堂上,教师向学生们解释了随机性,并且说明假装具有这种精神能力其实是非常容易做到的。这个例子中的教师,其实只是利用了人们不会产生足够的连串数这一事实:他们在产生“随机”数字时加入了太多认为修改的成分。在一个真正的随机数列中,连续三个2之后再出现一个2的可能性有多大?1/3,这同出现1或3的概率是一样大的。但这并不是大多数人产生这些数字的方法。即使在一个很小的连串序列后,人们也会倾向于改变数字来获得一个他们认为更具代表性的序列。因此,在我们这个例子的每一次猜测中,指导者只须在学生前一次没有选取的两个数字中选择一个。也就是说,如果在前一轮中学生们选择的是2,指导者只须在下一次选择1或3;如果前一轮学生选的是3,指导者在下一轮就选择1或2。这个简单的程序通常会保证猜测者得到一个高于33%的命中率,从而高于没有精神力量下的纯机会水平准确率。

人们相信如果一个序列是随机的,那么它将不会出现连串或模式情况的这种倾向,在2005年爆发的一场关于苹果iPod随机播放功能的争议中,得到了有趣的体现(Levy,2005)。这个功能可以将iPod中下载的歌曲以一个随机的顺序进行播放。然而,这项功能却引起了大量的争议——用户抱怨这个随机播放功能不可能是随机的,因为他们经常听到一连串来自同一唱片集或同一类型的歌曲。显然,了解我们刚刚讨论过的人们这类判断误区的心理学家和统计学家,都会在看到人们的这种必然反应时暗自发笑。技术文档作者史蒂文·里夫(Steven Levy,2005)描述了他对此的感受:他的播放器似乎总是在播放的第一个小时里,对Steely Dan乐队的歌曲有特别的钟爱。但是,里夫接受了专家给他的解释:真正的随机序列经常在人们看来并不是随机的,因为我们有种对任何事情都施加自身模式的倾向。在对这个问题进行深入研究之后,里夫总结说,“生活可能确实是随机的,iPod很可能也是。但我们人类总会为了控制这种无序而提供我们自己的解读和模式,如果这其中有错的话,错也是在我们自己身上,而不是随机播放的功能”。

概率对比:临床预测相比统计预测

概率理念能够让我们理解并且尽量避免犯下赌徒谬误——这也是一种普遍的不需数学运算的知识。与这种见解相似,我们还应深刻理解到,我们所看到的世界中发生的大部分事件,其实都是由机会性和系统性因素的复杂混合所带来的结果。因此,我们需要明确意识到,导致事件结果产生变异的一部分原因是随机性因素(由机会决定)。

在解释事件结果时不愿承认机会性因素的作用,事实上会降低我们对现实事件进行预测的能力。承认机会性因素在结果中的影响作用,意味着我们必须接受预测永远不可能是100%精准的事实,承认我们总会在预测中犯错。然而,有趣的是,承认我们的预测只能有低于100%的精准率,实际上可以帮助我们提高整体的预测精准度(Dawes,1991;Einhorn,1986)。这一点可以用认知心理学中一个已经研究了数十年的、非常简单的实验任务来进行说明(Fantino&Esfandiari,2002;Gal&Baron,1996)。

被试坐在两盏灯前(一盏红色、一盏蓝色),这两盏灯在实验中大约会有几十次闪烁过程,他们需要预测实验中的每一次哪盏灯会闪(被试通常在预测准确后会被给予报酬)。实际上,实验者将灯的程序设定为随机闪烁,并按照闪烁次数红灯闪烁70%,蓝灯闪烁30%的比例。被试很快就会发现红灯闪烁的次数更多,他们预测红灯相比蓝灯会在更多的实验次数中闪烁。甚至,他们已经能够预测到红灯大约会在70%的次数中闪烁。但被试总认为灯的闪烁是有模式可循的,从未想过这个顺序其实是随机的。因此,他们试图每次都能预测准确,来回变换红灯或蓝灯的猜测,并且在大约70%的次数中预测红灯,在大约30%的次数中预测蓝灯。然而,这并不是最优策略。

让我们仔细考虑一下这种情况背后的逻辑。如果被试在大约70%的次数中预测红灯,在大约30%的次数中预测蓝灯,而实际上红蓝灯只是以70:30的比率随机出现,被试将有多少次能够预测准确?我们来计算下实验中进行了100次后的情况:这时被试已经注意到红灯出现的次数更多,并且按照大约70%的比例预测红灯的出现。在100次中的70次,红灯会闪烁,被试会在这70次中的大约70%次预测正确(因为被试在70%的次数中预测红灯)。也就是说,在70次中的49次(70×0.70),被试会正确预测出红灯的出现。而在100次实验中的30次,蓝灯会出现,被试会在这30次中的30%次正确(因为被试在30%的次数中预测蓝灯)。也就是说,在30次中的9次(30×0.30),被试会正确预测出蓝灯的出现。因此,在100次实验中,被试大约会有58%的时间正确(49次成功预测红灯加上9次成功预测蓝灯)。但是要注意到,这种表现所获得的正确率,明显劣于被试只是单纯地发现哪种灯出现的次数更多,然后一直坚持预测这个灯会亮能获得的正确率(我们把它称为“100%红灯策略”)。在100次实验中,70次红灯闪烁,被试将预测成功所有的70次。对于30次蓝灯闪烁,被试一次都未猜中,但仍然可获得高达70%的预测正确率,这一结果比被试想要每次都猜中所以来回更换的结果58%,要高出12%!

最优策略确实也有不足之处,即每次蓝灯亮时预测都将是错误的。由于蓝灯确实会在至少一部分的实验次数中出现,永远不去预测它看起来似乎是不对的,但这正是正确的概率思维所要求的。它要求我们接受每次蓝灯亮时的错误,来获得每次都预测红灯的这种更高的整体命中率。简而言之,我们必须接受蓝灯预测错误,从而换取整体上更少的错误。

然而,接受错误来换取更少的错误是一件很难做到的事,心理学中长达40年有关临床预测和统计预测的研究就证明了这一点。统计预测指的是基于来自统计记录的群体(即集合)的规律来进行预测。一个简单的统计预测例子是,对拥有某一相同特征的个体都预测以同一个结果。举例说明,对不吸烟的人都预测以77.5岁的寿命,而对吸烟的人都统一预测以64.3岁的寿命。如果考虑更多的群体特征,还可以获得更精确的预测结果(使用统计方法如多元回归)。例如,对吸烟、超重并且不运动的人预测其寿命为58.2岁,就是基于一系列特征(吸烟行为、体重、运动量)进行统计预测的一个例子。这种预测几乎总比采用单一变量进行的预测要准确许多。这种统计预测在经济学、人力资源、犯罪学、营销、医学及大部分心理学的子学科,如认知心理学、发展心理学、组织心理学、人格心理学和社会心理学中都有广泛应用。与之相反,一些临床心理学从业者声称,他们能够超越群体预测,对特定个体给出更准确的预测结果,这种方法被称为临床或个例预测。当采用临床预测时,与统计预测相反:

职业心理学家声称他们可以对个体做出超越“人们整体上”或有关不同类型人的预测……职业心理学家不同的地方就在于,他们认为每个个体都是独特的,不能把他们当作某个集体中的一员而采用统计归纳的方法。他们声称可以对一个个体的生活做出“是什么引起了什么”的精确分析,而非阐述什么在“大体上”是对的(Dawes,1994)。

临床预测看起来似乎是对统计预测一种非常有效的辅助。然而问题是,临床预测并不准确。

如果临床预测确实有用,那么临床医生和客户的接触以及其所使用到的有关客户的信息,就应当较简单地编码有关客户的信息,然后按照最优化原则组合定量数据的统计方法,能够产生更好的预测结果。简而言之,这种主张认为,心理医生的经历让他们能够超越已有研究中发现的聚合型关系来进行预测。因此,可以通过这点简单地检测出临床预测是否真的是有效的。不幸的是,经过检验后,这个主张并不可靠。

有关临床和统计预测这一问题的研究结果非常一致。自从保罗·米尔(Paul Meehl)1954年出版了他的经典著作《临床和统计预测》之后,40多年来有100多项研究都表明,几乎在每个检验过的临床预测领域(心理治疗结果、保释表现、大学毕业率、电击疗法效果、刑事累犯倾向、精神疾病住院时长等),统计预测的表现都优于临床预测(如Dawes,Faust&Meehl,1989;Goldberg,1959,1968,1991;Swets,Dawes&Monahan,2000;Tetlock,2005)。

在一系列的临床预测领域,心理医生在拿到了有关某病人的信息后被要求做出对病人行为的预测,相同的信息再由统计方程进行量化和处理,而这些统计方程都是基于研究发现的精算关系发展出来的。对预测结果的比较一致性地表明,使用方程的方法更优。也就是说,统计预测比临床预测更准确。事实上,即使相比统计的方法,心理医生持有更多的预测信息,前者的结果也是更佳的。这样看来,当心理医生通过私人接触和面谈获得了更多有关客户的信息后,再加上与统计公式所用相同的信息,他们做出的临床预测仍然达不到统计预测的精准度,“即使处于信息上的优势,临床判断仍然不能超过统计方法;事实上,接触额外的信息经常对缩小两种方法的差距毫无作用”(Dawes et al.,1989)。原因当然是,公式能够精准并一致地整合信息。这种一致性因素可以超越心理医生通过私人方式收集到的任何信息优势。

临床–统计预测文献中用到的最后一种检测方法,是给心理医生展示统计方程的预测结果,让其根据自身与客户的接触对这个预测结果进行调整,而心理医生对统计结果的调整通常都实际上降低了预测的精准度(Dawes,1994)。这也是和我们之前提过的预测亮灯实验有密切相关的,未能做到“接受错误从而降低错误”的一个例子。在之前那个例子中,被试未能按照红灯出现更多这个统计信息,采取每次都预测红色的策略(得到70%的正确率),而是通过不断改变红绿灯预测的方式试图在每次预测中都能够得到正确结果,最终却获得了与前者相比减少了12%的正确率(他们只在大约58%的实验次数中正确预测)。类似地,这些研究中考察的心理医生,相信他们自身的经历给了自己一种“临床洞察力”,从而能够做出一种比采用客户生活中量化信息的预测方式更好的预测。实际上,他们的这种“洞察力”并不存在,反而致使他们得出的预测效果,比仅使用公共的、统计上的信息获得的预测结果更差。值得注意的是,统计预测的优势并不局限于心理学,而是延伸到很多其他的应用学科。例如,关于医学上心电图的读取(Gawande,1998)。

瓦赫纳尔和克伦(Wagenaar&Keren,1986)指出,对个人知识的过度自信和对统计信息的轻视,导致了人们忽视使用安全带的倡议运动。人们总觉得,“我不一样,我开车很安全”。问题是,超过85%的人都认为自己是“高于平均水平的驾驶员”(Svenson,1981)——这一结果显然是很荒谬的。

患有长期赌博问题的人,思维中也存在一种同样的谬误,相信“统计规律适用于某一局”。在他对赌博行为的研究中,瓦赫纳尔(1988)总结说:

在我们关于赌徒的讨论中,可以很明显看到,赌徒通常知道长期赌博是会带来负面结果的。他们知道自己已经输得比赢得多,并且这一结果在未来也会是一样的。但是,他们不能将这种统计考虑实际应用于下一局、下一小时或下一晚。这种启发式的多次重复……让他们以为统计规律并不适用于下一局或下一小时,以为他们能够预测到下次的结果。

瓦赫纳尔发现强迫性赌徒有一种强烈的倾向——不去“接受错误从而降低错误”。例如,赌徒有一种倾向,会拒绝采用一种称为“基础法”(basic)的策略,这种策略能保证将赌场的优势从6%或8%,降到1%以下。这是一种长期的统计策略,强迫性赌徒不愿使用这种方法,因为他们认为“一个有效的策略应当在每种情况下都有效”。瓦赫纳尔研究中的赌徒“一致认为对这些体系的通用性对策不可能有效,因为这忽视了每一种特定情况的特异性”。因此,未能采用这种能够保证他们少损失数千美元的统计策略,这些赌徒也踏上了一条试图基于每个特例的特质进行临床预测的不归之路。 NBS1039qHN/qYYW7aP0+KeW5SgHbih/V6RIwGpA0xHXNfCh+xs44IchTA/RzxRMf

点击中间区域
呼出菜单
上一章
目录
下一章
×