伟大的喜剧演员丹尼·凯说过一句话,这句话我从青少年时期一直记到现在。他这样形容某个他讨厌的女士:“她最拥护的立场是站在自己这边,她最热衷的活动是妄下结论。”我记得第一次与阿莫斯·特沃斯基讨论统计直觉的理性时,这句话就浮现在脑海,现在我认为它恰当地描述了系统1的功能。如果结论可能是正确的,偶尔犯错的代价是可承受的,而且快速下结论能节省大量时间和精力,那么这样做效率很高。但是,在不了解局势、风险很高、没有时间收集更多信息的情况下,妄下结论是危险之举。此时很容易出现直觉性错误,这些错误可以通过系统2的刻意干预来预防。
请看图7-1。
图7-1
图7-1中的三幅图有什么共同点?答案是它们都是模棱两可的。你几乎可以确定,左图读作“ABC”,右图读作“12 13 14”,但两幅图中间的字符其实是一样的。你本可以把它们读成“A 13 C”或“12 B 14”,但你没有。为什么?因为相同的形状在字母环境中会被解读为字母,在数字环境中会被解读为数字。整体环境有助于你理解每个元素。形状有歧义,但你能快速确定其身份,在不知不觉中消解了歧义。
对于中间这幅图的内容,你可能会想象一个满脑子是钱的女人安(Ann),正朝一栋有出纳员和保险库的大楼走去。这个解释看似合理,却不是唯一可能的解释。这个句子有歧义。如果这句话前面的话是“他们缓缓地顺流而下”,你会想象出一个完全不同的场景。想到河流时,“bank”这个词就与金钱无关了。(“bank”既可表示“银行”,又可表示“河岸”。)在没有明确语境的情况下,系统1自己生成了可能的语境。我们知道这是系统1在运作,因为你没有意识到存在另一种解释的选项或可能性。除非你最近在划独木舟,否则你去银行的时间可能比在河上漂流的时间长,你根据这一事实消解了歧义。在不确定的情况下,系统1会根据经验赌一个答案。下注的规则是明智的:在决定如何解释时,权重最大的是最近发生的事和当前的环境。想不起最近的事件时,更远的记忆会占据主导地位。我们童年时最难忘的经历是唱“ABC”,而不是“A 13 C”。
对于这两个例子,最重要的一点是,你做出了明确的选择,但并没有意识到。你只想到了一种解释,没有意识到其中的歧义。系统1没有注意到被否决的替代方案,甚至没有注意到替代方案的存在。有意识的怀疑需要在大脑中同时持有互相矛盾的解释,这会消耗脑力,不属于系统1的能力范畴。不确定性和怀疑是系统2的功能。
心理学家丹尼尔·吉尔伯特因著有《哈佛幸福课》而广为人知。他曾写过一篇论文,题为《心智系统如何相信》。在这篇论文中,他沿着17世纪哲学家巴鲁赫·斯宾诺莎的思路,创建了相信与不相信理论。吉尔伯特认为,理解一个说法的起点是尝试相信它:你必须首先知道,如果这个说法是正确的,它表达的是什么意思。只有这样,你才能决定是否“不相信”它。在初始阶段尝试相信,是系统1的自动运作,构想出对情况最合理的解释。吉尔伯特认为,即使是一句荒谬的话,也会唤起最初的信任。看一下他举的例子:“白鱼吃糖果。”当关联记忆自动寻找鱼和糖果之间有意义的联系时,你或许就对它们产生了模糊的印象。
吉尔伯特认为“不相信”属于系统2的活动。他以一个巧妙的实验来证明其观点。
受试者看到了一些荒谬的断言,比如“丁卡是一团火”,几秒钟后出现“对”或“错”的字样。随后,受试者接受记忆测试,回忆自己给哪些句子标记了“对”。实验还有一个条件,即受试者要在执行任务时记住几个数字。对系统2的干扰产生了选择效应:它使人很难“不相信”错误的句子。在后续的记忆测试中,精疲力竭的受试者认为许多错句都是正确的。该实验寓意深远:当系统2忙于他事、分身乏术时,我们几乎无所不信。系统1容易上当受骗,倾向于相信,系统2负责怀疑和不信任,但它有时很忙,而且经常偷懒。有证据表明,人们在疲劳或精力耗尽时,更有可能受空洞却有说服力的信息影响,比如广告。
关联记忆导致普遍的确认偏差。面对两个问句——“山姆友善吗?”和“山姆不友善吗?”,你想到的有关山姆行为的例子是不一样的。刻意寻找确证,被称为“正向检验策略”,这也是系统2检验假设的方式。科学哲学家建议通过反驳来检验假设,但人们(包括科学家)经常反其道而行之,寻找可能支持其现有信念的数据。系统1的确认偏差倾向于不加批判地接受建议,夸大极端事件和小概率事件的可能性。如果有人问你,未来30年内加州发生海啸的可能性,你的反应可能会类似于看到吉尔伯特提出的荒诞例子——“白鱼吃糖果”时的反应。你脑海中浮现的很可能是海啸的画面,你会高估灾难发生的概率。
你如果支持总统的政见,可能也会喜欢他的声音和外貌。喜欢(或讨厌)某人,就会喜欢(或讨厌)这个人的全部(包括你没注意到的方面),这一倾向被称为光环效应。这个词在心理学领域已使用了一个世纪,却没有成为日常用语。这很遗憾,因为它表达了一种常见的偏差,这种偏差在塑造我们对人和形势的看法方面起着重要作用。光环效应是系统1产生的用来表现世界的方式之一,这种表现比现实更简单、更连贯。
你在聚会上遇到一位名叫琼的女士,发现她风度翩翩,还很健谈。现在,你一想到她的名字,就觉得她可能是慈善事业潜在的捐助者。你知道琼有多慷慨?事实是,你对此一无所知。几乎没有理由相信,在社交场合表现友善的人也是慷慨的捐助者。但你喜欢琼,想起她时,对她的好感就涌上心头。你也欣赏慷慨的气度,喜欢大方的人。通过联想,你倾向于相信琼是慷慨的。现在,你认为琼很慷慨,你可能比以前更喜欢她,因为你在她友善的品质中又增加了慷慨。
认为琼是慷慨的,这一结论没有真实的证据。你通过猜测填补证据的空白,这种猜测与你对她的情感反应一致。在其他情况下,证据是逐渐积累的,人们做出的解释由第一印象附带的情感决定。在一项经典心理学实验中,所罗门·阿希描述了两个人的特质,要求受试者对他们进行评价。
你认为艾伦和本是怎样的人?
艾伦:聪明—勤奋—冲动—挑剔—固执—嫉妒
本:嫉妒—固执—挑剔—冲动—勤奋—聪明
如果你的评价与大多数人一致,你会觉得艾伦比本好很多。前几项特征会改变后面出现的特征的含义。人们认为,聪明的人有理由固执,可能还会因此受到尊重,但嫉妒、固执的人还很聪明,就更加危险。光环效应也是歧义被抑制的一个例子:就像单词bank一样,形容词“固执”也是有歧义的,人们会让它与语境相契合,以此解释其含义。
围绕这个研究主题,人们进行了很多不同的实验。在一项研究中,研究人员先让受试者考虑描述艾伦的前3个形容词,然后再考虑最后3个。他们被告知,后3个特质属于另一个人。当受试者想象出这两个人时,研究人员问他们,用这6个形容词描述同一个人是否合理,大多数受试者认为不合理!
我们对某人特征的观察顺序往往是随机的。然而,顺序很重要,因为光环效应加大了第一印象的重要性,有时甚至让人对后续信息视而不见。我刚任教授时,用传统方法给学生的期末论文打分。我会翻开某个学生的论文册,一篇接一篇打分,然后计算出总分,再为下一个学生打分。最终我注意到,对每本册子的不同论文,我给出的评分非常接近。我开始怀疑我的评分也存在光环效应,给第一篇论文的分数对总成绩产生了极大的影响。机制很简单:如果我给第一篇论文打了高分,那么即使后面的论文出现模糊或有歧义的陈述,我也会网开一面。这种做法貌似合理。第一篇论文写得这么好,这样的学生肯定不会在第二篇论文中犯低级错误!但我的评分方法存在一个严重的问题。如果某个学生写了两篇论文,一篇质量好,一篇质量差,我给出的期末成绩取决于先读的是哪篇。我曾告诉学生,两篇论文的分量一样,但事实并非如此:第一篇论文对期末成绩的影响比第二篇大得多。这是不可接受的错误。
后来,我采用了一种新流程。我没有按顺序阅读论文册的论文,而是先给所有学生的第一篇论文打分,然后给他们的第二篇论文打分。我将分数都写在册子末页,这样读第二篇论文时就不会有偏差(这种偏差甚至是无意识的)。改用新方法后不久,我发现我对评分质量的自信大幅下降,这令我感到不安。我经常体验到一种前所未有的不适感。当我对某个学生的第二篇论文感到失望,翻开册子末页准备给个低分时,我却发现我给他的第一篇论文打了高分。我还注意到,我想通过改变尚未写下的分数来缩小二者的差距,而且很难抵制这种诱惑。对同一个学生的不同论文,我经常给出差异很大的评分。缺乏连贯性让我感到沮丧和不确定。
相比以前,现在我对自己的评分质量不那么满意,也不那么自信,但我意识到这是一个好兆头,说明新流程更可靠。我之前享受的一致性是虚假的,它让我产生了认知轻松感,我的系统2在偷懒,欣然接受了最终成绩。之前,在评估后续论文时,第一篇论文带给我强烈的影响,这让我努力避免产生一种不和谐感,即发现同一个学生的不同论文质量差异很大。当我改用新流程时,令人不舒服的不一致性是真实存在的。它反映了两个问题:其一,以单一论题去衡量学生的学识,这种方法有缺陷;其二,我的评分不可靠。
我为克服光环效应采用的评分流程符合一个普遍原理:消除错误的关联!为了理解这一原理的运作方式,想象一下,向很多观察者展示几个装有硬币的玻璃罐,要求他们估计每个罐子中的硬币数量。詹姆斯·索罗维基在其畅销书《群体的智慧》中解释说,在这项任务中,个体判断的准确性很低,但群体判断的准确性非常高。
一些人的估计远远超过真实数量,另一些人则低估了它,但是,对所有人估计的数量进行平均时,均值往往很准确。这种机制很简单:所有人看到的是同一个罐子,所有判断都有共同的基础。另一方面,不同个体的估计错误互不相关,在没有系统偏差的情况下,错误的均值趋于0。然而,只有当观测结果互相独立且错误不相关时,降低错误的魔法才能很好地发挥作用。如果观察者有共同的偏差,判断的聚合就不会减少偏差。允许观察者相互影响,实际上减少了样本量,从而降低了群体估计的精确性。
要从多个证据来源中获得最有用的信息,应设法让信息源相互独立。这条规则是警察执法程序的一部分。当某个事件有多个目击证人时,在录口供之前,警方是不允许他们在一起讨论的。其目的不仅是防止不怀好意的证人相互串通,也在于避免公正的证人之间相互影响。互相交流的目击者往往会在做证时犯类似的错误,这会使他们所提供的信息的整体价值降低。消除信息源的冗余总归是个好办法。
公司高管在会议上耗费了大量时间,独立判断原则(以及“消除错误的关联”)也适用于会议的组织。一条简单的规则就能奏效:在讨论某个问题之前,先让与会者写一份简短的摘要,表明自己的立场。该流程充分利用了群体中各种知识和观点的价值。公开讨论的标准流程有一个弊端,那就是过度重视率先发言者或胸有成竹者的意见,导致其他人只能随声附和。
早年与阿莫斯合作时,最令我难忘的是他经常表演的一个滑稽段子。他惟妙惟肖地模仿他读本科时的一位哲学教授,用带着浓重德国口音的希伯来语吼道:“永远不要忘记‘Primat of the Is’。”我到现在也没搞懂这句话的确切含义(或许阿莫斯也是),但他的笑话总能一语中的。面对可用信息和未知信息,大脑的处理方式明显不同。每当遇到这种情况,他就会想起这句老话(后来这也成了我的习惯)。
关联机器的一个基本设计特征是,它呈现的只是被激活的想法。无法从记忆中提取(这甚至是无意识的)的信息就好像不存在一样。系统1擅长结合当前被激活的想法构建最有可能发生的故事,但它不会(也无法)考虑没掌握的信息。
衡量系统1是否取胜的标准是它所创造的故事的连贯性,故事所依据的数据数量和质量基本上无关紧要。在信息匮乏的常态下,系统1就像一台妄下结论的机器。思考以下问题:“明迪克会是好领导吗?她聪明又坚强……”你很快就想出了肯定的答案。你根据极少的信息选择了最合理的答案,但此时下结论为时尚早。如果接下来的两个形容词是“腐败”和“残忍”,你的答案又会是什么呢?
在匆忙认定明迪克是怎样的领导时,请注意你没做的事。你没有自问:“在判断某人的领导素质之前,我需要了解什么?”系统1从第一个形容词出现后就自顾自地运作起来:聪明是好特质,聪明又坚强就更好了。这是由两个形容词构建的最合理的故事。在认知非常轻松的状态下,系统1创建了这个故事。如果出现新信息(比如明迪克是腐败分子),故事就会被改写,但系统1不等待,不制造主观不适感,且看重第一印象。
寻求连贯性的系统1和懒惰的系统2结合在一起,意味着系统2将接受许多直觉性信念,这些信念反映了系统1生成的印象。当然,系统2也能更系统、更仔细地处理证据,在做决定之前会对照检查清单——想想买房这件事,你会刻意寻找未掌握的信息。然而,再谨慎的决策也会受系统1的影响。它每时每刻都在提供建议。
根据有限的证据妄下结论是理解直觉性思维的重要因素,本书经常提到这种情况。我会用一个冗长的缩写WYSIATI来表示“所见即一切”。对产生印象和直觉的信息质量和数量,系统1极不敏感。
阿莫斯和他在斯坦福大学带的两名研究生做了一项有关WYSIATI的研究,观察那些得到片面证据并对此心知肚明的人的反应。
他们报告了研究结果。受试者身处的都是法律场景,以下便是其中一例。
原告戴维·桑顿,43岁,工会界代表,于9月3日到168号平价大药房进行例行访问。到店不足10分钟,药房经理向他抗议说,不能继续在店内与工会员工交谈,必须等到休息时间,在后间交谈。这个要求符合与平价大药房签订的工会合同,但此前从未执行过。桑顿拒绝了。经理告诉他,要么遵守要求,离开药店,要么自己就报警,让警察逮捕他。此时,桑顿对经理说,只要不影响生意,他与员工10分钟的交谈一直是被允许的,他宁愿被捕也不愿改变例行访问的程序。经理随后报警,并以非法侵入罪将桑顿铐在店里。桑顿做了笔录,在拘留室待了一会儿。之后,所有指控都被撤销了。桑顿先生以非法拘留罪起诉平价大药房。
所有受试者都阅读了这一背景材料,除此之外,不同的小组还听取了控方或辩方律师的陈述。很自然,工会方的律师将此次逮捕描述为恐吓行为,而药店方的律师则辩称,在店里谈话扰乱经营秩序,经理的行为是恰当的。有些受试者,比如陪审团成员,听取了双方律师的陈述。双方律师并没有添加任何无法从背景故事中推断出的有用信息。
受试者完全了解其中的套路,那些只听到一面之词的人很容易想到对方的观点。然而,片面的证据对判断产生了重大影响。此外,相比看到双方证据的受试者,看到片面证据的受试者对自己的判断更有信心。这正说明,人们的信心取决于从现有信息中构建的故事的连贯性。一个好故事最重要的是信息一致,而不是信息完整。你经常会发现,知之甚少更容易让你将所知的一切融入逻辑连贯的模式。
“所见即一切”有助于获得连贯性和认知轻松,使我们相信某个说法是正确的。它解释了我们为何会快速思考,以及我们如何在复杂的世界中理解部分信息。很多时候,我们拼凑的连贯故事与现实很接近,足以支持合理的行动。然而,我还是会用“所见即一切”来解释各种判断和选择偏差。以下是其中的几种。
· 过度自信:正如“所见即一切”定律暗示的那样,在主观自信中,证据的数量和质量都不重要。人们根据自己的见闻构建故事,对信念的信心主要取决于故事的质量,即使所知甚少。我们经常忽视这种可能性,即我们并未掌握对判断起关键作用的证据,总是认为所见即一切。此外,我们的关联系统倾向于促发连贯的激活模式,抑制怀疑和歧义。
· 框架效应:以不同方式呈现同一信息往往会引发不同的情绪。“术后一个月的存活率为90%”的说法比“术后一个月的死亡率为10%”的说法更让人安心。同样,“脱脂率90%”的冷切肉比“脂肪率10%”的冷切肉更有吸引力。显然,两种说法的意思完全一样,但人们通常只看到一种表达方法,并认为所见即一切。
· 忽视基础比率:回想一下史蒂夫,这个性格温和、干净利落的人常被认为是图书管理员。个性描述鲜明而生动,尽管你知道,在男性人口中,农民比图书管理员多,但你第一次思考这个问题时,肯定没想到这个统计事实。所见即一切。
“她根本不了解此人的管理能力。她的判断只来自一次精彩报告产生的光环效应。”
“在进行任何讨论之前,先以独立判断来消除错误的关联。我们将从独立评估中获得更多信息。”
“他们做出的这一重大决定,依据的是某顾问的精彩报告。所见即一切。他们并没有意识到自己掌握的信息极少。”
“他们不想获得有可能毁掉故事的更多信息。所见即一切。”