你可以回答的问题数量是无限的,无论问题是别人提出的,还是你问自己的。你可以评估的属性数量也是无限的。你能算出本页有多少个“的”字,能比较你家和街对面人家窗户的高度,能用量表(从光明到惨淡)评估参议员的政治前途。这些问题都由系统2来解决,它会引导注意力,搜索记忆以找到答案。系统1的运作方式与之不同。它不断监测大脑内外发生的事情,不断对形势的各个方面进行评估。其运作没有具体意图,几乎不费什么力气,或者说毫不费力。这些基础评估在直觉判断中发挥着重要作用,因为人们很容易用它们来代替较难的问题——这是启发式与偏差方法的基本理念。系统1的另外两个特征也支持判断之间的替换。其一是跨维度的数值转换能力。“如果山姆的身高跟他的智商一样,他有多高?”这是一个大多数人都觉得很简单的问题。回答它时,你就在运用这个能力。另一个是思维霰弹枪。系统2回答特定问题或评估情况的特定属性,这种意向会自动触发其他评价程序,包括一些基础评估。
系统1是进化的结果,它持续评估生物体生存必须解决的重要问题。比如,事情进展如何?是否存在威胁或良机?一切正常吗?我应该靠近还是逃避?相比大草原上的羚羊,这些问题对都市人来说可能没那么紧迫,但我们继承的神经机制持续对威胁进行评估,这是无法关闭的。我们不断用“有利”或“不利”来评估形势,做出逃跑或靠近的判断。好心情和认知轻松就是人类对安全性和熟悉度的评估。
一眼区分敌友的能力就是基础评估的一个具体例子,这种能力提高了人在危险世界中生存的概率,并且在实践中不断被增强。我在普林斯顿大学的同事亚历克斯·托多罗夫探索了这一能力的生物学根源。
他表示,我们有一种天赋,只需要看一眼陌生人的脸,就可以评估关于此人的潜在的几个关键事实:他有多强势(潜在的威胁),可信度有多少,以及他的目的更有可能是善意的还是敌意的。
脸型为评估一个人的强势程度提供了线索,比如“硬朗的”方下巴就是强势的信号。面部表情(微笑或皱眉)为评估陌生人的意图提供了线索。方下巴配以下垂的嘴角可能预示着会有麻烦。
人脸解读的准确性并不高:圆下巴并非温顺的可靠标志,微笑(在某种程度上)也可以是伪装的。尽管如此,评估陌生人的能力仍给我们带来了生存优势。
在现代社会,这种古老的机制有了新用途:它会在一定程度上影响投票方式。托多罗夫向学生展示了一些男性的面部照片,有时照片只出现0.1秒。他要求学生根据各种特征(包括好感度和能力)对其进行评估。学生的评估非常一致。托多罗夫展示的面孔不是随机选择的,而是政治家的竞选照片。学生不了解这些人的政治背景,依据的只是一闪而过的照片。托多罗夫将选举结果与学生的评估进行了比较。在约70%的参议员、国会议员和州长竞选中,获胜者正是照片评估中得分较高的候选人。这一惊人的结果很快在各种选举中得到了证实,包括芬兰的全国大选、英国的区委会选举以及澳大利亚、德国和墨西哥的选举。
出乎意料的是(至少对我来说),相比好感度评估,托多罗夫研究中的能力评估对投票结果的预测更准确。
托多罗夫发现,人们通过强势和可信度来判断能力。干练的面孔表现为硬朗的下巴和自信的微笑。没有证据表明这些面部特征可以预测执政能力。科研人员研究了大脑对竞选获胜者和失败者的反应,结果表明,对那些缺乏我们所看重的特质的候选人,我们会本能地排斥——在这项研究中,失败者唤起了较强的负面情绪反应。这是启发式判断的一个例子,我将在后续章节中提到。选民想要对候选人的任期表现形成印象,依靠的却是一种较简单的评估,这种评估速度很快,自动执行,并在系统2必须做决策时发挥作用。
政治学家跟进了托多罗夫最初的研究。他们识别出一类选民,其系统1的自动偏好更有可能发挥重要作用。这类选民不了解政治、花大量时间看电视。不出所料,他们往往通过面部特征判断候选人的能力,这一效应对投票的影响大约是消息较灵通、较少看电视的选民的三倍。
显然,系统1在投票决策中的相对重要性因人而异。在后面,我们还会遇到体现个体差异的其他例子。
系统1当然能理解语言,而理解取决于例行的基础评估,这种判断是感知事件、理解信息的一部分,包括对相似性和代表性的计算、对因果关系的归因以及对关联和样本可用性的评估。尽管评估目的是满足任务的要求,但即使没有具体任务,系统1也会进行评估。
基础评估的内容很多,但并非所有可能的属性都得到了评估。请看图8-1。
图8-1
只需一眼,你就能对该图的很多特征产生直接印象。你知道,左右两堆积木一样高,其相似度大于左边与中间积木的相似度。但你不会马上知道左边的方块数量与中间的方块数量相同,你也想不出用这些方块搭起的物体有多高。要确认方块数量是否相同,你需要分别数一下,再对比结果。这项任务只有系统2才能执行。
再举一个例子。思考以下问题:图8-2中线条的平均长度是多长?
图8-2
这个问题很简单,系统1无须提示就能回答。实验表明,人们只需不到1秒就能精确地说出平均长度。此外,判断的准确性不会因观察者的认知忙碌(比如执行记忆任务)而降低。他们不一定能说出平均长度是多少英寸
或厘米,但能非常准确地调整另一条线的长度以匹配平均值。对平均长度的印象不需要系统2的参与,系统1会自动而轻松地完成,这个过程就像注意到线条的颜色,以及它们不平行的事实一样自然。我们还可以对众多物品的数量形成直接印象——数量少于4个,印象就精准;数量多于4个,印象就模糊。
现在来看另一个问题:图8-2中线条的总长度是多少?这是一种不同的体验,因为系统1无法提供任何建议。要回答这个问题,唯一的方法是激活系统2,它会费力地估计长度均值,估计出或数出线条的数量,再将二者相乘。
系统1无法一眼算出一组线的总长度,这是显而易见的。你从未奢望自己能做到这一点。事实上,这个例子说明了系统1的重大局限。因为系统1通过一个原型或一组范例来表示类别,所以它擅长估计平均值,但在估计总和方面表现很差。在判断被我称为“求和变量”的内容时,类别的规模,即包含的事例数量,往往会被忽视。
埃克森公司的“瓦尔德斯”号油轮原油泄漏事故的诉讼案引发了众多实验,其中一项实验的受试者被问及是否愿意支付保护网的费用,以覆盖导致候鸟丧生的漏油区域。
受试者按自愿拯救的候鸟数量分组,分别是2 000只、20 000只和200 000只。如果拯救候鸟是一种经济商品,那么它应该是一种求和变量:拯救200 000只鸟应该比拯救2 000只鸟的价值高得多。事实上,三组的平均捐款分别为80美元、78美元和88美元。鸟的数量差别对捐款额的影响很小。三组受试者只对同一个原型做出反应,那是一幅可怕画面:一只无助的鸟儿溺水了,羽毛浸在黏稠的原油中。在这种情感环境中,人们几乎完全忽视了数量。这一结论已被多次实验所证实。
关于你的幸福感、总统的受欢迎程度、对金融罪犯的合理惩罚以及政治家的未来前途,这些问题都有一个重要特征:它们都涉及强度或数量,可以用“更”来描述,如更幸福、更受欢迎、更严厉或更有影响力(对政治家来说)。例如,对候选人政治前途的评估,可以从最低级的“她将在初选中被淘汰”到最高级的“有朝一日,她将成为美国总统”。
此时,我们见识了系统1的一种新能力。强度的基本等级可以在不同维度上进行匹配。如果用颜色来表示罪行,那么谋杀是比盗窃更深的红色。如果用音乐来表达罪行,那么大屠杀是最强音,屡次逃交停车费则是最弱音。当然,我们对惩罚的强度也有类似感受。在一项经典实验中,部分受试者根据罪行的轻重调整音量,其他受试者根据法律制裁的轻重调整音量。如果你听到两个音,一个代表罪行,另一个代表惩罚,当一个声音比另一个高很多时,你会感到不公平。
思考以下例子。后文会再次提到这个例子。
朱莉4岁时就能流利地阅读。
现在将朱莉作为儿童的阅读能力与以下句子中提到的强度等级相匹配:
某人的身高可与朱莉的早慧程度媲美,他有多高?
你觉得6英尺合适吗?显然太矮了。7英尺呢?可能太高了。你在寻找一个与4岁儿童优秀的阅读能力相匹配的身高——很出色,但算不上异乎寻常。15个月大就能阅读才算异乎寻常,就像某人身高7.8英尺一样。
你的工作收入达到什么水平才能与朱莉的阅读能力相匹配?
哪种罪行的严重程度可与朱莉的早慧相匹配?
常春藤盟校的多少GPA(平均学分绩点)可与朱莉的阅读能力相匹配?
这些问题不太难,是吧?另外,你尽可以放心,与你处于同一文化环境中的人也会给出类似的答案。我们将了解到,当被要求根据朱莉学会阅读的年龄来预测她的GPA时,人们的解决方法是转换范畴,选择与阅读等级相匹配的GPA。对系统1来说,通过匹配进行预测完全是自然而然的事。而且,除了统计学家,大多数人的系统2也接受这种模式。我们将了解到,从统计学的角度看,这种模式为何是错的。
系统1每时每刻都在进行大量计算,有些是持续进行的例行评估。只要眼睛是睁着的,大脑就会计算视野中物体的三维表征,包括形状、空间位置及其特性。这种计算活动或对意外的持续监控无须刻意触发。与常规评估不同,其他计算只在需要时才进行:你不会持续评估自己有多幸福或多富有;即使热衷政治,你也不会持续评估总统的前途。系统1很少主动判断,只在有意向时才会那么做。
你不会自动计算读到的每个单词的音节数,但你如果愿意,就可以这样做。然而,我们对刻意计算的控制很不精准:计算量常比我们想要或需要的多。我将这种过度计算称为思维霰弹枪。用霰弹枪瞄准一个点是不可能的,因为它发射的子弹会散开。瞄准的难度堪比系统1的自控难度——对于系统2的指示,系统1很难不画蛇添足。很久之前我读到的两个实验报告说明了这一点。
在一项实验中,受试者听到几组成对的单词,研究人员要求他们在发现单词押韵时立即按键。
下面两对单词是押韵的:
VOTE—NOTE
VOTE—GOAT
因为你看到了这两对单词,所以会觉得区别很明显。VOTE和GOAT押韵,但拼写不同。受试者只能听到单词,但他们也受到拼写的影响。如果拼写不一致,他们识别单词押韵的速度会明显放慢。尽管只需要比较单词的发音,但受试者也会比较单词的拼写,无关维度的不匹配减慢了他们的识别速度。回答一个问题的意图唤起了另一个问题,这不仅多此一举,还不利于主要任务的执行。
在另一项研究中,受试者听到几句话,研究人员要求他们在识别句子对错后尽快按下两个不同的按键。
对以下句子的正确反应是什么?
有些路是蛇。
有些工作是蛇。
有些工作是监狱。
这三句话在字面意义上都是错的。然而,你可能注意到,第二句比另外两句错得更离谱——实验中收集的反应时间证实了这一显著差异。造成差异的原因是,从比喻的角度来看,第一句和第三句是对的。我们再次看到,执行一个计算的意图唤起了另一个计算。正确答案在冲突中再次占了上风,但与无关答案的对抗干扰了任务的执行。为什么我们对许多所知甚少的事情做出直觉性判断?在下一章我们将了解到,思维霰弹枪与强度匹配相结合就是原因所在。
“评估某人是否有吸引力属于基础评估。无论你是否愿意,评估都会自动进行。这会对你产生影响。”
“大脑中有一些回路,可以通过脸型评估此人是否强势。他看起来就像个领导。”
“惩罚的力度与罪行要匹配,否则我们就会觉得不公平。就像可以将音量大小与光线强弱相匹配一样。”
“这个例子可以明确说明思维霰弹枪。有人问他这家公司的财务状况是否良好,他想到的却是自己喜欢该公司的产品。”