长久以来,我一直为罗马数字所吸引。几个起始数字如此简单,而其他数字又复杂得令人迷惑,这看上去有点矛盾。起始的3个数字——Ⅰ(1)、Ⅱ(2)和Ⅲ(3)——所遵守的规律一目了然:有几个竖条就代表几。不过,数字Ⅳ(4)打破了这个规律,它引入了一个表面上完全看不出意义的新符号Ⅴ(5),以及一个减法运算——Ⅴ-Ⅰ,这个运算似乎是随意的,那为什么不用“6-2”“7-3”,甚至“2×2”呢?
回顾数字符号的历史,我们发现,前3个罗马数字就像是活化石,它们把我们带回到远古时代,那时人们还没有发明书写数字的方法。人们发现,想要记录他们拥有的绵羊或者骆驼的数量,只要在木棒上刻下相同数量的刻痕就可以了。这些刻痕是对计数的持久记录。事实上,这正是符号记数法最初始的形态,因为5个一组的刻痕可以代表任意5个客体。然而,这一史实更加凸显了罗马数字Ⅳ的神秘性。为什么人们放弃了这种简单实用的记数法?Ⅳ这个给读者带来注意和记忆负担的、任意的记号,又是如何取代 这个普通人都能理解的、简单明了的记号的呢?更重要的是,如果真是因为某种原因,记数系统需要做一些修订,那为什么前3个数字Ⅰ、Ⅱ和Ⅲ可以幸免呢?
难道这仅仅是个意外?一定有一些偶然事件影响了幸存至今的罗马数字符号的命运。然而,罗马数字Ⅰ、Ⅱ和Ⅲ的独特性,却具有一种超越了地中海国家历史的普遍特征。乔治·伊弗拉(Georges Ifrah)在他那本关于数字记数法历史的巨著中介绍 1 ,在所有文明中,前3个数字都是通过重复相应次数的代表“1”的符号来表示的,恰如罗马数字这样。而且,大部分的文明,甚至可能是所有文明,都会在数字大于3的时候停止使用这一规则(见图3-1)。比如,中文分别用1条、2条和3条水平横线代表数字1、2和3,却采用了一个差别相当大的符号“四”来表示数字4。再来看阿拉伯数字,尽管表面上看起来所有数字都是随意的,实际上它也遵循同一种规律。数字1是1条单独的竖杠,数字2和3实际上是书写时将2条和3条水平横杠连在一起的变形。只有4及以上的阿拉伯数字,才是真正随意的。
在世界各地,人们通过重复相应次数的相同符号来表示前3个数字。大于数字3或4时,几乎所有的文明都放弃了这种模拟记数法,这一现象表现出人类“即时”理解数字的局限。
图3-1 世界各地的模拟记数法
资料来源:重绘自Ifrah, 1994。
遍布世界的几十个人类社会最终选择了同一个解决方案。在几乎所有的社会中,前3个或4个数字都是由相应数量的记号组成,而接下来的数字基本上就是任意的符号。对于这种显著的跨文化汇集,需要一个具有普适性的解释。很明显,排列19个记号来表示数字19,对于写作和阅读都会是一个无法容忍的负担:一次写19个笔画,费时费力又容易出错,而且读者又该如何区分19与18和20呢?因此,一种比排列横杠更紧凑的记数法的出现似乎也合情合理。然而,这还是没有解释为什么所有地区的人一致选择在数字大于3或4的时候不再使用这种方法,不是5或8,也不是10。
我们很容易把这一现象与婴儿对数的辨别能力相提并论。人类婴儿可以轻而易举地区分1个对象和2个对象,或者2个对象和3个对象,但他们的能力很难超出这个范围。显然,婴儿对记数法的演变没有什么影响。我们甚至可以假设:成年人的数量辨别能力相对于婴儿也没有发生变化。其中的一个原因可能是,大于数字3后,线条符号表示的数字将不再清晰可辨,因为我们不能一目了然地区分 和 。
因此,罗马数字使我们能够研究,动物和人类婴儿的原始计数能力到底在多大程度上延伸到了成年。在本章中,我们旨在寻找能够带领我们回溯人类算术根基的活化石和其他线索,如罗马数字。事实上,许多迹象表明,这种对数量的原始表征在成年人身上依然存在。尽管数学语言和文化的发展使我们人类的能力远远超越了动物那有限的数字表征,但是这种原始的模块依然是我们数字直觉的核心。它对我们如何感知、构想、书写和谈论数字都有相当大的影响力。
早在一个多世纪之前,心理学家就发现,人类精确快速计数的能力有一条严格的界限。1886年,詹姆斯·麦基恩·卡特尔(James McKeen Cattell)在位于莱比锡的实验室发现,在向被试短暂呈现包含若干黑点的卡片时,如果卡片上的黑点不超过3个,他们可以准确无误地识别黑点的个数 2 ,超过这一界限,错误就会增加。继美国普林斯顿大学的沃伦(Warren)之后,法国巴黎索邦大学的贝特朗·布尔东(Bertrand Bourdon)也开发了用于准确测量对客体进行计数所需时间的新方法 3 。1908年,布尔东在没有任何高科技实验设备的情况下,通过拼凑一些特殊的工具,以自己为被试展开实验。下文摘自他的原著:
由水平排列的亮点所表示的数字距我的眼睛1米远。一片带着矩形开口的铜板从固定高度下落,使这些亮点只在一段很短的时间内可见……为了测量反应时,我使用了一台仔细校准过的希普计时器(一种电机精密计时器,精确到千分之一秒)。在这些点可见时,通过计时器的电路是闭合的。在这个电路中有一个口腔开关:其主要组成部分是两片独立的铜叶,每片铜叶的表面都覆盖着纤维,将其与口腔隔开。我将这两片铜叶放在门牙间,紧咬的时候两片铜叶彼此接触,一旦识别出点的数量,我必须尽可能快地说出数字,这样我就必然要开口,使铜叶分离,从而切断电流。
正是有了这种简陋的设备,布尔东才发现人类视觉计数的基本规律:对1个到3个亮点计数所需的时间缓慢增加,超出此范围后所需时间突然大幅增加,同时,错误数也突然剧增。这一实验结果得到了数百次验证,至今仍然有效。人类知觉到1个、2个或3个客体所需的时间不到半秒,但超过这个范围,速度和精度都会显著下降(见图3-2)。
当集合中有1个、2个或3个元素时,对它进行计数是很快的,但若元素数大于4,计数的速度会急剧变慢,同时,错误率也开始增加。
图3-2 知觉数量的速度和精度变化趋势
资料来源:重绘自Mandler & Shebo, 1982。
对反应时曲线的仔细测量揭示出几个重要的细节。在3到6个点之间,反应时的增加呈线性,这意味着对每一个新增点进行计数所需要的时间是固定的。超过3个点时,成人每辨识1个点,需要大概200毫秒或300毫秒。这个200至300毫秒的斜率,大致相当于成人尽可能快地出声数数所需要的时间。对儿童而言,辨识的速度下降到每个数字需一两秒钟——反应时曲线的斜率以同样的幅度增加。因此,成年人和儿童都以相对缓慢的速度对超过3个点的集合进行计数。
为什么对1、2和3进行计数会这么快?这一区间内平缓的反应时曲线表明,对前3个客体集合不需要一个一个去数。识别数字1、2和3的过程似乎没有任何数数的动作。
尽管心理学家仍然在琢磨这个不数数的计数过程是如何进行的,他们还是给它起了个名字,称其为“感数”(subitization或subitizing)能力,这个词起源于拉丁文“subitus”,意为“突然” 4 。这个名字并不恰当,因为尽管非常快速,但是感数并不是一个瞬时事件。识别3个点组成的集合大概需要0.5秒或0.6秒,这跟大声读一个单词或者识别一张熟悉面孔所需要的时间差不多。这个时间也并非恒定不变,识别从1到3的集合,用时会缓慢增加。因此,感数过程可能需要一系列的视觉操作,需要识别的数量越多,整个过程就越复杂。
这一系列操作到底是什么呢?一个被广泛接受的理论假设认为,我们识别由1个、2个或者3个对象组成的小集合之所以很快,是因为它们构成了易辨识的几何图形:1个对象是一个点,2个对象是一条线,3个对象则构成一个三角形。然而,这一假设并不能解释我们为什么对排成直线、因而不形成任何几何线索的数个对象依然可以进行感数操作。的确,没有什么几何参数能够区分罗马数字Ⅱ和Ⅲ,但是我们仍然对其进行感数操作。
心理学家拉纳·特里克(Lana Trick)和泽农·派利夏恩(Zenon Pylyshyn)发现了一种感数失败的情况,它出现在对象重叠以致很难准确觉察它们的位置时。 5 例如,辨识同心圆的数目时,我们必须通过逐个去数才能知道有2个、3个还是4个。因此,感数过程似乎需要各个对象占据不同的空间位置——正如我们前面所看到的,这一线索对于婴儿辨别面前呈现了几件物品同样重要。
我因此相信,成人的感数过程与婴儿和动物辨别客体数量一样,依赖于负责对客体空间位置进行判断和追踪的视觉系统回路。分布在大脑枕顶区的神经元群能够迅速提取视野内客体的空间位置,并且以并行方式加工这些信息。它们只负责加工客体的位置,而忽略其特性,甚至可以表征被挡在遮屏后面的对象。因此,它们提取的信息对运用近似累加器而言,具有理想的抽象性。我相信,在感数过程中,这些大脑区域迅速地将视觉场景分割成离散的对象。接下来就可以很容易地把它们一一相加,以得出一个近似总量。我在第1章描述过我与让-皮埃尔·尚热一起开发的神经网络模型,它展现了如何通过简单的脑回路来实现这个计算过程 6 。
为什么这一机制会导致3和4之间的不连续性?如果你还记得,我在前面讲过,累加器的准确性随着数量的增大而下降,因此,区别 n 与“ n +1”要比区别 n 与“ n -1”的难度更大。数字4似乎是我们的累加器产生大量失误的起始值,它会与3和5相混淆。这就是为什么我们不得不在超过4以后开始数数——我们的累加器仍然会给我们提供一个大概的数量,但是这个数量无法精确到某个具体的数字。
我刚刚简述的“客体位置的并行加工”理论并不是唯一解释感数的理论。美国加州大学洛杉矶分校的心理学家兰迪·加利斯特尔(Randy Gallistel)和罗切尔·戈尔曼认为,在我们感数时,即使我们意识不到,我们对所有的元素也都是逐个去数的,但是数的速度非常快 7 。因此,感数只是一个不需要语言参与的快速序列计数过程。尽管这有悖于直觉,但感数加工实际上需要依次注意每个对象,因而依赖的是一个序列性的、按部就班的算法。这个观点与我的假设分歧最大。我的模型认为,在感数过程中,进入视野中的所有物品被同时加工,而且不需要注意参与——这一过程在认知心理学术语中被称为“并行前注意加工”(parallel preattentive processing)。在我的神经网络模拟中,不管呈现1个、2个还是3个物品,数字探测器都会在同一时间开始响应(尽管随着输入数量的增大,探测器确实需要稍微长一点的时间来达到稳定的激活状态,从而准确给出一个精确的命名)。最重要的是,不同于戈尔曼和加利斯特尔的快速数数假设,我的数字探测器不需要通过心理“聚焦”或标记过程逐个把物品区分出来,一切都是即时而且并行发生的。
这一问题仍然悬而未决,或许能够证明感数不需要按顺序逐个注意每个物品的最好证据来自脑损伤患者:他们不能集中注意地探索视野中的环境,因而也不能数数 8 。我曾与劳伦特·科恩(Laurent Cohen)医生在巴黎的萨彼里埃医院一起诊察过I太太,她在怀孕期间由于高血压导致脑后动脉梗死。1年后,这一损伤对她的视知觉能力造成的后遗症依然存在。I太太变得无法识别包括面孔在内的某些视觉形状,而且她还抱怨过视觉的奇怪扭曲。当我们要求她描述一个复杂的图像时,她常常会因遗漏重要的细节而无法觉察整体的含义。神经学家将这种疾病称作“组合失认症”(simultanagnosia)。这使得她无法数数。当4个、5个或者6个点在电脑屏幕上快速闪过时,她几乎总是漏数一部分。她试图去数,但是无法把注意力逐次指向每个物品。她数到大约一半的时候就会停止,因为她觉得自己已经全部数完了。另外一个患有相似疾病的患者则陷于相反的错误模式:她对自己已经数过的个体没有概念,会一直不停地一遍一遍地数下去。她会毫不犹豫地告诉我们总共有12个点,而实际上只有4个。
尽管有计数缺陷,这两位患者在对1个、2个或3个点的集合进行计数的时候几乎没有任何困难。她们对小数字的反应非常迅速、自信,而且几乎不会出错。例如,I太太在数3个物品时错误率仅为8%,但是在数4个物品时错误率高达75%。我们经常观察到这种分离:即使脑损伤使患者完全无法逐次按顺序把注意力集中于每一个物品,他们对小数字的知觉仍然完好无损。这就强有力地证明了,在感数过程中并没有顺序计数的行为参与,它仅仅是一种对场景中的物品进行预先注意和并行提取的过程。
达斯汀·霍夫曼(Dustin Hoffman)在影片《雨人》( Rain Man )中扮演的雷蒙(Raymond),是一位具有惊人能力的孤独症患者,影片中发生了一起特殊事件。一位服务员掉了一盒牙签在地上,雷蒙马上咕哝道:“82……82……82……有246根!”仿佛他以82为单位来数牙签,比我们说“二二得四”还要快。在第6章,我们将会仔细分析哪些技艺造就了诸如雷蒙这样的计算奇才。然而,在这里,我并不认为达斯汀·霍夫曼的表演应该被当真。有些轶事报道了一些能够快速感数的孤独症患者,但是并没有给出他们的反应时。据我所知,反应时能够用于判断这些人是否确实在数数。我自己的经验是,要模拟《雨人》的场景很容易:提前开始数数,把各组点数在心里相加,然后以一种虚张声势的方式说出来。以这样的方式,猜准一次屋内的确切人数就足以使你成为传奇!更有可能的其实是,3个或者4个项目作为感数极限对于每个人来说都是一样的。
但是,这一极限的实质究竟是什么?当一个集合内元素多于3个时,我们的并行计数能力真的会瘫痪吗?达到这个临界值时,我们就必须去数吗?事实上,任何成人都可以在一个合理的不确定范围内估计超过3或4的数值 9 。因此,这个感知极限并不是一道不可逾越的障碍,而仅仅是个边界,超过它就进入了近似估计的世界。面对一群人时,我们可能不知道确切的人数是81个、82个还是83个,但是我们可以不通过数数而估计有80到100个人。
这样的估计通常是有效的。心理学家明确知道,在一些情况下,人类的估计值会稳定地偏离真实值(见图3-3)。例如,当物品规则地布满一张纸的时候,我们会倾向于高估其数量;相反,当物品不规则分布的时候,我们会低估其数量,这也许是因为我们的视觉系统把它们分解成了数个小集合 10 。我们的估计对环境影响也很敏感:同样是30个点,我们会因为其周围分布着10个点而低估其数量,也会因为其周围分布着100个点而高估其数量。但是一般来说,我们的估计其实非常准确,尤其是考虑到,在日常生活中我们很少有机会能够验证其正确性。确实,有关一群人是由100人、200人还是500人组成的,我们有多少机会能得到精确反馈呢?然而,在一个实验室条件下所做的实验中发现:只要向我们提供一次数量信息确定的材料,比如明确标记为200个点的集合,就足以提高我们对于点数在10到400个之间的集合的数量估计的准确性 11 。想要校准我们的数字估算系统,只需要少数几次精确的测量。
我们能够立即察觉到2个和3个(左上)之间的区别,但是如果不数数,我们较难区分5个和6个(右上)。我们对大数字的知觉依赖于物品的密度、占据的面积和空间分布的规则程度。尤塔·弗里思(Uta Frith)和克里斯托弗·弗里思(Christopher Frith)于1972年首次描述了中图所呈现的“宝石错觉”:我们的感知系统使我们错误地相信,中间的图中白点比黑点多,大概是因为白点被更紧密地组织在一起。下方的两张图中,随机分布的点看起来要比间隔规则的点少一些,而实际上这两幅图中都有37个点。
图3-3 人类的估计值会稳定地偏离真实值
人类知觉大数字的规律并不特殊,而是与动物数字行为所遵循的规律完全相同 12 。我们受制于距离效应:相比于差距较小的数值,如81与82,我们更容易区分差距较大的数值,如80与100。我们的数量知觉也表现出大小效应:对于相同差距的两个数值,相比于数值较小的情况,如10与20,我们更难区别数值较大的两个数,如90与100。
这些规律是心理学不同寻常的一项发现,其揭示的数学规律性因屡试不爽而令人印象深刻。假定一个人能够区分13个点的集合和另一个10个点的参考集合(数字间距为3),准确率达到90%。现在让我们将参考集合的点数加倍,变成20个点,我们要选择距离这个数值多远的一个数字,才能使分辨的准确率仍能达到90%呢?答案非常简单,你只需要将数字间距也加倍,让两个集合的点数相差6。因此该集合应该有26个点。当参考数字加倍,人们能够以同样的水准实现辨别的数字间距也同样加倍。这一加倍法则也被称为“梯度定律”(scalar law),或者“韦伯定律”(Weber’s law),以发现这一规律的德国心理学家命名。这一定律与动物行为规律的显著相似性表明,就数量的近似知觉这一点而言,人类与老鼠或鸽子没有任何不同。我们所有的数学天赋在感知和估计大数字时都毫无用处。
我们对数量的理解与其他动物没有差别,这一点听起来似乎不足为奇,毕竟哺乳动物都拥有基本相似的视觉和听觉系统。甚至在某些领域,如嗅觉方面,人类的感知能力远不如其他物种。有人可能会认为,涉及人类语言时,情况应该完全不同。很明显,我们与其他动物的区别在于,我们有能力运用任意符号来代表数字,比如单词或者阿拉伯数字。这些符号由离散的元素组成,人们可以以一种纯粹形式化的方式对其进行操纵,并且不存在任何模糊性。内省研究表明,我们的大脑能够以同样的敏锐度(acuity)表征1到9的含义。实际上,这些符号在我们看来没什么区别。我们对这些符号的使用得心应手,甚至可以在短暂的固定时间内对任何两个数字进行加法运算或者比较,就像电脑一样。总体来讲,数字符号的发明让我们摆脱了对数字的数量表征模糊不清的情况。
直觉误导人!尽管数字符号为我们开启了一扇通向原本无法触及的严格算术领域的大门,但是它们并没有将我们的根基与动物对数量的粗略表征分离开来。恰恰相反,每次面对阿拉伯数字,我们的脑都不得不把它看作一个表征精度随数量增加而降低的模拟量,这基本就是老鼠或是黑猩猩的做法。将符号翻译成数量,是以增加可以测量的心理运作速度为重要代价的。
对这一现象的首次报道要追溯到1967年。这一现象在当时具有革命性的意义,因此发表在《自然》杂志上绝对名副其实 13 。罗伯特·莫耶(Robert Moyer)与托马斯·朗多埃(Thomas Landauer)测量了成人判断两个阿拉伯数字哪个更大时所需要的精确时间。他们的实验过程是:快速闪现一对数字,如9和7,然后要求被试通过按下两个反应键中的一个来报告较大数字的位置。
这个简单的比较任务并不像看起来那么轻松,成人通常要用大于0.5秒的时间才能完成,而且结果并非全无差错。更令人吃惊的是,成人的表现会随所挑选的数字呈现系统性变化。若两个数字代表的数值差别很大,如2与9,被试的反应迅速而准确。然而,若两个数字的数值比较接近,如5与6,他们的反应会慢100毫秒以上,并且平均每10个实验轮次就会出错一次。此外,数值间距相同时,随着数值逐渐增大,被试反应会变慢。从1与2中挑选较大的数字很容易,但是比较2与3哪个更大,就会有点困难,比较8与9则会很困难。
我们需要声明的是,参与莫耶与朗多埃测试的人并没有异常,而是和你我一样的普通人。在数字比较实验进行了十多年后,我仍然没有找到任何一个不受数字距离影响且比较5和6与比较2和9一样快的人。我曾经对一群年轻有为的科学家进行过测试,其中包括法国最好的两所数学学院——巴黎高等师范学校和巴黎综合理工学院的学生。让所有人觉得神奇的是,他们在试图判断8与9哪个更大时居然会慢下来,甚至还可能出错。
系统的训练也不能改变这种情况。在一项实验中,我试图训练一群美国俄勒冈大学的学生,使他们免受距离效应的制约。我尽可能地简化任务,在电脑屏幕上只呈现数字1、4、6和9。如果看到的数字大于5,学生们必须按右手边的键,小于5则按左手边的键。很难想象还会有更简单的任务:看到1或4就按左键,看到6或9就按右键。然而经过几天共1 600个轮次的训练后,与离5较远的数字1和9相比,被试在看到离5较近的数字4和6时,反应仍然较慢,准确率仍然较低。事实上,在训练过程中,尽管反应时整体上是变短了,但是,被试在看到离5较近的数字与离5较远的数字时,反应时仍有差别,距离效应本身并没有受到训练的任何影响。
我们该如何理解这些数字比较的结果?显然,我们的大脑不会保留一份关于所有可能的数字比较的清单。如果我们靠死记硬背掌握所有的可能性,如1小于2、7大于5等,那么比较时间就不会随数字距离的改变而发生变化。这种距离效应究竟源自哪里?就外形而言,数字4和5的区别跟数字1和5的区别没什么不同。因此,判断数字4是小于还是大于5的困难,与分辨数字外形的难度毫无关系。显而易见,人脑并未在识别出数字的外形后就停止工作。它迅速在数量含义的层面上识别数字,数字4确实比1更靠近5。我们大脑的沟回之中隐藏着一种包含阿拉伯数字之间近似关系的数量信息模拟表征。我们一看到数字,就可以提取它的数量表征,但是这种表征较容易将相邻的数字混淆。
当我们比较两位数时,会出现另一种更为惊人的现象 14 。假设你要比较71和65的大小,一个合理的方法是,先检查它们最左边的数字,当你发现7大于6时,根本无须考虑最右边的数字是什么,就可以得出71大于65的结论。这一算法被应用于计算机的数字比较中。但是人脑并不是这样运行的。将65与其他两位数进行比较,并测量所需的时间,你会得到一条光滑的曲线(见图3-4)。随着数字逐渐靠近65,比较时间会持续上升。个位和十位数同时对这一趋势产生影响。因此,判断71大于65所用的时间要比判断79大于65所用的时间更长,尽管两种情况下左边的数字都是7。与此同时,当十位数不同时,反应时也不会不成比例地突然变化——比较71和65只比比较69和65快了一点,如果我们选择性地先注意左边的数字,比较69和65应该更加困难。
实验中35名成年志愿者将31和99之间的所有两位数与65进行了大小比较,他们的反应时以毫秒级的精确度被记录下来。每一个黑点代表一个给定数字的平均反应时。数字越接近65,反应越慢,这就是距离效应。
图3-4 比较两个数字需要多久?
资料来源:Dehaene, Dupoux, & Mehler, 1990。
我能想到的唯一解释就是,我们的大脑将两位数字作为整体来加工,并把它转化成一个内部数量或大小。在这一阶段,我们的大脑会忽略与这一数量相对应的精确数值。比较运算仅涉及数量,涉及用于传递数量信息的符号。
我们比较两个阿拉伯数字大小的速度不仅与它们的间距有关,同时也与它们的大小有关。判断9大于8比判断2大于1需要更长的时间。在距离相等的情况下,大数字会比小数字更难进行大小比较。这种数字变大引起的反应速度变慢再次让我们联想到婴儿与其他动物的知觉能力,它们同样会受到数字间距和大小的影响。这个惊人的相似性证实:在使用阿拉伯数字之类的符号时,我们的大脑所读取的数量内部表征与其他动物和婴儿的表征非常相似。
事实上,正像其他动物那样,决定人类区分两个数字容易程度的参数并不是两个数之间的绝对距离,而是相对于它们自身大小的距离。从主观上来看,8和9之间的距离与1和2之间的距离并不相同。我们衡量数字的“心理尺”的刻度并不是均匀的,而是倾向于将较大的数字压缩至一个较小的空间。我们的大脑表征数字的方式更像对数尺度:1和2、2和4以及4和8之间是等距的。因此,计算的准确性和速度都不可避免地随数值的增大而下降。
大量实证研究的结果非常集中地支持了大数字在心理上以压缩的形式进行表征的假说 15 。有些实验完全基于内省:主观估计4和6哪个更接近5? 16 尽管问题看起来有些词不达意,但大多数人都认为,在数字间距相同的情况下,大一点的6看起来与5差异更小。其他实验则采用了更微妙、更间接的方法,例如:让我们假设你是个随机数产生器,你必须在1到50之间随机选择数字。当参与这项实验的被试足够多的时候,就能产生一个系统偏差:不同于完全随机,比起大数字来,我们更倾向于经常性地产出小数字,就好像小数字在我们抽取数字的“内部容器”中占更大的比重 17 。这意味着,在没有“客观”的随机性来源(比如骰子或者一个真实的随机数产生器)的情况下,我们无法实现随机选择。
据我推测,这种对小数字的偏向可能对我们利用直觉来完成和解释统计分析有着深远的甚至是毁灭性的影响。思考一下下面这个问题 18 。计算机随机生成两组数字,你的任务是在不进行计算的情况下估计这两组自1到2 000之间的数字的随机性和均匀性:
多数人会觉得序列B中的数字看起来分布更均匀,因而比序列A组的数字“更随机”。在序列A中,大数字似乎出现得太频繁了。然而从数学的角度看来,A组比B组更能代表从1到2 000的数字连续体。序列A中的数字以略大于200为间隔单位规则地分布,而序列B中的数字则呈指数型分布。我们选择序列B的原因在于,它更符合我们对数轴的心理表征,即大数字不如小数字醒目的压缩序列。
我们在选择度量单位时,同样能够表现出这种压缩效应。1795年4月17日,公制开始在巴黎实行。为使其具有普遍性,其单位涵盖了从纳米到千米范围内所有10的幂,甚至每个幂都对应一个专门的名字:毫米、厘米、分米、米等。然而这些单位仍然因为间距太大而不适合日常使用。于是法国的立法者规定“每个十进位单位必须有它的双倍数和半数”。根据这项规定产生了规则序列1、2、5、10、20、50、100……今天的硬币和纸币系统仍在使用这个序列。这一序列符合人类的数感,因为它类似于指数序列,并且由较小的约整数 (8) 构成。1877年,出于类似的理由,查理·雷纳(Charles Renard)上校实施了一种基于准对数序列(100、125、160、200、250、315、400、500、630、800、1 000)的工业产品(如螺钉直径和轮子尺寸)标准化方法。当一个连续量需要被分割成一些离散的类别时,直觉就会指引我们选择一个与我们的内部数字表征相吻合的压缩序列,它通常是对数的形式。
一个阿拉伯数字出现在我们面前时,是一系列分布在我们的视网膜上的光子,这一模式被大脑的视觉区识别为熟悉的数字形状。然而,我们刚刚描述的许多例子表明,大脑可以一鼓作气地完成数字识别。它很快就重建出这一数字所对应的数量的连续性压缩表征。这种向数量的转换是一个无意识、自动化且速度很快的过程。事实上,看见了数字5的形状而不把它立刻转化成数量5几乎是不可能的,即使这种转换在有些情境下毫无用处。因此,对数字的理解是一个反射性的过程 19 。
假设有人将两个数字并排展示给你,要求你尽快说出它们是否相同,你肯定会觉得你的判断只会以数字的视觉外观为基础,即根据它们的形状是否相同做出判断。然而对反应时的测量结果表明,这个假设是错误的 20 。判断8和9不同所需要的时间稳定地长于判断2和9。数字距离再一次操控了我们的反应速度。我们无意识地抵触8与9是不同的数字,因为它们所代表的数量太接近了。
一种类似的“理解性反射”(comprehension reflex)也会影响我们对数字的记忆 21 。记住下面的数字:6、9、7、8。好了吗?现在告诉我,这个序列中有5吗?那么数字1呢?是不是看起来第一个问题要比第二个更难?尽管这两个问题的答案都是“没有”,但正式实验表明,目标数字距序列中的数字越远,所需要的反应时越短。很显然,我们在记忆的时候不仅把这个序列当成一系列任意符号,同样也把它当作一群接近7或者8的数量,这就是为什么我们可以立刻说出1不在这个集合内。
这种理解性反射有可能被抑制吗?为了回答这个问题,实验者让被试置身一种不去识别数字含义反而更利于完成任务的情境。以色列的两位研究者阿维沙伊·海尼克(Avishai Henik)和约瑟夫·策尔戈夫(Joseph Tzelgov)在电脑屏幕上呈现字号不同的一对数字符号,如1和9,然后测量被试判断哪个符号字号更大的反应时 22 。这个任务要求被试把注意力集中在物理尺度上,而尽可能地忽略数字的数量。然而对反应时的分析再次表明,我们对数量的理解是何等的自动化和难以抑制。对被试而言,若视觉刺激的物理维度与数量维度一致(如:“1”“9”),将比不一致时(如:“9”“1”)更容易做出判断。很显然,我们无法忘记符号“1”代表着小于9的数量。
更令人惊讶的是,即使我们没有意识到自己看见了数字,我们的大脑仍能获取数量信息 23 。通过在电脑屏幕上以非常短的时间呈现一个符号,可以使这个符号等同于不可见。有一种被心理学家称为“三明治启动”的技术,即把需要隐藏的单词或者数字夹在前后两个没有意义的字符串中间。比如,我们可以先呈现“#######”,然后是单词“five”(5),接着再呈现“#######”,最后呈现单词“six”(6)。如果前3个视觉刺激每个仅呈现1/20秒,那么夹在中间的启动词“five”就会变得不可见,不仅仅是很难被读出来,而且是从意识流中消失。在正常情况下,甚至实验设计者本人都不能分辨这个隐藏的单词有没有出现!只有最先呈现的字符串“#######”和最后呈现的单词“six”在意识上是可见的。其实,只需要50毫秒,视网膜上就能够形成一个完美的正常视觉刺激“five”。事实上,被试自己也不知道,这个单词在他的大脑中已经产生了一系列的心理表征。这一点可以通过测量命名目标词“six”所用的时间来证明。这一时间随启动词和目标词所代表的数量的距离改变发生稳定的变化。相比于启动词与目标词的距离较大的情况,如启动词是“two”(2),当启动词与目标词的距离较小时,如启动词是“five”,被试对目标词“six”的命名更快。理解性反射在这种情况下也有所体现:尽管无法有意识地看到单词“five”,它却仍然被大脑理解为“一个接近6的量”。
尽管我们并没有意识到在我们的大脑回路中不停进行的自动数值运算,但它们确实以各种方式对我们的日常生活产生了影响。在巴黎的一个较大的火车站中,由于车站被划分成几个区,站台编码的顺序被打乱:站台11紧邻站台12,但站台12与站台13却离得很远。由于数量的连续性在我们的观念中已经根深蒂固,这种设计使得很多旅客陷入混乱。我们直觉地认为,站台13就应该在站台12的旁边。
与此类似,下面这则轶事保证吸引眼球:
来自阿维拉的圣特雷莎(St. Theresa)在1583年10月4日至15日夜间去世。
不,这不是排印错误!巧得很,圣特雷莎去世的夜晚很特殊,恰好是教皇格雷果里十三世废除恺撒颁布的古老的罗马儒略历、启用格雷果里历(沿用至今) (9) 的夜晚。这一调整非常必要,因为几个世纪以来,夏至或者冬至等天文事件已经导致日历中的日期逐渐推移,使10月4日后的那天变成了10月15日。这是一个及时的决定,但同时也严重扰乱了我们的数字连续感。
对数字的自动诠释也被运用到了广告界。众多零售商不怕麻烦,为商品标价59美元,而不是60美元,那是因为他们知道,顾客会自动地认为这个价格是“大概50美元”,只有稍加思考,顾客才会意识到真实的价格其实更接近60美元。
最后一个例子,让我说说我自己不得不适应华氏温标的经历。我生长在法国,在那里,我们只使用摄氏温标,水凝固的温度为0,沸腾的温度为100。即使在美国生活了两年,我发现自己仍然很难把32℉想成低温,因为对我来说,32会被自动认为是一个温暖而阳光明媚的天气所具有的正常温度值。反之,我猜想,在欧洲旅行的大部分美国人都会惊讶,37这样低的温度值居然代表人的体温。这种把意义自动赋予数量的习惯深深根植于我们的大脑中,成年人需要克服很多困难才能校正它。
数字不仅会激发数量感,它们还会诱发一种不可抑制的空间上的延伸感。数字与空间之间的这种紧密联系,在我的数字比较实验中明显可见 24 。你可能会记得,在该实验中,被试需要判断数字是大于还是小于65。因此会有两个反应键,一个在左手边,一个在右手边。作为一个执着的实验者,我系统地改变了反应侧:一半的被试右手边的按键代表“大于”,左手边的按键代表“小于”;而另一半的被试遵循相反的指示。令人吃惊的是,这一看似无关痛痒的变化让我关注到一个重要的现象:“右大”组中被试的反应要快于“左大”组,而且错误更少。当目标数字比65大时,被试按右键比按左键要快,数字小于65时则正相反。似乎在被试的头脑中,大数自发地与右手边的空间联系在一起,而小数与左手边的空间联系在一起。
这种联系的自动化程度还有待观察。为了弄明白这一点,我设计了一项跟空间和数量都没有关系的任务。被试现在要判断的是数字的奇偶性 25 。随后其他研究者采用了更加随意的任务,例如,判断数字名是以辅音开头还是以元音开头,或者判断数字是否具有对称的视觉外观 26 。不管指导语是什么,所有实验都出现了同一种效应:数字越大,右手反应越快;数字越小,左手反应更快的偏向性就更明显。为纪念刘易斯·卡罗尔(Lewis Carroll),我把这项发现命名为“SNARC效应”,即“反应编码的空间-数字联合”(Spatial-Numerical Association of Response Codes)。在卡罗尔的著名荒诞诗《蛇鲨之猎》( The Hunting of the Snark )中,主人公不屈不挠地寻找一种神秘生物“蛇鲨”,虽然从来没人真正见过它,但是人们却清楚地知晓它的行为细节,包括它喜欢睡懒觉,以及它对游泳更衣车的钟爱。这是对科学家执着追求更加精确地描述自然的贴切比喻,比如夸克、黑洞和普遍语法。遗憾的是,我没能想出一个正好能与snark相对应的有意义的首字母组合词!事实上,只要数字可见,即使任务本身与数量无关,“SNARC效应”都会出现,这证实了被试的大脑对数量信息是自动加工的。
在寻找“SNARC”的许多实验中,我和同事们有很多有趣的发现 27 。首先,数字的绝对大小无关紧要,真正要紧的是实验中所使用的数字之间间隔的大小。例如,如果实验只涉及0到5之间的数字,那么数字4与5就会优先与右侧空间联系在一起,而如果只涉及4到9之间的数字,这两个数字就会优先与左侧空间联系在一起。其次,负责反应的手也是无关变量。若被试在做出反应时两臂交叉,仍然是右侧的空间与大数关联在一起,即使右侧空间的反应是由左手做出的。被试自己当然也完全没有意识到某一侧的反应要快于另一侧。
数字与空间的自动关联这一发现,引出了一个对于数量心理表征的简单却引人注目的隐喻——数轴(number line),即各个数字在心理上被排在一条线段上,每个位置都对应一个确定的数量,相邻的数字在线段上的对应位置也毗邻。这也难怪我们会如距离效应所反映的那样容易将它们混淆。而且,我们可以想象这条数轴在空间中具有方向性:0在最左边,越大的数字越靠右。这就是为什么阿拉伯数字所对应数量的反射性编码会与数字在空间上的自动定位相一致:小数在左边,大数在右边。
这条从左向右排列的特别数轴的起源是什么呢?它与生物学上的参数有关,如利手或者大脑半球特异化,还是仅仅依赖文化因素?为探索第一种假设,我对一组左利手被试进行了研究,但是结果与此前针对右利手被试所做的实验结果没有不同,大数同样与右侧空间相联系。接下来转向第二种假设。我和同事们招募了20名伊朗学生,他们最初学习阅读时是从右向左读的,这与我们的阅读方向相反。这次的结果是决定性的。从整个组的情况来看,伊朗人没有显示出任何数字和空间的选择性关联。然而就个体而言,这一关联的方向变化受被试接触西方文化时间长短的影响。长期居住在法国的伊朗学生表现出了与法国本土学生一样的“SNARC效应”,而那些近几年才移民到法国的伊朗学生,则倾向于将大数与左侧而不是右侧的空间联系在一起。由此看来,文化浸染是一个主要因素。数字与空间联结的方向似乎与书写的方向有关系 28 。
我们稍稍思索一下就可以发现,书写体系确实普遍地影响了我们在生活中使用数字的习惯。每当我们写下一串数字时,小数总是先出现而位于左侧。同样地,直尺、日历、数学图表、图书馆的书架、电梯门上方的楼层标记以及计算机键盘等,也都同样采用从左到右的数字排列方式。对这种惯例的内化开始于孩提时代:美国儿童从小就开始从左往右探索物品,而以色列儿童的探索方向则与此相反。数数时,欧美国家的儿童几乎总是从左开始。数数时起始点和终止点与不同空间方向的规律性关联被逐渐内化,成为我们对数字进行心理表征的一种主要特征。
只有当这条内隐的惯例被违背时,我们才会突然痛苦地意识到它的重要性。旅客在进入巴黎戴高乐机场2号航站楼时会经历这样一种让人困惑的情形:标号为小数的登机口向右侧延伸,而标号为大数的登机口向左侧延伸。我发现很多旅客,包括我自己,在走向登机口时总会搞错方向,即使来过这里很多次,我也没有办法完全摆脱这种空间错乱感。
数字与垂直轴可能也有关联,尽管还没有这方面的实证研究。我曾经跟同事住过一家酒店,它位于意大利的里雅斯特附近亚得里亚海边的峭壁上。入口在顶层,也许就是因为这点,楼层号码是从上往下排的。我们坐电梯的时候,经常会感到非常困惑。向上走时,我们会下意识地希望亮起的楼层号码逐渐变大,但是情况却相反,这总会使我们困惑几秒。甚至在决定去楼上那层要按哪个键时我们都会遇到麻烦!我希望,读到这本书的建筑家和生物工程学家,在将来排列数字时能采用从左到右、从下到上的顺序,因为这确实是我们大脑所期待的惯例。
大部分人头脑中都有一条从左向右延伸的无意识数轴,不过有些人对数字有更加生动的形象知觉。5%~10%的人确信数字有颜色,而且具有非常精确的空间位置 29 。早在19世纪80年代,约翰·高尔顿(John Galton)爵士就观察到他的一些熟人,其中大多是女士,能够赋予数字极其精确和丰富生动的特质,这对别人来说是无法理解的 30 。他们中有一位将数字比作一条向右延伸的丝带,由蓝色、黄色和红色等丰富的色彩渐变而成(见图3-5)。
这些图所描述的是高尔顿的两个被试所体验到的“数形”(number forms)。其中一个被试看到的是一条向右延伸的彩带。另一个被试把数字排列在一条扭曲的曲线上,其初始部分类似于一个时钟的钟面。
图3-5 大脑中的“数形”
资料来源:转自Galton, 1880,版权所有©1880 by Macmillan Magazines Ltd。
另一位声称从1到12的数字盘绕成一个圆形的曲线,在10到11之间有一个轻微的断点。过了12曲线开始向左延伸,在每个整十数处就有一段弯曲。还有人认为在他心里数字1到30呈垂直柱状排列,接下来以整十数为单位逐渐向右偏移。在他看来,这些数字“大概1.27厘米长,暗棕灰色带着一点亮灰色”。
不管听起来多古怪,这样的“数形”都不是这些想象力丰富的维多利亚时代的人为了满足高尔顿对数字的热情而杜撰的。在距高尔顿的时代1个世纪的现代,一项研究发现,大学生也能够感知到类似的数字图像。有人看到同样的曲线,有人看到同样的直线,也有人说整十数时就会出现外形的突然变化,等等 31 。此外,数字和颜色之间的关联是系统的:大多数人会把黑色和白色与0和1或者8和9相关联;把黄色、红色和蓝色与2、3和4等小数相关联;将棕色、紫色和灰色与6、7和8等大数相关联 32 。
这些统计出来的规律表明,大多数声称体验到数形的人是真实可信的。他们似乎忠实地描述了一种极其精确的真实知觉。有个被试被要求用50支彩色铅笔在纸上画出她知觉到的数字形象。在间隔一个星期的两次测试中,她选择了几乎完全一样的颜色。对于一些数字,她甚至觉得自己需要混合几种铅笔的色调,才能更准确地刻画她头脑中的图像。
尽管数形很少见而且显得很奇怪,它却与“正常”的数量表征之间有许多共同的特性。整数序列几乎总是一条连续的曲线,1在2的旁边,2在3的旁边,依此类推。只有在极少数的情况下,在整十数的边界处,如在29和30之间,会出现方向上的突然变化或小小的不连续性。至今还没有一个人声称他看到的是一个混乱的数字图像,比如质数或平方数被组织在同一曲线上。数量的连续性是数形的组织所遵守的主要参数。
数字和空间之间的关系也有所体现。在大多数的数形中,越来越大的数字会向右上方延伸。最终,大多数人声称他们的数形在表征大数字时变得越来越模糊。这正是大小效应或压缩效应的体现,是动物和人类表征数字的特点,它限制了我们对大数进行心理表征的精确度。
数形在本质上可以被当作大家所共有的心理数轴的另一个版本,该版本中的心理数轴可以被意识到,并且更加丰富。大多数人的心理数轴只能通过精细的反应时实验反映出来,但是数形能够被有意识地知觉,而且具有丰富的视觉细节,如颜色,或是空间上的精确定位。这些修饰从何而来?被问及此,拥有数形的人说它们在自己8岁之前就自然地出现了,或者是从记事起就一直存在。有时候,一个家庭的几名成员具有相同的数形。然而,这并不意味着它一定有遗传因素,因为家庭环境也可能是一个决定性因素。
我个人的猜测是,数形的形成,可能跟空间和数字的脑皮层发育有关系。正如第2章所提到的,婴儿可能已经有了数量的“心理表征”。在3到8岁之间,伴随着学校教育,为了适应儿童日益增长的大数知识以及以十进制为基础的记数方式,初始的数轴一定被大大丰富了。我们可以推测,算术的习得过程伴随着负责“数字地图”的脑皮层的逐渐扩张,这种扩张在动物学习精细手工任务时也被观察到了,它发生在大脑感觉运动区域。正如我们将在第7章和第8章中看到的,在邻近顶枕颞叶的联合处,有一块更靠后更靠两侧的大脑区域,称为下顶叶皮层,算术知识的神经网络的扩张很可能发生在这一区域。由于神经元的总数是恒定的,数字神经网络的扩张必然会牺牲周围的脑皮层,诸如编码颜色、形状和位置的区域。而对有些儿童来说,非数字区域的缩小可能并没有达到最大限度。在这种情况下,编码数字、空间和色彩的脑皮层之间就会存在部分重叠,并在主观上转化成一种无法抑制的“看到”数字的颜色和位置的感觉。类似的原因也许能够解释联觉这一相关现象,例如诗人和音乐家所熟知的感受:声音具有形状,味道唤起色彩。
尽管这种解释有些推测的成分,但是这个关于脑皮层如何被越来越精细化的数字表征侵占的理论是有证据的。神经心理学家斯波尔丁(Spalding)和奥利弗·赞格威尔(Oliver Zangwill)描述了一个24岁的患者,在左侧顶枕区受到损伤之后,他感知数字视觉图像的能力突然消失了。这一区域一直以来都被认为在心算方面发挥着核心作用 33 。事实上,这位患者在计算和空间定位上也都出现了严重障碍,我们会在第7章更详细地讨论这种神经系统综合征。这一病例证实:“看到数字”的主观感觉依赖于数字和空间信息在大脑皮层的同一区域同时编码。
此外,皮层表征可能会重叠,进而导致奇怪的主观感觉这一假设在对截肢患者的研究中也得到了验证 34 。截掉一只胳膊后,这只胳膊对应的感觉皮层区域会空置,之后会被周围的感觉区域侵占,例如感觉头的区域。极少数情况下,刺激患者面部的某些点位,会使患者感觉到刺激好像是来自失去的胳膊,从而产生一种无法克制的拥有“幻肢”的感受。例如,一滴水落在脸上,给人的感觉就像已经不存在的手臂浸没在一个水桶中!我相信,数字引起不存在的颜色和形状知觉的数形现象,也同样起源于大脑皮层表征的重叠。
现在来概括一下本章的基本内容。本章集合了对罗马数字的观察、对阿拉伯数字比较反应时的观察,以及对一些人奇怪的数字幻觉的观察,揭示出我们的数字心理表征的迷人特殊性。一个专门负责感知和表征数量信息的器官深深地扎根于我们的大脑中。它与动物和婴儿表现出来的原始的数字能力密切相关。它可以精确表征不超过3的数量;数字变大或相互临近时,则容易被混淆。它还倾向于把数量范围跟空间地图关联起来,从而使空间上延伸的心理数轴的隐喻更加合理化。
显然,与婴儿和动物相比,成年人具有使用文字和数字表达数量的优势。在下一章我们将看到,语言如何简化精确数量的计算和沟通过程。然而,精确的记数法的使用,并不会消除我们生来具有的对数量的连续近似表征。恰恰相反,实验表明,一旦有数字呈现,成人的大脑就会迅速地把它转换成最接近的内部近似量。这种转换是自动的、无意识的。它让我们能够迅速获取一个符号的含义,例如,符号8是7和9之间的一个数量,离10更近,离2更远,等等。
这种数量表征,是我们在进化过程中继承的一种能力,它是我们凭直觉理解数字的基础。如果不是我们已经对数量8有了一种既定的非语言的内部表征,我们可能根本不会赋予数字8一个含义。我们将被限制于纯粹形式化的数字操作,和一台遵循算法而并不理解其意义的计算机没有两样。
我们用来代表数量的数轴显然只支持一种非常有限的数字直觉形式,它只对正整数和它们之间的距离关系进行编码。这或许解释了我们能直觉地掌握整数含义的原因,同时也解释了为什么我们缺乏掌握其他类型数字的直觉。现代数学家认为的“数字”包括零、负整数、分数、像π这样的无理数,以及像 这样的复数。然而,除了最简单的分数,如1/2或1/4,所有这些实数,在过去几个世纪中给数学家们带来了许多概念上的困扰,而且仍然给今天的学生造成很大的困扰。
在公元前5世纪之前,对于毕达哥拉斯和其追随者来说,数字仅限于正整数,不含分数或负数。 这样的无理数被认为是违背直觉的。传说希帕索斯(Hippasus)因为证明了无理数的存在,粉碎了毕达哥拉斯整数统治宇宙的观点,因此被抛入大海。尽管丢番图(Diophantes)以及后来的印度数学家都是计算算法的大师,然而他们都不接受负数作为方程的解。在帕斯卡(Pascal)看来,结果是负数的减法“0-4”纯粹是无稽之谈。1545年,意大利数学家卡丹(Cardan)首次将负数的平方根写进了数学公式,这激起了持续一个多世纪暴风雨般的抗议。“虚数”(imaginary numbers)这种叫法正是来自抵制它的笛卡尔,而德·摩根(De Morgan)也认为虚数是“没有意义的,甚至是自相矛盾和荒谬的”。只有在扎实的数学基础建立起来后,这类数字在数学界才获得了认可。
我想说明的是,这些数学实体之所以很难被接受,并且如此违背直觉,都是因为它们不属于任何预先存在于我们大脑中的范畴。正整数自发地呈现在我们天生的数量表征中,因此一个4岁的儿童就能够理解正整数。然而,大脑中并不存在对其他各种数字的直接模拟。要真正了解它们,我们必须整合出一个新的心理模型以提供直观的理解。这正是教师所做的事,他们会通过打比方来介绍负数,如温度低于零摄氏度,从银行借来的钱,或者一条向左延伸的线。英国数学家约翰·沃利斯(John Wallis)在1685年引入的复数的具体表征,可以称得上是他送给数学界的一份独特的礼物。他最先认识到,数字可以被设想为一个平面,而“实”数沿水平轴存在。我们的大脑想要在直观模式下起作用需要图像——而在数字理论方面,进化赋予我们的只有对正整数的直觉图像。