学习目标问题 6-7 可见光作为能量有什么特点?
眼睛中的哪些结构有助于集中这种能量?
我们的眼睛能接收光能并且将其转换成神经信息。生命最伟大的奇迹之一——大脑——会把它们加工成我们能有意识看到的东西。这样一件理所当然却又非同寻常的事情是如何发生的呢?
波长:指从光或声波的一个峰值到下一个峰值的距离。电磁波的波长从伽马射线的短脉冲到无线电传输的长脉冲不等。
色调:由光的波长所决定的颜色的维度,我们所知道的颜色有蓝色、绿色等。
强度:光或声波的能量大小,影响着我们对明度或响度的感知。强度由波的振幅(高度)决定。
当看见一朵鲜红的郁金香时,刺激你眼睛的不是红色的粒子,而是我们视觉系统所知觉到的颜色的电磁脉冲。我们能看到的可见光其实只是电磁光谱上很窄的一部分。电磁光谱的范围从波长很短且不可见的伽马射线(γ射线),到无线电传输的长波(见文前彩图6.3)。其他物种可以看见光谱上的其他部分。例如,蜜蜂虽然看不到红色,却可以看到紫外线。
光以波的形式传播,而波的形状会影响我们看到的东西。光的 波长 (wavelength)是指相邻的两个波峰之间的距离(见文前彩图6.4a)。波长决定光的 色调 (hue),即我们看到的颜色,比如红色的花或绿色的叶。光波的振幅或高度,决定了它的 强度 (intensity)——光波所包含的能量大小,而强度影响亮度(见文前彩图6.4b)。
要想了解我们如何把物理能量转化成颜色和感觉,首先需要了解我们的心灵之窗——眼睛。
光线通过角膜进入眼睛,角膜弯曲并聚焦光线。然后光线通过瞳孔——一个大小可调的小孔。瞳孔的大小受虹膜调节,虹膜是瞳孔周围的有色肌肉。虹膜会根据光线的强度舒张或收缩。每个虹膜都很独特,因此虹膜扫描技术可以用来确认身份。虹膜能对认知和情绪做出反应。如果你有完整的视野,想象你在阳光明媚的天空之下,此时你的虹膜会收缩;想象你在幽暗的房间之中,你的虹膜会舒张(Laeng & Sulutvedt, 2014)。当你准备对一个问题说“不”或感到厌恶时,虹膜也会收缩(de Geeet al., 2014; Goldinger & Papesh, 2012);含情脉脉或感到信任时,你那明显舒张的瞳孔会暗示你的感受(Attard-Johnson et al., 2016, 2017; Kret & De Dreu, 2017; Prochanzkova et al., 2018)。
瞳孔后面就是透明的晶状体,它可以把进入的光线聚焦到位于对光具有敏感性的眼球内表面多层组织—— 视网膜 (retina)上。通过改变晶状体的曲率和厚度而聚焦光线的过程称作 适应 (accommodation)。如果晶状体将图像聚焦在视网膜前面的一个点上,你就能清楚地看到近处的物体,但看不到远处的物体。这种现象称作近视,近视可以通过佩戴眼镜或手术来矫正。
视网膜:对光具有敏感性的眼睛内表面,包含视杆细胞、视锥细胞以及开始加工视觉信息的神经元层。
适应:眼睛的晶状体改变自身形状使近处或远处的物体在视网膜上聚焦的过程。
几个世纪以来,科学家已经发现当蜡烛的图像经过一个小孔成像时,在黑暗的后壁上出现的是蜡烛倒置的镜像。如果视网膜接收的是完全颠倒的图像(如图6.5),那我们怎么能看到正向的世界呢?不断探求新知的达·芬奇提出了另外一种观点:也许是眼睛内的流体性物质使进入的光线被弯曲,在光线到达视网膜时再把图像的位置恢复原位。但是在1604年,天文学家和光学专家约翰内斯·开普勒(Johannes Kepler)发现,视网膜接收到的其实是完全颠倒的图像(Crombie, 1964)。我们是如何理解这样的一个世界的呢?困惑的开普勒说:“我把这个问题留给自然哲学家吧。”
图6.5 眼睛
蜡烛反射的光线会通过角膜、瞳孔和晶状体。晶状体通过改变曲率和厚度把近处或远处的物体聚焦在视网膜上。光线是沿直线传播的。所以蜡烛顶端发出的光线会到达视网膜底部,而蜡烛左侧的光线则到达视网膜右侧。因此,蜡烛在视网膜上形成的图像是颠倒并反转的。
现在的人认为:视网膜并不是将图像作为整体来读取的。想一想棒球击球手对投手的快球做出反应只需要0.4秒的例子,视网膜上数以百万计的感受器细胞将光能粒子转化为神经冲动,并将其转发给大脑,大脑将它们重新组合,正面朝上,使之成为击球手感知到的东西——即将来袭的快球!视觉信息加工以惊人的速度逐步渗透到更抽象的层次。
学习目标问题 6-8 视杆细胞和视锥细胞如何处理视觉信息?视觉信息从眼睛传递到大脑的途径是什么?
想象自己在追踪一个已到达视网膜的光能粒子。首先,你将穿过视网膜稀疏的外层细胞,到达眼睛的最里面。在那里,你会看到视网膜中隐藏的近1.3亿个感光细胞,即 视杆细胞 (rod)和 视锥细胞 (cone)(图6.6)。那里是光能引发化学变化的地方。这种化学反应会激活附近的双极细胞发出神经信号。然后,你可以看到双极细胞又激活了邻近的神经节细胞,这些神经节细胞的轴突像绳索一样缠绕在一起,形成 视神经 (optic nerve)。信息在丘脑短暂停留后,将被快速传递到最终目的地——位于大脑后部枕叶的视觉皮质。
视杆细胞:视网膜感受器,能识别黑色、白色和灰色,并对运动很敏感。当视锥细胞没有反应时,视杆细胞对于周围视觉和暗视觉来说是必需的。
视锥细胞:视网膜感受器,集中在视网膜中心,在白天或光线充足的条件下发挥作用。视锥细胞能探测到光线细节并产生颜色感觉。
图6.6 视网膜对光的反应
视神经是一条从眼睛到大脑的信息高速公路。视神经可以通过近100万条神经节纤维同时传送接近100万条信息(相比之下,负责听觉的听神经通过它仅有的30 000条纤维能传递的信息少得多)。我们为这种高速连接付出了代价。视神经周围的地方没有感受器细胞,于是形成了 盲点 (blind spot)。闭上一只眼睛。你的视觉消失了吗?并没有,因为你的大脑会自己填补盲点,无须你同意。
视神经:将神经冲动从眼睛传递到大脑的神经。
盲点:视神经离开眼睛的区域,那里没有感受器细胞。
检索练习
RP-1 视神经周围的区域没有感受器细胞,于是形成了我们视野中的盲点。为了证明这一点,请你闭上左眼,注视这个圆点,然后左右移动你的脸,直到其中一辆汽车消失(你预测哪一辆车会消失?)。闭上你的右眼,再重复一遍上述操作——注意现在消失的是另一辆车。你能解释这是为什么吗?
答案见附录D
视杆细胞和视锥细胞的位置和作用各不相同(表6.1)。视锥细胞分布在 中央凹 (fovea)及其周围,即视网膜中心聚焦的区域(图6.5)。许多视锥细胞有跟大脑联系的直接途径:一个视锥细胞将信息传递给一个双极细胞,再由双极细胞将信息传递给视觉皮质(皮质上有很大一部分区域接受来自中央凹的神经冲动)。这有利于保存视锥细胞的精确信息,使它们能更好地检测细节。视锥细胞可以识别白色,使你能够在非夜晚的时间感知颜色(Sabesan et al., 2016)。
中央凹:视锥细胞在视网膜中心聚焦的区域。
表6.1 眼睛中的感受器:杆状的视杆细胞和锥形的视锥细胞
视杆细胞(与视锥细胞不同)位于视网膜的外部区域,在弱光下仍保持较高的敏感性,形成黑白视觉。视杆细胞没有这种联系大脑的直接途径。如果说视锥细胞是独奏者,那么视杆细胞则是合唱团。多个视杆细胞可以把暗淡光线的微弱能量汇聚起来后输入同一个双极细胞,该细胞再将综合信息发送到你的大脑。
视锥细胞和视杆细胞分别具有不同的敏感性——视锥细胞对细节和颜色敏感,而视杆细胞对弱光和周边变化敏感。现在请花一分钟,体验一下视杆细胞和视锥细胞的区别。在这个句子中挑出一个字,并一直注视它,那么这个字的视像就会聚焦在中央凹的视锥细胞上。你有没有觉得其他的字变得很模糊?之所以看不清其中的细节,是因为周围其他字的视像更多激活了视网膜外围视杆细胞分布的区域。因此,在开车或骑车时,视杆细胞能让你先检测到周边视野中的汽车,然后才会感知到它的细节。
当你进入一个黑暗的剧院或在夜晚关灯时,你的瞳孔会扩大,以使更多光线到达视网膜。人眼通常需要20分钟或更长时间才能完全适应。这一段暗适应的时间与太阳落山到黑夜来临之际自然的黄昏过渡时间相对应。人体是多么奇妙啊!
在初级阶段,视网膜的神经层不仅传递电脉冲,还参与编码和分析感官信息这一过程(例如,青蛙眼睛的第三个神经层上有“昆虫探测器”细胞,只对类似于苍蝇的移动刺激做出反应)。在人眼中,任何给定的视网膜区域都会将信息传递到视觉皮质中相应的位置——枕叶。大脑的线路如此奇特,意味着眼睛所见的一半感官信息通过x形视交叉,到达大脑的另一侧(图6.7)。
视网膜细胞放电的敏感度同样可以导致其错误放电,你可以证明这一点。请把视线左移,闭上眼睛,然后用指尖轻轻地摩擦右眼皮的右侧。注意左侧的光斑在随着你手指的移动而移动。
图6.7 从眼睛到视觉皮质的途径
视网膜的神经节轴突形成视神经。视神经通向丘脑,在那里轴突与通向视觉皮质的神经元形成突触连接。
为什么你能看到光斑?为什么光斑在左边出现?这是因为视网膜细胞的反应性很强,压力也能触发其反应,但是大脑会把这种触发解释为光。此外,它还会解释光线来自左侧——正常激活视网膜右侧光线的方向。
自问
请想想过去一天你所做的活动中,哪些是依靠视杆细胞完成的?哪些是依靠视锥细胞完成的?如果没有这些细胞的多方面支持,这些活动会有什么不同——还是说这些活动根本无法完成?
检索练习
RP-2 一些如蟾蜍、小鼠、大鼠和蝙蝠之类的夜行动物,夜视能力极强,这是因为它们视网膜中______(视杆细胞/视锥细胞)比______(视杆细胞/视锥细胞)多得多。这些生物的______(彩色/黑白)视力可能非常差。
RP-3 猫的______可以张得比我们人类大得多,这样能够让更多的光线进入眼睛,让它们在晚上看得更清楚。
答案见附录D
学习目标问题 6-9 我们如何感知周围世界的颜色?
我们一般认为物体都具有颜色。我们说:“番茄是红色的。”也许你思考过这样一个老掉牙的问题:“如果有一棵树在森林中倒下却没有一个人听到,那么它发出声音了吗?”我们可以对颜色提出同样的问题:如果没有人看到番茄,那么它还是红色的吗?
答案是否定的。首先,番茄绝不是红色的,因为它“拒绝”了红色长波,把红光反射出去了。其次,番茄的颜色只是我们的心理建构。如艾萨克·牛顿指出的:“(光)线是没有颜色的。”和所有的视觉特性一样,颜色不是附着在物体上而是附着在我们大脑的剧场里。即使在睡梦中,我们也认为物体是有颜色的。
“在头脑里,罂粟花红了,苹果香了,云雀歌唱了。”
——奥斯卡·王尔德
在视觉研究中,最基本且引人入胜之处是我们如何看到多姿多彩的世界。大脑如何从冲击视网膜的光能中构建我们对如此多颜色的视觉体验?
现代对颜色视觉之谜的探索工作始于19世纪,德国科学家赫尔曼·冯·亥姆霍兹(Hermann von Helmholtz)在英国物理学家托马斯·杨(Thomas Young)观点的基础上进行了研究。杨和亥姆霍兹了解到任何一种颜色都可以用红、绿、蓝三原色光波混合产生。因此,他们推测眼睛必定有三种类型的感受器。
研究人员后来测量了对不同颜色刺激进行反应的不同视锥细胞,并且证明了 杨-亥姆霍兹三色理论 (Young-Helmholtz trichromatic theory)。视网膜上确实有三种类型的颜色感受器,每种感受器分别对红色、绿色或蓝色光波中的一种特别敏感。当光线同时刺激这些视锥细胞时,我们便会看到其他颜色。例如,我们视网膜上没有单独对黄色特别敏感的感受器,但当红色和绿色光波同时刺激对红色和绿色敏感的视锥细胞时,我们就会看到黄色。换句话说,当你的眼睛看到了红色和绿色而没看见蓝色时,你的大脑就会认为这是黄色。
杨-亥姆霍兹三色理论:视网膜上有三种类型的颜色感受器,分别对红色、绿色和蓝色最敏感,当同时刺激这些感受器时,便能感知任何颜色。
据估计,我们大多数人可以看到超过100万种颜色变化的差异(Neitz et al., 2001)。一些幸运的人(大部分是女性),由于是四色视觉者,可以看到多达1亿种颜色(Jordan et al.,2010)。一位具有四色视觉能力的女性看向一片树叶时说:“你可能看到了深绿色,但我能看到紫色、青绿色和蓝色,就像马赛克一样。”(Ossola, 2014)另一些人就没那么幸运了(大部分是男性),他们有与性别相关的色觉遗传缺陷。全世界约有1 /12的男性和1 / 200的女性是“色盲”。大多数有颜色缺陷的人实际上并不是完全的“色盲”。他们只是缺乏对红色、绿色或两种颜色都敏感的视锥细胞。他们的视觉是单色或双色的,而不是三色,这使得他们很难辨别红色和绿色。也许他们自己并不知道这一点,因为他们终身的视力似乎是正常的(Boynton, 1979)。狗也缺乏对红色波长的感受器,因此只能看到有限的两色(Neitz et al., 1989)。
在新加坡,显眼的黄色出租车的事故率比不那么显示的蓝色出租车低9%(Ho et al., 2017)。
但是为什么看不见红色和绿色的人仍然能看到黄色呢?而且,为什么黄色看起来是一种纯色,却不是红色和绿色的混合,就像紫色是红色和蓝色的混合一样呢?正如与亥姆霍兹同时代的生理学家埃瓦尔德·赫林(Ewald Hering)指出的那样,三色理论在色觉方面留下了一些未解之谜。
赫林在视觉后效 (afterimage)中发现了线索。注视一个绿色的正方形一段时间后再看一张白纸,你会看到红色——绿色的互补色。如果注视黄色的正方形,稍后你会在白纸上看到黄色的互补色,蓝色(如果想要体验这一过程,可利用文前彩图6.8中的彩色旗帜)。赫林猜测还有另外两个颜色加工过程,一个加工过程负责红-绿知觉,另一个加工过程负责蓝-黄知觉。
事实上,一个世纪后,研究人员证实了赫林的假说—— 拮抗过程理论 (opponent process theory)。这个概念很复杂,要点如下:色觉取决于三组互补的视网膜加工过程——红和绿、蓝和黄,以及黑和白。当光脉冲到达视觉皮质时,视网膜和丘脑的某些神经元会被红色“打开”而被绿色“关闭”,其他神经元会被绿色打开而被红色关闭(DeValois & DeValois, 1975)。就像红色和绿色的弹珠被送进狭长的管道一样,“红色”和“绿色”信息不能同时进行。因此,红色和绿色是互补的,所以我们要么看到红色,要么看到绿色,而不是红绿混合。但是红色和蓝色在不同的通道中传播,所以我们可以看到红蓝色混合而成的品红色。
拮抗过程理论:互补的视网膜加工过程(红和绿、蓝和黄、黑和白)形成了色觉。例如,有些细胞受到绿色的刺激,而受到红色的抑制;另一些则受到红色的刺激,受到绿色的抑制。
那么,拮抗过程是如何帮助我们理解彩旗演示中的视觉后效现象呢?答案是这样的(对于绿色变为红色):首先,我们因注视绿色而使自己对绿色的反应疲劳;之后当我们注视白色(白色包含了所有颜色,包括红色)时,由于对绿色的反应已经疲劳,红和绿这一组中只有红色部分可以被正常激活。
因此,目前对色觉之谜的解释大概是这样的。颜色加工发生在两个阶段,分别是:
1. 视网膜上红色、绿色、蓝色敏感的视锥细胞对不同颜色的刺激会做出不同程度的反应,正如杨-亥姆霍兹三色理论所指出的那样。
2. 然后,视锥细胞的反应受到拮抗过程细胞的加工,正如赫林的拮抗过程理论所提出的那样。
自问
当你得知颜色并不“存在”于我们所感知到的物体中——这些物体可以是任何颜色,除了我们所感知到的颜色——你会感到惊讶吗?如果有人问你,“草是绿色的吗?”在学本章节前,你将如何回答?
检索练习
RP-4 色觉的两个关键理论是什么?它们是矛盾的还是互补的?请你解释一下它们之间的关系。
答案见附录D
学习目标问题 6-10 特征觉察器位于何处,有何作用?
科学家们曾把大脑比作一个电影屏幕,眼睛能够在上面投射图像。后来,大卫·休伯尔(David Hubel)和托斯登·威塞尔(Torsten Wiesel)证明了视觉加工会解构视觉图像,然后再将其重新组装。休伯尔和威塞尔因其在 特征觉察器 (feature detector)方面的成就获得了诺贝尔奖。特征觉察器是枕叶视觉皮质中的神经细胞,能对场景的具体特征——特定的形状、线条、角度和运动做出反应。
特征觉察器:大脑视觉皮质中的神经细胞对刺激物的具体特征做出反应,如形状、线条、角度或运动。
利用微电极,他们发现猫以某个角度看到线条时,一些神经元会被激活,而不同的神经元则对不同角度的线条做出反应。他们推测这些专门的神经元——现在被称为特征觉察器,从视网膜上的单个神经节细胞接收信息。特征觉察器将这种特定的信息传递到其他皮质区域,在那里细胞团队(超级细胞群)对更复杂的模式做出反应。
对于生物学上重要的物体和事件,猴子的大脑(当然也包括我们人类的大脑)有一个“庞大的视觉百科全书”,存在一些专门细胞(Perrett et al., 1990, 1992, 1994)。这些细胞仅仅对某一种刺激做出反应,如特殊的凝视、头部位置、身体姿势或身体动作。只在这些刺激共同指明了个体的注意力和行动方向时,超级细胞群才会整合这一信息并放电。这一快速的分析有利于我们祖先的生存,也可以帮助曲棍球运动员预测射门方向,以及帮助司机预测行人的下一步行动。
图6.9 大脑是如何识别面孔的
像人类这样的群居动物有一块很大的右颞叶区域(如图所示的大脑右侧)专门用于识别面孔这一关键任务。与观赏著名建筑相比,观看著名人物的面孔更能够刺激这一梭状回面孔区(Gorno Tempini & Price, 2001)。
位于右耳边的颞叶区域(图6.9)能够帮你识别面孔,并且由于颞叶区域有一个专门的神经网络,你可以从不同的视角识别面孔(Connor, 2010)。这个梭状回面孔区帮助我们识别朋友和陌生人的面孔,与我们长相不同的人的面孔,以及来自相似种族的人的面孔(Hughes et al., 2019; Wiese et al.,2019)。如果一个人的梭状回面孔区受到刺激,可能会在没有其他人存在时看到面孔。某位参与者对实验者说:“你变成了另一个样子,你的脸不一样了。”(Koch, 2015)如果这个区域受损,他可能会无法识别熟悉的面孔,却可以识别其他物体。
当研究人员用磁脉冲暂时干扰大脑的面部加工区域时,人们无法识别面孔。但此时他们仍然可以识别其他物体,比如房子,因为大脑的面孔感知与物体感知是分开进行的(McKone et al., 2007; Pitcher et al., 2007)。因此,功能性磁共振成像(fMRI)扫描发现,当人们观察不同的无生命物体时,大脑的其他区域会被激活(Downing et al., 2001)。大脑活动非常具体,在大脑扫描的帮助下,研究人员“可以根据人类大脑的活动模式判断一个人是否正在注视一只鞋、一把椅子或一张脸”(Haxby, 2001)。
学习目标问题 6-11 大脑如何通过平行加工来构建视觉感知?
我们的大脑通过平行加工可以同时做很多事情。为了分析一个视觉场景,大脑会同时加工它的各个子维度——运动、形状、深度、颜色。
为了识别面孔,你的大脑将视网膜投射到几个视觉皮质区域的信息整合起来,并将其与存储的信息进行比较,从而使梭状回面孔区能够识别面孔。科学家们一直想弄明白,这些存储的信息是包含在单个细胞中,还是分布在一个细胞网络中,一点一点地建立面部图像(现在看来这种情况更有可能)(Tsao, 2019)。但一些超级细胞——常被戏称为“祖母细胞”——似乎确实在100张面孔中识别出了其中一两张面孔(Bowers, 2009;Quiroga et al., 2013)。整个面孔识别过程需要大量的脑力,涉及视觉、记忆、社交和听觉网络之间的连接(Ramot et al., 2019)。超级细胞需要大量的脑力。
破坏或禁用视觉子任务的神经工作站,就会出现一些奇怪的结果,就像发生在M夫人身上的那样(Hoffman, 1998)。中风导致她大脑两侧后部附近的区域遭到破坏,因而无法感知运动。房间里的人似乎“突然出现在这里或那里,但我没有看到他们移动”。向杯子里倒茶对她来说就是一项挑战,因为液体似乎是凝固的——她无法察觉液体正在杯中上升。
因中风或外科手术失去大脑视觉皮质的人,可能会体验到视野中某部分区域的消失(见第3章)。在视盲区域呈现一系列木棒,他们报告说看不到任何东西。然而,当要求他们猜测木棒是垂直呈现还是水平呈现时,他们通常会根据视觉直觉给出正确的答案。当被告知“你都答对了”时,他们大吃一惊。似乎存在另一个“大脑”——“平行加工”系统——负责加工不可见的信息。这些分别用来感知和行动的视觉系统再次说明了我们双通道思维惊人的双重加工过程。
* * *
想一想视觉加工的奇妙之处。阅读这些文字时,这些文字将光线反射到你的视网膜上,从而触发了一个过程——将无形的神经冲动发送到大脑的几个区域,这些区域能整合并解码信息。令人惊讶的是:我们已经跨越了时空,将信息从自己的大脑转移到你们的大脑中。这一切都能在瞬间完成且毫不费力地持续发生,这确实令人惊叹。正如罗杰·斯佩里提出的,“科学知识增强(而不是减弱)了对人类的强大能力产生敬畏、尊重和崇敬的理由”。
检索练习
RP-5 当你看到并认出朋友时,紧接着会发生什么事?
答案见附录D
学习目标问题6-12 格式塔心理学家是如何理解知觉组织的,以及图形-背景和分组原则是如何影响我们的知觉的?
图6.10 内克尔立方体
你看到的是带白线的六边形,还是立方体?如果你盯着立方体看,可能会发现它的位置变了,小小的字母X从前面的边缘移到了后面。有时,六边形跟在立方体后面,似乎在向前漂浮。其他时候,立方体穿过六边形形成的孔出现,看上去就像是立方体漂浮在这些孔后面一样。感知远比所见要多(Bradley et al., 1976)。
我们如何将图形-背景组织和解释为有意义的知觉——一朵盛开的玫瑰,一张熟悉的面孔,一次日落?在20世纪早期,几位德国心理学家提出了自己对这个问题的见解。他们注意到,人们倾向于将一组感觉信息组织成一个 格式塔 (gestalt,德语单词,意思是“完形”或“整体”)。当我们睁着双眼直视前方时,我们无法将感知到的场景分成左视野和右视野(仅用左眼可以看见左视野,反之仅用右眼可以看见右视野)。我们有意识的知觉一直都是一个无缝的场景——一个整体。
请看图6.10:这个图形叫作“内克尔立方体”(Necker cube),其实际上是8个六边形,每个六边形都包含三条汇聚的白线。当我们把这些元素放在一起会看见什么?内克尔立方体很好地阐释了完形心理学家最喜欢的一句话:在知觉方面,整体可能超过部分的总和。
格式塔:一个有组织的整体。格式塔心理学家强调我们倾向于将信息碎片整合成有意义的整体。
多年来,格式塔心理学家证明了许多我们用来将感觉组织成知觉的原则(Wagemans et al., 2012a, b)。这些原则基于一个基本事实:我们的大脑不仅记录关于世界的信息,知觉并不是印在大脑上的图像,我们大脑过滤传入的信息并构建知觉,知觉很重要。
请想象一下,假如你要设计一个像眼脑系统一样能一眼识别面孔的视频-计算机系统,那这个系统要具备哪些功能?
图形与背景 首先,系统需要通过感知 图形-背景 (figure-ground)来将面孔从背景中分离出来。在我们的眼脑系统中,这是第一个知觉任务——感知与周围环境(背景)不同的任何物体(图形)。当你阅读时,文字就是图形,无字区域就是背景。这种知觉也适用于听觉。在聚会上听到某人的声音时,那个人就成了图形,其他所有人都成了背景。有时,同一刺激会引发多个感知。在图6.11中,图形与背景的关系不断逆转。首先我们看到花瓶(或面孔),然后是面孔(或花瓶),但我们总是把刺激组织成一个与背景相对的图形。
图形-背景:将视野组织成从周围环境(背景)中突出的物体(图形)。
图6.11 可逆图形和背景
分组 在从背景中识别出图形之后,我们(以及我们的视频-计算机系统)还必须将图形组织成一种有意义的形式。我们会立即自动加工场景的一些基本特征——如颜色、运动和明暗对比(Treisman, 1987)。格式塔心理学家还发现,我们的大脑通过遵循特定的 分组 (grouping)规则为其他刺激带来秩序和规则。甚至在婴儿时期,在触觉感知中,我们都会运用这些规则。这些规则阐明了所感知的整体与部分之和的区别,就像水不同于其中的氢与氧之和一样(Gallace & Spence, 2011; Quinn et al., 2002; Rock & Palmer, 1990)。图6.12给出了三个例子。
分组:将刺激组织成连贯组的知觉倾向。
这些原则通常有助于我们构建现实。然而格式塔分组有时也会让我们误入歧途。
检索练习
RP-6 就知觉而言,乐队主唱会是______(图形/背景),而其他乐手是______(图形/背景)。
RP-7 当我们说,在知觉方面“整体可能超过部分的总和”,是什么意思?
答案见附录D
图6.12分组的三个原则
(a)基于邻近性,我们将位置邻近的图形分成一组。我们看到的不是六条独立的线,而是三组两条的线。(b)通过连续性,我们能感知到平滑、连续的图案,而非不连续的图案。这个图案可能是一系列交替的半圆,但我们认为它是两条连续的线——一条波浪形,一条直线。(c)利用封闭性,我们的大脑填补空白来创造一个完整的物体。因此,我们假设左边的圆是完整的,但部分被(错觉的)三角形挡住了。如果只添加一些小线段来封闭圆圈,你的大脑可能就不会再构建三角形了。
全球范围内,有一些城市用错觉的三维人行横道来减缓行车速度,这都要感谢艺术家Saumya Pandya Thakkar和Shakuntala Pandyaand(他们在印度首创了此类作品)。
深度知觉:虽然落在视网膜上的图像是二维的,但我们仍能形成三维知觉的能力。这种能力使得我们能够判断距离。
视觉悬崖:一种检测婴儿和动物幼崽尝试知觉的实验室装置。
学习目标问题 6-13 我们是如何利用双眼和单眼的线索来观察三维空间的?我们如何感知运动?
我们的眼脑系统有许多功能,其中包括 深度知觉 (depth perception)。通过视网膜上的二维图像,我们以某种方式形成三维知觉,例如,我们能够估计一辆迎面驶来的汽车与我们之间的距离。我们是如何获得这种能力的?我们生来就具有这种能力还是我们后天学会的呢?
当心理学家埃利诺·吉布森(Eleanor Gibson)在科罗拉多大峡谷(位于美国亚利桑那州西北部,科罗拉多高原西南)野餐时,对科学的好奇心让她开始思考这一问题:幼儿从峡谷边缘向下看时,会不会察觉到自己有坠落的危险并后退呢?为了寻找这一问题和一些其他问题的答案,吉布森和理查德·沃克(Richard Walk)在康奈尔大学实验室中用 视觉悬崖 (visual cliff,有着由坚固玻璃覆盖的“落差”区的悬崖模型)设计了一系列实验。他们把6~14个月大的婴儿放在“悬崖”边,让父母哄着婴儿趴在玻璃上或爬到玻璃上(图6.13)。大多数婴儿对此表现抗拒,这表明他们可以感知深度。
图6.13 视觉悬崖
埃利诺·吉布森和理查德·沃克设计了这个玻璃覆盖的微型悬崖,以检验爬行的婴儿和新生动物是否能感知深度。
深度知觉是不是婴儿后天习得的呢?学习似乎也是人生的一部分。在吉布森和沃克的经典视觉悬崖实验结束多年后,心理学家凯伦·阿道夫(Karen Adolph)继续研究婴儿运动发展(Adolph & Hoch,2019)。阿道夫等人认为,无论婴儿从何时开始学会爬行,爬行似乎都会加剧婴儿的恐高症(Adolph et al., 2014; Campos et al., 1992)。爬行的婴儿倾向于往下看,他们更有可能近距离感受到自己可能发生的危险(Kretch et al., 2014)。会出现这种倾向是因为学会避开悬崖他们才能生存。可移动的新生动物——即使是那些没有视觉经验的动物(包括猫幼崽、一天大的山羊和刚孵化的小鸡)——也拒绝冒险穿越视觉悬崖。这能够说明,天性让我们对高度保持警惕,而经验则放大了这种恐惧。
如果我们想要在视频-计算机系统中构建感知深度的能力,那么什么规则能让系统将二维图像转换成三维感知呢?我们的大脑能从单只或两只眼睛提供的信息中接收到深度线索,这就是一个很好的起点。
双眼线索 用两只眼睛看东西的人能够感知深度,这在一定程度上要归功于 双眼线索 (binocular cue)。你可以试着做一下这个小实验:睁开双眼,将两支钢笔或铅笔放在面前,并尝试用手去触摸笔尖,这很容易做到。现在闭上一只眼睛,再尝试用手去触摸笔尖,这似乎变得难了起来。
双眼线索:深度线索,如视网膜视差,这取决于你用单眼还是双眼看。
视网膜视差:感知深度的双眼线索。通过比较双眼上的视网膜图像,大脑计算出距离——两幅图像之间的差距(差异)越大,物体越近。
我们通过双眼线索判断自身与附近物体的距离。其中一个线索是视轴辐合,即双眼聚焦于近处物体时的内角。另一个是 视网膜视差 (retinal disparity)。由于双眼之间有距离,每个视网膜接收到的外部世界的图像略有不同。通过比较这两张图像,大脑就可以判断一个物体离你有多近。两张视网膜图像之间的差距(差异)越大,物体就离自己越近。试着这样做:将两根食指靠近鼻子,越近越好(但不要接触到鼻子),你的左右视网膜将接收到完全不同的两张图像。先只用左眼看,然后再只用右眼看,你就能看出区别(将两根手指靠近脸,就会看见一根“手指香肠”,如图6.14所示)。当距离比较远时——比如说把手指放在距离我们一臂的长度时,两只眼睛的图像差距就会小一些。
我们可以很容易地将视网膜视差纳入视频-计算机系统中。电影制片人有时会使用两个同一水平线上相距较远的镜头拍摄同一个场景。观众戴上眼镜观看电影时,左眼只看到来自左摄像机的图像,而右眼只能看到来自右摄像机的图像。3D影迷们都知道,这种效果模仿或夸大了正常的视网膜视差,让人产生深度知觉。
图6.14 漂浮的手指香肠
把你的两个食指放在眼睛前方约12厘米处,指尖相隔1厘米。现在将视线拉远点,你看到了什么?将手指向外侧移动时,两只眼睛视网膜的差异——也就是形成的“手指香肠”——会缩小。
单眼线索 我们如何判断一个人在10米外还是100米外呢?视网膜视差在这种情形下无法提供帮助,因为投在我们左右视网膜上的图像差别不大。因此我们通过 单眼线索 (monocular cues)判断距离(每只眼睛单独得到的深度线索)。
单眼线索:一种深度线索,如插入或线条透视,可作用于任何一只眼睛。
检索练习
RP-8 我们通常如何感知深度?
答案见附录D
想象一下,就像M女士之前描述的那样,你可以感知世界的颜色、形状和深度,但却无法感知运动。你不仅不能骑自行车或开车,而且就连写字、吃饭和走路也会有困难。
通常情况下,大脑会部分依据“正在缩小的物体在后退(而不是变小)和正在放大的物体在靠近”这一假设感知运动。而幼儿这种正确感知车辆正在靠近(和放大)的能力尚未完全发展,因此他们可能遭遇事故(Wann et al., 2011)。但其实不只是儿童在运动感知方面有困难。成年人的大脑有时也会被欺骗,相信并非亲眼所见之事。当大型和小型物体以相同的速度移动时,大型物体似乎移动得更慢。因此,火车的速度似乎比汽车慢,巨型喷气式飞机的着陆速度似乎比小型喷气式飞机慢。
你有没有注意到,虽然每次眨眼只需要0.1秒,但是这0.1秒会打断视线多少次呢?——大约每分钟15次还是每天15 000次?可能每一次眨眼并不会打断视线。我们的大脑将一系列快速变化的图像视为连续的运动(这种现象称为频闪运动)。正如电影动画师所熟知的那样,在一秒钟播放24张静止图片的超高速幻灯片会让人产生一种运动的错觉。我们在大脑中构建这种运动,就像在闪烁的字幕和节日的灯光中构建运动一样。当两盏相邻的静止的灯在快速连续地闪烁时,我们所感知到的是一个单独的灯在来回移动。发光标志利用这种 似动现象 (phi phenomenon),用一连串灯光创造出了一种运动错觉。例如,一个移动的箭头。
似动现象:两盏或多盏相邻的灯连续快速闪烁时产生的一种运动错觉。
学习目标问题 6-14 知觉恒常性如何帮助我们构建有意义的知觉?
目前我们已经发现,我们的视频-计算机系统只能感知具有独特形状、位置和运动的物体——像我们一样。视频-计算机系统的下一个任务是在不被其颜色、明度、形状或大小的变化所欺骗的前提下识别物体——这一自上而下的过程称为 知觉恒常性 (perceptual constancy)。无论视角、距离和照明情况如何,我们都能在比呼吸更短的时间内识别人和物。这一壮举对视频-计算机系统来说是一个巨大的挑战。
知觉恒常性:即使光照和视网膜图像发生变化,依然认为物体不变(具有一致的颜色、亮度、形状和大小)。
颜色和明度恒常性 詹姆斯·吉布森(James Gibson, 1979)主张一种生态逻辑(ecological approach)的感知方法,即我们的感知取决于物体所处的环境。想象一下你是如何感受西红柿的颜色的,如果你用纸筒观察它一天,它会有什么变化。随着光的变化——也就是番茄反射波长的变化,番茄的颜色似乎也会改变。但如果你扔掉纸筒,把西红柿看作沙拉碗里的一个东西,它的颜色就会保持基本不变,我们将这种一致的感知现象称为颜色恒常性。
“从这里到那里,从那里到这里,哪哪都是有趣的事情。”
——苏斯博士
虽然我们认为颜色具有恒常性是理所当然,但这一能力确实很神奇。室内照明下蓝色扑克筹码反射的波长与阳光照射下金色筹码反射的波长一致(Jameson, 1985)。但是,金丝雀并不会因为在室内就看起来像一只蓝知更鸟。我们之所以能看到鸟的颜色,不是因为鸟的羽毛有颜色,而是因为我们的大脑会计算一个物体相对于周围物体所反射的光线。
明度恒常性(brightness constancy,也称作lightness constancy)同样取决于环境。我们认为即使光照强度在变化,物体的明度仍是恒常的。这种对恒常性的感知取决于相对明度——物体相对于其周围环境反射的光量(图6.15)。白纸能反射落在它上面90%的光,而黑纸只能反射10%。尽管在阳光下看到黑纸反射的光可能比在室内看到白纸反射的光强100倍,但这张纸看起来仍然是黑色的(McBurney & Collings, 1984)。但如果试着通过一根狭窄的管子观察阳光下的黑纸,此时我们除了黑纸以外,其他什么都看不到了,这张黑纸可能看上去是灰色的,因为在强光下它会反射相当多的光。在没有管子的情况下看,这张纸看上去则是黑色的,因为它反射的光线比周围的物体少得多。
图6.15 相对明度
由于周围环境原因,我们认为正方形A比正方形B的颜色更亮。但它们的颜色是一样的。用喜剧演员理查德·普赖尔(Richard Rryor)的话说:“你会相信谁:我,还是你那会骗人的双眼?”如果选择相信说谎的眼睛——实际上是说谎的大脑——你可以复印这幅插图,然后剪下方块进行比较(Edward Adelson, 1995)。人类非常容易犯这种错误,因此在知道垃圾邮件机器人会正确回答此类问题的情况下,某个计算机系统会利用这种错误来识别人类网站用户。
我们不是孤立地感知物体,而是在其所处的环境背景中感知它。这一原则对艺术家、室内装潢师和服装设计师来说很重要。我们对一面墙壁颜色和明度的感知,对画布上一抹油漆颜色的感知,不仅与油漆本身有关,也与周围的颜色有关。经验告诉我们:环境支配着我们的感知。
形状和大小恒常性 如图6.16中的门,即使我们的视网膜接收到的图像是不断变化的,由于形状具有恒定性,我们认为熟悉物体的形状是不变的。我们的大脑之所以能做到这一点,是因为视觉皮质神经元能迅速将物体的不同视图联系起来(Li & DiCarlo, 2008)
根据大小恒常性,我们认为一个物体的大小不变,即使我们与它之间的距离发生了变化。假设有这么一辆公共汽车,即使这辆公共汽车在两个街区外看起来比较小,我们也认为它足够大,完全可以载人。这个假设也说明了距离知觉和大小知觉之间的密切联系。感知一个物体的距离可以让我们知道其大小。同样地,我们知道一辆公共汽车通常的大小,相当于我们知道它离我们的距离。
图6.16 形状恒常性
当一扇门打开时,它会在我们的视网膜上投射出越来越明显的梯形图像,但我们仍然认为它是矩形的。
然而,即使是在对大小-距离做出判断时,我们也要考虑物体所处的环境。这种感知到的大小和距离之间的相互作用有助于解释几个著名的错觉现象,包括月亮错觉现象(moon illusion):月亮在地平线附近时看起来比在高空中大50%。你知道这是为什么吗?
学者们思考这一问题已长达22个世纪(Hershenson, 1989)。其中一个原因是,感知某个物体距离的单眼线索使地平线上的月亮看起来更远。我们的大脑认为,如果地平线上的月亮离我们更远,那么它一定比夜空中的月亮更大(Kaufman & Kaufman,2000)。同样地,如果你通过纸筒观察(此时没有距离线索),地平线上的月亮就会立即显得小了一些。
“有时我想知道:为什么我看到那个飞盘变得越来越大?然后它就击中了我。”
——匿名者
错觉让我们明白了一个基本的道理:知觉不仅仅是世界对我们大脑的投射。相反,我们的感觉被分解成信息碎片,然后由大脑重新组合成外部世界的功能模型。在这个重组过程中,我们的假设——比如距离和大小之间通常存在的关系——可能会把我们引入歧途。我们的大脑构建了我们的感知。
* * *
形状知觉、深度知觉、运动知觉和知觉恒常性能够解释我们如何组织视觉感知。知觉组织也适用于我们的其他感官。在听一门不熟悉的语言时,我们很难在一句话中捕捉到单个的词语;当我们听自己的语言时,我们会自动听到不同的单词。这也反映了知觉组织。不仅如此,我们甚至能把一串字母——THEDOGATEMEAT——组织成一个可以理解的短语:它更可能是“THE DOG ATE MEAT”而不是“THE DO GATE ME AT”(McBurney & Collings, 1984)。这个过程不仅包括我们一直在讨论的知觉组织,还涉及知觉解释——在我们所感知到的事物中辨别意义。
哲学家们一直在争论,我们的感知能力应该归功于固有的天性还是后天的教养。知觉在多大程度上受到学习的影响?德国哲学家伊曼纽尔·康德(Immanuel Kant,1724—1804)认为,知识来自我们组织感官信息的先天方式。的确,我们生来就具备处理感官信息的能力,但英国哲学家约翰·洛克(John Locke,1632—1704)认为,我们也能通过自身经验学会如何感知世界。事实上,我们学会了将物体的距离与其大小联系起来。那么,经验到底有多重要呢?它是如何从根本上塑造我们的知觉解释呢?
学习目标问题 6-15 关于经验对知觉的影响,对视力恢复、感觉限制和知觉适应的研究揭示了哪些内容呢?
视力恢复和感觉限制 在写给洛克的信中,威廉·莫利纽克斯(William Molyneux)问道:“一个天生失明的人现已成年,并通过触摸学会了区分立方体和球体,若现在视力恢复,他能否在视觉上区分两者呢?”洛克的回答是否定的,因为这个人从未看见这两者的区别。
“我们的感知是一张白纸,上面没有任何记号,也没有任何观念。那我们后期的感知是如何形成的呢?对此,我的回答是一个词——经验。”
——约翰·洛克
随后,出现了这样的真实例子——有些人出生时失明,但后来获得了视力——莫利纽克斯的假设也因这些例子得以被检验(Gandhi et al., 2017; Gregory, 1978; von Senden, 1932)。大多数患有先天性白内障的人透过混浊的晶体,只能看到漫射的光线——就像视力正常的人通过折叠几次的纸巾向外看,只能看到模糊的图像一样。白内障手术后,患者能够区分人物和背景,区分颜色,区分面孔和非面孔——这表明感知这些方面的能力是与生俱来的。但正如洛克所设想的那样,他们往往仍然无法从视觉上识别那些通过触摸熟悉的物体。
为了让先天性白内障病人能恢复得更好,研究人员人为影响了初生小猫的视力(Hubel & Wiesel, 1963)。过了婴儿期,小猫的视力得以恢复,此时它们的行为就像先天性白内障人类患者一样。它们能区分颜色和明度,但不能区分圆形和方形。它们的眼睛没有退化,视网膜仍能将信号传递到视觉皮质,但由于缺乏早期刺激,它们的大脑皮质细胞没有发展出正常的连接。因此在功能上,这些动物仍然看不见形状。
对印度儿童进行的手术表明,天生失明的儿童可以通过白内障切除手术恢复视力。并且儿童年龄越小,恢复程度越好。但他们的视敏度(清晰度)可能永远无法恢复正常(Chatterjee, 2015; Gandhi et al., 2014),对于正常的感官和知觉发展来说,有一个关键期——一个需要接触某些刺激或获得某种经验的最佳时期。
一旦过了这个关键时期,往后生活中的感官限制就不会造成永久性的伤害。研究人员蒙住一只成年动物的眼睛几个月,它的视力在眼罩移除后并未受到影响。当外科医生切除在成年后期形成的白内障时,大多数人都会为视力恢复正常感到兴奋。
知觉适应 戴上新眼镜时,我们可能会有点儿分不清方向,甚至感到头晕目眩。但在一两天内,我们就会适应。这是因为我们对发生改变的视觉输入产生 知觉适应 (perceptual adaptation),这种适应使世界看起来恢复正常。但是,想象一下有一副更戏剧化的新眼镜,能让物体的位置看起来像是往左移了40度。当你第一次把球扔给朋友时,球会往左偏移。当你走向前与人握手时,你的手也会往左偏移。
知觉适应:适应变化的感觉输入的能力,包括人工移位甚至倒置的视野。
你能适应这个扭曲的世界吗?如果你是一只小鸡,那么你将无法适应。当戴上这种眼镜时,小鸡会继续啄食看起来有食物的地方(Hess, 1956; Rossi, 1968),但我们人类很快就适应了会导致扭曲的镜片。几分钟内,你会重新校准投掷的方向,你的步伐仍然朝向目标。但是摘下眼镜后,你会经历一些后遗症:一开始,你投的球会朝相反的方向——右边飞去;但同样地,几分钟内你会重新适应。
事实上,如果你有一副效果更戏剧性的眼镜——一副可以真正倒置真实世界图像的眼镜——你仍然可以适应。心理学家乔治·斯特拉顿(George Stratton, 1896)就做了相关实验。他发明了一种能将左边图像翻转到右边、上面图像翻转到下面的光学头套,并佩戴了八天。他是第一个在直立状态下体验到右旋视网膜图像的人——地面朝上,天空朝下。
起初,当斯特拉顿想走路时,他发现自己在寻找自己的脚,而他的脚现在是“朝上”的,他几乎无法吃饭。他开始感到恶心和沮丧,但斯特拉顿坚持了下来,到了第八天,他可以轻松地伸手取物,而且如果他的手在视线范围内,他走路时也不会撞到东西。而当斯特拉顿最终摘下头套时,他很快就重新适应了。研究人员后来也在骑摩托车、在阿尔卑斯山滑雪,以及驾驶飞机时佩戴了这种头套(Dolezal, 1982; Kohler, 1962)。通过在倒置的世界中积极活动,他们适应了新的环境,并学会了协调自己的动作。
那么,我们是否学会了感知世界?我们在一定程度上做到了,因为我们不断自我调整以适应变化的感官输入。对关键期进行的研究使我们了解到,早期的经验影响我们对世界的感知。在我们的一生中,早期的经验一直默默无闻地发挥着自己的作用。指导、支持并维护着让我们得以感知的大脑通路。
自问
请想想你认识的患有某种视力障碍的人(也可能是你自己),在视觉加工过程中,什么样的干扰可能导致视力障碍?