视觉使用一种组织严密的系统来应对单词识别中的恒常性问题。我们将在第2章中详细了解到,进入视觉脑区的神经活动将一步一步被整理成有意义的分类。非常相似的形状,例如“eight”和“sight”,将通过一系列越来越精细的过滤,在这一过程中被逐渐区分开,并对应到心理词典中的不同词条上去。所谓的心理词典是一个虚拟的词典,它记录着我们看到过的每一个词。相反,像“eight”和“EIGHT”这样形状特征明显不同的图形,开始在初级视觉皮质由不同的神经元加工,但在不断重新编码的过程中,它们逐渐变得几乎不可分辨。探测特征的神经元从“i”与“I”之间找到相同点,也有更加抽象的探测字母的神经元将“e”与“E”归类为同一个字母的两种不同形式。不论最初的差异有多大,阅读者的视觉系统最终将对字母串“eight”和“EIGHT”的本质进行编码,而忽略它们的具体形状。视觉系统让这两个字母串指向了思维中相同的“地址”,所产生的抽象代码让脑的其他部分可以进一步提取这个单词的发音和意义。
这种“地址”是什么样的?有一些模型认为,脑使用了一种无结构的列表,表中只是提供了E-I-G-H-T这一字母序列。也有的模型认为,脑使用了一种非常抽象、非常传统的编码方式,与随机密码表相似,例如1296是“eight”而3452是“sight”。然而,当代的研究支持的是另外一种假设:很可能每一个书面单词都由一个树形结构进行编码,在这个结构中字母被组合成稍大一级的单元,而这些单元则再组合成音节与单词,就像人体可以划分成下肢、上肢、躯干和头,而这每一个部分又可以进一步划分为更简单的单元。
例如,我们可以看一下怎样将“unbuttoning”这个单词分解成相应的小单元。我们必须先将前缀“un”和熟悉的后缀“ing”(也可以把它看作由语法产生的结尾)拿掉。它们都是用来修饰这个词的中心元素,也就是词根“button”的,即词中词。而这三个组成部分统称为“词素”(morpheme),即具有语义的最小单位。在这个水平上,词素的组合方式就是一个单词的特征。将一个词分解为词素甚至可以帮我们理解从来没有见过的词,例如“reunbutton”或“deglochization”,我们能看出这个词指的是与“gloch”相反的动作,虽然我们不知道“gloch”是什么意思。在某些语言中,例如土耳其语和芬兰语,词素可以组成超级长的单词,这些单词可以承载的信息与整个英文句子一样多。在这样的语言中,当然在英语里也一样,将词分解为词素对于从视觉到语义的转换过程尤为重要。
很多实验数据表明,视觉系统可以非常迅速地,甚至根本是无意识地从单词中识别出词素。例如,如果我们让“departure”在电脑屏幕上一闪而过,再给你呈现“depart”时,你就能更快地读出来。这是因为呈现“departure”对于词素“depart”进行了预激活,从而使你提取起来更容易了。心理学家称之为“启动”(priming)效应,即阅读一个词的时候会启动对其他相关词的阅读,就像是预先为水泵灌好水,让它更快地开始输送一样。
重要的是,启动效应并不只是依赖视觉相似性:看起来差异很大但却拥有相同词素的词,像“can”和“could”也可以彼此启动;而那些看起来相像,但却没有共同词素的单词,像“aspire”和“aspirin”则不会彼此启动。启动也并不需要两词在语义水平上有相似性,例如“hard”和“hardly”,或“depart”和“department”也可以彼此启动,虽然它们的意义基本上是无关的 12 。将词分解为词素这一过程,对阅读系统似乎非常重要,因为我们有时甚至会去猜测单词的分解方法。阅读系统将“department”分解为“depart”和“ment”,以方便后续加工过程解码出这一单词的意义 13 。不过这种机制并不是完美的,一个无精打采(listless)的人并不是在等一份杂货清单(grocery list)的人,而你与室友同住一间公寓(apartment)也并不意味着你们将很快分离(live apart)。不过不要介意,这种解析错误会在单词分解过程的其他阶段中得到修正。
如果进一步分解“unbuttoning”这个单词,就会发现词素“button”本身并不是一个不可分割的整体。它由两个音节[bʌ]和[ton]组成,而这两个音节又可以分解为单个的辅音和元音:[b][ʌ][t][o][n]。这里,我们又看到另一个对阅读系统至关重要的单元:字素(grapheme),即对应目标语言中一个音素的一个或一系列字母。注意,在我们的例子中,双字母“tt”对应一个单独的音[t] 14 。实际上,由字素到音素的对应并不总是直接的。在很多语言中,字素可以由一组字母构成。英语中就包含了特别多的复杂字素,例如“ough”、“oi”和“au”。
视觉系统学会了如何将这些字母组合看作真正的单位,甚至已经不再深究它们究竟是由什么字母组成的了。我们用一个小实验来证明这个观点。请观察下面一组单词,并标出包含“a”的单词:
garage
metal
people
coat
please
meat
你有没有感觉到,在最后的三个单词“coat”“please”“meat”上,你的速度稍稍减慢了一点?这三个词都包含字母“a”,但是“a”嵌在一个复杂字素中,而这个字素的发音又不像“a”的发音。如果我们仅仅利用探测字母的神经元来探测“a”的存在,将单词划分成字素并没有意义。然而,实际的反应所用的时间清楚地表明,脑的加工并不止步于单字母水平。视觉系统会自动地将字母再分组为更高级的字素,这就让我们更加难以判断类似“ea”的分组中是否真的含有“a”的问题了 15 。
接着,字素将被自动地组合为音节(syllable)。这里也有一个小例子来证明这一过程。你将看到一些由5个字母组成的单词。有一些用了 黑体 ,有一些用了正常字体。请将注意力集中于中间的字母,试着判断出它是黑体还是正常字体:
第一组 HO RNY RID ER GR AVY FIL ET
第二组 VOD KA ME TRO HAN DY SU PER
你有没有觉得第一组比第二组稍稍难一点?在第一组中,黑体字符并不代表音节的边界,例如在“ RID ER”中,“D”是黑体而其所在音节的其他字母都是正常字体。我们的思维倾向于将组成一个音节里的字母组合到一起,这与黑体对字母的分组形成了冲突,导致我们的反应明显变慢了 16 。这个现象说明视觉系统会自动将单词划分为基本组成单元,即使我们并不希望它这样做。
单词组成成分的性质现在还是一个很热的研究课题。看起来,单词的分解存在不同的层次:最底层是单个字母,然后是一对字母,或者叫作双字母(bigram,这是一个重要的单元,我们后面还会讲到),双字母后是字素,再接着是音节、词素,最后才是单词。最终,视觉加工将一个单词解析成一个层级结构,即一个树形结构,其树枝为大小逐级递增的单元,而叶子则是字母(见图1-3)。
图1-3 单词的树型结构
单词串就这样被简化到极致,去掉了不相关的字体、大小写、字号信息,分解为基本要素,从视觉系统传至脑的其他区域,加工出单词的语音和意义。