购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

“魔鬼的集会”

词汇通达的几个模型,实现了模拟在类似于神经系统所创造的条件下,人类阅读系统的行为。其中,几乎每一个模型都是在奥利弗·塞尔弗里奇(Oliver Selfridge)于1959年提出的几个观念的基础上发展而来的。塞尔弗里奇提出,心理词典的工作方式就像魔鬼的大型集会,或者叫“鬼蜮”(pandemonium) 28 。他把心理词典生动地比喻为一个由上万魔鬼围成的巨大半圆,而魔鬼们都在彼此竞争。每个魔鬼都只对一个词有反应,而且必须在这个词被喊到的时候大叫,以便让大家知道这是他的词。每当一个字母串出现在视网膜上时,所有的魔鬼都同时仔细地观察它。那些认为自己的词可能出现了的魔鬼就会大叫起来。因此,当“scream”(喊叫)这个词出现时,负责这个词的魔鬼就会大叫,但是他的邻座,那个对“cream”(奶油)进行编码的魔鬼也会大叫。“scream”还是“cream”?短暂的竞争之后,代表“cream”的魔鬼放弃了,很明显,他的对手从字母串“s-c-r-e-a-m”这一刺激中得到了更强的支持。至此,这个单词就被识别出来了,并且可以进入系统的后续加工。

在这个简单的比喻背后,隐藏着关于阅读过程中神经系统工作方式的几个关键观点:

所有这些简化的特征都与神经系统的主要特征相吻合。人类的脑大约由一千亿个细胞组成,简直就是一个巨型的并行计算系统的原型,所有神经元都同时进行运算。这些神经元之间的被称为突触的连接,从外界的感觉刺激中为神经元带来计算的依据。此外,还会有一些突触是抑制性的,即当该突触的源头神经元放电时,其他神经元的放电就被抑制了。加拿大的神经生理学家唐纳德·赫布(Donald Hebb)将这种并行运算形容为一种神经网络,名叫“细胞集群”,指不断竞争的神经细胞之间的联合。因此也无怪乎塞尔弗里奇的鬼蜮模型为那么多有关神经系统的理论模型提供了灵感,其中也包括第一个阅读的神经网络模型。图1-6显示了最早的这类模型中的一个,该模型由杰伊·麦克莱兰(Jay McClelland)和戴维·鲁姆哈特(David Rumelhart)在1981年提出 30 。这个模型包括了类似神经元的单元所组成的三个层级。

图1-6 麦克莱兰和鲁姆哈特的模型

单词识别就像是在一个成千上万字母和单词单元的大集群中,各单元彼此合作找出输入字母串的最佳解释的过程。本图仅显示了麦克莱兰和鲁姆哈特模型中的一小部分。该模型中,输入字母串的基本特征激活字母探测神经元,而字母探测神经元再优先连接到包含这些字母的单词的探测神经元。这些连接可以是兴奋性的(箭头)也可以是抑制性的(圆头线段)。而单词单元通过激烈的竞争最终选出一个获胜的单词,这个单词就是输入字母串在网络中所产生的最佳结论。

所有这些单元都被千丝万缕的连接紧密地联系在一起。这种数量庞大的连接使得这一网络的运作变成了一场复杂的政治博弈,字母和单词彼此支持,彼此检查,或者彼此消灭。仔细观察这张图表,你就可以看到,既存在由箭头表示的兴奋性连接,又存在以圆头线段表示的抑制性连接。它们的职责是传递每个魔鬼的投票。每一个输入探测神经元都对某一特定的特征进行编码,如竖直线,然后将刺激信息传递给所有包含这一特征的字母——为了简单起见,我们可以说每一个视觉神经元都对这些字母是否进入下一层级进行“投票”。同样,在下一个层级上,字母探测神经元便依据每个单词相应的单元所提供的刺激,共同推选出某些单词。例如,“A”和“N”的出现,可以支持“RAIN”和“TANK”这两个单词,而对单词“RAIL”只有部分支持,对单词“PEST”则完全不支持。

抑制在筛选最佳候选词时也发挥作用。由于抑制性连接的存在,每个字母都可以给那些不包含它们的单词投反对票。例如,对“N”进行编码的单元会通过抑制的方式给“RAIL”这个词投反对票。此外,互相之间存在竞争的单词会彼此抑制。因此,出现“RAIL”时就不能识别为“RAIN”,反之亦然。

最后,自上而下的连接也是必要的,即从单词到其组成字母的连接。我们可以把这一过程比喻为参议院,单词在参议院中代表了字母的声音,并且会反过来支持选举出它们的那些字母。互利的连接创造了一种稳定的合作关系,可以避免偶然出现遗漏字母的情况影响单词的识别。例如,如果单词“crocodile”中少了一个“o”,与“o”相邻的字母们仍然会选举出“crocodile”一词,而这个词又会反过来支持词中间的“o”出席,虽然书写时把它漏掉了。最终,为了支持这种将单词、字母、特征联系起来的巨量的统计学约束,我们需要上百万的连接。

还有其他一些微妙的特性使得整个网络得以流畅运行。例如,每一个单词所对应的单元的放电阈限可能会不同。常见单词的阈限比罕见单词的阈限低,在拥有等量的自下而上的支持时,常见单词更容易胜出。最近的一些模型还纳入了对字母位置的细致编码过程。所产生的网络运作模式非常复杂,已经无法进行算术描述了。我们必须借助电脑模拟的方法才能知道系统识别出正确单词所需要的时间,以及它出错的频率。 RwXGcBlPLF0OT2zaDDSW4f2/cXCH+agYDMBvee7zxxfa766mo2no0RUN9ZSslxUn

点击中间区域
呼出菜单
上一章
目录
下一章
×