购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

语言突破瓶颈

这个极其狭窄的“事不宜迟瓶颈”只能容纳几个词,要获得更多的信息似乎是一种奢望,更不用说复杂的哲学思想,汇编成《贝奥武甫》(Beowulf)、《奥德赛》(Odyssey)或《摩诃婆罗多》(Mahabharata)的口头故事,甚至连打听最近的超市怎么去也很困难。由于受到用计算机隐喻大脑的误导,语言学和语言心理学的许多理论过去一直认为大脑可以先接收并保存长串的语言材料,然后再弄清楚这些材料是如何组合在一起的。毕竟,一台传统的计算机不仅可以完全准确地存储大量信息,如果安装了合适的软件,还可以在待机时检查隐藏在数据中的模式。然而,大脑的工作方式并非如此——大脑并没有硬盘,无法方便地下载并存储声音文件便于以后的检索和审核。那么,我们如何能够通过这个狭窄的瓶颈获得更多的语言呢?

6月的那个重要夜晚,我们在马克斯·普朗克心理语言学研究所仔细琢磨着“语言是猜谜游戏”的想法,随后得出了一个重要的结论:“语言是猜谜游戏”这一观点侧重于合作和即兴创作,为我们了解大脑解决瓶颈问题的方式提供了关键的见解。如果要猜测某人想要模仿什么,那么我们需要将他们头、手、胳膊和腿的不同动作拆分成我们能够理解的独立单元。再想想尼克家将手指搭成尖塔状代表船头的例子。双手可以上下晃动,表示一艘船正在横越大洋(甚至表示哥伦布的航行);也可以向下俯冲,表示这艘船正在沉没(可能是指“泰坦尼克号”)。在这两种情况下,表示船的手势都需要与这两种类型的动作分开考虑。我们需要将手势拆分为可重复使用的不同要素。通常情况下,就像一般的交流一样,如果单独考虑这些不同的手部动作,那么它们表示的含义是非常模糊的。如果我们不把手指搭成尖塔状,而是把双手稍稍分开,假装握着方向盘,那么上下晃动的动作就可以表示通过一连串减速带,而向下的动作可以表示从一座极其陡峭的山峰开下来(如果再加上适当的恐惧表情,甚至可以表示越过悬崖)。一个连续的动作可以分解为单独的小块,即单个手势和动作,再进行灵活处理并加以创造,就可以在不同语境中重新使用并得到理解。

适用于“你比我猜”游戏的方法一般也适用于语言游戏。克服“事不宜迟瓶颈”的秘诀是时刻“组块”:这是一种基本的记忆过程,我们可以通过这种方法将两个或多个元素组合成一个单元(例如将一串11位数的英国电话号码分成三个小块,分别对应区号、交换码和线路号码)。通过将输入的语言材料组合成更大的单元,我们便能在遇到它时立即理解。然后,这些语块可以传递下去以用于其他更复杂的分析,并可能进一步组合成更大的单元。为了直观地感受语块的作用,请大声朗读以下一串随机字母,然后闭上眼睛,试着按正确的顺序回忆尽可能多的字母:

m u e g a g l e g a n a

大多数人只能想起四五个字母。事实上,我们从几十年的研究中得知,短期记忆仅限于少数几项信息,所以要回忆起全部的12个字母是一项不可能的任务。现在,试着再次完成相同的任务,但此次字母顺序进行了重组:

l a n g u a g e g a m e

这12个字母的字符串突然变得好记多了,因为我们可以把它分成language和game这两个熟悉的单词。要记住第一个字符串中的12个随机字母几乎是不可能的,但是你只需要记住两个单词,再把它们拼写出来,就可以重建第二个字符串。实际上,限制我们短期记忆的并不是字母或单词这种特定类型的元素,而是“语块”。组块可以帮助我们把较小的元素归并成更大的元素,从而减轻记忆和注意力的压力。

但是组块需要进行大量的练习。如果没有经过数千小时的广泛阅读练习,如果没有掌握大量的英语单词,那么你不可能记住第二个由12个字母组成的字符串。如果不识字,你甚至不会认为这是12个字母,而只是陌生且无法解释的弯曲线条——在这种情况下,记住并复述哪怕一个字母都可能是一种挑战。正如“古希腊七贤”之一的佩里安德(Periander)的名言:“练习即是一切。”(Practice does everything.)

如果这句话是正确的,那么我们也许能通过将数字组合成有意义的、更便于记忆的组块,并不断地练习这个方法,以此记住一长串无意义的数字。实际上从古希腊演说家时代起,将模式强加于毫无意义的材料就一直是记忆方法的核心。在20世纪70年代末,一个名叫史蒂夫·法隆(Steve Faloon)的年轻本科生——其姓名缩写SF在记忆文献中更广为人知,证明了这种方法可以产生惊人的效果。大多数人能记住5个左右的数字,而他可以记住多达79个随机数字!当法隆同意参加由卡内基梅隆大学的记忆研究者、后来的知名专家安德斯·埃里克森(Anders Ericsson)进行的实验时,他只是一名普通的本科生,没有出众的记忆力,也没有学习任何专门的记忆技巧。 他并不是轻而易举就拥有了惊人的记忆力:他在实验室里花了几百个小时乏味地记忆随机的数字串,听到的数字以每秒一位的速度读出。随着时间的推移,他学会了将数字组合成更大的数字串,比如将数字与跑步时间(法隆酷爱越野跑)或者著名的日期(如1944代表“第二次世界大战即将结束”)对应起来。后来,他发展出将这些数字串集合成更大的“超级组块”的方法,每个超级组块由多个跑步时间或日期组成。通过一次又一次地练习记忆数字、学习构建小组块和超级组块,法隆最终能够记住近80个随机数字,这看起来是常人不可能完成的。同样,我们的大脑会采用类似的多层组块策略来处理不断输入的语言。

那么这种策略是如何起作用的呢?在口语中,这个组块过程从到达我们耳朵的不断变化的复杂声音信号频谱开始。输入的内容不仅包含我们感兴趣的言语,还包括大量的背景对话、音乐和混杂其中的各种噪声,大脑必须把说话人的声音从背景杂音中分离出来。确定声音的方向尤其有用。大脑可以通过一系列线索大致判断声音的来源,其中最重要的是声音到达左耳和右耳的时间差。在播放立体声录音时,我们也会用到这个方法。例如,当我们戴着立体声耳机听交响乐时,管弦乐队的不同组成部分听起来就像是在不同的位置。因此,从单声道录音中分辨一个人在背景噪声下说的话往往出奇地困难,因为关于声音来源的三维空间位置关键线索已经丢失了。

一旦说话者的声音信号从背景中分离出来,就会从复杂的声波转换成基于小块的初始格式,比如简单的音素(单个语音)或音节。我们已经知道,在流利的话语中,这些基于声音的单元出现的速度惊人,因此很快就开始相互干扰(就像12个字母组成的那个字符串那样)。解决办法是将这些声音组成单词(language和game)。这个技巧为大脑提供了更多的时间来处理输入信息,但在迎面而来的语言洪流中,单词很快就会开始相互混淆甚至完全丢失(想想我们对一系列随机单词的记忆有多差)。因此,大脑需要重复组块过程,快速地将单词组合成多词语块或短语。这又为我们争取了更多时间,直到干扰再次出现,组块过程必须再次重复,先组成完整的句子,最终组成更大的有意义的话语单元,成为会话交流、故事或指令。

为了说明这种组块化过程,让我们看看下面的例子。在这个例子中,为了模拟语音流的连续性,删除了单词之间的空格,并且使用了非字母符号来表示声音输入中混入的非言语声音(我们在这里忽略了音素并不与字母直接对应这一更复杂的问题):

W@ec%hunks#peechr&epeate%lyintoe@#verbigg$erchunk&s

ofi nc#reasi%ngabstr@action

第一步,将语音信号与噪声和其他环境声音分离:

Wechunkspeechrepeatedlyintoeverbiggerchunks

ofi ncreasingabstraction

由于无法长时间记住语音信号,所以我们一听到就会很快将其分割成音节:

We chunk speech re peat ed ly in to ev er big ger chunks

of in creas ing ab strac tion

但是音节一旦出现,哪怕只有几个,它们之间都会相互干扰,因此我们会尽快将它们组合为单词:

We chunk speech repeatedly into ever bigger chunks

of increasing abstraction

这些单词又会进一步组合成短语,为我们的记忆争取更多时间:

[We chunk speech repeatedly] [into ever bigger chunks]

[of increasing abstraction]

这些不同层次的组块过程是并行的,同时我们也逐渐将单词的意义、它们在当前语境中的含义以及我们对世界其他方面的了解纳入进来。最终,我们对整句话的理解会被吸收到我们对当前对话的记忆之中。因此,我们所拥有的是一系列连续、并行的心理活动。为了应对语言的快速输入,我们需要将新材料尽可能快地组合成更大的单元,再将这些语块立即传递到下一个抽象“层次”进行进一步分析和组块,从音节到单词到短语,再到更大的语块。

我们必须从一开始就准确地进行组块:由于“事不宜迟瓶颈”一直存在,我们很难撤销之前创建的语块,将其分解为更小的子单元(例如,将组块的单词还原为组成该词的声音),再用不同的方式重新组块。一旦我们创建了一个语块,组成它的原始要素很快就会消失,无论是文字还是口头的形式,我们只会保留原始输入的大意。 但是,由于人类语言普遍具有模糊性,所以我们不能仅仅依靠输入信息来构建正确的语块。想一想听到某人说出以下短语(用英语字母标音,试着大声朗读):tOOrEkuhnlEspEEch。这段声音至少可以用两种不同的方式进行组块,分别会产生截然不同的解释。在当前的语境中,将这句话组块为to recognize speech(识别语音)似乎更好。但是,如果我们是在海边散步时听到的,而那里正好在修建一个大型石油码头,我们可能会把这句话组块为to wreck a nice beach(破坏一片美丽的海滩)。 因此,为了确保一次就能正确组块,我们必须使用所有的可用线索。就像玩“你比我猜”一样,正确的解释取决于交际冰山的淹没部分。如果将这句话解释为破坏一片美丽的海滩,那么线索可能来自当前的对话(我们正在谈论建筑工作)、过去的对话(我们对环境的担忧)、我们周围的环境(建筑工地刚刚进入视野),或者只是对世界的背景知识(关于油轮、建筑项目、美学、游泳安全等)。只有在大脑能够利用上下文时,组块才能起作用:上下文要充分,而且组块速度要很快。

大脑需要不断地将输入的信息进行组块,并把小语块组成大语块,这就解释了为什么人类语言之间虽然有巨大的差异,但都是以分层级的单元组织起来的,比如音素、音节、单词、短语。 相比之下,计算机之间的信息传输完全不是这种方式。例如,在互联网上利用流媒体技术传输一段人声录音的过程中,不会有任何元素与我们熟悉的语言单元对应,经数字压缩的声音信号是以一串0和1的数字形式传输的。人类语言的分层、块状结构并不仅仅是出于交流的需要,而是源于人类记忆的深刻局限性,以及大脑为了处理源源不断的语言洪流而必须进行的组块和再组块过程。 L5k1JciPX1alseIVfaliGPyCT2U2S6iP8aomTtmnipmOFXHl/cApkSPlgibERwEW

点击中间区域
呼出菜单
上一章
目录
下一章
×