购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第二章
从信息加工的观点看记忆

记忆结构是固定的,而控制过程是可变的。记忆由感觉记忆、短时记忆和长时记忆三个贮存系统组成。

——Atkinson, R.C & Shiffrin, R.M

从信息加工的过程上看,记忆可以分为感觉记忆、短时记忆和长时记忆。感觉信息在刺激作用停止之后的瞬间贮存,被称为感觉记忆,它为进一步的信息加工提供了时间和可能性。短时记忆对信息的保持时间约为一分钟,是信息从感觉记忆通往长时记忆的一个中间环节或过渡阶段。长时记忆一般指信息贮存时间在一分钟以上,最长可以保持终生的记忆。本章将依次探讨感觉记忆的发现过程及其容量、短时记忆的容量、信息表征方式、信息检索过程和遗忘机制、长时记忆的类型,以及认知主义和联结主义各自的语义记忆模型等内容。

第一节 感觉记忆

多亏了视觉滞留,人们才得以将相继出现的静止画面知觉为运动的图像,且不受眨眼和眼动的干扰而保持视知觉的连续性,从而享受到欣赏影视作品的快感。其实,不仅是视觉,其他诸如听觉和触觉感觉通道等也存在感觉滞留现象。感觉滞留现象表明感觉信息在刺激作用停止之后的瞬间贮存,这种记忆被称为感觉记忆或感觉登记,或称为瞬时记忆。感觉记忆与短时记忆的差异在于:输入感觉记忆的信息尚未得到充分识别以及适宜归类,并且其作用时间极其短暂。尽管如此,感觉记忆却为进一步的信息加工提供了时间和可能性,因此对知觉和其他高级认知活动都具有重要意义。目前感觉记忆的研究主要是关于视觉和听觉的;视觉的感觉记忆称作图像记忆,听觉的感觉记忆称作声像记忆。

那么,感觉记忆的存在是怎样得到证明的?它的容量又有多大?George Sperling于1960年所做的一系列经典实验回答了这些问题。

一、感觉记忆的存在——全部报告与部分报告

Sperling之前的记忆实验均采用全部报告法(Whole Report),即先将字母或数字简短地呈现给被试,然后要求被试将记住的东西全部或者尽可能多地报告出来。用这种方法测得的记忆广度通常为4或5个项目,并且不受项目的呈现持续时间与数量的影响。但是通过被试的内省报告发现,这种测定方式所得的广度值未必能充分反映记忆容量。具体说来,全部报告法的两个基本假设均存在问题:第一,全部报告法假设被试有能力报告他在刺激呈现阶段看到的所有项目;但内省报告显示,被试看到的或能记住的项目要比之后报告出来的更多,只是报告活动本身使得被试迅速遗忘了其中的一部分;第二,一旦某一刺激停止呈现,被试对于该刺激的知觉也随之立即消失;但是被试则“觉得”刺激是在大约一秒钟内慢慢从速示器中消失的——换言之,在物理刺激停止作用后,被试还能在大约950毫秒的时间里继续“看到”它。

为解决上述两个问题,Sperling(1960)设计了部分报告法(Partial Report)。实验中,首先用速示器呈现一张字母排列为3×4的卡片,呈现时间为50毫秒。之后可能出现的音调提示有三种,每种提示音分别对应卡片中的一行字母。要求被试根据提示音报告卡片中相应的字母行。其假设是,出现哪种提示音是随机的,因此被试无法预见到需要报告的行数,所以被试对于某一行的回忆情况即可作为其对全部项目记忆情况的推断基准。实验结果显示,记忆项目的平均数为9.1,这比起全部报告法的测定结果增多了近一倍。Sperling由此提出,人类的记忆中存在一种感觉记忆,它的容量相当大,但信息保持时间却十分短暂,很快就会消失。

二、图像记忆

Sperling(1960)的另一个实验,要求被试在刺激消失后,间隔不同的时间再用部分报告法再现呈现过的项目。实验结果表明,即时再现的回忆率为 80%;而当声音信号延迟0.15秒呈现时,回忆率就下降到约70%;延迟0.3秒,则下降到约55%;延迟0.5秒,回忆率就与全部报告法的结果接近;而延迟到1秒,就没有什么差别了。这些结果提示,图像记忆的作用时间似乎在0.5秒以内,约为300毫秒。在Sperling之后,Averbach和Coriell(1961)采用条形标记作为回忆线索的研究也得到了类似的结果。Erikson和Collins(1967)运用随机点图合成字母的方式来研究图像记忆的时间特性。虽然实验结果与Sperling的结果有些出入,但总体趋势基本一致。

综上可知,视觉感觉记忆具有鲜明的形象性,可以将感觉信息贮存几百毫秒。而且它具有相当大的容量,就已有的研究结果看,至少是9个项目。但由于研究方法上的限制,目前要确定这个容量的上限还比较困难。第一,不论采用声音线索还是视觉条形线索,随字母行数的增加,区分不同的声音信号或字母位置的难度势必也随之增加,从而对感觉记忆的保持产生不利影响;第二,可能存在输出干扰,即先前信息的提取会干扰对后面信息的提取。

三、声像记忆

听觉感觉记忆的实验最早是由Moray等人(1965)进行的。他们模仿Sperling的部分报告法,设计了“四耳人实验”。被试可以同时从4个不同的声源听到声音,并且能区分出声源的位置,就像人长了四个耳朵似的。实验时可以从2个、3个或4个声源同时呈现1至4个字母。刺激呈现完毕后,被试根据指示灯的提示报告他听到的字母。实验和 Sperling的一样,采用了全部报告法和部分报告法两种形式。结果表明,部分报告法的成绩优于全部报告法,以此证实了听觉系统中存在感觉记忆。

其后,Darwin等(1972)进行了更接近Sperling的“三耳人”实验,结果也是部分报告法优于全部报告法。他们的研究还表明,声像记忆在两个方面不同于图像记忆:其一,声像记忆的容量较小,即时回忆的数量仅为5个左右,而视觉感觉记忆的容量至少为8至9个项目;其二,声像记忆的作用时间可达4秒,比起图像记忆的几百毫秒要长得多。综合关于声像记忆的研究结果可以看出,听觉信息的贮存时间约为2至4秒,声像记忆最清晰的时间是1秒,其容量可能是很大的。至于确切的容量值,目前没有实验能具体说明。但可以推论,人类理解言语的容量完全可能是基于声像贮存,声像贮存使我们能够在新线索出现时短暂地留住听觉线索,以便使我们能在语音前后联系的基础上提取信息。

一些研究表明,声像记忆存在后缀效应和通道效应。词表以听觉形式呈现给被试,并在词表呈现完毕之后再额外呈现一个词(即“后缀”),要求被试回忆时忽略这个词,结果回忆的成绩降低,尤其是降低了词表的最后部分的成绩。这种后缀对项目即时回忆的影响称为后缀效应。Crowder和Morton等人(1969)认为,后缀效应是声像记忆能被接下来呈现的声音项目所掩蔽的象征。因此,后缀效应常被作为支持声像记忆存在的证据。但是一些研究发现,非听觉刺激(如唇读、手势语等)也能出现后缀效应,因而该效应更可能反映了发音器官的运动肌对刺激的编码。

通道效应则是指,对于最近呈现的项目,听觉呈现方式比视觉呈现的回忆成绩更好。它的一种解释是,来自声像记忆的听觉信息对于项目回忆的促进作用,要比图像记忆所提供的视觉信息有效期更长。但是,Gardiner和Gregg等人(1997)发现,在每一个词表项目呈现前后,要求被试从事紧张的口头分心活动,依然出现通道效应。这就表明通道效应并不依靠声像记忆。以上相互驳斥的研究结果,显示声像记忆研究中仍然存在许多悬而未决的问题。

其他有待进一步研究的问题还包括:如果感觉记忆保持的信息是直接以刺激的物理特征形式编码,那么在声像记忆较长的作用时间中,信息的编码形式和性质是否会发生变化?如果会,那是否还是感觉记忆呢?

综上,已有的图像记忆和声像记忆的研究表明存在感觉记忆。感觉记忆可能是根据信息的原有形式来贮存的,但并不能排除存在一定的编码和组织的可能性;感觉记忆虽然作用时间短,但它为进一步加工提供了材料和时间,是人们接受和处理外界信息必不可少的前提。

第二节 短时记忆

自20世纪50年代至70年代,短时记忆的研究成为记忆研究的一个中心课题。短时记忆对信息的保持时间约为1分钟,是信息从感觉记忆通往长时记忆的一个中间环节或过渡阶段。短时记忆对信息的贮存具有暂时性、动态性和操作性的特点。已有研究曾援引短时记忆和长时记忆在容量、保持时间、编码等方面的差别作为短时记忆存在的证据。虽然后来的研究表明,两者之间的差别存在被夸大的倾向,但是短时记忆确有独特之处。有关记忆二分说的争论,将在下一章中进行讨论。本节将讨论短时记忆的以下几个方面:短时记忆能保持多少信息?信息在短时记忆中是以什么形式表征的?从短时记忆中检索信息的过程是怎样的?信息在短时记忆中是如何被遗忘的?

一、短时记忆的容量

短时记忆最突出的特点就是其信息容量的有限性和相对固定性。虽然人们在记忆能力方面存在个体差异,但仅就短时记忆的容量来说,几乎所有的正常成人都约为7±2,即在5至9之间波动。1956年,Miller发表了题为《神奇的7加减2:我们加工信息能力的某些限制》的著名论文,明确提出了短时记忆的容量为7±2。其后,研究者对此进行了大量的实验,使用了圆点、硬币、无意义章节、数字、单词、字母以及动作等实验材料,均得到了一致的结果。

(一)组块

前面所谈短时记忆容量为7±2,没有特定单位。换言之,音节、字母或单词等皆可能为其单位:人们可记住7个左右互不关连的字母或单词,然而后一种情况下,短时记忆可容纳的字母数就远远超过了7个。也就是说,短时记忆容量的绝对值会随实验材料的不同而出现较大幅度的波动。为了解释这种现象,Miller(1956)提出了组块(Chunk)的概念。所谓组块,是指将若干小单位相结合,从而构成更大单位的信息加工方式,也指通过这种方式所构成的较大的信息单位。短时记忆的容量正是以组块来计算的,短时记忆容量的有限性和固定性也是就组块数而言的。

组块加工在短时记忆中具有极其重要的作用。短时记忆信息量可以通过组块而得到扩充和提高,即组块具有扩容性。组块水平不同,或信息在编码的方式不同,则相应的组块所包含的信息量也不同。增加每个组块所包含的信息量,则短时记忆所能容纳的组块数就将随之减少。Simon(1974)以单音节词、双音节词、三音节词和短语为实验材料,张武田等(1987)及喻柏林(1989)以汉语字词句为实验材料,均证明随组块复杂性的增加,短时记忆容量(组块数)倾向于逐渐降低。但这并不意味着信息量也在减少。提高组块水平,优化组块方式是提高短时记忆水平的先决条件。为此,我们必须分析和研究影响组块的因素。

(二)组块及其相关因素
1.组块与主体的知识经验

组块实际上是一种信息的组织或再编码,人们利用贮存于长时记忆的知识对进入短时记忆的信息加以组织,使之构成人们熟悉的、有意义的较大单位。

意义组块的作用及其对知识经验的依赖在象棋这类复杂的智力活动中可以明显地表现出来。Chase和Simon(1973)的研究发现,象棋大师、一级棋手和新手对于随机摆设棋子的棋盘记忆水平大体一致。而对于真实的棋局,大师复盘准确率为62%,一级棋手为34%,新手只有18%。进一步对三位被试各自组块数进行测算,结果发现,象棋大师、一级棋手和新手在各次实验中的平均组块数分别为7.7、5.7、5.3,每个组所包含的棋子平均数为2.5、2.1、1.9。这一结果显示,知识经验越丰富,就能越快发现棋子之间的关系,进而较易形成组块,结果便表现为组块数目的增加,以及每个组块所包含的相应的信息量增加。

Miller和Selfridge(1950)通过研究语义和句法信息对组块的影响,也证明了贮存在人们头脑中的语义知识和句法规则介入了组块加工,影响了组块水平。喻柏林、荆其诚和司马贺(1985)通过测试不同熟悉程度和复杂程度的汉字对短时记忆广度的影响发现,熟悉性对汉字短时记忆广度影响更大。

2.组块与客观刺激材料的特征

刺激材料的特征可以分为内部特征(材料的性质、结构等)和时空特征。表2–1列出了部分不同类别材料的短时记忆容量。以汉字、图形、数字和位置等四种材料为记忆项目的实验(陈辉,1988)也表明,数字类短时记忆容量最大,其次是图形类,再次是汉字类,位置类的短时记忆容量最小。

表2–1 不同类别材料的短时记忆容量与加工速率

(资料来源:Cavanaugh, 1972)

刺激材料本身的结构也影响短时记忆的容量。张武田、杨德庄(1987)以使用频率相同的单个汉字为实验材料研究记忆广度。结果发现,笔画少的字比笔画多的字记忆广度大,字型复杂程度是造成短时记忆容量差异的原因之一。陈辉(1988)采用单字、双字词、四字成语为实验材料,测得四字成语的短时记忆容量显著低于单字和双字词,并认为这是由于各项目的复杂性(比如笔画数目的多少)不同所致;结构复杂的项目比结构简单的项目短时记忆容量小。

(三)容量有限理论的解释

短时记忆容量有限且固定的观点已在一定程度上得到公认,但对其解释却众说纷纭。

Waugh和Norman(1965)及Atkinson和Shiffrin(1968)认为,短时记忆的信息贮存在有限的记忆槽道里。当槽道被信息占满以后,新输入的信息就极有可能挤掉最先进入槽道的信息,随着信息输入,这种替换不断发生。Miller认为,每个槽道只能放进一个组块,而且贮存空间内的组块数必须与槽道数吻合。因此当组块数目超过槽道数目之后,新的组块唯有替换掉最先进入槽道的组块,才能存储在短时记忆中。

Klatzky(1975)将短时记忆比喻为一个工作台,其有限的空间分为工作空间(即对有关信息进行加工操作)和贮存空间(即用来贮存各种项目)两部分。因此这两种空间存在此消彼长的关系。据此观点,短时记忆容量是可变的。Baddley等(1975)也认为短时记忆容量有限却不固定。他们用复述回路说来对此加以解释:短时记忆痕迹只能维持2秒,在此期间内如不加以复述,就会迅速衰退;为此,短时记忆有一个复述回路专司复述。因此,短时记忆容量实际上反映了在2秒内能够加以复述的项目数量,这不是一个固定的值,而是取决于一个项目复述所需的时间长短。因此,复述项目所需发出的音节数越多,则单位时间内能够复述的项目数量就越少,因而对于此类项目的短时记忆容量就越小;反之,音节少的项目需要的复述时间少,对于此类项目的短时记忆容量就大。喻柏林(1989)用汉字单字词、双字词、四字成语和七字句为实验材料的研究结果也支持了Baddley的复述回路说。但张武田、杨德庄(1987)的研究表明,汉字音节数对短时记忆容量的影响是由于字型在视觉上的复杂程度不同造成的,不支持Baddeley的复述回路说。喻柏林等人(1990)的实验也表明,发音长短显著不同的词在记忆保持量上无显著差异,因此研究汉字词的短时记忆容量应考虑字型,也就是刺激的视觉特点。

二、短时记忆的信息编码

(一)短时记忆的编码方式

有关短时记忆的编码方式,最有影响的是Conrad(1963,1964)提出的听觉编码理论。其后,随着研究的深入,人们发现短时记忆的编码方式还有视觉性编码和语义性编码等。除了音、形、义编码方式外,莫雷(1986)还提出了策略性编码的观点,即短时记忆编码方式是随情境不同而不断改变的一种策略。

1.听觉编码

Conrad(l963,1964)的实验为短时记忆的听觉编码提供了最有力的证据。他的实验发现,短时记忆错误的产生是以听觉特征而不是以视觉特征为基础的;即使是视觉呈现的刺激材料,进入短时记忆时也会发生“形—音”转换,其编码仍具有听觉性质。Wickelgren(1965)用数字和字母进行的实验也得到类似的结果。此外,Conrad(1971)的另一项研究表明,当记忆材料不是字母或字词而是图画时,听觉代码还是存在的。此外,他还研究了先天失聪学生对字母记忆的混淆情况。结果发现,说话好的聋童有声音混淆错误,而说话不好的聋童则有其他错误。由此推测,善于说话的聋童在短时记忆编码过程中将视觉符号转换为在功能上与语音代码相似的一种代码。这就说明,即使在听觉有缺陷的人身上,听觉编码也可能存在。台湾学者郑昭明(1978)以汉字作为实验材料,也发现了汉字短时记忆编码的听觉特性。与此不同的是,王乃怡(1993)的研究发现,虽然听力正常人出现的错误内容与所提供的语音线索基本一致,但缺乏语音知觉的聋人在对汉字材料的贮存与提取等信息加工过程中,没有使用语音编码。

值得一提的是,听觉编码的存在以听觉混淆作为其证据,但是听觉混淆现象——或者至少其中一部分——也可能有另一种解释,即也可能是由言语运动或发音的混淆所致。我们知道,在阅读过程中接受字词视觉信息的同时,总伴有内部言语使得相应的信息可以转换成言语运动器官的动作模式。由于听觉混淆和发音混淆难以区分,而字母、字词的听觉代码与口语代码都是不同形式的言语代码,所以常将听觉的(Auditory)、口语的(Verbal)、言语的(Linguistic)代码联合起来称为AVL单元,听觉代码常包含以上这几个方面的意思。

2.视觉编码

听觉编码并不是短时记忆唯一的编码形式。Posner(1967,1969)通过字母的视觉匹配和名称匹配的实验证实,至少在部分时间里,信息在短时记忆中是以视觉编码的。

汉语是图形文字,倾向于表意,汉语字形本身与其发音并无直接关系。一些实验表明,汉字短时记忆的视觉编码是明显的。莫雷(1986)以汉字为材料,用信号检测论的方法对短时记忆的编码方式进行了研究。实验的自变量为字形的复杂程度、字义的使用频率以及噪音的类型。结果显示,形近字的干扰作用较大。这说明汉字总体上来说是以形状编码为主的。刘爱伦等(1989)的研究也表明,视觉呈现方式下对汉字的回忆成绩明显优于听觉呈现方式下的回忆成绩。并且从听觉呈现转换成视觉呈现时,出现了明显的前摄抑制释放。这意味着汉字短时记忆确实存在视觉编码。王乃怡(1993)通过对听力正常人和聋人的研究表明,形码在汉字短时记忆的加工过程中对正常人与聋人来说都是很敏感的,且对聋人似乎有更大的影响。郑涌(1991)以英语专业和非英语专业的中国大学生为被试,以英文为实验材料进行的实验结果也发现在听觉呈现转换为视觉呈现时,两组被试均出现了前摄抑制释放,证明了视觉编码的存在。同时,实验也表明,非专业组被试总体上偏好于形状编码,而专业组偏好于听觉编码。

3.语义编码

除了听觉编码和视觉编码外,短时记忆还有语义编码。语义编码是一种与意义有关的抽象编码,不带有感觉通道的特征。语义编码一度被认为是长时记忆的本质特征,但随着研究的深入,人们发现短时记忆也有语义编码。Wickens(1970,1972)采用前摄抑制设计,得到了“自前摄抑制释放”的结果。由此证明短时记忆与长时记忆一样,也有语义编码。其表现为:若前后识记材料有意义联系时(字母—字母),表现出前摄抑制的作用;而在前后识记材料失去意义联系时(字母—数字),则出现前摄抑制的释放。Wickens应用了各种不同范畴刺激进行实验,如字母、数字、分类词、感觉印象词以及阴性/阳性名词,都获得了类似的结果。Shulman(1972)采用了Waugh和Norman(1965)的探测法,以“同一匹配”中的语义混淆错误为依据,也证明了语义编码的存在。

喻柏林(1986)采用中文语词材料,在控制被试的输入编码条件下发现,语义信息也能和语音信息一样在短时记忆中得到贮存和提取,而且语义编码比语音编码具有更好的回忆成绩。莫雷(1986)的研究表明,涉及有利于语义编码的材料时,被试短时记忆编码方式会显示出语义编码的特征。王乃怡(1993)也发现,无论听力正常的人还是聋人,在对近义和反义字表的反应中,多数都显示出语义的积极作用。还有许多研究为短时记忆的语义编码提供了证据(黄英,1991;张武田,1990)。

上述实验结果均显示,短时记忆中存在语义编码。但是Baddeley等人认为这些结果的出现可能与长时记忆的信息贮存、加工以及提取策略有关,并非一定就表明语义编码在短时记忆中存在。这种说法也有道理。事实上,长时记忆库中的信息确实会对短时记忆产生影响。上一节中所说的组块就是长时记忆对短时记忆影响的一个极好的例子,但这并不能因此而否认短时记忆的组块或语义编码。

综上所述,短时记忆的编码方式不只是听觉编码,还有视觉编码和语义编码。那么,这些编码方式是如何被运用的呢?莫雷(1986)认为,短时记忆编码可能是因情境而不断改变的一种策略性编码。例如,短时记忆的编码方式在汉字情境中与在英文字母情境中是不同的,前者主要采用的是视觉编码,而后者主要采用的是听觉编码。而且对于不同类型的汉字,短时记忆的编码方式也会作出相应的变动。刘爱伦(1989)和郑涌(1991)的实验结果也证实,呈现通道(视、听)的改变也会引起短时记忆编码方式的改变。

(二)短时记忆的编码水平及相关因素

短时记忆的各种编码方式中,听觉编码和视觉编码因为其刺激的外部特点,而属于感知编码水平;语义编码则较为抽象,包含对刺激内部意义的解释,属于高级心理活动的编码水平。从加工水平看,前者较浅,后者较深。喻柏林(1986)认为语义编码的记忆成绩优于语音编码可能与被试加工信息的深度有关。

另外,短时记忆编码方式与主体的知识经验密切相关。前面提到短时记忆是随情境的改变而变换编码策略的。显然,策略的选择离不开主体的知识经验,主体的知识经验越丰富,相应的编码策略的选择就越有利于高水平的编码(郑涌,1991)。从短时记忆与心理发展的关系来看,编码水平与年龄阶段之间关系密切。黄英(1991)关于中学生记忆英语单词编码方式的实验研究表明,若将形音编码、形音义编码、意义编码分别设定为三级、二级、一级加工水平,那么中学生一级加工水平的意义编码发展缓慢,二级加工水平的形音义编码发展较快,三级加工水平的形音编码则随年龄的增长呈下降趋势。

三、短时记忆的信息提取

将短时记忆中的项目回忆出来,或者当该项目再度呈现时能够再认,这些都是短时记忆的信息提取。由于短时记忆中信息保持时间短、提取任务很容易就可以完成,使人感到其提取过程很简单。但是进一步的研究表明,情况远非如此。其实,短时记忆的提取过程相当复杂,它涉及许多问题,并引出不同的假说,迄今没有一致的看法。

(一)Sternberg的经典研究
1.实验范式

Sternberg(1966,1969)是最早研究短时记忆信息提取的人。他不仅开创了这个新的研究领域,而且还发展出一个新的反应时实验方法,即相加因素法。他设计的相关实验已被视为经典实验,其基本原理和程序如图2–1所示。

图2–1 Sternberg(1966)实验方法中的一次实验

(资料来源:Sternberg, 1966)

实验由学习阶段和检索阶段构成。在学习阶段,通过听觉或视觉向被试呈现一系列的刺激项目,让被试将其输入短时记忆。这一系列项目称为记忆集合(Memory Set)。随后,要求被试在把这个记忆集合纳入短时记忆并自信已能够保持时按动电钮。实验随之进入检索阶段。在检索阶段,呈现一个检索项目,让被试报告这个项目是否包含在记忆集合中。被试要尽可能迅速无误地进行反应。在图2–1的例子中,数字3、1、7、4构成了记忆集合,如果检测项目是1,被试的正确反应应是“有”;如果检测项目是6,被试的正确反应则应是“无”。在实际操作中,被试通过操作按钮来回答。由于识记的项目数量都在短时记忆容量以内,被试的错误反应很少,一般低于5%,所以实验以反应时为指标。

2.平行扫描与系列扫描

运用Sternberg的相加因素法实验可以研究关于短时记忆检索中一个基本而重要的问题,即从短时记忆中提取所贮存的信息时,是对信息作平行扫描(Parallel Scanning)还是必须逐项依次地系列扫描(Serial Scanning)?为了回答这个问题,Sternberg 首先要求获得记忆集合大小同反应时之间的函数关系。如果平行扫描说成立,那么记忆集合的大小不会影响检索时间;相反,如果系列扫描说成立,则检索时间会随记忆集合增大而延长,即反应时是记忆集合大小的函数。实验结果显示,反应时随识记项目的增加而增加成一条上升的直线,因此他认为短时记忆信息提取是逐个比较的,即进行系列扫描。此外,由于结果是一条直线,Sternberg认为检索过程是一个包含若干加工阶段的相当具体的过程,由此他提出了一个模型来说明短时记忆信息的提取过程,大致可以分为以下几个阶段:

第一阶段——模式识别,对检验数字识别编码。他假定这个阶段用了e毫秒。

第二阶段——把已编码的检验数字和记忆集合中的数字依次进行比较,并确定它们是否一致。假定每次比较费时c毫秒。如果记忆集合中有N个项目,则全部比较所需时间为cN毫秒。

第三阶段——基于比较结果的一致与否,作出“有”或“无’的决定与反应(此阶段又可分为决策和反应组织两个阶段),假设用d毫秒。

被试的反应时是各个阶段所用时间的总和,可以用下述公式表示:

Rt=e+cN+d

也可以改写为:Rt=cN+(e+d)。因此,反应时是以c为斜率,以(e+d)为截距的N的一次函数。根据以上的实验结果计算,c=38,e+d=397。由此可以作出结论,每比较一次需时38毫秒,而刺激编码、作出决定和反应共需397毫秒。

3.从头至尾的扫描与自我停止的扫描

Stergberg实验中还涉及另一个重要的问题,即在进行系列扫描时,被试是从头至尾对记忆集合的全部项目都检查一遍,还是在扫描记忆集合时,一旦遇到检验项目就停止扫描。前者称为从头至尾的(Exhaustive)扫描,后者称为自我停止的(Self Terminating)扫描。Sternberg的假设是,如果被试采用的是自我停止的扫描方式,那么对于“有”反应来说,由于检验项目均匀地分布在识记项目系列的不同位置,所以平均只须检查记忆集合中的一半项目数就可以了;对于“无”反应来说,则必须对记忆集合中的所有项目逐个进行检查。这样“有”反应时的比率就应该是“无”反应时斜率的一半;

Rt (有) =(c/2)N+(c/2+e+d)

Rt (无) = cN+(e+d)

要检验假设,只须观察两者的斜率就可以获得结论。Sternberg的实验结果支持了从头至尾的系列扫描。也就是说,被试在发现检验项目和记忆集合中的某一个项目一致后,继续把剩余的项目和检验项目进行比较。为什么被试要做这种显然无用的检查呢?Sternberg认为,这是由于比较过程和决策过程不是独立进行的,比较过程进行得很快,费时少,而决策过程则费时多。为提高工作效率,与其每次比较之后即相应地进行一次判断,不如全部检查完毕后,作一次性判断更为省时。

4.Sternberg模型引起的争议

Sternberg的研究发表后,他的研究方法、研究结果及其相应的解释引起了许多心理学家的关注,他们开展了更为广泛的研究。有些研究结果支持了Sternberg的实验结果(Chase, 1969;Anderson, 1972;Harris, 1974;Koh, 1983;Solso, 1979;吴志平,1988),但也有一些研究认为Sternberg的研究成果和解释存在值得商榷的地方。

首先,自我停止扫描说在一定程度上得到了实验证据的支持。Carballis(1975)等通过增加识记项目的长度发现提取存在系列位置效应。系列的开始部分和末尾部分的项目提取得快些。其他一些研究也得出类似结果(Clifton, 1970;Klaltzky, 1971;Burrows, 1971;Morin, 1976),他们认为对于系列位置效应,从头至尾系列扫描无法作出解释,但自我停止扫描却能予以说明。首因效应与近因效应可以理解为扫描是从项目两端开始的,搜索到所需的项目后,即可停止。还有研究表明,“有”反应的斜率要小于“无”反应的斜率,这一结果似乎亦有利于证明自我停止模型(Theois et al.,1973)。此外,Sternberg的实验结果也可以以平行扫描说加以解释。Townsend(1971)对Sternberg实验结果的解释提出了异议,他从加工能量有限的观点出发,认为短时记忆中信息的提取不是系列扫描,而是平行扫描。反应时随识记项目的增加而增加是由于加工能量的分散而造成的:记忆集合中项目越少,分配给各项目的能量就越多,比较效率就高,比较时间也就短。反之亦然。因此即使是同时比较,随着记忆集合中项目的增加,每个项目分配到的能量减少,反应时也相应增加。这种解释也有一定道理,但还缺乏相应的实验证据支持。

(二)直通模型

与系列加工模型和平行加工模型不同,直通模型认为信息的提取不是通过比较或搜索,而是直接通往所要提取的项目在短时记忆中的位置,进行直接提取(Wickelgren, 1973;Eysenck, 1977)。按照该理论模型,短时记忆中的各个项目均有一定的熟悉值或痕迹强度。同时,每个人有着自己的内部判断标准。当探测项目的熟悉值高于这一判断标准时,便作出“有”反应,否则作出“无”反应。并且熟悉值越偏离这个标准,则反应速度愈快。直通模型得到一些实验的支持(Theois et al.,1973;Baddley, 1973)。但是直通模型无法说明反应时为什么会随识记项目的增加而线性增加。

(三)混合模型

Atkinson和Juola(1973)提出的混合模型试图将搜索模型和直通模型结合起来。该模型认为,每个探测词在主观熟悉量表上都有一个值。人们在主观上有两个判定标准,一个是“高标准”(C 1 ),如果某一探测词的熟悉值高于C 1 ,人们便迅速作出“有”的反应。同时,还有一个“低标准”(C 0 ),如果某一探测词的熟悉值低于C 0 ,人们便迅速作出“无”的反应。这是一个直通的过程。但是对于一个熟悉值介于C 1 和C 0 之间的探测词,即中等熟悉值的探测词,则要进行系列搜索,才能作出相应的反应。该模型如图2–2所示。

图2–2 短时记忆信息提取的混合模型

(资料来源:Atkinson & Juola, 1973)

根据该模型,人们有时基于探测词的熟悉值大小便可以直接作出判断,有时则需要通过搜索才能作出判断;前者是平行的快速过程,后者是系列的慢速过程。人的主观标准C 1 、C 0 是可变的,受情境影响较大,取决于个体在当时所接受的速度—准确性权衡。这样,Sternberg的模型可以看作这个混合模型的一个特例。因为Sternberg强调反应的准确性,因而被试倾向于只用较慢的搜索以保证反应的正确性。由此可见,混合模型比单一的搜索模型和直通模型更加灵活。但是该模型也受到了批评。Eysenck(1977)认为该模型忽视了记忆痕迹的多维性,应进一步对“熟悉性”的内涵作出界定和分析。另外,按照混合模型,出错是由较快的直通过程造成的,那么错误反应的反应时就应该较短。但实验结果并未证实这一点(Corballis, 1975)。另外,该模型的系列扫描加工也没有说明该加工是“自我停止”还是“从头至尾”的问题。

四、短时记忆的遗忘

(一)遗忘进程

短时记忆容量有限,保持时间短暂。若不进行复述,信息就会从短时记忆中消失。按照不同的复述方式,复述在短时记忆中发挥着不同的作用:一种是机械性复述,它使短时记忆中的信息不断加强,以免遗忘;另一种是意义性复述,它对短时记忆中的信息进行意义性处理,使得短时记忆中的信息转入长时记忆。如果复述被阻断,短时记忆中信息是如何被遗忘的呢?研究者通常采用“Peterson-Peterson”法(或称“Brown-Peterson”法)来进行研究。这种方法在呈现刺激和回忆之间插进干扰作业——要求被试尽快地作连续减数的运算和报告——来阻止复述。Peterson等人用三个辅音组成的三音连串作为实验材料,得到了如图2–3的结果。

图2–3 阻止复述后的短时记忆的遗忘速率

(资料来源:Peterson & Peterson, 1959)

从图中可以看出,当延缓时间为3秒时,被试的平均回忆正确率将近80%。但随着间隔时间的延长,正确回忆率急剧下降。延长到 6秒时,正确率降到 55%,而延长至 18秒时,被试反应的正确率只有10%了。因此,这个实验表明,短时记忆保持信息短暂,如未得到及时复述,将迅速遗忘,复述对短时记忆的保持或遗忘发挥着关键的作用。

(二)传统的遗忘理论——痕迹消退与干扰

已有的实验证明,在没有复述的情况下,遗忘进程是很快的。但是造成遗忘的原因是什么呢?这是研究历史上一直争论不休的问题。一种观点认为,遗忘是信息痕迹自然消退的结果;另一种观点则认为,遗忘是由于短时记忆中的信息被其他信息干扰造成的,这两种观点分别称为消退说和干扰说。那么,遗忘究竟是痕迹的消退还是由于干扰使得贮存的信息无法提取?要分离这两个因素很困难,因为干扰作业总是需要时间的,而回忆之前即使不进行额外作业也难以排除内外因素的干扰。Waugh和Norman(1965)设计出一个非常巧妙的实验,他们利用“探测法”分别考察间隔时间和间隔数字对遗忘的作用,从而将痕迹消退和干扰这两个因素分开。实验结果支持了干扰说,证明短时记忆遗忘的主要原因是干扰而不是记忆痕迹的消退。

(三)成分衰退模型

虽然一些实验为干扰理论提供了较为确凿的证据,但是仍然存在值得质疑的地方。一个方面在于实验设计,研究者通常采用分散注意法来研究短时记忆,但是分心活动不一定能阻止复述。Roediger(1977)指出了分心活动要达到实验目的必须满足两个条件:(1)分心活动必须能够完全分散注意;(2)复述必须真正地利用了被试有限的注意容量,而不是被自动化地操作。他发现,有些时候分心活动的认知负荷并没有影响记忆的操作,分心任务没有像预期的那样导致了被试注意的完全分散;另外,记忆操作的下降可能是由于任务超出了注意广度的范围,这样新信息甚至没有被编码和贮存。然而,没有被贮存的信息是不会被遗忘的,由此对干扰理论的效度提出了挑战。

近年来,随着联结主义的兴起,人们对记忆的表征问题提出了新的看法,因此出现了力图整合干扰说和消退说的成分衰退模型(Component Decay Model)。该模型认为,干扰说和消退说实际上侧重于加工过程的两个不同方面——前者强调指向代码的提取加工,后者关注代码内部的操作加工。该模型还认为,传统遗忘理论的缺陷主要在于其对“代码”这一信息表征方式的基本假设存在错误——这两种理论均假设,信息以“全代码”(Holistic Code)的方式或格式加以表征,因此无法得到进一步的分解。具体地说,每个代码作为一个完整的、不可细分的信息单元,被赋予一个特定地址。因此全代码的提取遵循“全或无”的规律,即要么知道某个代码的地址,继而发现所搜寻的信息(此时,该信息单元中的所有信息均被提取,而不可能只提取其中的一部分信息);要么不知道这一地址,无法发现所搜寻的信息。因为代码的不可细分这一特征致使其包含的所有信息、其痕迹均以相同的速率消退。所以,即便存在由信息痕迹的消退所致的遗忘,其对于同一代码内部的不同信息的操作加工的影响也是恒定的,无法在反应时等指标上表现出来。因此,实验证据仅仅表现出对于侧重提取的干扰说的支持,而无法支持消退说。所有有关记忆组合和结构的问题,就这样逐渐转为搜索加工的问题。

与传统理论不同,成分衰退模型假设,信息表征为“成分代码”(Component Code)的格式。成分代码可以进一步分解为信息成分本身,以及不同信息成分之间的结构关系这两类成分;也无须为某个成分代码特别规定一个地址。因此,成分代码的提取不遵循全或无的规律,可以立即访问一个成分代码的任一部分。因为代码可以细分,代码内不同成分的记忆痕迹消退的速率不同,消退的影响从而得以在反应时等指标上表现出来。关于成分代码的假设已经由来自三个不同领域——多重速率遗忘(Multirate Forgetting)、舌尖现象(Tip–Of–The–Tongue)、记忆的恢复(Hypermnesia)——的研究得到证明。

成分衰退模型认为,一个代码贮存了信息的所有成分,包括冗余成分。每个成分都会保留一段时期,其相对重要性取决于具体任务的加工目标。例如,阅读一篇文章,如果加工目标是“理解课文”,编码的深度水平是语义水平,要求记忆的是笔画、字母、单词所引申出的深层语义信息;如果加工目标是“校正文稿”,那么只涉及侦察笔画、字母和单词中的错误这一较浅的加工阶段。在这两种情况下,会形成同种类型的感觉代码,但是校正比阅读水平产生的信息成分少。因此,校正阅读比正常阅读遗忘快。成分衰退模型还认为,短时记忆中的代码存在一个自动消退的过程,而且浅的代码成分比深的代码成分消退快(例如,单词的感觉代码消退得非常迅速,语义代码保存的时间较长)。但是代码提取时,搜索加工是从最深的水平开始的,语义信息比感觉信息提取得快。如图2–4所示,代码矢量包含了n个成分。

图2–4 消退和搜索加工沿着相反的方向进行。感觉信息比语义信息消退得快,而语义信息比感觉信息提取得快

(资料来源:Roediger, 1977)

成分消退模型可以同时解释传统的消退理论和干扰理论的预测。它的独特之处就在于二者结合为一个独立的假设:将干扰过程描述为消退过程的结果。根据该模型,随着时间的推移,更多的成分会消退,所以,代码提取时的干扰和混淆倾向也在增加。项目相似性效应也可以由成分消退模型来解释,两个刺激越相似,代码的成分也就越相似,只要成分不衰退,就可以容易地区分两个代码。一旦消退开始,区分的难度也随之增加。另外,我们还可以根据相似的类型进行估计项目相似性效应的大小。例如,在相对来说加工较浅的语音和字符水平,“hat”和“cat”存在部分相同的成分,只有一个字母不同。但是。在语义水平,两种代码没有任何相同的成分。所以,如果加工目标是识别单词的含义,那么单词之间语音与字符的相似不会导致任何混淆。由于浅加工的代码比深度加工的代码消退快,所以感觉代码可能已经消退,但语义代码仍足以区分记忆中的表征。

第三节 长时记忆

从信息加工的观点来看,长时记忆是相对于感觉记忆和短时记忆而言的。一般指信息贮存时间在一分钟以上,最长可以保持终生的记忆。按照James(1890)的看法,长时记忆构成了一个人“心理上的过去”,它是个体经验积累和心理发展的前提。长时记忆中贮存着我们关于世界的一切知识,为我们的一切活动提供必要的知识基础。自20世纪70年代以来,长时记忆又一次成为记忆研究的热点。认知心理学对长时记忆的研究有两个鲜明的特点。第一,长时记忆不再被看成单一的实体,而是被分为不同的类型或系统,如情景记忆和语义记忆、表象系统和言语系统等。第二,着眼于长时记忆的内部加工过程,重视信息的内部表征和组织。近些年来,认知心理学对长时记忆的研究主要针对语义记忆,并提出了各式各样的模型。这些研究与人工智能的有关研究相互渗透,成果十分引人注目。

一、长时记忆的类型

(一)情景记忆与语义记忆

Tulving于1972年提出了信息在长时记忆中贮存的两种形式:情景记忆和语义记忆。情景记忆接收和贮存的是关于个人在特定的情景或事件及其时空关系信息;语义记忆是运用语言时必须的各种知识。

为了分析情景记忆和语义记忆的不同机制,Tulving提出应从信息加工的对象、操作和应用三个方面对两个系统进行比较,具体如表2–2所示。

这种划分得到一些临床证据的支持。例如,有些遗忘症患者特别难以回忆特定的情景,但是他们可以对此作一般的言语描述。这说明患者的情景记忆受到了更大的损坏。也有相反的情况,某些智力落后症患者可以记住一些个人的具体事件,但很难记住运算规则和其他抽象的东西,这说明他们的语义记忆受到更大的破坏。但二者也有许多共同点,比如,它们都包含表象;又如,对特定时间和地点的情景记忆,经过在不同背景上的多次重复,就会逐渐概括而成为语义记忆。因此,目前倾向于将情景记忆和语义记忆看作一个连续体的两端,而非截然区分。

表2–2 情景记忆与语义记忆的比较

(资料来源:Tulving, 1972)

(二)描述性记忆和非描述性记忆

前面已经提及,语义记忆和情景记忆的界限不是绝对的,两者都是有关事实的知识,所以有一种观点认为无须再去细分两者,而可以将它们都称为描述性记忆(Cohen & Squire, 1980;Squire, 1987)。所谓描述性记忆是指有关事实的知识,它可以通过言传一次性地获得,也可以经过意识性的回忆而直接提取。例如,外语课上学习的生词、日常的生活常识以及对各种生活事件的记忆。与描述性记忆相对,非描述性记忆是关于怎样去做的知识。在绝大多数情况下它们是不可言传的,如人们的各项技能。以前人们是用“程序性记忆”来表达这个概念,但是后来研究者觉得用“非描述性记忆”这个术语能更好地描述反映遗忘症病人身上所保留的学习能力。例如,遗忘症病人可以学习和记住动作和知觉技能(如光点追踪以及镜中字的阅读等),而动作和知觉技能是典型的程序性记忆。另外,遗忘症病人还表现出正常的经典条件反射和操作性条件反射,并显示出语义启动效应;如果用合适的方法还可以测出他们学习新的认知任务的能力。

(三)表象系统和言语系统

Paivio(1975)的双重编码理论认为,长时记忆中,除了语义代码外,还存在一种表象代码。语义代码又称为命题代码,是一种抽象的意义表征,以命题为形式。表象代码是记忆中事物的形象,与知觉的性质以及外部客体相类似,被看作类比表征。因此,他从信息编码的角度将长时记忆分为两个彼此独立又互相联系的系统,即表象系统和言语系统。表象系统以表象代码来贮存关于具体的客体和事件的信息,构成了非言语思维的表征方式;言语系统以言语代码来贮存言语信息,具有听觉—运动性质。以上两类代码的存在都得到一些实验证据的支持,现在公认的是,语义代码在长时记忆中占有特别重要的地位,而表象代码是否存在还有待进一步探讨。

二、语义记忆的模型

语义代码在长时记忆中的重要地位已得到公认,下面就分别叙述几个主要的语义记忆模型。

(一)层次网络模型和激活扩散模型
1.层次网络模型

层次网络模型是Quillian和Collins(1969)提出的,它是认知心理学中的第一个语义记忆模型。这个模型原来是针对言语理解的计算机模拟而提出的,称为“可教的言语理解者”(Teachable Language Comprehender)。该模型认为在长时记忆中概念分层次地组织成具有逻辑性的种属关系,每一类事物的特征总是贮存在对应于该类别的层次上。这样的分级贮存可以节省贮存空间,体现出认知经济的原则。一个概念的意义由该概念与其他概念和特征的关系来决定,即一个概念的意义决定于某种连线的模式。信息提取,就是通过连线在网络层次中进行搜索,或者说根据网络层次的结构进行推理的过程。因此层次网络模型有一定的推理能力。

Collins(1969)等人用语义验证法检验了层次网络模型的假设。实验结果发现了范畴大小效应。所谓范畴大小效应,是指人们在判断一个简单的陈述句时,如果谓语的范畴变大,判断句子所需的时间也会相应增加。该发现支持了语义记忆具有层次网络的观点。这一结果得到了许多实验的支持(Meyer, 1970;Wilkins, 1971;Kunzendorf, 1976;McCloskey, 1980;陈永明等,1985)。但是另一些实验结果却对层次网络模型提出了疑问,例如,它无法解释熟悉效应、典型性效应以及人们在作出否定判断时的表现等(Conard, 1972;Smith et al.,1974;Rosch et al.,1975;陈宝国,1993)。

层次网络模型对记忆领域的研究产生了极大的影响。它非常简洁,但同时也存在一些明显的缺点。首先,该模型涉及的概念间联系没有包括平级概念之间的横向联系。其次,分级贮存的假设增加了信息提取的时间。但对人类来说,信息提取的速度可能比节省贮存空间更为重要。第三,未能考虑到影响提取时间的其他因素,如概念联系的频率和强度等。第四,该模型无法解释具有非字面意义的语句的语义表征。

2.激活扩散模型

激活扩散模型是Collins和Loftus(1975)提出的,它也是一个网络模型,但它不是以层次结构而是以语义相似性将概念组织起来的。概念之间的联系由连线表示,连线的长短代表了联系的紧密程度。两个概念间的连线越短,通过共同特征的连线越多,则它们之间的联系越紧密。一个概念的内涵是由与它相联系的其他概念、特别是联系紧密的概念来决定的。该模型的结构虽不是逻辑层次结构,但是它本身并不排斥概念的逻辑层次关系。除了这个语义网络外,还存在一个词汇网络,用于贮存概念的名称。此网络是按读音和正字法的相似性组织起来的,每个名称结点与语义网络中的一个或多个结点相联系,因此,语义网络和词汇网络既彼此分开又相互联系。

激活扩散模型的加工包括搜索和决策两种过程。当一个概念受到刺激,该概念结点就会产生激活,然后激活沿该结点的各个连线向四周扩散;当不同的激活在某一结点交叉,而该结点从不同来源得到的激活总和超过活动阈限时,产生这种交叉的网络通路就受到评价。这种评价实际上是一个决策过程,可以看作计算。因此,激活扩散模型虽然是类似于层次网络模型的一种预存模型,但是信息的提取和应用还要依靠计算。

激活扩散模型得到一些实验的支持,其中特别突出的是关于启动效应的实验(Freedman & Loftus, 1971;Meyer et al.,1971)。实际上,激活扩散模型是对层次网络模型的修正,它用语义联系取代了层次结构,因而更加全面和灵活。它不仅可以解释范畴大小效应,而且,由于该模型中概念间的联系不仅有紧密程度,而且还有强弱,所以它能解释熟悉效应和典型性效应;由于加工过程中包含决策机制,所以它还能解释人们在作否定判断时的表现。总之,激活扩散模型比层次网络模型更具弹性、不确定性和模糊性,因此更加适合于解释人类的行为和现象。

(二)集理论模型和特征比较模型
1.集理论模型

集理论模型由Meyer在20世纪70年代提出。该模型将语义记忆看作是由许多集合构成的系统,每个概念均可表征为若干个信息集,这些信息集又分为样例集和特征集两类。样例集由该概念的一些样例构成。特征集则包含这个概念所具备的各种属性或特征。不同概念的信息集之间没有现成的联系。对句子的真伪进行判断时,可以分别搜索两个概念的属性集,根据这两个属性集的重叠程度作出判断:重叠程度高,就作出肯定判断,反之则作否定判断。由于两个集合共同属性越多,重叠程度就越高,因此,该模型能说明范畴大小效应。而且,它也能较好地解释某些迅速作出的否定判断。更值得注意的是,集理论模型提出了非预存的思想,即概念间的联系不是现成的,而是要通过比较计算才能得到,这样它就包含了更多推理的可能性。集理论模型已得到一些实验的证实,例如,根据该模型,对特称语句的判断要快于对全称语句的判断。Meyer(1970)的实验结果支持了这个预测。然而,后来的研究也发现了对该模型不利的证据。例如,它无法解释熟悉性效应和典型性效应;还有在Meyer的实验中,特称语句与全称语句是分开呈现的,而Rips(1975)发现,如果在实验中将两种语句混杂呈现,则没有出现特称语句的判断快于全称语句的结果。这是集理论模型无法解释的。

2.特征比较模型

特征比较模型由Smith、Shoben和Rips(1974)提出。与集理论模型类似,语义记忆中的概念是由语义特征的集合来表征的。但是,该模型认为,各语义特征在确定某一事物是否属于某类别时重要性不同,其中那些必须具备的特征称为“定义性特征”,另一些不大重要但也有一定描述功能的特征则称为“特异性特征”。特征比较模型认为,当被试判断一个简单的陈述句时,被试会将两个概念的特征分为定义性特征和特异性价征,然后分别进行比较。为了给自己的理论收集证据,Rips等人(1973)运用“多维量表程序”,用二维空间的距离来表明一些样例和其类别的关系的密切程度。结果表明,被试应用了几个特定维度的语义特征来评定两个概念间的联系程度。这在很大程度上说明了特征比较的重要意义。

特征比较模型的加工包括两个阶段。第一个阶段是提取该句的主语和谓语两个概念的全部特征加以比较,以确定相似程度。如果相似程度高,就直接判断为“正确”;如果相似程度低,则直接判断为“错误”;如果相似程度中等,则进入第二阶段,只比较定义性特征,然后作出反应。

特征比较模型可以解释范畴大小效应和典型性效应,甚至可以说明对两个句子的反应为什么有不同的反应时。而且,对于这些效应和实验结果的解释都只依据一条原则,即语义特征的相似性。当然,特征比较理论也存在一些问题,例如,Glass和Holyoak(1975)发现,一些包含相似项目的假命题比包含不相似项目的假命题更容易被否定。特征比较模型对于这种情况难以解释。而且,如何将定义性特征和特异性特征加以区分,也存在着很大困难。

综上所述,各类模型对先前信息和当前情境的合适度都很敏感,但是,生活中人们有时也从Bayes统计的角度来理想化地综合信息。这种能力使人们能够在当前提取合适的信息,虽然Bayes推断统计不是直觉性的,而且人们的意识判断常与之不符,但是它确实是一个简单的机制。这样,通过简单的统计推断,我们就能在知识应用中获得很大的适应性。

第四节 联结主义模型

如果说上一节讨论的网络模型是在计算机科学的影响下提出的,那么可以说本节将要讨论的联结主义模型(Connectionist Model)是在神经科学研究的蓬勃开展下应运而生的。由于联结主义模型与前面所讨论的诸多语义模型在理论基础上差异很大,所以这里单列一节予以介绍。

一、联结主义模型的历史演变

在认知心理学孕育和诞生之初,研究者们就沿着两条途径展开了对人类心理的探索:一条途径以符号为导向,将心理过程与计算机的信息加工过程进行类比,偏重人工智能的探索,以对于符号进行串行加工的方式建立心理模型,即所谓的认知主义导向;另一条途径将心理过程与人脑神经系统的运作过程相比拟,通过简化的神经元网络的并行加工方式建立心理模型,这就是联结主义的导向。

一开始,这两种研究取向得以同步发展,但是到了20世纪60年代后期,联结主义模型由于带有联想主义色彩备受人们反对,而认知主义的研究逐渐占据上风,乃至成为认知心理学、认知科学的理论基础和核心。然而,到了80年代初期,以Hindon和Anderson在1981年主编的《联想记忆的并行模型》的出版为标志,联结主义再度兴起。1986 年,Rumelhart、McClelland和平行分布式认知加工流派即PDP研究小组共同编辑出版的《并行分布加工》一书,已成为联结主义的代表作。80年代末,联结主义开始占据上风,并已表现出取代认知主义而成为认知心理学新的理论基础和核心的趋势。

因此,语义记忆研究开始时多采用认知主义的取向,出现了像上节所介绍的层次网络模型、激活扩散模型、集理论模型和特征比较模型等以符号串行加工为基础的网络模型,20世纪80年代末期以来,则出现了一些语义记忆的联结主义模型。虽然此类模型的结构复杂且高度数学化,然而研究者对它们的研究兴趣却有增无减。其原因有二:第一,许多人认为,以大脑活动的方式来对语义记忆建模直觉上是可行的。采用平行分布加工的模型可以同时处理许多约束条件,给出确定的解,作为定解的外显表现的显现行为(Emergent Behavior)是靠网络内各单元在兴奋、抑制上的相互作用而达到稳态发放来实现的。这不仅与人脑处理信息的方式相似,而且与人脑的解剖结构特点雷同。第二,近年来计算机软硬件的发展,使采用联结系统模拟人类的行为与操作得以实现。20世纪70年代的神经生物学的研究表明,暂时联系是中枢神经系统的普通特性,其细胞生理学基础是“异源性突触异化”。80年代,人工神经网络的联结理论中,神经节之间权重变换正是受到这一神经生理学概念的启发而产生的。

由此可见,语义记忆的联结主义模型的出现是心理学、神经科学和计算机科学各自发展并互相借鉴融合的结果。

二、语义记忆的联结主义模型的特点

认知主义为取向的各种语义记忆模型认为,知识是以概念或命题的形式表征的,它们贮存在网络的单个节点上,这些节点通过激活扩散逐个依次激活。而且,网络模型是以控制学习和信息加工的外显规则为基础来操作的(Anderson, 1983;Collins & Loftus, 1975)。相反,联结主义模型以人脑的工作方式来建模,这些模型认为知识分布在整个系统之中,或者说贮存在单元之间的联结中,而且所有的认知加工都是平行的。这就意味着不同的节点或单元之间同时进行着交互作用,相互兴奋或者相互抑制。因此各种记忆活动都发生在相邻神经元的突触(联结)间,知识学习或信息加工的基准是单元间联结的强度。因此此类模型常被称为平行分布加工模型(PDP)或神经网络。现有的语义记忆的联结主义模型具有以下四个特点:

(一)联结性

联结模型在网络各单元之间进行分布式运算,实质上是一种统计推断过程。网络中每个单元都可以看成是某项目的一种微特征,联结强度就是微特征之间的微推理程度。微推理过程实际是对输入和权重变换间的关系采用点积函数模型等方式进行统计学相关运算。该过程通过调节模型中单元间的联结强度,可以使某个项目的各种微特征共存,从而贮存起来。该过程包括意义推理和矛盾推理,前者使单元间联结强度加强,而后者减弱或抵消联结强度。网络提取信息的过程则是提供一些推理的条件或线索,使网络能在自已的存贮中找到满足约束条件的项目。

(二)分布式存贮和处理

分布式存贮和处理是联结主义模型信息加工的最基本的特性,具有非局域性或非定位性的特点。所谓非局域性是指一个系统的许多整体行为不仅取决于系统内单元的个数,而且更由单元之间的相互关系、相互作用所决定。若系统具有非局域性,那么,系统的行为也就不会定位于系统的某个特定部位,因而具有非定位性。该模型的加工处理过程中,同一个知识(及其各部分)分布在由突触及其不同强度构成的整个网络关系中,并且在各个突触上进行加工处理。一定知识的获取或存贮,是通过神经网络中所有神经元之间突触连接关系的变化和调整来实现的;同样地,有关知识的运用和提取是通过分布在网络中各突触上的处理过程来实现的。

网络中各个突触与知识所包含的各项内容之间不存在一一对应关系,但具有同态的关系。因此,网络的局部损坏并不会损害特定的某个知识,而是损害其中存贮的所有那一类知识;网络功能的受损程度主要与整个网络损坏的程度相关(但输出层受损除外)。这与有关的神经心理学研究和临床上的发现是一致的。

(三)表征的非符号性和运算的连续性

用离散符号表征知识是人工智能学利用计算机处理知识的基本前提,而联结主义模型则强调连续性的模拟运算和信息表征的非符号性。Oden等人(1988)将符号认知科学研究与联结主义模型用模糊数学概念联系起来,证明连续性模拟运算是联结模型处理知识的本质特征。然而,模糊命题的数学模型也是一种符号系统,所以符号性与联结性未必就一定是不相容的,或可互为补充。人工智能理论与联结理论两者的差别仅在于采用符号表征的层次不同:人工智能利用物理符号表征高层次的概念;联结理论使用“亚符号的方法”(Sub-Symbolic Approach)表征“亚概念”(Sub-Conceptual)。前者处理的是知识结晶,经过语言文字加工以概括总结;后者是个体直觉体验、感受尚未升华为用语言表达出来的概念。因此,联结主义的模型可称为无意识处理器或直觉处理器。联结动力系统可以由直觉处理器组成,也可由许多数字计算机处理器并行组成。联结动力系统的状态可用向量及向量激活状态所描绘,这种系统可用一些方程描绘其状态向量的动力变化,这种方程式常被称为“激励进化方程”。因此,连续性是联结理论的实质性特点。

(四)高效性和容错性

由于联结主义模型采用分布式贮存与处理,而分布式编码不需要每个特征对应一个单元,因此该模型可以节省大量存贮和加工单元。而且,由于分布式表征的信息存贮和提取本质是多个单元的并行活动,所以加工速度相当快。基于此,记忆的联结主义模型比其他模型更高效。另外,联结主义模型最突出的优点是具有较强的容错性。在加工处理的实际过程中,当输入具有一些偏差时,并行分布式网络仍能进行正确的处理而得到正确的输出。

三、语义记忆的联结主义模型(Connectivity Model)

上节提到以符号串行加工为基础的语义记忆模型,随着记忆网络复杂程度的增加,搜索加工的速度会减慢。但实际情况往往并非如此。例如,专家与新手相比,前者贮存的信息一定比后者多,但是在检索信息时,前者的提取速度却比后者快。这是上述模型所无法解释的。而联结主义模型从结构假设和加工假设两方面入手,对原有的语义模型进行了修改,解决了这个矛盾。

(一)结构假设

以符号串行加工为基础的各种语义记忆模型是以完全的(Holistic)代码结构和严格的等级结构假设为基础的,代码的内容互不相关,彼此间只通过共同的连线间接相连。这将导致记忆中的信息都是一些非整合的片段。然而,人类的记忆表现出强大的联想功能,它使我们可以探究事物之间的共性,或对异质的事物进行类比。认知主义模型只有通过访问地址的加工方法才能解释联想现象,而联结主义模型由于采用了成分代码假设就可以解决这个问题。

具体说来,联结主义模型的代码是由成分(Component)来表征的,各成分之间的结构相互联结(Interconnect),因此是作为整合的信息成分来贮存的。各成分均与源节点直接相连,都可以作为源于短时记忆的搜索加工的访问指针。联结主义模型中,长时记忆中事实的贮存和语义信息的编码都被假设为遵循相互连结的原则。每个节点均直接与长时记忆中其他节点相联系;节点之间连线越多,节点中包含的信息就越能更好地整合进长时记忆。因此,可以利用信息的冗余量对丢失的信息进行重建。同时,该模型依旧承认非整合的节点或严格的等级结构可以作为整合性储存一般规则的一个特例。

联结主义模型中的代码结构和整体结构使得记忆的操作非常高效:搜索加工相当迅速,而且相应信息之间的连结也易于形成。最重要的是,结合加工假设可以预测,随着贮存信息量的增加,搜索加工会变得更加迅速。

(二)加工假设

间接激活是语义记忆联结主义模型的一个重要加工假设。间接激活的产生必须满足下列三个条件:(1)网络的一个或多个节点必须被会聚的通路激活;(2)那些导致会聚激活的加工必须源于同一个源节点;(3)为了使会聚激活可以累积,它们必须在一个关键期t(k)内同时或几乎同时被激活。可见,间接激活只有在联结主义模型中才有效。值得注意的是,间接激活不等同于ACT模型中的反响激活。反响激活是指从被激活的节点向源节点方向相反的激活活动。联结主义模型中假设,一旦源节点接收到反响激活,搜索加工也就终止了。

搜索加工开始于一个或多个源节点的激活,源节点的激活数目依赖于搜索目标。如果只搜寻一个单独的节点,那么只须激活一个源节点;如果要发现几个节点之间的共同通路,那就需要激活几个源节点。以单一源节点扩散出的简单搜索加工为例,如果反响激活有效,那么,搜索加工在第一个节点激活后立即停止。激活将从这个节点流回源节点,即使在第一个结果出现之前,搜索加工也会停止。间接激活流回源节点代表了搜索加工的成功,由此可以得到肯定的结果,而且间接激活量与肯定证据量是相应的:间接激活量流回得越大,搜索加工的回声就越大,得到肯定结果的证据就越多。假设I代表间接激活的程度,t (I) 代表得到肯定结果的搜索加工的时间长度,如果在关键期t (WI) 内,没有激活流回任何源节点,这就显示了搜索的失败。在这种情况下,在t (WI) 时间后搜索加工停止。因此,成功的搜索加工比相应的失败的搜索加工速度快,即t (I) <t (WI)

另外,提取的认知加工不仅包括搜索加工,还包括对其结果的评价,例如评价搜索的结果是否与原先的期望或其他知识相符合。联结主义模型假设,搜索加工结果的加工速度与肯定证据量成正比,肯定证据越强,结果就能越快得到继续加工。因此,肯定证据的程度I不仅通过短暂的搜索时间间接易化了进一步加工的速度,而且直接对加工所需时间发生作用。

根据结构假设和加工假设,联结主义模型作出了重要的预测,网络的复杂程度与搜索加工速度的交互作用表现为:

(1)间接激活的程度(I)随着节点或成分数n的增加而增加;

(2)随着节点数或成分数目n的增加,搜索加工的速度将增加,所需时间将减少。

也就是说,节点间连结数量的增加可以增加间接激活的程度,结构间相互联结可以显著地增加输入的激活量,以此提高加工的速度。因此,联结主义模型使我们可以解释加工速度是如何作为复杂程度和相互联结程度的一个函数来变化的。

图2–5 由五个节点构成的完全相互联结的结构

(资料来源:Anderson, 1983)

为了更清楚地说明这一问题,此处引用一个5个节点完全联结的实例(如图2–5所示)。所谓完全联结,是指结构中每个节点都与n-1个节点相联结。这样的结构叫做完全的相互联结结构。完全的相互联结结构中连线的数目 m=[n(n-1)/2]。如果一个结构的源节点通过连线与其余n-1个节点相连,这n-1个节点又都和剩余的n-2个节点相连,以此类推得到的一个封闭的结构就是部分的相互联结结构。如果一个代码的网络中,所有n-1个节点都通过一个不经过源节点的通路直接或间接地联结在一起,那么,这个网络就是封闭的。一个代码如果符合部分相互联结结构的要求,那么,它就是相互联结的。因为LTM中只存贮相互联结的代码,所以不符合先前定义的节点联结主义模型的就不予以考虑。图2–5是一个由5个节点构成的完全联结,每个节点都与其他节点通过连线相连,所以共有10条连线。因为所有节点都与其余节点相连,所以每个节点都可以作为源节点。搜索加工可以从任一节点开始,然后传到网络的其余节点上。当源节点收到返回的间接激活时,搜索加工就以肯定的结果结束。也就是说,当记忆中出现一个相应的强的回响时,搜索加工就终止了。由此可见,间接激活只在相互联结的结构中出现,而不在扇形的等级结构中出现。没有间接激活,就无法限定搜索加工的时间。

四、关于联结主义模型的几点说明

(一)关于联结主义模型与等级代码

联结主义模型也可以应用于非相互联结的或等级结构。因为相互联结的定义仅适用于LTM代码的内部结构,不同代码之间的相互联结仍可能是等级结构,然而,一个等级节点是一个被动的节点,只有当它被作为访问节点时才传输激活。激活传到等级层次中的某个节点后,可以与其他激活累积,但不会传给其他节点。因此,联结主义模型必须具有一种可以描述不同节点间搜索过程的能力,故该模型的加工假设应能用于所有结构,而不只是相互联结的结构。

(二)关于加工假设的几点说明

前面简要地介绍了加工假设,下面进一步对加工假设进行说明:

1.任何已激活的节点能将所有的激活量传递到与之相连的任一连线上。所以,此假设亦被称为“传播激活的无限能量”(Unlimited Capacity Of Spreading Activiation)假设。

2.一个节点只在一个关键期t(k)内保持激活。如果一个节点t(k)这段时间内没有受到进一步激活,那么它的活动就被设定为0;如果激活加工在t(k)这段时间的不同时刻会聚过来,那么称之为此节点的同时激活。

3.如果一个节点被激活,那么结果的激活量等于原来的激活值加上新近的激活量。

4.每个连线可以被相反的方向同时激活。

5.由于联结主义模型的加工假设不允许反响激活,所以每个连线将激活传给另一个节点后,不能在1/sh时间内被同一个节点反响激活。s是传输到连线上的激活量,h代表抑制(h<l)或不抑制(h>l)的因素。为了方便起见,我们假设h=1,所以抑制时间为1/s。

6.用来激活节点1的时间t (i) 是连到某节点连线激活量s (i) 的倒数,即t (i) =1/s (i)

7.在中性状态时,所有连线和节点显示出同样的强度,即没有预激活和抑制,连线和节点的不同强度是扩散激活加工的结果。

以这些假设为基础,我们可以预测控制节点数目n与间接激活量I之间的关系。第一,一个代码包含的节点数目越多,间接激活传回的量I越大;第二,一个代码包含的节点数目越多,在源节点累积得越快,并由此得到下面两个推论:

推论1:间接激活的程度随复杂程度的增加而增加。

在联结主义模型中,激活扩散可以分为三个阶段(以完全相互联结的结构为例)。

阶段一,假设a是源节点接收到的激活量。所有与源节点直接联结的n-1个节点被源节点以总量a激活。在激活的第一阶段末期,n-1个节点都受到a的激活。根据假设6,激活的第一阶段的持续时间为1/a。因为我们拒绝了反响假设,所以从n-1个节点没有激活返回源节点。根据假设5,将激活传给下一个节点的连线在1/s(此处等于l/a)时间内不会被反响激活。根据假设6,n-1个节点在1/a段时间后被激活。这样,在这段时间里,n-1个节点无法将激活返回给源节点。

阶段二,根据假设5,激活从n-1个节点中的每个节点流向所有n-2个节点。所有这些连线从两个方向被激活(假设4)。假设在第二阶段,激活量等于b, 这样n-1个节点均被所有n-2个节点以激活量b激活。根据假设3,这n-l个节点每个节点的激活总量等于b(n-2)。若考虑激活后扩散过程中可能存在的衰减,实际上b≤a;如果我们假设n-1个节点仍被以a的激活量激活,那么在第二阶段,每个节点的激活量等于a+b(n-2)。再根据假设5,在经过历时1/a的第一阶段后,在又一个 1/s的时间单元内,没有可以返回源节点的激活。所以,只有在1/a+1/a的时间间隔后才能将激活返回源节点。阶段二需要1/b的时间,所以源节点传导激活已经过了1/a+1/b的时间单元。因为l/a+l/b≥l/a+l/a,所以,从n–1个节点指向源节点的联结在第二阶段结束第三阶段开始时已经解除抑制了。另一方面,在第二阶段末期,因为所有n–1个节点已经被剩余n–2个节点激活,所以没有激活能返回这n–2个节点。

阶段三,a+b(n–2)的激活量从n–1个节点返回源节点。因为从开始激活至今已经历两个阶段,假如已经超过t (k) ,则源节点失去了所有的原来的激活。在第三阶段末期,源节点被[a+b(n–2)](n–1)间接激活。在任何完全相互联结的模型中,当多于三个节点时,联结数为m=[n(n–1)/2],间接激活量I=[a+b(n–2)](n–1)。因为a和 b值恒定,所以I仅依赖于节点数目。一个完全相互联结结构包含的成分越多,流回源节点的间接激活量越大。间接激活量的方程支持了预测I,而且即使t (k) 和b的值变化,I的绝对值会发生变化,但I和n之间的关系不变。这种关系对完全的和部分的互相联结的结构均适用。

对于部分相互联结的模型,也存在三个激活阶段。阶段一和完全的相互联结模型一样,所有n–1个结点以a的数量被激活,而且同样根据假设5没有反响激活流回源节点。在第二阶段,与完全相互联结的模型不同,比n-2连线的最大值要少。假设连线数为f(n–2)。这样,在第二阶段末期,n–1个节点每个均以a+bf(n–2)的量激活。到了第三阶段,像完全相互联结的模型一样,激活从n–1个节点流回源节点。源节点以[a+bf(n–2)](n–1)的量被激活。部分相互联结模型中,当1≤f(n–2)≤(n–2)时,I=[a+bf(n–2)](n–1)。此方程与完全相互联结模型的区别仅在于f, f值降低了间接激活。然而,此处仍能看出,I随节点数的增加而增加,虽然间接激活的累积效应在削弱,但是I仍以(a+b)(n–1)的量增加。

总之,无论是完全的还是部分的相互联结的模型,间接激活量回与节点数n之间存在着肯定的关系,即间接激活量随节点数的增加而增加。

推论2:搜索加工的速度随复杂性的增加而增加。

我们已经假设,当间接激活返回源节点时,搜索加工就已成功结束。搜索加工的速度依赖于t (I) 。根据假设6,用于激活一个连线所需的时间是激活量的倒数值。由于我们已经决定了阶段一、二、三的激活量,所以可以很容易地计算出激活时间t (kI) 。在完全的相互联结的模型中,t (I) =1/a+1/b+1/[a+b(n–2)];在部分的相互联结的模型中,t (I) =1/a+1/ b+1/[a+bf(n–2)]。在这两个方程中,n只出现在分母上,所以搜索加工的持续期随着节点数目的增加而缩短。有许多成分的复杂代码能比简单代码搜索得更快,这对于完全或部分的相互联结的模型也都同样适合。

(三)关于激活扩散能力的假设

与以往激活扩散的无限能量(Unlmited Capacity Of Spreading Activation)为出发点的模型不同,联结主义模型只在激活扩散能力是非限制或部分限制时才有效。那么联结主义模型如何解释扇形效应呢?由于加工假设1与扇形效应的解释相矛盾,而有限能量和无限能量的假设象征着一个连续体的两个端点,因此可以采用激活扩散的部分有限能量假设。此假设不仅保证了扇形效应的解释,而且支持了联结主义模型的预测l。激活扩散的能量若是部分有限的,那么一方面输出的激活总和随着节点连线数的增加而增加(联结主义模型),另一方面每个分离连线的输出激活随节点连接数目的增加而减少。然而,部分有限能量的假设只支持了联结主义模型的预测1,而不支持预测2,但这并不意味着联结主义模型无法解释扇形效应。Ratcliff和Mckoon(l981)的研究发现,激活扩散的时间非常快,所以不适于用来预测反应时。鉴于此,Anderson(1983)只用激活量而不用激活时间来预测反应时。只有预测1可以作为一种测量搜索加工持续的方法被有效地用来预测反应时。搜索加工不仅包含激活的加工,而且包含对搜索结果的检验。如果以反应时为指标,联结主义模型可以简单地解释正向扇形效应和负向扇形效应。

有一点值得引起注意,即激活扩散的能力不一定是一个常量,它很可能作为年龄、相互联结或精细化的程度、甚至智力这些变量的函数而变化。而我们知道,个体间记忆力存在差异,那么个体间的加工能力是否也存在差异呢?是否记忆力好的人激活扩散的能力也好呢?这些都有待进一步研究。

(四)关于控制的假设

联结主义模型的控制假设主要关心激活加工是如何被监控的。因为一定存在某些类型的监控机制,使得每个代码在激活扩散的三个阶段能保持信息。我们知道,源节点与代码的所有成分相连,因此它正好可以承担监控的任务。联结主义模型假设,与网络连线平行,分布着独立的“控制连线”。这样就可以合理解释源节点对激活扩散的控制。具体地说,在激活的时候,一个代码的n–1个节点通过控制连线将一个反馈信号送回源节点。这n–1个节点激活的时刻和激活的频率由源节点记录,一旦n–1个节点第二次送回反馈信号时,此代码的激活扩散就中断了。需要注意的是,即使第一个激活的不是源节点本身,而是n–1个节点当中的一个,源节点仍然能够承担监控的功能。

因此,激活的扩散之所以能保留在网络相应点,是因为任何没有收到源激活的代码在第二个阶段后就停止了活动。值得一提的是,当搜索以肯定的结果结束时,网络必须提供每个代码激活强度的信息。这一信息将指挥提取加工去访问共同通路的相应部分。为此,联结主义模型假设所有代码的源节点都与一个独立的“控制网络”相连。由于该网络只连接所有源节点,而不是代码的所有节点,因此它比记忆网络小很多。

五、对联结主义模型的评价

从以上对联结主义模型的介绍可以看出,与认知主义模型相比,语义记忆的联结主义模型具有几个较为明显的优点。

第一,它比认知主义的模型更接近人脑的神经系统,理应更贴近人的认知特征。例如,一个单元的激活状态就与神经元的静息和发放冲动类似,而单元之间的联结则是按神经元的轴突和树突的形态来模拟的。

第二,它更接近现实中信息的贮存和提取状态。例如,能够解释为何专家与新手相比,前者拥有的知识量大而且复杂,但是他们对信息的贮存和提取速度远远胜于后者。

第三,更加高效。由于采用了分布式贮存和处理,可以节省大量贮存和加工单元。而且,在以前以符号串行加工为基础的系统中,起控制作用的是规则;然而,规则总有例外,因此要加写更为复杂的规则来解决例外情况。而在联结主义模型中,两个单元之间的连结结构成了对网络加工的限制。一个单元接受其他许多单元的输入,因此是寻求对多重限制的最佳总体解决,无须加写复杂的规则就可以解决一些特殊的情况。

第四,贮存在联结主义模型中的信息只会衰退而不会完全丢失。像人脑一样,语义记忆的联结主义模型也是一个容错系统,即使信息过载、指令过载或某些联结、某些单元有物理损害,也不会使系统停止工作,而只是使系统恰当地衰减其功能。成分代码结构使得信息贮存具有冗余性,由于代码各成分相互联结,所以部分成分的丢失可以通过其余成分的存在得到重建。

尽管语义记忆的联结主义模型具有上述优点,提供了关于语义记忆现象的新解释,但是联结主义模型也不能解释所有记忆现象。而且,虽然一些根据联结主义模型设计出的系统能够成功地模拟人类的学习机制,但是我们在根据这些系统的结果作出结论时仍须谨慎。对于某些认知功能的完美模拟,并不能证明有着同样功能的人类大脑也是这样工作的。联结主义的研究取向也受到了一些批评。例如,Fodor和Pylyshyn(1988)认为,认知系统的内在状态是表征的,而符号表征具有语言的特征,具有统合的句法和统合的语义,因此只有符号系统才可以用来为认知过程建模。他们提出,联结主义仅能说明符号表征系统的实现基础,就像神经系统仅能说明认知活动的生理实现基础一样。

综上所述,我们认为,语义记忆的联结主义模型是语义记忆基础理论的重要演进,它以神经系统作为理论启示。把记忆看作是并行分布式的动态活动系统,把网络的整体状态的变化看作是记忆加工,这种对记忆的研究应该更加接近人的真实的记忆过程。但是,联结主义模型本身尚存在局限,我们在依据它对各种记忆现象作出解释时尚需谨慎。然而,可以预计,记忆的联结主义模型必将吸引认知心理学家和记忆的研究者继续进行深入的探索。

本章小结

记忆是人类的高级心理过程。本章结合信息加工理论的观点,阐述了记忆心理的加工过程。按照信息加工观点,记忆是一个“三级加工”过程:通过“注意”将信息从“感觉记忆”状态转送到“短时记忆”加工,并经过“复述”再将信息贮存到“长时记忆”库中以备需要时提取;其中,感觉记忆系统负责接收和登记感官所接受的信息,短时记忆系统负责信息的编码、加工和操作,而长时记忆系统承担信息的保存和提取。在此基础上,本章也详细介绍了针对三个记忆系统内部加工过程和认知机制作出理论解释的网络模型,以及从神经科学视角解释记忆过程的联结主义模型。结合认知机制和神经机制两条思路的解释,使我们对记忆心理的加工过程有了更为全面的了解。 0eeRs/enNrgZ9iQP6I8w42F0+lbZndqy/CepIg3T3vgqU6TgCoQ9MycO01FnB8Zg

点击中间区域
呼出菜单
上一章
目录
下一章
×