购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2 利用语料库考察离合词的异态特征

2.1 语料库在语言研究和教学中的重要性

20世纪60年代初,世界上第一个机读语料库在美国布朗大学建成,此后大量的语料库陆续建成,如LOB语料库、LLC语料库、IEC语料库等。我国的语料库建设开始于20世纪80年代,近些年来取得了长足的发展。

随着语料库的不断建设,人们的语言学理念也不断更新。“现代语料库的巨大包容性及开发语料的种种手段的出现构成了深化我们对语言认识和理解的巨大基础。”(Halliday,1991)Sinclair(1991)在对比不同的语言事实时指出,真实的语言材料,即自然语言文本,是语言研究最可靠的依据。Leech(1993)认为“从科学的方法角度,语料库是一种更为强有力的研究方法,因为其结果是可以验证的”。

语料库在语言教学中的优势越来越显著。在语言教学上,语料库产生了巨大的影响,Hunston(2002)认为语料库对语言教师的职业生涯有两大影响:一是语料库会导致对一种语言的新的描写,从而使教师对教什么的看法产生根本的改变;二是语料库本身能被用来开发新的教学材料,并为新的教学大纲、教学方法的制订奠定基础。

语料库在语言研究尤其是语法研究方面的贡献更为突出。当代语言学家Quirk等人基于“英语用法调查”语料库编写了《当代英语语法》,这本书被公认为权威之作。后来,作者又在此基础上根据扩充了的语料库编写了《英语语法大全》,这本巨著更有权威性,它发现了一些新的语法规律,补充或修订了一些原有的语法规则。20世纪90年代末,根据语料库语言学的最新成果编写的英语语法专著相继问世。Douglas Biber等编著的《朗文英语口语和笔语语法》值得借鉴。这本语法书所依据的语料库共有377,244个文本,计4,000多万词。语料主要选自会话、小说、新闻、学术文章等四个语域。通过对各种语法现象的分布进行全面而可靠的统计,得出哪些是常见的语法现象,哪些是一般现象,哪些是特殊现象。

西方语言学家利用语料库进行语言研究的经验启示我们,通过对语料库进行大规模的语料调查,我们会发现一些习焉不察的语言规律。“有时以语料库的大量语料为基础进行的语言研究,更有可能使研究者发现原有对某些语法现象的解释与自然语言中的实际情况不符合,这就使得他们有机会去修正或补充前人的结论,促进语言科学的发展。”(卢伟,1999)

2.2 语料库在离合词研究和教学中的必要性

现代汉语离合词是当前汉语教学和研究的重点和难点,多年来人们对离合词的性质、用法、语法规律等各方面进行了许多有益的探索,但许多问题仍然没有达成共识。我们认为最根本的原因是,我们在讨论离合词问题时忽视了语言的客观实际,过多地依赖语感,因而对一些问题众说纷纭,莫衷一是。

值得特别提出的是,我们至今并没有完全弄清离合词这个家族每个成员离析形式的“底细”。“说到离合词,一般的语法书都指出可以在离合词中插入‘了、着、过’,可以插入补语和定语。如果直接把这些规律搬到对外汉语教学中就显得线条太粗、太笼统。”(饶勤,1997)

饶勤的感觉是正确的,不同的离合词离析形式和各离析形式的出现频率并不完全相同。我们看离合词“毕业”:通过检索CCL语料库,我们发现其离析成分只有“了”“过”和补语“不了”3种,而且60条例句中,插入“了”的有52例,占86.7%;插入“过”的5条,占8.3%;插入补语“不了”的3条,仅占5.0%。这说明“了”是“毕业”的优势插入成分,客观语料中没有插入“着”、定语等情况。我们再看“当面”:我们检索出451条离析例句,其中插入“着”的例句就有427条,占94.7%;插入名词或代词的例句有21条,占4.7%;插入“了”的例句只有3条,仅占0.6%。这说明不同的离合词离析形式尤其是优势离析形式并不一样。请看下表:

表2 不同离合词离析形式及其出现频率对比

也有很多人认识到不同的离合词插入成分并不相同,但每个离合词中间到底能插入什么成分,常常凭个人语感,实际上离合词的离析形式远非我们想象的那样。

我们看一个例子,《现代汉语离合词用法词典》(杨庆蕙,1995)对“着急”用法的解释:

【离】1)“着”后带助词“了”“过”等:为这事他可着了急了。/我也着过急。

2)“着”后带补语:她为女儿着了半天急,女儿可不领情。

3)“急”前带定语:你着什么急?

客观语言事实中“着急”离析情况如何呢?我们利用CCL语料库进行搜索共得出“着急”有效离析形式句85条,分析发现“着急”的离析情况跟上述说法不一致,请看:

1)“着”后带助词“了”,37条,占43.5%。

(3)看着老婆赌气不拿药,小林倒[着了急]。

2)“着急”插入代词“什么”,30条,占35.3%。

(4)这事[着什么急],登个记还不简单?

3)“着急”插入数量词,6条,占7.1%。

(5)招弟不是我由娘家带来的,她是你们冠家的姑娘,你难道就不[着一点急]?

(6)老爹后来说,他不过是想和王仙客开个玩笑,让他[着一会儿急]。

4)“着急”插入其他代词,4条,占4.7%。

(7)孔太平说自己心中有数,让他别[着这个急]。

5)“着急”插入形容词,3条,占3.5%。

(8)他说,要是他姐或是姐夫病了,这孩子也许不会[着这么大的急]。

6)“着”后带助词“过”,2条,占2.4%。

(9)就为了四先生的睡懒觉,四奶奶可是[着过急]的,睡懒觉,那是要误事的,什么差事也不能作了。

7)“着急”插入补语“起来”,2条,占2.4%。

(10)乘客和司机都[着起急来]:……

8)“急”提前,1条,占1.1%。

(11)李:对,这下消费者没[急着]了。

当然,语料库中出现的用法,未必完全跟现实生活中的用法一致,但大型语料库毕竟比我们的语感更为客观全面。我们可以利用大型语料库为研究和教学提供科学依据,比如,语言现象的分布和频率等信息可以使我们科学地确定哪些是研究和教学的重点和难点,以使我们的工作更为准确和高效。Halliday和McDonald(2004)指出,语料库最主要的优点是语料的真实性,真实的自然的语料之所以重要,是因为理想中的语言与实际运用中的语言是不完全相同的,本族语者的直觉并不总是准确的。

由此看来,解决现代汉语离合词的教学与研究的难题首先要从摸清离合词的“底细”做起,而这个工作仅凭语感是不准确的,必须借助于大型的语料库。

本章考察统计主要使用北京大学中国语言学研究中心语料库(简称CCL语料库)网络版现代汉语部分。CCL语料库在国内是一个比较成熟的语料库,容量大,检索方便;语料分布平衡,涉及新闻、文学、口语、戏剧、应用文、词典、翻译作品等。 MZgSisVOt3BH6OBFs+VutQYhwoWjCSSElhsyCXFAnqbb0+B623Y4lRBBdqtVYWMq

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开