怎样确定词,对汉语研究来说,是一个很复杂的问题。这里只能谈个大概。
6.1 各种不同的词。
说到确定词,首先要注意,从各种不同的角度看,有各种不同的词。
(一)语法词和词汇词
吕叔湘《汉语语法分析问题》指出了两者的不同。他说:
“整个组合如果能单用就是词(或短语),如果不能单用就不是词而只是构词的成分,这样规定看上去是合理的。可是遇到一个问题:比如说‘高射’不是词,‘高射炮’才是一个词,孤立起来看这个例子,说得通,但是‘高射机关枪’呢,就有点为难了。‘高射’不能单说,这是事实,能不能算是可以单用呢?值得考虑。有很多语素组合是属于‘高射’一类的,这一类组合又常常跟别的组合(不能单用的和能单用的)连成很长一串,例如‘袖珍英汉词典│大型彩色纪录片│同步稳相回旋加速器│多弹头分导重入大气运载工具’,等等。说这些都只是一个词,行吗?从语法理论这方面讲,没有什么不可以,但是一般人不会同意。一般人心目中的词是不太长不太复杂的语音语义单位,大致跟词典里的词目差不多。这可以叫做‘词汇的词’,以区别于‘语法的词’。咱们不能忘了,词这个东西,不光是语法单位,也是词汇单位。二者有时候一致,有时候不一致,因为所用的标准不同。袖珍,英汉,大型,彩色,同步,稳相,多弹头,这些都可以算是词汇词。”
“从词汇的角度看,双语素的组合多半可以算一个词,……四个语素的组合多半可以算两个词。……在这里,语素组合的长短这个因素起了很大的作用。”
这段文章的意思是说:什么是词,可以有不同的标准。能单用的才是词,不能单用的就不是词而是构词成分,这是确定语法词的标准。按照这个标准,像“袖珍”和“英汉”这些单位都不能单说(不能单独成句,不能用来回答问题),所以不是词,只是构词成分;只有和别的单位组合,成为可以单说的“袖珍英汉词典”,才是一个词。根据这种标准确定的词,可以叫“语法词”。但一般人心目中的“词”不能太长,现代汉语中大多数词都是双音节,而像“袖珍”和“英汉”等单位就是双音节的,而且它们有明确的意义(袖珍:体积较小便于携带的。英汉:英语和汉语),虽然不能单说,但是可以单用(即和其他单位自由组合,比如“袖珍学生词典”、“袖珍收音机”、“英汉对照”、“英汉比较”等),具备这些条件也可以看作是词。根据这种标准确定的词,可以叫“词汇词”。
(二)韵律词
冯胜利(2000)提出了“韵律词”的概念。这是对上述吕叔湘提出的问题的进一步深化。吕叔湘说:“例如‘袖珍英汉词典│大型彩色纪录片│同步稳相回旋加速器│多弹头分导重入大气运载工具’,等等。说这些都只是一个词,行吗?从语法理论这方面讲,没有什么不可以,但是一般人不会同意。一般人心目中的词是不太长不太复杂的语音语义单位,大致跟词典里的词目差不多。”冯胜利接着说:“一般人”的语感是哪里来的?确定“不太长”的标准是什么?他认为,这可以通过韵律来确定。
“一个在韵律结构中可以独立的基本单位,就是一个词。为了跟语素词或句法词区分开来,叫做‘韵律词’(prosodic word, 简称Pr word)。”“汉语的标准音步是两个音节,……因此汉语的‘标准韵律词’只能是两个音节。”但“三音节可以构成一个‘超音步’。是音步就可以构成韵律词,因此‘超音步’也可以导致韵律词,故名之曰‘超韵律词’。”
但是,有了“韵律词”这个概念,“并不意味着我们可以不要传统的‘词’和‘短语’这两个概念”,韵律词“不能取代词和短语的职责”。根据“韵律词”的概念,可以清楚地区分出“可成词”的形式和“不可成词”的形式;“不可成词”的形式都是短语,“可成词”的形式中则有词也有短语,但不是一般短语,而是可成词性短语。
这就是说,“韵律词”跟“短语”和“词”(包括“语法词”和“词汇词”)不是一个层面上的。韵律词可以是短语(如“念书”),也可以是词(如“大树”、“大车”),而同样是词,又有“语法词”(冯称之为“句法词”)和“词汇词”之分。至于“韵律词”究竟是“短语”还是“词”,究竟是“句法词”还是“词汇词”,还要根据一定的标准做仔细的区分。
比如:“大盘子”、“小狗”、“大褂儿”、“小豆”,都是韵律词。那么它们究竟是短语还是词呢?如果是词,究竟是句法词还是词汇词呢?
冯胜利认为,确定词的依据是“词汇的完整性”(Lexical Inte-grity Hypothesis)原则:短语(句法)规则不能影响到(适用于)词汇内部的任何成分。比如:表示“大小”的修饰语必须放在表示颜色的修饰语之前。但是,可以说“白大褂儿”、“红小豆”。这只能解释为:“大褂儿”、“小豆”是词,“大”、“小”是词汇的内部成分,所以上述修饰语规则不能干涉词汇的内部成分。那么,“大盘子”、“小狗”是词还是短语呢?我们可以说“大白盘子”、“小黑狗”,符合上述修饰语规则,从这么看,它们应该是短语。但我们不能说“很大盘子”、“很小狗”,说明“大”、“小”还是词汇的内部成分,从这么看,它们又应该是词。
既然都是词,“大盘子”、“小狗”和“大褂儿”、“小豆”在上述修饰语规则面前为什么表现不同呢?冯胜利认为:“小狗”和“小豆”都是词(因为前面都不能加“很”),但“小狗=小的狗”,说明“小狗”是句法上合成的单位,是句法词。“小豆≠小的豆”,说明“小豆”是词法里构成的单位,是词汇词。句法词是可以随时拆开的,所以“小狗”可以拆开,中间加进“黑”去。而词汇词中的成分之间的关系比句法词紧密,所以中间拆不开。
应当注意,冯胜利所说的“句法词”、“词汇词”和吕叔湘所说的“语法词”、“词汇词”内涵不完全一样,用以确定词的标准也不完全一样。但他们说的,对我们研究汉语历史词汇学都是很有价值的。汉语历史词汇学研究的主要是那些两个或三个音节的韵律词(还有四个音节的成语),至于这些韵律词里面,哪些是短语,哪些是词,更是需要深入研究的。下面会涉及这个问题。
此外,董秀芳《汉语的词库与词法》(2004)还提出了“词汇词”和“词法词”的概念,她说的“词汇词”和吕、冯所说的又有不同。不过她说的“词汇词”和“词法词”主要讨论一个词是不是词库的成员,不涉及“词”与“非词”的问题,所以在本章不做介绍,放到第二章中去讨论。
6.2 确定词的两个重要问题
确定词有两个重要问题:大小问题,异同问题。赵元任、吕叔湘都谈到这两个问题。
赵元任说:
“咱们可以从句子里的语位连锁关系来看词的单位,也就是看语位在什么情形下合在一起变成词,又在什么情形下是独立的词。这就是词的连接性。……是有关大小的问题。”(《中国话的文法》,P.77)
“咱们上头的讨论,主要是讲多长的一截话可以单独看成一个词。这是有关大小的问题。另一个不同但是相关的是关于种类的问题,也就是什么时候是同一个词,什么时候是不同的词。语位方面,也有同样的问题。”(同上,P.93)
吕叔湘说:
“语素有三方面的问题:大小问题,异同问题,以及与汉字对应的问题。”
“汉语的语素,单音节的多,也有双音节的。……有很多双音节,里边是两个语素还是一个语素可以讨论,例如‘含糊’(比较‘含混’、‘胡涂’),‘什么’(比较‘这么’、‘那么’、‘怎么’)。这是语素的大小问题。”
“一个语素可以有几个意思,只要这几个意思联得上,仍然是一个语素。……如果几个意思联不上,就得算几个语素。……有时候,几个语素联得上联不上难于决定,例如快速、锐利的‘快’和愉快、痛快的‘快’。这是语素的异同问题。”
“这两个问题都可以说是‘一个还是两个?’的问题,不过前一个是一根绳子切不切成两段的问题,后一个是一根绳子掰不掰成两股的问题。”
“辨认语素跟读没读过古书有关系。读过点古书的人在大小问题上倾向于小,在异同问题上倾向于同。”(《汉语语法分析问题》,P.490—491)
吕叔湘谈的是语素的问题,但词同样有这两个问题。下面分开谈。
(一)词的异同问题
汉语的单个的字,不论是在现代汉语中还是在古代汉语中,很多是有多个意义的。对这种现象,究竟是应该看作同一个词有多个义项,还是应该看作是几个不同的词?按道理说,正如吕叔湘所说,只要这几个意思联得上,就是一个词。如果几个意思联不上,就得算几个词。但实际情况相当复杂。
《现代汉语词典》原则上是这样做的。比如前面已经举过的例子:动词“开”的几个相关义项标作“开 1 ”,含金量单位的“开”标作“开 2 ”。但是,也有的条目下几个义项是否意义有联系还很难说。如“匡”下列四个义项:
匡❶〈书〉纠正。❷〈书〉救;帮助。❸〈方〉粗略计算;估计。❹料想。
❶❷是有联系的,❸❹是有联系的。但❶❷和❸❹之间的关系看不出来,应该看作两个词。
至于古汉语词典,一般都是把一个字头分为不同音项,同一音项下的若干义项都一一列出,而不考虑这些义项之间意义有无联系,也就是说,不考虑它们是一个词还是几个词。古代汉语中同一个字的各个义项之间意义有无联系,有的容易判断,有的不好判断。如“厉”的“磨刀石”、“危险”、“严厉”、“带之垂者”、“连衣涉水”等义项之间意义有无联系,“厉”应该看作是一个词还是几个词,这个问题就不大好回答。这是需要深入研究的。
两个音节的组合也有“同一性”的问题,不过比单音节的简单一些。如:
魂兮归来!君无 上天 些。(《楚辞·招魂》)
上天 降灾,使我两君匪以玉帛相见。(《左传·僖公十五年》)
布衣 不完,蔬食不饱。(《大戴礼记·曾子制言中》)
贱为 布衣 ,贫为匹夫。(《荀子·大略》)
显然,前一个是短语,后一个是词,两者没有同一性。但也有比较复杂的。如:
悠悠 我里,亦孔之痗。(《诗经·小雅·十月之交》)
萧萧马鸣, 悠悠 旆旌。(《诗经·小雅·车攻》)
悠悠 万事,唯此为大。(《后汉书·李固传》)
这几个“悠悠”是一个词还是几个词,就需要讨论。
同一性的问题有时还和汉字有关。有的词在历史发展过程中写成不同的汉字,特别是用区别字或累增字来表示,是否就意味着它的词义发生了较大的变化,应该看作一个新的词了?这不能一概而论,要具体分析。
像“取妇”后来写作“娶妇”,“(水)益出”后来写作“溢出”,说明人们觉得“娶妇”的“娶”和“取物”的“取”有较大区别,“溢出”的“溢”和“增益”的“益”有较大的区别,可以看作是一个新的词了。但下面这些例子有所不同:
1)落,草曰零,木曰落。 ,雨零也。
2)颠,顶也。槙,木顶也。
3)淤,淀滓浊泥也。瘀,积血也。
4)息,生也。瘜,寄肉也。
5)然,是也。嘫,语声也。《说文句读》:“然否之然,盖亦此字。”《说文通训定声》:“谓相应之声。经典皆以然为之。”
6)果——菓
7)穿——
这些后起的字虽然存在,但使用得不普遍,说明只有一部分人觉得这种意义和原来的意义有较大的区别,需要用不同的字形来表示,而多数人还是认为这种意义仍可用原来的字形表示。所以,不能根据这些并不普遍的写法而认为这些词已发展出一个新词。
(二)词的大小问题
词的大小问题就是词和短语的区分问题。汉语中词和短语的区分确实是个难题。研究现代汉语的学者曾提出“扩展”、“替换”、“插入”等方法,吕叔湘《汉语语法分析问题》从五个方面来谈这个问题:
一、这个组合能不能单用,这个组合的成分能不能单用;
二、这个组合能不能拆开;
三、这个组合能不能扩展;
四、这个组合的意义是不是等于它的成分的意义的总和;
五、这个组合有多长。
但不能完全解决这个问题。
在古代汉语中不像现代汉语那样可以用重音、轻声、变调等来检验,处理起来更为困难。研究者也曾提出一些区分古代汉语中复音词和词组的办法,如:
马真(1980)主要从词汇意义的角度提出确定古代汉语复音词的五条标准:
A.各成分的原义融化在新的整体组合中。如:“先生”。
B.各成分意义互补,凝结成更概括的意义。如:“恭敬”。
C.其中一个成分意义消失。如:“市井”。
D.重叠后在原义基础上增加某种附加意义。如:“滔滔”。
E.其中一个成分是没有词汇意义的附加成分。如:“率尔”。
伍宗文(2001)谈到先秦汉语复音词(合成词)判定的五个方面的标准:
A.形式标志:唐钰明(1986)把“某个形式是否有合文这个形式标记”作为判定复音词的依据之一。但不能说凡用合文来记录的都是复音词。
B.意义标准:有些复合词可以根据其意义来判定。如“璞玉(=璞)”,“虫蝗(=蝗)”之类“小名加大名、大名加小名”的双音节组合;“鱼鳞(=鳞)”,“瞋目(=瞋)”之类从综合到分析的双音节组合;“南面(天子)”,“知识(朋友)”之类不能直接从两个语素推知其意义的双音节组合;“卜筮”,“辽远”,“是非”等产生概括意义的双音节组合;以及“利害(=利)”,“股掌(=掌)”之类的偏义复词,都可以断定为复合词。
C.修辞手段:表示由修辞手段而产生的新义的双音节组合,应该看作复合词。如“蟊贼”(比喻“害人者”),“布衣”(借代“平民”),“晏驾”(委婉语,指“君主死亡”),等等。
D.语法性质:双音节组合的语法性质发生了变化,可以断定是复合词。如“砥砺”(原为名词,变为动词),“执事”(原为述宾,变为名词)。相同句式中处于对应句法位置,和单音词对应的双音节组合,也可以判定是复合词。如《吕氏春秋》:“日短至,则伐林木,去竹箭。”/《礼记》:“日短至,则伐木,去竹箭。”前一句中的“林木”相当于后一句中的“木”。一些双音节组合处在“相~~”、“不~~”、“所~~”、“~~者”的语法格式中,如“相教诲”、“不欣喜”、“所憎恶”、“谄谀者”,可以判定是复合词。
E.见次频率:“贤人”、“忠臣”现代汉语是词,古代汉语频率高,也应该是词。
王云路(2010)也提出判断复合词的五个标准:
词频标准。
词性标准。
词义标准。
构词标准。
音节标准。
也可以参考。这里就不详细介绍了。
但是,不论用什么标准,都无法把词和短语彻底地区分开。这是因为:汉语从短语到词是一个连续统,最典型的词和最典型的短语当然是区分得很清楚的,但处于两者中间地带的单位是短语还是词就无法清楚地区分,特别因为汉语的词“不是现成的”,很多没有明显的形式标志,区分起来更加困难。而且,从历史上看,很多词都是由短语凝固而成的,处于凝固过程中的单位,究竟是短语还是词也难以判断。这是汉语的词和短语很多难以区分的原因。
(三)顺便说一说,词的大小问题和异同问题,不仅汉语有,其他语言也有。
1.异同问题。
任何语言都有词义的引申,引申得远了,都有是看作一个词还是两个词的问题。
索绪尔《普通语言学教程》:
“一个词可以表达相当不同的概念,而它的同一性不致因此遭受严重的损害。(试比较adopter une mode‘采用一种时式’和adopter un enfant‘收养一个小孩’,la fleur du pommier‘苹果花’和la fleur de la noblesse‘贵族的精华’等等)” (P.153)
布龙菲尔德《语言论》:
“凡是具有相同的语音形式(而只是意义不同)的不同的语言形式就叫做‘同音异义词’(homonyms)。由于我们没有把握来确定意义,所以我们往往不能决定用于不同场合的某个语音形式是否总具有相同的意义或者代表一组同音异义词。例如,英语的动词bear在bear a burden(负重担),bear troubles(受累),bear fruit(结果实),bear offspring(生孩子)这些中间可以看成同一个形式或者是两个或者甚至两个以上的同音异义词。” (P.173)
“在很多情况下,我们往往犹豫,究竟是把一个形式看成是带有好几种意义的形式呢,还是看作一套同音异义词。这一类的例子如:air (空气,大气,调子,乐曲,风度)(最后这个意义包括airs〔拿架子〕),key(用于开关的工具,钥匙;音乐里的音调),charge(攻击,装置,谴责,使负债),sloth(一种动物的名字,懒惰)。” (P.180)
Saeed “ Semantics ”是这样来处理这个问题的:
他把下面的三个foot看作三个“语义词”(semantic words=lexeme):
foot: part of the leg below the ankle;
foot: base or bottom of something;
foot: unit of length, one third of a yard.
把walks, walking, walked 看作三个“语法词”(grammatical words),而对heat(v.)和heat(n.)是不是几个不同的语义词或语法词没有谈。
可见,英语也是存在词的同一性问题的。
2. 大小问题。
英语的词一般是很容易从形式上辨认的,对这些词来说,不存在短语和词的区分问题。如:day and night 是词组,daybreak 是词,day-dream也是词。但英语中也不是每一个词在形式上都很清楚,如:present-day 也可以写作 present day; washing-machine 也可以写作 washing machine;如果光看书写形式,就分不清是短语还是词了。布龙菲尔德《语言论》第十四章“形态类型”详细地讨论了复合词和短语的区别,可见,在西方语言中,词和短语的区别也不是一目了然的。
当然,总的看来,词的确定问题在汉语(尤其是古代汉语)中要比在西方语言中困难得多,这是需要我们认真研究的。
陈卫恒 2011 《音节与意义暨音系与词汇化、语法化、主观化的关联:豫北方言变音的理论研究》,北京语言大学出版社。
董秀芳 2004 《汉语的词库与词法》,北京大学出版社。
冯胜利 2000 《汉语韵律句法学》,上海教育出版社。
黄曾阳 1998 《HNC(概念层次网络)理论》,清华大学出版社。
李 波 2006 《史记字频研究》,商务印书馆。
吕叔湘 1959/1993 《汉语里“词”的问题概述》,《吕叔湘文集》,商务印书馆。
吕叔湘 1963/1993 《语文常谈》,《吕叔湘文集》,商务印书馆。
吕叔湘 1984/1993 《汉语语法分析问题》,《吕叔湘文集》,商务印书馆。
马 真 1980 《先秦复音词初探》,《北京大学学报》第5期。
王洪君 1994 《从字和字组看词和短语——也谈汉语中词的划分标准》,《中国语文》第2期。
王 力 1957/1988 《汉语史稿》,《王力文集》第九卷,山东教育出版社。
王 力 1982 《实用释义组词词典·序》,北京华文出版社。
王 力 1990 《汉语词汇史》,《王力文集》第十一卷,山东教育出版社。
王 庆 2009 《评徐通锵的“字本位”理论和学风》,《外国语言文学》第4期。
王云路 2010 《中古汉语词汇史》,商务印书馆。
伍宗文 2001 《先秦汉语复音词研究》,巴蜀书社。
徐通锵 2008 《汉语字本位语法导论》,山东教育出版社。
赵元任 1968/1979 《汉语口语语法》,吕叔湘译,商务印书馆。
赵元任 1968/2002 《中国话的文法》(增订版),丁邦新译,香港中文大学出版社。
赵元任 1975/2002 《汉语词的概念及其结构和节奏》,《赵元任语言学论文集》,商务印书馆。
郑锦全 1998 《从计量理解语言认知》,《汉语计量与计算研究》(邹嘉彦等编),香港城市大学。
布龙菲尔德 1933/1985 《语言论》,袁家骅、赵世开、甘世福译,商务印书馆。
索绪尔 1916/1985 《普通语言学教程》,高名凯译,商务印书馆。
Saeed, john I. 1997/2000 Semantics , 外语教学与研究出版社。