许多印欧语的语法书不给词下什么定义,也不说明词与非词的界限。词么,是一种普通的语言单位,大家都认识的,自然不必多费笔墨。在汉语语法书里却不然,既要给词下定义,又要说明如何在语言片断中切分出词来。
通常给词下的定义是:最小的能够独立运用的语言单位。
所谓语言单位,指的是音义结合的单位,当然不包括语音单位(音素)和语义单位(义素)。
“最小的”是区别于较大的语言单位,如“短语”。
“独立运用”或称之为“自由运用”,包括下列内容:
第一,能单说的(包括能单独回答问题的)最小语言单位。
第二,虽然不能单说,但是在句子中抽去可以单说的词之后,剩下的又不属词的一部分,也是词。
能单说的主要是名词,其次是动词、形容词、代词。但是,并非这几类词中所有的词都能单说。比如,“爸”、“妈”可以单说,“弟”、“妹”不单说。“来”、“去”可以单说,“回”、“过”不单说。“对”、“好”可以单说,“错”、“坏”不单说。“你”、“我”可以单说,“这”、“那”不单说。数词中基数词(一至十)能单说,但限于读数、计数。位数词(百、千、万等)不能单说。比如说年龄,可以说“五岁”,但不能单说“五”。说日期,可以说“六号”、“初七”,但不能单说“六”或“七”。可以说“十五”、“六十”、“二十七”等,这些是数目,不是数词,它们由数词组成,可以称之为数词短语。数词短语可以单说不等于数词可以单说。量词都不能单说,副词只有极少数(“不”、“也许”等)可以单说。介词、连词、助词、语气词都不能单说。看来,用单说来鉴定词,作用是很有限的。
由于句子中不能单说的成分常常连在一起,把剩余的部分全看作词经常会出现问题。例如“我错了”中的“错”和“了”不能单说,“我姓张”中的“姓”和“张”不能单说,“他们也都被批评了”中的“也”、“都”、“被”不能单说,我们不能因此认为“错了”、“姓张”、“也都被”都是词。
有些语言学家,例如亨利·斯威特(Henry Sweet)认为有些语言单位不能单说,可是又不能否定它们是词,这可以用类比的方法来说明。比如goes不能单说,可是跟命令式“go!”类比,得认为它们都是词。布龙菲尔德(L.Bloomfield)也说,the这个词虽不能单说,可是它的作用跟this、that相似,经过类比,它也得算是词。如果运用类比的方法,得出的就不一定是最小的独立运用的单位,因为许多短语也可以与词的功能进行类比。其实,西方学者运用类比方法,旨在说明goes、the等语言单位为什么是词,并不在运用这个方法切分出词来。换句话说,goes、the是词,已不成问题,因为是大家公认的。但是它们为什么会被看成词,要加以解释。汉语要解决的问题并不是须说明虚词为什么是词,而是要区分词与非词,所以,这样的类比不切合我们的需要。
研究什么是词,通常考虑的是:第一,给词下定义的问题;第二,如何从成片语言中分析出词来的问题。这两方面的探讨都不很令人满意。我们似乎可以换个角度来考虑问题,研究一下词的性质。比如,我们可以想一想,词是不是语流中的自然单位。在语流中,音节是一种自然单位。尽管对音节的定义还有不少争论,但是在汉语中,元音构成的响峰成为音节的标志,这是可以用仪器测定的。人们在实际划分音节界限时,也不会出现分歧。当然,词不是语音单位,它是音义结合的语言单位。在语流中能不能找到划分的标志呢?有人认为词与词之间有些微的间歇,这完全是一种主观的想象。比如英语里的“All right”是两个词,听起来却是[ɔːlrait],中间无间隔,似乎是一个语言单位。“That will do”是三个词,听起来是[ðætl duː],似乎是两个单位。汉语何尝不是如此。“你们吃了饭吗?”听起来是三个单位组成的,可是谁也不认为它只包含三个词。至于想凭借语流中的轻声和重读来切分词,那更是不可能的。念轻声的有的是词,如“了”、“着”、“过”,有的不是词,如“桌子”、“多么”、“看头”中的“子”、“么”、“头”。重读的情况更是复杂,拿双音词的重读来说,有的第一个音节重读,如“月亮”、“动作”、“衣服”;有的第二个音节重读,如“出席”、“辛苦”、“老李”;有的两个音节都重读,如“天地”、“国家”、“文学”。因此,我们不免产生疑问:词是不是口语中自然存在的语言单位?
拿使用拼音文字的语言和汉语相比,他们划分词是很容易的事,但是辨识语素却常常感到为难。例如英语的名词,由单数变成复数大都在词末添加-s或-es,发音是[s]、[z]或[iz]。这三个音可以看作同一语素的变体,因为它们表达的意义相同,出现的语言环境是互补的。可是ox(公牛)的复数形式是oxen,en该当作另一语素。child(小孩)的复数形式是children,表示复数的部分是en还是ren?而且,单数的child与复数的child读音并不相同,它们是一个语素还是两个语素?又如动词,表示过去的形式大都添加ed或d,发音是[t]、[d]或[id]。这三个音也可以看作同一语素的变体。可是understand的过去式是understood,overthrow的过去式是overthrew,它们究竟包含几个语素,该如何切分,人们的意见很不一致。
为什么汉语的语素容易辨认而英语的情况却两样呢?关键在书面语言。汉语的书写形式基本上是按语素分开排列的,而拼音文字是按词分开书写的。为什么英国人认为classroom是一个词而不是两个词,因为class和room是连写的。在早期的英语中,class和room是分写的,人们都认为它们各是一个词。后来当中加了一短横,即成为class-room,人们当它是词和短语之间的过渡形式,不妨称之为短语词。类似的例子如blackboard、earthquake,都曾经分作两个词书写,也有过插入短横的过渡形式。不管怎么说,分开写时是两个词,连写时是一个词,人们依据书写习惯来辨认词与非词。像well chosen之类,有人把它们连写成词,有人却写成wellchosen,反映人们对此尚有不同看法。看来,我们似乎可以得出这样的结论:词不是语言中的自然单位,而是人们在书写时的一种规定。然而书面语言是口语的加工形式,难道可以脱离口语而自成体系?
在使用拼音文字的人的心目中,连写的是词,分写的是短语。也就是说,划分词的标准是书写形式。但是这不等于说,词的形成与口语无关。口语是书面语的依据,依据并不一定是标准。在科学领域内,常常要推究分类的依据和分类标准之间的种种关系。打个比方:一年分为四季,虽然有客观的依据,即天体的运行和气候的变化,可是划分四季还得确立个标准。我国古代以立春、立夏、立秋、立冬为四季的开始,而欧美一些国家却以春分、夏至、秋分、冬至为换季的界限。虽然如此,中国人谈到“春天”和“春风”与外国人说的“Spring days”和“Spring breeze”却有共同的理解。语言学的情况也往往如此:一方面根据分类的依据可以大体了解语言单位的类别;另一方面,依据和标准不能完全吻合,有必要指明它们之间的差异。
因为以口语作依据,人们说同一种语言,对语言单位会有许多共识。比如“人”、“一”、“来”、“走”、“快”、“好”等,说汉语的人都会认为它们是词,因为它们可以单说,而且是最小的意义单位。遇到“人们”、“第一”、“来了”、“走开”、“快要”、“好看”之类,究竟是一个词还是两个词就将引起争议了。问题出在我们缺个分词连写的标准。
1988年国家教育委员会和国家语言文字工作委员会联合发表了《汉语拼音正词法基本规则》。这个规则是用《汉语拼音方案》拼写现代汉语的规则,以词为拼写单位,并适当考虑语音、语义等因素,同时考虑词形长短适度。这就是说,这个“正词法”既包括公认的词,又包括规定的词,也包括一些短语词。
规定的词如:
kāihuì(开会)dàhuì(大会)
dǎpò(打破)ɡèɡe(个个)
fùbùzhǎnɡ(副部长)zǒnɡɡōnɡchénɡshī(总工程师)
短语词如:
ɡōnɡ-ɡuān(公关)rén-jī duìhuà(人机对话)
bā-jiǔtiān(八九天)zhōng-xiǎoxué(中小学)
dì-shísān(第十三)jiji-zhɑzhɑ(叽叽喳喳)
当然,这个正词法还没有作为一切领域(例如词典编写)的准则,而且即使用于汉语拼音的方面,也有待进一步完善,不过,我们仍旧可以从中得到启发。
第一,从使用拼音进行分词连写与单纯从语法的角度考虑什么是词,所得的结果未必一致。那么,我们在规定词与非词的界限方面,该作进一步的研究。
第二,无论是从什么角度考虑词的定形,不能不承认短语词的存在。也就是说,词和短语之间有中间单位。
短语是词和词结合起来构成的,可是词和词联在一起并非都是短语。比如,“铁”是一个词,“路”也是一个词,“铁路”却不是短语,而是另一个词。“人”是一个词,“家”是一个词,“人家”却是另一个词。正因为如此,复合词与短语的界限有时模糊不清。
王力主张用“插入法”区分词和短语。他说:“‘马车’是仂语,因为它是‘马拉的车’;‘车子’是单词,因为它不是‘车的儿子’。”(《汉语语法纲要》,第23页)陆志书曾指出,“马车”与“马拉的车”含义不同,因为我们可以说“牛拉了一辆马车”。这就给插入法提出一个要求:插入别的词之后,不但要保持基本结构,而且不能改变原来的意义。比如“大雨”可以说成“大的雨”,是短语;“大衣”不能说成“大的衣”,是词。
插入法也叫隔开法,也许叫扩展法更为合适。如“我去”可以扩展为“我和你去”,“我的”可以扩展为“我和你的”,“从北京”可以扩展为“从上海和北京”,如此等等,它们都是短语。可是扩展法也会遇到一些麻烦。
第一,有些偏正式结构,在甲场合能扩展,在乙场合却不能扩展。例如“羊肉”,在“这是羊肉,不是狗肉”中,可以插入“的”;在“买三斤羊肉”中,不能隔开使用。类似的例子如:
牛奶 鸭毛 鹿角 鸡腿 鹅蛋 旁人 死棋
如果使用拼音文字,可以在它们中间加一短横,可汉字没有这种用法。通常认为既然以不插入“的”为常见,不妨全当作词;如果插入“的”,就当作短语。可是编纂词典的人会有意见。正如《汉语的构词法》中所说:“假若‘羊肉’是词,‘羊毛、羊角、羊腿、羊肝儿……’,‘猪肉、狗肉、鸡肉、鱼肉……’全都是词。单只这一个格式,就给汉语平白地添出成千成万的词来。”
第二,有些动宾结构也有类似的情况。例如:
鞠躬 洗澡 理发 注意 起草 平反 留神
冒险 偷懒 造谣 出丑 受罪 负责 担忧
这些语言单位都是动词性的,当中可以插入数量词或“了”,如“鞠一个躬”、“洗一次澡”、“注点儿意”、“平了反”、“出了丑”。前边讲的“羊肉”之类,两个语素都是能单说的;这里的动宾结构,大都有一个不能单说的语素,所以把它们看成词更有理由。但是插入了别的词语之后,宜当作短语。这种短语是词的扩展形式,有人称之为离合词,吕叔湘称之为短语词。
第三,动补结构的情况更为复杂,先比较下列几组例子:
(1)证明 改进 说穿 纠正 推迟
(2)看见 打倒 叫醒 完成 发动
(3)放大 缩小 学好 降低 增多
(1)组不能拆开,宜当作词;(2)组只能插入“得”或“不”;(3)组不但能插入“得”、“不”,而且还可以扩展得更长。如“放得屏幕那么大”、“学得比你还好”。于是有各种不同看法。有人认为(2)、(3)两组宜同样看待:未隔开时作为词,隔开时作为短语。有人认为(2)、(3)两组是词,插入“得”或“不”仍旧是词,这是比照“来得及”、“来不及”、“合得来”、“合不来”、“对得住”、“对不住”、“看得起”、“看不起”得出的结论。就是说,“得”和“不”是构词成分,属于中缀。只有插入其他词语,才能当成短语。还有人认为(2)组和(3)组应分别对待,(2)组是词,(3)组是短语。
上边谈的种种看法,都有一定的依据,难比高低。如果单纯从语法教学方面考虑,宜采取简便的方法,即认为未隔开时是词,隔开时是短语,对偏正、动宾、动补结构都同样处理。
固定短语是词的等价物(equivalent),汉语的固定短语主要有三类。一类是专名,多数由名词连缀而成,有时也夹入别类词。例如:
中山医院门诊部手术室 北京朝阳门内南小街
上海市园林管理局 甲状腺机能亢进症
这种固定短语的特点是进行不同的切分,通常不妨碍理解。如“中山医院/门诊部手术室”与“中山医院门诊部/手术室”的含义相同。
另一类是动词和名词的组合,动词是单音节的,名词大多是双音节的。例如:
摆架子 (比较:摆桌子)
敲竹杠 (比较:敲大锣)
吹牛皮 (比较:吹口琴)
开夜车 (比较:开汽车)
喝西北风 (比较:喝青菜汤)
坐冷板凳 (比较:坐靠背椅)
这些固定短语的动词大都是表示行为动作的常用词,整个短语的功能是动词性的,常用来表示对事物的否定态度,含有消极意味。
最常用的固定短语是成语。成语也和上述短语一样,有固定的形式和凝结的含义。然而成语中词与词之间的凝聚力并不完全相同。试比较:
(1)之乎者也 一日三秋 三长两短
(2)囫囵吞枣 唇亡齿寒 画蛇添足
(3)平易近人 量力而行 乘人之危
(1)的凝聚力最强,字面不暗示含义;(3)的凝聚力最弱,含义可以从字面去理解;(2)的情况介乎当中。就是说,成语的含义大体能从字面的意义引申而得。
上述(3)这一类短语,既然从字面可以了解含义,为什么列入成语之中?原来把短语分为固定短语和非固定短语,是从两个方面来看的。第一,从理解的过程看,理解非固定短语的含义,是在理解词义的基础上实现的;理解固定短语的含义却不是这样。第二,从使用的过程看,非固定短语是根据交际需要临时组合的,固定短语是作为现成的构件供人选用的。划定固定短语的范围,主要是根据第二条,所以专名也作为固定短语,(3)这一类短语也包括在内。
我们经常看到一些四字短语,从形式上看,很像成语,可是它们是根据交际需要临时创造出来的。举几种常见的格式:
(1)××之×
成语里有:
莫逆之交 金石之言 杞人之忧 犬马之劳
乌合之众 城下之盟 切肤之痛 多事之秋
仿造的如:
欢乐之情 分别之时 敬仰之心
特点:短语为偏正结构,功能是名词性的。
(2)××而×
成语里有:
一挥而就 待价而沽 侃侃而谈 脱颖而出
竭泽而渔 不言而喻 接踵而来 扬长而去
仿造的如:
奔腾而来 挺身而出 一晃而过
特点:短语为偏正结构,功能是动词性的。
(3)××不×
成语里有:
从容不迫 有条不紊 参差不齐 局促不安
执迷不悟 坚定不移 直言不讳 放荡不羁
仿造的如:
闭口不言 酣睡不醒 模糊不清
特点:短语为并列结构,并列两部分的意义相近(如“从容”和“不迫”)。功能是形容词性的。请注意:“美中不足”、“寸步不离”等属另一种格式。
(4)××如×
成语里有:
目光如豆 大雨如注 一贫如洗 一见如故
冠盖如云 巧舌如簧 杀人如麻 应对如流
仿造的如:
堆积如山 洁白如银
特点:短语为主谓结构,功能是谓词性的。请注意:“空空如也”是另一式。
从上边的例子可以看出:仿造的成语的含义可以根据字面来理解,这一点跟一般短语相同。但是它们有特有的格式和功能,跟某些成语近似,不妨称之为类固定短语。事实上,一些凝聚力较弱的成语原也是由少数人创造、多数人使用,从而进入成语范围的。由此我们也可以了解,成语和非成语的界限有时并不是十分清楚的。
学习任何一种语言,要掌握一定数量的语言材料,包括词和固定短语,也要掌握组词成句的规则。学习汉语,掌握类固定短语是值得重视的。从理解方面说,由于它们有比较固定的格式,即使对个别词义不甚了了,也能悟出整体的含义或功能。从使用方面说,四字格在汉语中有稳定、庄重的色彩,在论文中是经常使用的。请看一段文章:
会议上发言,有种种情况;但是无论如何,总得考虑效果。讲的人泛泛而谈,听的人昏昏欲睡;既浪费了自己的精力,也空耗了别人的时间。有意见要发表,切忌东拉西扯,使人不得要领;要言不烦,常常能使人获得深刻印象。出于礼貌,有时得说些应酬话。虽然属随口之言,应当力求表达真情实感;不能是官样文章,千篇一律。
这段文章用了许多成语和类固定短语,读起来有一种严整精练的感觉。当然,并不是说表达上边的内容非如此写不可,但是作为一种有效的表达手段,学习汉语的人应该熟悉它。
要补充说明的是:前边谈到类固定短语是模仿成语的某些格式创造出来的,这里的所谓模仿,属于用词造句的范围,不同于修辞上的成语仿造。下边是修辞上的例子:
龙二井又有油和水的矛盾,这是它的特殊性。周队长说,要促使矛盾转化,就要捞水,把水捞干。我们想一不做,二不休,搞它个水落油出。
“水落油出”是仿“水落石出”造出来的,这在特定的语言环境中才能出现,目的在使语言表达生动。这种仿造的成语必须依附被仿造的成语,才能显示出它的修辞效果。