我们以《汉语水平词汇与汉字等级大纲》(国家汉办,1992)词汇为考察基础,参考《现代汉语词典》(第7版)对离合词的标注,确定了207个离合词作为考察范围。
我们通过CCL语料库对圈定的207个离合词离析形式进行了穷尽的考察,得到含离合词离析形式的离析形式句14,968句。我们发现:
1)离合词结构的标记性。通过对207个离合词的离析形式进行细致的归纳整理,我们发现离合词在实际语料中的离析形式可以大致归纳为13种。统计发现,离合词插入“了”的离析形式最多,其次是插入补语或插入名词/代词以及数量词的离析形式,然后是插入体标记“过”,再次是B前置和插入“着”,这7种离析形式应该是离合词的主要离析形式。离合词中插入数词、形容词、“个”“的”以及动词A重叠的情况较居后位,而插入动词性成分的情况最少,居末位。虽然207个离合词出现的离析形式有13种,但是,这些离合词离析形式出现的种类分布并不一致。离合词离析形式的出现种类与可以以这些形式离析的离合词的数量和所占比例成反比:越是离析形式种类少的离合词,其数量和所占比例就越大;反之亦然。
2)离合词离析的低频性。我们发现,207个产生离析现象的离合词的平均离析频率仅为0.059,离析频率高于0.5(含0.5)的只有4个,71.0%的离合词离析频率低于0.1,86.5%的离合词离析频率低于0.2。在实际语言中绝大部分离合词(占98.1%)“合”大于“离”。实际上所谓离合词,“合”是常态,“离”是异态。
此外,我们发现,离合词离析频率与其在语言中的使用频率有一定关系。大部分高离析频率离合词常常也是现实生活中高使用频率的词语,低离析频率离合词也常常是低使用频率离合词。
3)离合词离析形式的主观性。通过对离合词离析形式进行考察,我们发现离合词离析形式反映了语言的主观性,表现了说话人的视角、认识以及情感。