本体研究中没有给出一个确切的统计分析:哪些动宾结构中间能够插入成分,哪些动宾结构中间不能插入成分,这样导致教者难教,学者难学,无规可循。
目前无论是离合词的本体研究还是对外汉语教学的研究都取得了很多的成果。但是这些研究成果很多都没有受到足够的重视,没有及时反映到教学大纲的制定、教材的编写与课堂教学等环节中。
在《汉语水平等级标准与语法大纲》中,离合词被安排为“词类”来处理,在《汉语水平词汇与汉字等级大纲》中,离合词没有标注词性。另外,《汉语水平等级标准与语法大纲》与《汉语水平词汇与汉字等级大纲》对于离合词的安排顺序也没有相互映照,如,《汉语水平词汇与汉字等级大纲》的甲级词中有“发烧、见面、起床”等,但是在《汉语水平等级标准与语法大纲》根本没有“离合词”这一语法项目。
研究者们对于离合词的教学建议,虽说提法都各有所长,但是对于每种教学方法,从提出到完全应用于教学实践,均有很大一段距离,建议大多过于笼统,不具体,不细致。比如一些研究者提出采用语块教学法对离合词进行教学,可是具体怎么操作没有说明;再如,很多研究者提到要在教材中的语法部分为离合词立项,但是究竟为哪些离合词立项,为哪些形式立项,这些语法项目的顺序怎样安排等问题却谈得很少;还有,研究者还提议要在教材中增加离合词的练习题,怎样设计这些练习题,设计什么形式的练习题,不同学习阶段的留学生适合什么样的练习题等问题也谈得不够详细。这就需要我们进一步做出更多、更细致的工作。
总体来说,离合词在自然语言处理中的研究逐渐受到重视。北京大学计算语言学研究所开发的电子版《现代汉语语法信息词典》收录动词共有1万多条,其中标明离合词用法的只有1894条,主要包括了动宾式、动结式和动趋式三种。现有的语料库对于离合词的标注大多是没有的,只有北京语言大学的“现代汉语研究语料库”标注了离合词,对于离合词在自动句法分析和语义分析中将如何处理的研究,重视程度也不够多。在机器翻译中,离合词的研究和应用也需要重点关注。
尽管我国政府部门有“信息处理用现代汉语此类标记集规范”立项,有GB13715等面向信息处理的国家标准,但是这种“规范”“标准”并没有被普遍接受和使用。同时,有许多其他国家及公司正凭着他们的规范与标准的优势占领着中文信息处理市场,因此,我们需要加快提高中文语料库规范化程度。