本章语料主要来自北京大学中国语言学研究中心现代汉语语料库(简称CCL语料库)。
我们在CCL语料库中,共搜索得到“涉及”和“涉及到”的语料15,199条,共131.9万字,我们对这15,199条语料进行整理筛选。
本章主要研究“涉及”“涉及到”作谓语之情况,凡有“涉及”作修饰语或其他用途的语料,不计入统计范围,如“涉及范围”“涉及面”“涉及面积”等;或者“涉及”与“涉及到”在句中构成“的”字短语,即包含“所涉及的”“所涉及到的”“涉及的”“涉及到的”一类语料,此类短语在句中未作谓语,所以也不计入统计范围。
有一些“涉及”或“涉及到”的语料跟我们的研究对象性质不同,如:
(1)苏:泰阿泰德,我为你这些最新的自我[涉及]感到震惊。你说起话来,好像我们是在背台词的演员。
此类语料数量极少,只有一条。其中的“涉及”的用法与我们的研究对象性质不同,所以未计入研究范围。
一些语料如“词典”类语料,缺乏语境与上下文,无法用以研究“涉及”和“涉及到”的关涉成分和关涉距离等因素,所以也不在统计范围内。具体语料如:
(2)【广泛】[涉及]的方面广,范围大;普遍:内容~|题材~|~征求群众意见
重复语料指在语料库中检索所得内容相同的语料,此类语料只保留其中一条,将其他数条略去不计。
同一句中出现2个或2个以上“涉及”或“涉及到”的语料,拆作几条处理。
语料中包含“涉及不到”的,算作“涉及到”的否定形式,计入统计,此类语料在CCL语料库中只有两条。如下文所示:
(3)第二,目前看来,你们的产品是为了满足交通远洋船的需要,还[涉及不到]外贸的问题,这个问题以后再说。
经过整理筛选,我们选取“涉及”的有效语料10,526条,“涉及到”的有效语料2,523条作为本章的研究对象,通过对其进行鉴别、分类、分析与研究,厘清“涉及”与“涉及到”之间的复杂关系。