购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2 利用语料库考察的基本步骤及方法

本章语料主要来自北京大学中国语言学研究中心现代汉语语料库(简称CCL语料库)。

我们在CCL语料库中,共搜索得到“涉及”和“涉及到”的语料15,199条,共131.9万字,我们对这15,199条语料进行整理筛选。

本章主要研究“涉及”“涉及到”作谓语之情况,凡有“涉及”作修饰语或其他用途的语料,不计入统计范围,如“涉及范围”“涉及面”“涉及面积”等;或者“涉及”与“涉及到”在句中构成“的”字短语,即包含“所涉及的”“所涉及到的”“涉及的”“涉及到的”一类语料,此类短语在句中未作谓语,所以也不计入统计范围。

有一些“涉及”或“涉及到”的语料跟我们的研究对象性质不同,如:

(1)苏:泰阿泰德,我为你这些最新的自我[涉及]感到震惊。你说起话来,好像我们是在背台词的演员。

此类语料数量极少,只有一条。其中的“涉及”的用法与我们的研究对象性质不同,所以未计入研究范围。

一些语料如“词典”类语料,缺乏语境与上下文,无法用以研究“涉及”和“涉及到”的关涉成分和关涉距离等因素,所以也不在统计范围内。具体语料如:

(2)【广泛】[涉及]的方面广,范围大;普遍:内容~|题材~|~征求群众意见

重复语料指在语料库中检索所得内容相同的语料,此类语料只保留其中一条,将其他数条略去不计。

同一句中出现2个或2个以上“涉及”或“涉及到”的语料,拆作几条处理。

语料中包含“涉及不到”的,算作“涉及到”的否定形式,计入统计,此类语料在CCL语料库中只有两条。如下文所示:

(3)第二,目前看来,你们的产品是为了满足交通远洋船的需要,还[涉及不到]外贸的问题,这个问题以后再说。

经过整理筛选,我们选取“涉及”的有效语料10,526条,“涉及到”的有效语料2,523条作为本章的研究对象,通过对其进行鉴别、分类、分析与研究,厘清“涉及”与“涉及到”之间的复杂关系。 7hEpuc/NMR76q5CSfBlE/CUzwpnND9MivtluWfSndVb5ZcsWbd7IogknergSdvs8

点击中间区域
呼出菜单
上一章
目录
下一章
×