The landscape belongs to the man who looks at it.
——Ralph Waldo Emerson
风景属于看风景的人。
——拉尔夫·沃尔多·爱默生
由前面讨论可见,在目前阶段,中外学术界对于中国英语作为“英语本土化产物的语言变体”概念上还未达成一致,这一领域的研究大都停留在“定性”阶段,实证研究也尚未形成体系。本书作者认为,除了加强对中国英语的理论探讨之外,更应该着手这一领域的实证研究,为进一步研究这种新兴的英语变体提供更直观、更科学的材料储备,而语料库语言学正可以为这方面的研究提供有效途径。
我们知道,语料库语言学家主要是通过建设语料库和数据库研究语言变体的。近年来,语料库建设的蓬勃发展已经为英语变体尤其是中国英语变体的研究提供了重要的技术和物质支持。1990年,戈格鲍姆领导设计了国际英语语料库(International Corpus of English,ICE),用来横向比较不同国别和地区中的英语变体,特别关注句法和词汇特征(转引自Bolton,2003)。目前已经有超过23个国家和地区的专家参与。 但该项目只有部分香港英语的资料,并没有涉及中国大陆英语。而中国专家也开始启动中国英语语料库的建设,近几年同样发展迅猛。目前已经建成了中国学习者英语语料库(Chinese Learner English Corpus,CLEC),中国学习者英语口语语料库(College Learners’ Spoken English Corpus,COLSEC),中国学生英语口笔语语料库(Spoken and Written English Corpus of Chinese Learners,SWECCL),中国英语新闻语料库(China English News Articles Corpus,CENAC)等,这些都可以成为国际英语语料库中国分库建设的基础。
上述前三个语料库是中国目前三大学习者语料库。《中国学习者英语语料库》(桂诗春、杨惠中编著,上海外语教育出版社2003年版)是国家社科基金“九五”规划项目重要组成部分,是中国第一部中国学习者英语语料库。该语料库由我国中学生、大学生的一百多万词的书面英语语料组成。编者将库内所有的语料进行语法标注和言语失误标注,工程十分宏大,是世界上第一部正式对外公布的含有言语失误标注的英语学习者语料库。《中国学习者英语口语语料库建设与研究》(杨惠中、卫乃兴编著,上海外语教育出版社2005年版)也是国家社会科学基金资助项目,包含70万容词量和语音、语调、话轮、话语结构等学生的口语信息,包括中国学生的英语发音错误特征、口语中的话语结构特征、词块使用特征和会话策略特征等。《中国学生英语口笔语语料库》(文秋芳、王立非、梁茂成编著,外语教学与研究出版社2005年版)是北京外国语大学中国外语教育研究中心的资助项目,是国内首个大型英语专业学生口笔语语料库。它包含1000余个珍贵的口语语音样本、100万词的语音转写文本、100万词的书面作文样本和语料库简介。所有文字样本均经过词性赋码,可供大、中、小学英语教师和大学生、研究生、社会各界英语爱好者进行英语教学研究和学习使用,也可作为教材编写、教学测试、师资培训、网络课程建设等的重要参考依据。
尽管中国英语语料库建设已取得较大成就,但语料库的规模还很有限,语料也需要与时俱进、不断更新;另一方面,目前基于语料库的中国英语研究也还很有限,而且现有的研究一般是通过数据统计的方法研究了语言学中某个方面的现象,如研究中国英语新闻中主题词、标题的特征,分析词汇与主题表达的关系,以及词汇运用的语言学特点,但仍然不能构成体系,对词汇选取和搭配、类连接及典型句法结构提取等语言问题缺乏深入探讨;而且还缺乏与以英语为母语的国家英语语料库中相关领域的实证性对比分析;此外,目前国内外与英文摘要相关的研究大都还是围绕宏观的写作规范或者是某一专业(医学、林业、体育、工业工程、航空航天等)论文的英文摘要语体或体裁特点分析等方面展开,而把中国作者学术论文的英文摘要当作一种英语变体进行的综合研究还不多见。