一、汉语中介语语料库是在国内外母语语料库建设和语料库语言学不断发展的影响下,因应对外汉语教学、汉语中介语研究和汉语作为第二语言习得研究的实际需求而产生的。它从无到有,从小到大,从少到多,今天已经发展到一个新的阶段,进入了以“精细而丰富”为基本特征的2.0时代。正如Svartvik三十年前所预言的那样:“计算机将运行更快,体积更小,价格更低;语料库将规模更大,质量更好,利用率更高。”(Svartvik,1992)另一方面,教学与研究实践在功能、易用性、安全性等方面对语料库建设提出了更高的要求和新的挑战。汉语学界和语料库建设者应主动迎接这个新的时代和挑战,树立新的理念,用更高的标准进行设计和施工,增强语料库的功能与使用价值,使语料库更好地为国际中文教育的教学与研究服务。
二、毋庸讳言,汉语中介语语料库建设在蓬勃发展的同时还有很多不足之处,口语语料库建设尤其有其特殊性,存在诸多问题与难题。应通过多种渠道与方式研究并解决相关问题,促进语料库特别是口语语料库建设与发展。例如语料来源与分布,可以通过与国内不同高校的汉语教学单位的合作,与国外不同国家的大学中文系、中文部、孔子学院等汉语教学单位进行国际合作,解决语料的平衡性问题。应尽快研制口语语料的收集标准,规定录音的音量、声道、制式等技术标准;研究并制定口语语料的标注规范,包括标注的目的、原则、内容、方法、工具、代码等,以便于建库相关工作的开展,确保工作质量与效率。对口语语料来说,语音和语体是其显著特点,对其标注规范的研究应给予充分的重视。为了提高语料库建设的效率与水平,应开发基于网络的语料库建设平台,包括语料收集与转写转录系统、语料标注与审查系统、语料库管理系统、语料检索系统等,使语料库建设更加便捷、高效。
口语语料库具有十分重要的作用、意义与价值,与书面语/笔语语料库相辅相成而不能彼此替代。应充分认识口语库建设的重要性、必要性、紧迫性,积极开展口语库建设,更好地为对外汉语教学与相关研究服务。
三、大数据时代的典型特征是数据公开,资源共享,但在汉语中介语语料库建设与应用研究领域始终未做到全面的资源共享。实际上,对外开放的语料库只有北京语言大学的HSK动态作文语料库、中山大学的汉字偏误连续性中介语语料库、暨南大学华文学院的留学生汉语中介语语料库,以及北语牵头国内外众多汉语教学单位参加建设的全球汉语中介语语料库。除此之外的语料库均尚未开放。这是不符合语料库建设的根本宗旨的,也是不符合今天的时代特征与要求的。我们期待并相信,随着时代的发展,观念的进步,会有越来越多的语料库对外公开,实现广泛的资源共享。
四、语料库给汉语作为第二语言的教学与相关研究带来了极大变化,起到了极大的推动作用,把过去那种小规模、经验型、思辨性研究提升到了一个新的水平,即基于大规模真实语料的、定量分析与定性分析相结合的实证性研究,极大地提高了研究结论的客观性、稳定性和普遍性。同时,基于语料库的汉语中介语研究、习得研究面临瓶颈,急需寻求新的突破。根据目前的现实情况,如果对偏误的考察不能摆脱四大偏误类型、五大偏误原因的桎梏,倒不如按照大数据的思路,依据语料库,采用探索研究的方式,通过考察、分析、概括,切实搞清楚汉语中介语的实际情况。然后从学习者的国籍、母语、年龄、学习时间、学习地点、学习方式、学习动机、汉语水平等角度考察与学习者中介语状况相关的因素。搞清这些相关因素对教学无疑是有很大帮助的。至于影响学习者中介语状况形成的真正原因,影响的实际过程,作用大小等,可能有待于新的理论和研究方法的指导与助力。