“语料库语言学已经成为语言研究的主流。基于语料库的研究不再是计算机专家的独有领域,它正在对语言研究的许多领域产生愈来愈大的影响。”这是1996年Jenny Thomas等人在 Using Corpora for Language Research : Studies in Honour of Geoffrey Leech 一书中的开场白。(黄昌宁,2002:1)
Granger(2003:17-29)也曾指出,语料库方法尤其适用于对比语言研究和翻译研究。现在,随着语料库尤其是多语语料库的创建和应用,对比研究、翻译研究、翻译技术研发之间的关系日益密切。它们的共同之处在于都是处理两种或两种以上的语言。无论在理论层面或应用层面,它们都指向两种或多种语言之间的异同问题,甚至可以说,都是专门处理语言异同问题的学科,主要表现为三者都使用相似或相同的双语或多语语料库从事研究或开发,语料创建和使用时也遇到和处理大致相似的问题。
比如,大多数语料库翻译研究与对比研究关系密切,集中研究译文与原文的词法和句法的特征差异,如译文所体现出的明晰化、简略化、标准化等普遍性特点。有代表性的研究(参见陈伟,2007:67-73)涉及了类比构词现象、名词化现象、词语多样性、词频分析、类型/标记比、平均句长和叙事结构特点、搭配规律和语义韵、男女译者的风格差异、语义场和文化信息差异等。这些统计数据不仅能帮助定量分析,也给定性研究者分析社会、文化、意识形态等背后的因素时,带来诸多惊喜。
在翻译技术的研发方面,基于语料库的翻译系统具有明显优势,它结合最新的人工智能技术,可以实现翻译质量、数量和速度的大幅度提高。但是,由于尚有理论问题和技术难题未能解决,也缺乏综合性人才,比较理想的基于语料库的成熟翻译系统在短期之内恐难以实现(李亮,2004:59-62)。
近年来,三者在对语料库使用和借鉴时所体现出来的共性尤为突出,这些语料库的类型有双语、多语、平行或类比(可比)。一方面,在机器翻译中,平行语料库所搜集的数据能为翻译模式提供训练材料,也能为计算语言学的相关问题提供数据,如多语语法推理、自动词典生成等。另一方面,翻译研究的学者利用语料来对翻译过程进行实证研究,包括翻译策略或翻译文本的特定属性。对职业译者而言,多语语料库给译者提供参考性资料,帮助译者快速找到所需信息。而语料库在对比研究中,可以为研究设想及发现提供实证数据,同时还能发现之前未被关注的跨语言差异。
由此可见,它们有着共同的基础和性质,有互补作用,最终目的都是为了跨文化和跨语言的交际,如果能将三者结合得更为紧密,互动性更强,将有可能帮助翻译技术研发突破目前的瓶颈,即语义理解和确定翻译对等单位等方面的问题,促进技术工具的进一步改善。
但不容置疑,对比研究、翻译研究和翻译技术研发又有各自独特之处,尤其在使用语料库作为研究方法方面,三个领域之间的交流还是较少。例如,对比研究和翻译技术研发都使用平行语料库,但翻译方向、翻译属性、翻译策略这些因素都没有加以考虑。尤其是翻译关键技术的研发,基本不考虑文本类型或者语域因素(巢文涵,2008)。另一方面,对比语言研究和翻译研究中,通常只使用多语语料库最基本的标注加工和查询功能,不太重视这些功能对翻译技术研发的潜在价值。因此,三者之间又有一定程度的疏离。