《水浒传》四英译本翻译特征多维度对比研究：基于平行语料库的研究范式最新章节_刘克强著

六、基于平行语料库的研究范式

Halliday（1991:24）曾指出：“语料库语言学将数据收集与理论论述有机地结合在一起，使我们对语言的理解发生了质的变化。” Tymoczko（1998:652）曾预言，基于语料库的翻译研究将是翻译研究的重中之重，这个预言其实已经得到证实。本节首先对语料库做一简单描述，然后介绍基于平行语料库的研究范式。

（一）语料库概述

重视语言材料的充分收集、整理及在此基础上进行语言研究自古有之，且成为传统，中外概莫能外。不同的是，在计算机语料库问世之前，人们则完全依赖手工搜集语料并记录在纸或卡片上。以英语语法研究为例，叶斯泊森7大卷《现代英语语法》（1909～1949）中选取自乔叟以后历代文学作品1200种，引录达12万条，并将作者、书名、页码等一一注明，叶氏的辛勤工作为语言变迁等历时研究提供了丰富的语料。在词典编撰方面，国产《词源》主要编撰者吴泽炎先生亲手摘录的卡片达60万张，每张卡片上标明词汇的各种信息。计算机的问世和飞速发展，为机读语料库的产生创造了条件。1964年，第一个计算机语料库布朗语料库在美国布朗大学诞生，规模达100万词次，开创了现代意义语料库的先河。正是由于有了计算机及语料检索分析软件，才使得基于语料库的语言研究摆脱Abercrombie（1965:114～19）所指责的“伪方法”（pseudo-procedure）。（即分析大规模的语料库而没有计算机软件的支持，尽管也许可以获得十分有趣和原则上有用的结果，但在实践层面是不可能的）。随着计算机计算能力的增强及存贮技术和语言处理技术等的发展，语料库的容量也从原来的百万词级扩大为千万词级甚至上亿词级或数百亿词级。

这些语料库的兴建，带动了基于语料库的研究，这种研究方法是意义研究的得力工具，具体来讲，就是从语料库中通过检索软件检索研究对象，往往包括上下文组成的相对固定的结构，亦可借助统计推断的方法，通常可以发现和解释常规方法无法解决的问题。语料库是在随机抽样的基础上收集人们实际使用的、具有代表性的真实语言材料而创建起来的。语料库语言学则是在语料库的基础上对语言进行定性和定量分析与研究的科学，旨在反映人们实际使用中的真实语言，即社会语境中的语言，为语言研究提供了一种全新的思路和方法。它以真实的语言数据为研究对象，对大量的语言事实进行系统分析，通过考察语言的实际应用来发现语言使用的规律，包括频率和典型性之间的关系，实例与规范之间的关系。这些运用实证方法对语言进行描述，进而从功能的角度构建意义理论框架。基于这些独特的特点，语料库语言学蓬勃发展起来，成为语言研究的热点并应用于语言的诸多领域。特别是在词典编撰、语言教学、文体学研究、语言对比及计算语言学等领域。

（二）基于平行语料库的研究范式

虽然语料库在上述学科领域得到广泛的应用并取得了巨大的成就，但翻译研究在过去很长时间没有被纳入语料库语言学的研究范畴，直到20世纪90年代，语料库研究才逐渐被人们所认识和重视。原因可能是多方面的，总结可归纳为以下两点：第一，语言学家过分强调语言的形式因素而忽略了语言发生的社会文化背景；第二，传统语料库语言学家认为翻译语言背离了规范，不同于标准语言，因此翻译文本一直被排除在语料库之外（廖七一，2000:380～384）。随着语料库语言学的不断深入发展和描写译学研究的兴起以及西方现代翻译研究在方法论上的变迁——从经验式研究到语言学取向，从文化转向到语言学的回归——为我们对翻译研究的认识提供了有益的启示。翻译研究历来重视语言、文本的比较，因此在理论上多借鉴语言学，在方法上多采用描写法、比较法。一脉传承下来，便有了现代的语料库翻译研究。在语料库的支持下，“翻译学理论研究的重心，从原文与译文的比较或A语言与B语言的比较，转向文本生成本身与翻译的比较”（Baker 1995:233）。Mona Baker（1996:175）进而提出“基于语料库的翻译研究”（corpus-based translation studies）。此后，Tymoczko（1998:1）将基于语料库的翻译研究称为“语料库翻译研究”（Corpus Translation Studies，简称CTS）。并指出：“语料库翻译研究出现在翻译研究的关键时刻。它萌芽于语料库语言学，因而完全属于翻译研究的语言学方法。同时，它也标志着从规定性到描写性的转向，……整个翻译研究中的各种争论都在语料库翻译研究中得到了反映。”（同上：652～660）。Mona Baker的学生Laviosa（1998:1）提出翻译研究中的语料库途径是翻译研究的一种“新范式”（a new paradigm）。

区别于单语语料库，用于翻译研究的语料库一般要依靠双语语料库，主要是翻译语料库（translational corpus）、平行语料库（parallel corpus）和类比语料库（comparable corpus）。这些语料库为翻译和语言对比研究提供了重要资源。正如Aijmer ＆ Altenberg（1996:12）所述，平行及可比语料库对翻译和语言对比研究特别有用，而且扩展了研究问题的范围：

（1）便于从语言对比中深入了解所对比的语言，而这种了解往往容易在研究单语种语料库时被忽略；

（2）通过一系列比较，揭示语言的共性以及某语种所特有的、语言类型的与文化上的差异；

（3）揭示原文与译文、母语与非母语之间的差异；

（4）用于诸多实际应用，如词典编撰、外语教学和翻译。

Granger（2003:21）以更加细致的划分对跨语言研究中使用的语料库加以描述，下图是她的描绘及界定：（转引自王克非，2004:8）

图3.5 双语语料库类型及关系

从上图可见，研究需要决定语料库的性质，也就是说后者根据研究类型的变化而变化，因而往往依据研究需要来选择或创建相应的语料库：

平行语料库，又称对应语料库，是由原文文本及其平行对应的译语文本构成的双语语料库，其双语对应程度（级别）可分为单词级、短语级、句子级及段落级几个种类。平行语料库根据库内的语言对应方向可分为三类：单向平行语料库、双向平行语料库及多向平行语料库。其中前者是指含一种语言的文本和该文本的译本；双向平行语料库则是既含有由A语言的源文及其译入语B语言的译语文本，又包括B语言的源文本及其译入语A语言的译文文本；后者是指该语料库由同一种语言的原文文本及其被翻译成两种或两种以上语言的译文文本构成的平行语料库。

类比语料库是由不同语言的文本或同一种语言不同变体的文本所构成的两个或两个以上的语料库。类比语料库也可再细分出单语类比库和双语/多语类比库。前者收集一种语言类似环境下的类似内容的文本，如Loviosa构建的ECC（English Comparable Corpus，TEC的姊妹项目）属于此种。而后者收集的是在内容、语域、交际环境等方面相近的不同语言文本。

翻译语料库是指彼此具有翻译关系的不同语言文本构成的语料库。翻译语料库中的双语语料不一定具有对应关系，它可能只是篇章上的对应收录，这是其与平行语料库的区别之处。

肖忠华、戴光荣（2011:8～15）区别并比较了上述三种语料库并认为，不同类型的语料库可以用来进行不同目的的研究。比如，在探讨一种语言是如何翻译成另一种语言的过程中，平行语料库是非常有帮助意义的，它可以为研究翻译过程提供间接证据；类比语料库对于译者提高对翻译领域的理解以及涉及到译语的流畅、正确选词及习语表达等翻译质量方面，也是非常有用的；翻译语料库可为以产品为导向的翻译研究以及翻译共性研究提供主要的证据。如果对相关的社会语言学及文化参数进行标注，这类翻译语料库还可以用来研究翻译的社会文化环境。源语和目的语的单语种语料库在翻译研究中也非常有价值，它们可以提高译者的语言与文化敏感度，为译者提供一种高效的参考工具。

肖忠华（2003:1）还专门探讨了平行语料库与类比语料库的区别，指出平行语料库与类比语料库主要用于翻译与语言对比研究，但这两种语料库有其自身的特点，使用目的也不相同。平行语料库可用于探索“同一内容是如何用两种语言表达的”（Aijmer ＆ Altenberg 1996:13）。但如果对比研究中只用平行语料库，结果就不可靠，因为译文不可避免地带有原文的烙印，即“翻译腔”（见Hartmann，1985；Baker，1993:243～5；Teubert，1996:247；Gellerstam，1996；Laviosa，1997:315；McEnery ＆ Wilson，2001:71～2；McEnery ＆ Xiao，2002）。而类比语料库由于其子库抽取的是不同语言的母语文本，就避免了翻译腔。然而，正因为如此，类比语料库也就不具备平行语料库在翻译研究方面的优势。

在厘清以上概念后，继续考察目前国内外利用语料库研究翻译的方法，目前研究的方法有三种：第一，以Mona Baker为代表的大多采用比较对应译入语母语与译文的方法，即应用翻译语料库与类比语料库进行比较的方法；第二，利用双语平行语料库的方法，即研究原文与译文之间对应的方法；第三，McEnery＆ Xiao（2002）提出的将前两者结合的研究范式，即把类比语料库与平行语料库研究结合在一起，从不同角度对译文进行考察，从而系统地进行语言对比和翻译研究，探索译文的多维度特征。本文基本采用的就是第三种方法和范式，不同的是本研究中的平行语料库是一本四译平行语料库，而类比语料库也不是单一的，而是多个的。综合运用一本四译平行语料库及多个类比语料库，本研究尝试探索不同译文的翻译特征，其中分析研究的框架关系见下图：

图3.6 分析框架

上图清楚地表明：本文采用的是将平行语料库与类比语料库综合利用的方法。其中的平行语料库包括原文与赛译、原文与杰译、原文与沙译及原文与登译的四个一对一汉英平行语料库；另外，为了便于四个译文与原文的比较及四个译文间的比较，笔者遵照“求同存异”的原则建立的一对四汉英平行语料库；类比语料库包括TEC-FIC，BNC-FIC，The trilogy of the good earth（大地三部曲），其中TEC-FIC，BNC-FIC即翻译英语语料库的文学部分及英国国家语料库的文学部分与四个译文都做比较，目的是发现翻译语料的特征。此外，由于赛珍珠既是译者又是作家，考虑到这个情况，赛译特征的研究增加了与其中国题材的原创小说《大地三部曲》的对比，旨在进一步探索赛氏的作品特征。此外，FLOB语料库是一个平衡的英文原创语料库，本文将之作为参照语料库（reference corpus），和四个译文进行比较，主要挖掘译文的主题词、主题语域特征。