购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第二节
在线检索的方法

在线检索是指利用计算机设备和网络检索网上的各类信息。在线检索并不是简单的上网搜索这么简单,而是与其他类型的检索一道,是系统性检索的一个环节。系统性检索至少包含几个环节:首先,要能够触发检索需求,这需要译者保持高度敏感。比如在K-12 and tertiary sectors中,如果译者想当然地认为tertiary sectors指的是第三产业,就不会想着去检索,也就极有可能犯下重大翻译错误。查一下就会发现,tertiary还指Tertiary education fol lows secondary education,指的是“中学后教育”或“高等教育”,这跟“第三产业”完全不同。当然,此处所说的“检索”,并非只有在线检索一条路,在线检索只是其中一个方法。因此,接下来就要判断采用哪种检索方法,虽然在线检索是比较常用的,但也不能忽略(线下)词典、纸质参考资料、TM、TB等其他检索方式,即便是在线检索,也有网页搜索、图片搜索、视频搜索、学术搜索、客户官网搜索,甚至是地图的街景搜索。要根据具体情况综合判断,选出最优方案。第三,在确定好检索方法(比如使用在线检索)后,还要具有甄别和判断能力,哪些信息是可信的,哪些信息是不足为证的,需要译者自己明辨是非,做出取舍。第四,译者根据自己查证的信息做出一个最终呈现(体现在最终的译文中)。最后,译者还需要在实践中验证自己的方法是否有效,不断总结、修正,提高自己的检索能力。下面介绍一些搜索方式。

一、布尔逻辑搜索

严格意义上的布尔检索法指利用布尔逻辑运算符连接各检索词,然后由计算机进行相应逻辑运算,以找出所需信息的方法。它是使用面最广、使用频率最高的逻辑。布尔逻辑运算符的作用是把检索词连接起来,构成一个逻辑检索式。目前,利用布尔逻辑运算符进行检索词或代码的逻辑组配是现代信息检索系统的最常用技术。常用布尔逻辑运算符有三种,即“与”“或”“非”(王华树,2018:43)。

(一)逻辑“与”

表示同时检索含有“A”和“B”两个词的信息,可以使用“AND”和“*”进行搜索。

例1 急性胆囊炎患者行胆囊切除术(时箫,2020)

在该例中,初译的部分都已经确定下来,但对于“行”这个核心谓语(意为“进行”),我们可能一时难以想到合适的对应词。这时,可以用“*”代替它。在谷歌学术中加引号键入“patients*cholecystectomy”,可以得到如图2-1结果:

图2-1 “patients*cholecystectomy”搜索结果

通过查询资料发现,在医学领域中,undergo后面多接手术(有创性的治疗方法),也常用以表示接受检查。所以,例1完整的翻译就应是“Patients underwent cholecystecto my for acute cholecystitis”。严谨起见,我们再在谷歌学术中验证这一译文是否准确,在搜索框中加引号输入该译文,得到1500条结果,前两条结果为专业论文,且引用次数颇多,因此可以确定这一翻译的准确性。

(二)逻辑“或”

表示检索出含有“A”或“B”词的信息,可以使用“OR”或“+”进行搜索。

例2 搜索“bolt together”(李义用例)

搜索结果的页面中必须有bolt together,可以有“螺接”,也可以有“栓接”,也可以两者都有,使用“OR”或“+”,表示“或”。搜索方法如表2-1:

表2-1 同时搜索“螺接”和“栓接”

(三)逻辑“非”

表示检索出包含“A”,但不包含“B”的搜索内容。

例3 搜索“indicating valve”(李义用例)

搜索结果中也全部含有完整的indicating valve,但同时也出现很多post indicating valve,排除搜索,即在搜索框中输入半角减号“-”,输入要排除的内容,须注意减号“-”要使用半角格式,且不得与后面的文字之间存在空格。搜索方法如表2-2:

表2-2 排除搜索“indicating valve”

逻辑运算符在中文数据库中多用符号“*”“+”“-”,在英文数据库中使用单词“and”“or”“not”。逻辑运算顺序是:括号优先;无括号时,各系统规定不同,检索时请参考数据库的帮助或说明。

二、诱导词搜索

当对某术语的译名无法做出初步猜测时,可加入诱导词,如例4中的separator,因为已知这是轴承的一个基本元件,可以“separator轴承构造”为关键词进行搜索,这里“轴承构造”是诱导词,可以导出英汉双语的轴承元件信息,见图2-2。

图2-2 “separator轴承构造”在百度中的搜索结果

例4 In low-priced bearings the separator is sometimes omitted,but it has the important function of separating the elements so that rubbing contact will not occur.

通过百度搜索结果我们可以发现“保持架”一词可能是separator的中文名称。然后可以通过图片比较的方法,如以bearing components为关键词进行图片搜索如图2-3:

图2-3 “bearingcomponents”的必应图片搜索结果

我们可再以“轴承组成”为关键词进行百度图片搜索,得到中文的轴承部件图如图2-4:

图2-4 “轴承组成”的百度图片搜索结果

经过比对,我们可以确认,separator的中文名称为“保持架”,是轴承的四个基本构件之一。

三、语料库搜索

“翻译的不断发展推动了语料库的产生和发展,广义上看,有道、海词、灵格斯、金山词霸等常用词典都属于小型双语平行语料库;而百度、谷歌等搜索引擎则是超大语料库。”(王华树,2015:65)与此同时,各种专业语料库也以其针对性强、相关案例丰富大大提高了对科技翻译的辅助效率。如下例:

例5 翻译“粮食种植面积”

分析 为寻找专业的译法,可以分步查询语料库:首先,输入关键词“粮食种植面积”搜索,并在检索出的网页左侧点击“翻译所有英文网站”,发现有PDF文章题目用了acreage一词,且 Agricultural Economic Report 第 157 期有篇文章“An Econometric Analysis of U.S.Wheat Acreage Response”,文中“小麦种植面积”使用了115次acre age。其次,利用COCA语料库进行查证,输入acreage,发现1000多项例子,其中tobacco acreage和agricultural acreage较多,如图2-5所示。因此“粮食种植面积”可简洁地译为acreage(王华树,2018:71)。

图2-5 COCA语料库显示“acreage”的搜索结果

四、截词检索

截词检索是一种常用的检索技术,是防止漏检的有效工具。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著,但一定要合理使用,否则会造成误检。

不同的系统所用的截词符也不同,常用的有“?”“$”和“*”等。一般用“*”表示无限截断,用“?”表示有限截断,但现在百度不再支持该技术,而谷歌则不支持“?”号,并且认为“*”号代表的必须是一个完整的词。截词根据不同的标准也有不同的分法:根据截词位置的不同,可分为后截断、中截断和前截断;根据截词数目的不同,可分为有限截词和无限截词两种。在截词检索技术中,较常用的是后截词和中截词两种方法,现分述如下:

后截词:是指检索结果中单词的前面几个字符要与关键字中截词符前面的字符相一致的检索,具体包括:(1)有限后截词:此类主要用于词的单、复数,动词的词尾变化等。例如“book?”可检索出包含有book或books词的记录;“acid??”可检索出含有acid、acidic和acids的记录。此时截词符“?”代表一个或零个字符。(2)无限后截词:此类主要用于同根词。例如“educat*”可以检索出education、educational和educator这样的词,此时,词根后的截词符“*”,表示无限截词符号。

中截词:一般地,中间截词仅允许有限截词,主要用于英、美拼写不同的词和单复数拼写不同的词。例如“s? w”可检索出含有sew和saw的记录。此时,截词符号“?”代替了那个不同拼写的字符。

任何一种截词检索,都隐含着布尔逻辑检索的“或”运算。采用截词检索时,既要灵活又要谨慎,截词部位要适当,如果截得太短,将影响查准率。(王华树,2018:46)

五、搜索符搜索

为了精确搜索内容,我们需要学习一些搜索语法,表2-3是一些简单的搜索运算符。

表2-3 运算符实例

例6 利用搜索符搜索松下KV-S5055C高速彩色扫描仪使用手册的平行文本

图2-6 松下KV-S5055C高速彩色扫描仪使用手册的平行文本搜索结果

使用filetype搜索的方法,在搜索框输入“使用手册+空格+service manual+空格+filetype:PDF”,搜索出共68500条关于使用手册的结果,如图2-6。从中找到的几篇相关性高的电子产品说明书作为本次翻译实践的平行文本,借鉴专业词汇、术语以及句段等方面的表达方式,大大提高了翻译效率和质量。

例7 利用运算符搜索中文教育科研网站(edu.cn)上所有包含“村上春树”的页面。

键入“村上春树site:edu.cn”,注意域名前不要加“http://”。另外,“site:”和站点名之间不要带空格,因为空格可让一个词变成一个词组。分词不一样,搜索结果页也会不一样。使用“site:”语法时注意限制网站类型,如学术资料在edu和org域名后缀中会更精练,政府相关内容在gov域名后缀中也许更容易找,但要注意用了edu、org、net和gov等域名后缀并不会搜索所有含这个后缀的网站;“site:”还能搜索某种语言或某个关键词在指定国家的网站,如查英国英语就输入“site:uk”,查美国英语就输入“site:us”,查加拿大英语,就输入“site:ca”(王华树,2018:52)。

六、其他搜索方法

除了上述搜索方法外,如果在翻译中需要搜索相应的公司以及地址信息,可通过官方注册查询系统(如国家企业信用信息公示系统、香港公司注册处网上查册中心等)或天眼查、企查查、启信宝等第三方企业信息查询网站查询。有的可通过图片查询,有的情况甚至可通过地图街景直接查看公司门口的信息。除此之外,当查找网页总是跳转时,可以查询缓存网页。在搜索结果页面中,找到网址右方的倒三角,点击后会出现Cached,然后点击它,就会跳出相应的页面。百度中这一功能叫作“百度快照”,直接点击即可跳出。 5FzXGDImocRCsmJ3Q1EoJ6Jj6EZiiGSAMF1/rImHTUqW2cjji72VkD470dRSOIor

点击中间区域
呼出菜单
上一章
目录
下一章
×