购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第四节
搜索方法

在翻译工作中,绝大多数译者都要借助网络搜索引擎,通过搜索浩瀚的互联网找到自己需要的信息。而面对互联网上纷繁复杂、良莠不齐的海量信息,如何快速获取我们想要的信息显得尤为重要。掌握搜索方法和搜索技巧的译员往往能够事半功倍,快速找到自己所需的信息,提高翻译效率。搜索方法可以大致分为基本搜索逻辑、简单搜索方法和高级搜索方法。

一、基本搜索逻辑

简单来说,信息搜索就是找什么、哪里找和怎么找的问题,也可以用“2W1H”来表示,也就是What(找什么)、Where(哪里找)、How(怎么找)。如图1-2所示,“找什么”需要搜索者准确描述自己想要搜索的目标;“哪里找”需要搜索者找到垂直搜索的网站或渠道;“怎么找”需要搜索者掌握高级搜索指令及其他搜索方法。

图1-2 基本搜索逻辑

(一)分析搜索问题

分析要搜索的问题是搜索过程的第一步,也是最关键的一步。搜索诉求是否明确会直接影响最终的搜索结果,搜索引擎是机器,不是人类,我们要明确表达搜索诉求,精简搜索内容,避免口语化搜索。例如,译者在翻译实践中遇到“中间件上云”这个陌生的短语,想知道如何去翻译它。首先,译者需要弄清这个短语的中文释义,并判断其是否为一个专业的术语,如果其不是专业的术语,就要去英文中寻找对等的表达。

(二)明确搜索过程

搜索者的搜索需求和对象往往是多样化的,针对不同的搜索需求和对象,要选择合适的搜索渠道,制定明确且合理的搜索过程。以上面的问题为例,译者想弄清“中间件上云”的中文释义,应该在百度中搜索“中间件上云”(搜索时应包含双引号),得到包含完整短语的搜索结果。要判断其是否为一个专业的术语,译者可以在术语在线 等在线术语库中搜索“中间件上云”。要在英文中寻找对等的表达,应选用相关的英文关键词在Google、Bing等英文网站中进行搜索。

(三)优化搜索结果

搜索引擎往往会为我们呈现纷繁复杂且良莠不齐的搜索结果,因此我们需要学会过滤无用信息,快速定位我们真正准确有用的搜索结果。以上面的问题为例,根据在百度中搜索“中间件上云”得到的结果,得知此短语大致意为“将中间件放上云端”。根据在术语在线等在线术语库中搜索得到的结果,得知其不是一个专业的术语,但可以确定“中间件”是“middleware”“云”是“cloud”。根据在Google中搜索“middleware cloud”得到的结果,得知英文中存在“cloud middleware”的固定表达,且其英文释义与“中间件上云”的中文释义十分接近,因此译者可以选用“cloud middleware”作为“中间件上云”的翻译。

二、简单搜索方法

简单搜索方法通常是指译者最常使用的一些搜索方法,这些方法虽然简单,但是掌握和熟练使用之后,能够在诸多场景下帮助译者快速搜索信息和资源,提高搜索效率。

(一)利用快捷键搜索桌面应用或文件

快捷键,又叫快速键或热键,指通过某些特定的按键、按键顺序或按键组合来完成一个操作。在电脑桌面和常用Microsoft办公软件中都有搜索功能的快捷键组合。善于使用快捷键搜索能够使我们事半功倍。

常用搜索快捷键包括:(1)“Win+S”快捷键快速调出Win10搜索框,在搜索框输入关键词,搜索电脑应用和文件。(2)“Ctrl+F”快捷键在网页搜索结果中搜索关键词,在Word、Excel、PPT文件中查找目标内容。

(二)利用Google验证英文表达是否地道

译者在翻译实践中经常遇到的一个问题就是无法确定英文译文中的某个表达是否正确或地道,这种情况下有时候无法通过查询词典解决,但译者可以在Google和Bing等英文网站中去验证表达的准确性。如译者想知道用“badge pickup”表示“签到处”是否地道,可以在Google中输入“badge pickup”进行搜索,利用“Ctrl+F”快捷键在搜索结果中查找关键词“badge pickup”,如图1-3所示,可以看到其出现的频率较高,在英文中是一个常用的表达。然后以“badge pickup”为关键词,点击Google搜索下方的“图片”搜索,得到许多国外签到处的图片,可以看到很多图片中签到处都是用“badge pickup”来表示,如图1-4所示,因此“badge pickup”可以表示“签到处”。

图1-3 在Google中搜索“badge pickup”得到的结果

图1-4 在Google Images中搜索“badge pickup”得到的结果

(三)利用Linggle判断两种英文表达哪种更地道

译者在翻译实践中对于同一个词组或表达通常会有不同的译法,因此也会为选取哪一种译法更合适和更地道而头疼,此时译者可以利用COCA或Linggle等语料库搜索工具来解决此问题。此处以Linggle为例,如译者想用英文表达“在家办公”,却不知道“work at home”和“work from home”哪个表达更好,这时译者可以在Linggle网站上搜索“work at/from home”,即可得到两种表达在网站内提供的英文结果中的使用次数及频率,如图1-5所示。根据搜索结果得知“work at home”在英文中出现的频率更高,更地道,因此译者选用这个表达。

图1-5 在Linggle中搜索“work at/from home”得到的结果

三、高级搜索方法

《大西洋月刊》的一项调查统计曾显示,有大约90%的人不知道电脑上的组合键“Ctrl+F”具有“查找”的功能,这个方法并不高级,但是此现象足以说明大多数人都没能充分利用网络搜索,更不用说掌握高级搜索方法。译者要想提升自身信息搜索能力,提高翻译工作效率,必须掌握一些高级的搜索方法。常用高级搜索方法包括网络搜索引擎搜索语法、专业数据库中的高级搜索方法等。

(一)常用网络搜索引擎的搜索语法

在翻译工作中,每一位译者都离不开网络,离不开搜索引擎,都必须在浩瀚的互联网找到自己需要的信息。网络资源的高级搜索技巧类型较多,在翻译工作过程中应用时往往需要灵活运用,适当搭配搜索语法,提高自己的信息搜索技能,这样才能在短时间内定位最准确的信息来源。常用网络搜索引擎的搜索语法包括以下几种(搜索注意事项:冒号和双引号均为英文模式下的,搜索时请去掉搜索语法中的“+”),如表1-1所示。

表1-1 常用网络搜索引擎的搜索语法

(二)利用中国知网(CNKI)进行高级搜索

1.案例引入

译者想通过中国知网了解国内人文社科领域中各个学术期刊发表“翻译技术”相关文章的情况,以此来大致判断国内人文社科领域中哪些期刊比较重视翻译技术的发展,了解国内人文社科领域翻译技术研究的大致情况。如何运用中国知网中的“高级检索”来实现呢?

2.技术实操

(1)百度搜索“中国知网”,点击中国知网官网,进入官网首页,点击右侧“高级检索”按钮。点击后,进入知网“高级检索”界面,如图1-6所示。

图1-6 知网“高级检索”界面

(2)点击界面下方的“中文”和“学术期刊”两个选项,学术期刊来源默认为“全部期刊”,如图1-7所示。

图1-7 在知网“高级检索”中点击“中文”、“学术期刊”选项

(3)点击“主题”,并在下拉选项中选择“篇名”选项,如图1-8所示。接下来在输入框中输入“翻译技术”,如图1-9所示。

图1-8 在知网“高级检索”中选择“篇名”选项

图1-9 在知网“高级检索”中输入关键词“翻译技术”

(4)点击“检索”后,得到检索结果。截止至搜索日期,按照发文日期的先后排序,共有216条检索结果,均为篇名中包含关键词“翻译技术”的中文学术期刊,如图1-10所示。

图1-10 在知网“高级检索”中点击“检索”得到检索结果

(5)在检索结果页面中点击左侧学科一栏,勾选下方“中国语言文字”和“外国语言文字”两个选项,然后点击“确定”,如图1-11所示。

图1-11 在知网的学科检索页面勾选目标学科

(6)在检索结果页面中点击左侧学术期刊一栏的可视化图标,如图1-12所示。

图1-12 在知网的学术期刊检索页面点击“可视化”图标

(7)点击后得到篇名中包含“翻译技术”的中文学术期刊可视化图表,如图1-13所示。从图中可知,截至目前,国内人文社科领域中“翻译技术”相关的文章主要发表在《上海翻译》《中国科技翻译》《外语电化教学》《中国翻译》四家中文学术期刊上,这四家期刊较为重视翻译技术发展。

图1-13 知网中与“翻译技术”相关的期刊分布可视化图表

(三)利用八爪鱼采集器进行数据采集

八爪鱼采集器是一款功能强大、操作简单的网页数据采集软件,可以在短时间内从不同的网站或者网页获取大量的规范化数据,帮助用户实现数据自动化采集、编辑以及规范化,摆脱对人工搜索及收集数据的依赖,从而降低获取信息的成本,提高效率。

1.案例引入

译者想批量获取某个招聘网站上与翻译有关的招聘信息,如果去网站上进行文本的复制粘贴将会十分耗时,那如何使用八爪鱼采集器快速对招聘信息数据进行批量抓取呢?此处以深圳智联招聘网站 为例进行实操介绍。

2.技术实操

(1)下载并安装八爪鱼采集器 ,注册完成后,打开软件,其主界面如图1-14所示。

图1-14 八爪鱼采集器主界面

(2)打开八爪鱼采集器,输入要爬取的网站。此处以深圳智联招聘的网站为例,点击开始采集,如图1-15所示。此处由于网站防采集,需要登录才能显示数据,故需在八爪鱼采集器中进行登录。

图1-15 在八爪鱼采集器主界面输入目标网站进行采集

(3)输入关键词并搜索。选中搜索框,在操作提示框中点击“输入文本”,在输入框输入要搜索的关键词,此处输入“翻译”。选中“搜索”按钮,在黄色操作提示框中点击“点击该元素”,出现搜索结果列表页,如图1-16所示。

图1-16 在八爪鱼采集器中输入关键词并搜索

(4)设置滚动以加载出新的职位列表。进入“点击元素”设置页面,点击“高级设置”,勾选“页面滚动”,设置“滚动方式”为“滚动到底部”,滚动“4”次,每隔“2秒”滚动一次(此处的滚动次数和时间间隔并非固定的,请根据采集需求和网页加载情况进行设置),设置后保存,如图1-17所示。

图1-17 在八爪鱼采集器中设置“页面滚动”

(5)接下来通过以下几步建立“循环-点击元素”。首先,进入职位详情页,选中页面上第1个职位链接。然后在黄色操作提示框中点击“选中全部”,以选中全部职位链接。最后点击“循环点击每个元素”,进入第1个职位的详情页,如图1-18所示。

图1-18 在八爪鱼采集器中建立“循环-点击元素”

(6)进入详情页后,手动提取需要采集的字段。此处选中页面中的文本,然后在操作提示框中点击“采集该元素的文本”,如图1-19所示。职位名称、职位薪资、职位描述等文本类型的字段,均可这样提取。

图1-19 在八爪鱼采集器中采集元素文本

(7)采集页面网址。进入“提取数据”设置页面,点击“+”按钮,选择“添加当前网页信息”>“网址”,然后保存,如图1-20所示。

图1-20 在八爪鱼采集器中采集页面网址

(8)创建“循环翻页”,采集多页数据(如果只是采集一页数据,可跳过此步骤)。由于默认的“循环翻页”XPath会在最后一页重复翻页,导致其他关键词无法输入并采集,需修改“循环翻页”XPath。进入“循环翻页”设置页面,修改XPath为://button[text()=“下一页”and not(@disabled)],如图1-21所示。

图1-21 在八爪鱼采集器中创建“循环翻页”

(9)编辑字段。点击流程图里的“提取数据”,让页面返回到职位详情页页面。在“当前数据预览”页面对字段进行操作,包括删除多余字段、修改字段名称、移动字段顺序等,如图1-22所示。

图1-22 在八爪鱼采集器中编辑字段

(10)启动采集。点击“采集”并选择“启动本地采集”选项,如图1-23所示,启动后八爪鱼采集器将开始自动采集数据。

图1-23 在八爪鱼采集器中点击启动本地采集

(11)导出数据。数据采集完成后,点击“导出数据”选项。选择导出数据的方式,支持导出为Excel、CSV、HTML等格式,或直接导入至数据库中。此处选择“Excel(.xlsx)”格式,最终得到的数据结果如图1-24所示。

图1-24 在八爪鱼采集器中导出数据结果

(12)此处的智联招聘职位信息采集案例主要包含以下几步:输入目标网址、输入关键词并搜索、设置页面滚动,建立“循环-点击元素”、采集字段与页面网址、创建“循环翻页”,采集多页数据、编辑字段、启动采集并导出数据。具体的操作步骤和更多采集场景可以参考八爪鱼采集器官网中的教程 YoLizFsZtdQ7FbC3gup0rtc6QwVfP9HjbeHkeGxeqfYwa/N7WJlCnPcZmGf/qudK

点击中间区域
呼出菜单
上一章
目录
下一章
×