购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第一节
搜索概念

一、搜索与知识管理

在当今大数据时代下,各种数据与信息呈爆炸式增长,信息的多样性、新颖性、分散性、无序性等使得人们无法准确快速获取想要的信息。如何快速获取有用信息,将有用信息转化为知识进而提炼为智慧,成为很多人迫切的需求。因此,提升搜索技术和加强知识管理变得尤为重要。DIKW(Data-to-Information-to-Knowledge-to-Wisdom)模型是知识管理领域的经典金字塔理论,是关于数据、信息、知识及智慧的体系。其中数据层是最基本的,通常包括数字、文字、图像、符号等。通过对数据进行加工处理,使庞杂且离散的数据变成有意义的信息。将信息与个人经验与能力结合,用于解决实际问题,信息就转化为了知识。当人们真正掌握了某个知识,并懂得如何去运用,知识就变成了智慧。DIKW模型展现了数据是如何一步步转化为信息、知识乃至智慧的,如图1-1所示。

图1-1 DIKW模型

翻译知识观认为,翻译的本质属性并非语言转换,而是知识迁移。如果从知识管理视角看待翻译过程,翻译是一种知识管理与转化活动。因此,引入知识管理领域的DIKW模型可以帮助我们更好地理解翻译过程中数据、信息、知识与智慧之间的关系。如果用DIKW模型来看待“翻译”的内涵,译者在翻译实践中通过搜索得到的原始素材,如文字、图像、音视频等就是一大堆零散的、待处理的数据。译者的首要任务就是去存储、整理和分析这些数据,使之成为能为译者所用的有用信息。这些信息被用于解决翻译工作中遇到的问题,逐渐转化为译者的知识。当译者懂得如何灵活运用知识去解决对应的问题后,知识也就内化为个人智慧。要想有效进行知识管理,建立起自己的知识体系,搜索是第一步,也是最重要的一步。

二、搜索与搜商

信息搜索是人们日常生活和译者工作流程中必不可少的环节。一般来说,搜索是指依托于特定应用程序,按照一定策略、原则从互联网海量数据中筛选出用户所需信息的过程。在翻译工作中,搜索技术是指利用信息技术和技巧,借助网络等资源,查找和筛选信息的技术。而提到搜索,就必然绕不开一个概念——搜商。

(一)搜商的定义

搜商(Search Quotient,缩写为SQ),即一种通过工具有效获取资源和解决问题的能力——搜索能力,是一种与智商(IQ)、情商(EQ)并列的人类智力因素。在信息爆炸的21世纪,知道知识在哪里,远比知道知识是什么更重要,掌握获取知识的能力远比掌握知识本身更重要。在当今时代,搜商已经成为衡量一个人能力的指标,更有甚者,将搜商定义为“人类的第三种能力”。提高搜商能够帮助人们提高工作效率,帮助人们在浩瀚的互联网中快速找到想要的信息。译者的搜商直接关系译者在翻译中通过搜索获取有效信息的效率,是决定译者在现代翻译行业中是否具有核心竞争力的关键。对于大数据时代的译者而言,其搜商的高低直接影响其翻译能力。

(二)提高搜商的途径

1.建立搜索意识

搜索意识是指人们能够意识到搜索对学习、生活、工作的重要作用,会把搜索作为获取信息的首要渠道。在这个万物互联的时代,只要我们清楚地知道我们想搜索什么,我们总有途径能够搜索到。每当我们遇到问题,要先尝试着自己去搜索答案,而不是第一时间去请教他人,只有切身的实践才能锻炼搜索能力,提高搜商。

2.善用搜索渠道

善用搜索渠道,就是要善用各种搜索资源和搜索工具。搜索渠道绝不止Google和百度这么简单,除了Google、百度等网络搜索引擎,微博、知乎、小红书甚至淘宝等都是现代人的主要信息来源。而译者在翻译实践过程中通常会接触各种专业领域,还需要用到各种各样的搜索资源与搜索工具,如学术数据库、术语库、在线语料库、垂直搜索引擎和桌面搜索工具等。

3.掌握搜索方法

搜索方法是搜商的核心要素,高搜商的学习者往往是通过高效的搜索技能突显出来的。搜商强调所获得的知识与花费时间的比值,搜索强调效率。面对海量的信息资源,要懂得如何筛选出有用的信息为自己所用。而这就需要我们掌握一定的搜索方法,例如常用高级搜索语法、诱导词查询法等。

三、搜索的原理

从输入关键词到搜索引擎给出搜索结果,整个过程只需几毫秒,搜索引擎会根据输入的关键词提供相关的关键词搜索,输入两个差别很小的关键词得到的搜索结果却千差万别。想知道搜索引擎为何如此“神奇”,我们需要明白其工作原理。现代大规模、高质量的搜索引擎的工作原理一般包含以下几个模块:页面抓取与存储、页面分析与收录、页面排序、关键词查询。

(一)页面抓取与存储

搜索引擎会通过蜘蛛爬行程序在互联网上抓取页面并进行存储,为搜索引擎提供数据支持,这是搜索引擎最基础,也是最重要的工作。页面抓取方式主要有广度优先、深度优先、高权重优先等。不同搜索引擎抓取页面的策略与方式不同,其呈现的搜索结果也各不相同。

(二)页面分析与收录

互联网中有些网页具有欺骗性或者是空白内容页面等,这些网页对于搜索引擎和用户来说没有意义。因此在对网页进行抓取后,搜索引擎会对收录到的页面进行分析与筛选,并保留对用户有用的内容。

(三)页面排序

用户向搜索引擎提交关键词查询后,搜索引擎返回与该关键词相关的页面列表到搜索结果页面,这些页面按照搜索结果的质量高低进行排列。在搜索过程中,人们搜索的字词、搜索目标网页的相关性、可用性、来源专业程度等都会影响到页面的最终排名。

(四)关键词查询

完成页面排序后,搜索引擎会建立索引数据库,当接收到来自用户的关键词查询请求后,搜索引擎会对查询的信息进行切词,匹配信息,向用户返回相应的页面列表。

四、搜索的作用

搜索不仅是现代人获取信息和知识的首选方法,在某种意义上也是网络信息时代人们必备的能力,是学习能力的重要表现。在大数据时代,人与人之间的差别除了情商、智商,还有搜商,也就是搜索能力。无论是对于大众,还是翻译从业者而言,搜索都能为人们的生活和工作带来极大便利,甚至创造价值与财富。

对于大众来说,网络信息技术的发展消除了信息壁垒,为人们日常生活、学习和工作带来了巨大的便利。通过搜索打开信息渠道,人们可以快速接触到海量的信息和优质的资源。搜索可以帮助我们快速找到问题的解决方案、学习课程资源以及宝贵的经验知识,可以说人们生活的方方面面都离不开搜索。例如,在日常的生活和学习过程中,我们经常会遇到一些问题,例如“电脑启动后黑屏怎么解决?”“去哪里找免费的PPT模板或者简历模板?”“去哪里找学习Python的课程视频?”等等。当我们掌握一定的搜索技术,提高个人搜商后,这些问题都能够迎刃而解。

在21世纪,翻译技术已经成为新时代译者所必须要学习和掌握的东西,翻译技术能力包括计算机基本应用能力、信息搜索能力和计算机辅助翻译技能,而信息搜索能力是翻译技术能力的重要组成部分,也是翻译能力的应有之意。对于不同翻译从业者而言,搜索在翻译实践、翻译教学、翻译教研甚至整个翻译行业都有着重要作用。对于笔译和口译人员而言,可以通过搜索快速查询翻译背景知识、陌生的人名地名、验证译文表达是否准确地道、某个专业术语如何翻译等,有助于译者改善译文的质量。搜索技术还能辅助翻译教学,大数据时代的教学方式不同于以往的传统教学那样局限于书本上的知识。互联网上的教学资源极其丰富,教师可以引导学生通过搜索去学习丰富的网络资源,扩大知识面,提升自主学习能力。而对于翻译学界的科研人员而言,可以通过搜索获取国内外优质的学术资源和权威数据,把握学界最新发展动态,助力翻译学科发展。 7UEEF0/Ld9ELqgvSisNW40xZW7dXdootmSPqtnkpj2YTE5edkZa02qdQ1eW9HfNz



第二节
搜索资源

提起搜索,很多人首先会想到百度或Google等搜索引擎,但对于职业译者而言,搜索资源绝不仅是通过百度或Google简单搜索得到的网络资源,还包括在线词典、在线语料库、术语库、学术数据库、专业数据库等。译者在翻译实践中,通常会接触各种专业领域,对于专有名词、人名、地名等术语以及专业知识等的搜索,译者需要参考各种各样的搜索资源。根据不同的标准,可以按用途、对象、专业性、资源存放类型等对搜索资源进行分类。

一、按用途分类

(一)一般用途

一般用途主要指人们日常工作、生活中的各种用途,包括通过搜索获取各类资源、获取他人的知识经验,获取问题解决方法等。例如,搜索学习课程资源可以去中国大学MOOC、可汗学院网站、哔哩哔哩等。搜索他人知识经验可以去简书、知乎、微信公众号等。许多找不到的资源都可以在淘宝上搜索代找。还可以在猎手导航、Lacker垂直导航等导航网站上搜索各种类型的垂直领域资源和网址。

(二)专业用途

专业用途主要指翻译实践、翻译教学、翻译研究等与翻译有关的用途。专业用途下的搜索资源主要包括在线词典、术语库、语料库、专业数据库、学术数据库、CAT工具中的语料搜索等。

1.在线词典

Dictionary、Glosbe、Collins、Bing Dictionary(必应词典)、Webster's Dictionary(韦氏词典)、海词词典、有道词典、欧路词典、金山词霸等。

2.术语库

联合国术语库(UNTERM)、TermWiki、加拿大Termium术语库、TAUS数据联盟、中国思想文化术语库、术语在线、中国特色话语对外翻译标准化术语库等。

3.语料库

COCA、BNC、Linggle、WebCorp、Sketch Engine、LIVAC汉语共时语料库、北京语言大学BCC汉语语料库、绍兴文理学院语料库等。

4.专业数据库

PATENTSCOPE专利数据库、欧洲专利局、美国专利局、北大法宝法律数据库等。

5.学术数据库

Web of Science、EBSCO、ResearchGate、ScienceDirect、中国知网(CNKI)、万方数据知识服务平台、维普网、中国国家图书馆等。

6.CAT工具中的语料搜索

SDL Trados Studio的“相关搜索”功能、memoQ中的LiveDocs功能、Déjà Vu中的自动检索功能、ApSIC Xbench中的搜索功能等。

二、按对象分类

根据网络信息资源的定义与分类,按照搜索的对象来分,网络信息资源可以分为文本、图片、音视频等。

1.常用文本搜索资源

ManyBooks、Project Gutenberg、ePUBee电子书库、鸠摩搜书、百度文库以及一般电子图书馆的电子资源等。

2.常用图片搜索资源

Google Images、Unsplash、Stocksnap、Pexels、百度图片、视觉中国、搜图神器等。

3.常用音视频搜索资源

YouTube、哔哩哔哩、优酷、百度视频等。

三、按专业性分类

译者在翻译实践中通常会接触不同的专业领域,如医药、法律、机械、建筑、金融等领域。由于不具备一些领域的专业知识,不熟悉一些专业表达,这时译者往往就要去搜索相关领域的信息资源。

1.常用医药领域搜索资源

Pubmed、丁香园、生物谷、国家药品监督管理局、中国医药网、生物医药大词典等。

2.常用法律领域搜索资源

Westlaw、度小法、秘塔检索、北大法律英文网、中国法律数字图书馆、法律英语翻译网等。

3.常用金融领域搜索资源

CEIC、Tushare大数据社区、金融界、中国经济学教育科研网等。

四、按资源存放类型分类

搜索资源按照资源存放类型可以分为局域网资源和互联网资源。局域网(Local Area Network, LAN)指局部地区的区域网络,是一种私有网络,其具备安装便捷、成本节约、扩展方便等特点,可以实现文件管理、应用软件共享等功能。局域网资源主要指个人电脑资源,包括本地的文件和软硬件资源。而互联网不是一个单一的网络,其泛指多个计算机网络按照一定通信协议相互连接而成的一个大型计算机网络。任何组织和个人都可以使用各种不同的方式,通过各类不同的基础设施连接到这个网络中,接受和提供不同的网络服务。互联网资源则指通过互联网搜索引擎搜索得到的信息和资源,与局域网资源相比内容更加广泛,访问更加便捷。 7UEEF0/Ld9ELqgvSisNW40xZW7dXdootmSPqtnkpj2YTE5edkZa02qdQ1eW9HfNz

点击中间区域
呼出菜单
上一章
目录
下一章
×