购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.4.3 计算机信息检索技术

1.布尔逻辑(Boolean logical)运算

布尔逻辑检索就是采用布尔代数中的逻辑与、逻辑或、逻辑非等逻辑运算符,将情报提问转换成逻辑表达式。

① 逻辑“与”(AND或*):用来表示其所连接的两个检索项的交叉部分,即交集部分。它可以缩小检索范围,有利于提高查准率。“A AND B”表示让系统检索同时包含检索词A和检索词B的信息集合。

② 逻辑“或”(OR或+):一种用于并列概念的关系组配。它可以扩大检索范围,有利于提高查全率。“A OR B”表示让系统查找含有检索词A、B之一,或同时包括检索词A和检索词B的信息。

③ 逻辑“非”(NOT或¯):一种用于排除某种概念的关系组配。它同样可以缩小检索范围。“A NOT B”表示检索含有检索词A而不含检索词B的信息,即将包含检索词B的信息集合排除掉。

在不同的检索系统中,布尔逻辑的运算顺序是不同的,因此会导致检索结果的不同。通常的运算顺序是NOT、AND、OR,但是可以根据需要,用括号来规定或改变执行顺序。一般,在检索系统的帮助文件中都会有这类说明。

2.位置(position)运算

文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样。布尔逻辑运算符有时难以表达某些检索课题确切的提问要求。字段限制检索虽能使检索结果在一定程度上进一步满足提问要求,但无法对检索词之间的相对位置进行限制。位置运算符又称邻接运算符(adjacent operator),是用一些特定的运算符(位置运算符)来表达检索词与检索词之间的临近关系,并且可以不依赖主题词表而直接使用自由词进行检索的技术方法。位置运算符是调整检索策略的一种重要手段。

按照两个检索出现的顺序和距离,可以有多种位置运算符。而且对同一位置运算符,检索系统不同,规定的位置运算符也不同。以美国Dialog检索系统使用的位置运算符为例,介绍如下。

①(W)运算符:W的含义为with,表示运算符两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序不可以颠倒。(W)运算符还可以使用其简略形式“()”。例如,检索式为communication(W)satellite时,系统只检索含有communication satellite词组的记录。

②(nW)运算符:nW的含义为nWord,表示运算符两侧的检索词必须按此前后邻接的顺序排列,顺序不可颠倒,而且检索词之间不允许有其他的词或字母,但允许有空格或连字符。例如,laster(1W)print可检索出包含laser printer、laser color printer和laser and printer的记录。

③(N)运算符:N的含义为near,表示运算符两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。

④(nN)运算符:(nN)表示允许两词间插入最多n个其他词,包括实词和系统禁用词。

⑤(F)运算符:F的含义为field,表示运算符两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,词序不限,中间可以插任意检索词项。

⑥(S)运算符:S是Sub-field/sentence的缩写,表示运算符两侧的检索词只要出现在记录的同一个子字段内(例如,在文摘中的一个句子就是一个子字段),此信息即被命中。要求被连接的检索词必须同时出现在记录的同一句子(同一子字段)中,不限制它们在此子字段中的相对次序,中间插入词的数量也不限。例如,high(W)strength(S)steel表示只要在同一句子中检索出含有high strength和steel形式的均为命中记录。

3.截词(truncation)运算

截词就是利用检索词(关键词、主题词)的词干或不完整词形进行查找,它可以起到扩大检索范围、提高查全率、减少检索词(关键词、主题词)的输入量、节省检索时间的作用。尤其在英文检索系统中检索时,若遇到名词的单复数形式,词的不同拼写法,词的后缀变化,均可采用此方法。截词运算的方式有多种,可以分为有限截词、无限截词和中间截词。

其他的检索技术还有限制检索、大小写敏感检索及禁用词表检索等技术,在后面具体的数据库中再详细说明。 DoTKHWJycNX5BWWPXer8Pk3Hz95dFZ1YusFY32bagZKLBoGm3dpKrdDWqvt6r9KO

点击中间区域
呼出菜单
上一章
目录
下一章
×