检索技术是指在利用检索系统检索相关文献信息时采用的相关技术手段,主要包括布尔逻辑检索、截词检索、位置检索、字段限制检索和其他检索技术等。
布尔逻辑检索是利用布尔逻辑运算符进行检索词的逻辑组配而完成的一种检索技术。规定检索词之间的逻辑关系的运算符称为布尔逻辑运算符,常用的布尔逻辑运算符有逻辑“或(OR)”、逻辑“与(AND)”和逻辑“非(NOT)”。多数检索系统支持布尔逻辑检索,可进行三种布尔逻辑运算符中的一种、两种或三种逻辑运算。
在检索系统中,逻辑“与”运算符可用“AND”“﹡”或“并且”表示,其含义是指检索结果中必须同时含有逻辑“与”运算符连接的检索词。例如,“A AND B”或“A﹡B”,该检索式的含义是指检索结果中必须同时包含检索词A和B。逻辑“与”运算能够缩小检索范围,提高检索结果的查准率,但查全率会相对降低。
在检索系统中,逻辑“或”运算符可用“OR”“+”或“或者”表示,其含义是指检索结果中含有逻辑“或”运算符连接的任何一个检索词或者所有检索词。例如,“A OR B”或“A+B”,该检索式的含义是指检索结果中包含检索词A或检索词B或同时含有检索词A和B。逻辑“或”运算能够扩大检索范围,提高检索结果的查全率,但查准率会相对降低。
在检索系统中,逻辑“非”运算符可用“NOT”“-”或“不包含”表示,其含义是指排除检索结果中逻辑“非”运算符后面的检索词,只能含有逻辑“非”运算符前的检索词。例如,“A NOT B”或“A-B”,该检索式的含义是指检索结果中包含检索词A,而不包含检索词B。逻辑“非”运算能够缩小检索范围,提高检索结果的查准率,但并不一定能够提高文献信息的准确性,甚至可能降低查准率,一般来说只是起到减少检索结果数量的作用,因此进行课题研究时要慎重使用逻辑非运算符。
在实际检索过程中,使用以上布尔逻辑运算符构造一个检索式进行检索时,其运算优先级顺序视不同的检索系统而不同。对于一个复杂的逻辑运算检索式,检索系统的处理顺序是由左向右进行;在有括号的情况下,先进行括号内的运算;在有多层括号的情况下,先进行最内层括号中的运算,再逐层向外完成运算。
截词检索是指在检索词中的不同位置加上不同符号进行截断,检索出包含该检索词在内的其他词的检索技术。截词检索是应用较为普遍的一种扩检技术,尤其在西文检索中应用最为广泛。根据西文构词特点,如名词单复数形式的不一致,英美拼法对于同一含义的词拼法的不一致,以及词干加前缀和后缀的派生词等,在实际检索过程中,仅选择检索词的某一种或几种形式,均有可能造成漏检,且漏检的结果有可能与研究密切相关。因此,采用截词检索能够避免漏检情况的发生,同时可以做到扩大检索范围、提高查全率、减少检索词的输入量、节省检索时间等。截词检索运算符可用“+”“﹡”“?”等表示,截词检索技术按照截词位置,主要有四种方式:(1)采用检索词右截断,保持检索词前方一致:将检索词词尾部分截掉,比较检索词前方一致的部分,可省去输入检索词各种词尾有变化的麻烦。(2)采用检索词左截断,保持检索词后方一致:将检索词词头部分截掉,比较检索词后方一致的部分,可省去输入检索词各种词头有变化的麻烦。(3)采用检索词左右同时截断,保持中间一致:将检索词词头和词尾同时截断,可用于较复杂和较广泛的课题资料的获取和研究。(4)采用检索词中间截断、保持前后一致:有些检索词中间有若干变化形式,可用于检索词的不同拼写法、单复数拼写不同等。在不同的检索工具中截词运算符代表的字母个数具有不同含义,视具体检索系统的要求来正确使用。
位置检索是指使用位置运算符规定检索词之间的关系或距离,对检索词之间的相对位置进行限定,能够使得检索结果更加接近和准确表达检索要求的一种检索技术。位置运算符是调整检索策略的重要手段,根据检索词之间出现的距离和顺序,可使用多种位置运算符对检索词进行调整,以达到精确检索的目的,从而提高查准率。在不同的检索系统中,使用的位置运算符也不同,主要分为以下几种。
1.With运算符
用(W)或()表示其两边连接的检索词保持原有排列顺序,顺序不允许颠倒,且要求两个检索词之间不能出现其他词或字母,但允许出现空格和标点符号。
2.n Words运算符
用(nW)表示其两边连接的检索词保持原有排列顺序,顺序不允许颠倒,且要求两个检索词之间最多可插入n个实词或虚词。
3.Near运算符
用(N)表示其两边连接的检索词顺序可以颠倒,两个词必须保证相邻。
4.n Near运算符
用(nN)表示其两边连接的检索词顺序可以颠倒,检索词之间最多可插入n个词。
5.Field运算符
用(F)表示其两边连接的检索词顺序和位置不限,但检索词必须出现在检索结果中的同一字段内,如篇名、文摘、叙词、自由词等字段。
6.Subfield运算符
用(S)表示其两边连接的检索词顺序和位置不限,但检索词必须出现在检索结果的同一子字段内,如出现在篇名、文摘等字段的一个句子中。
字段限制检索是指采用特定的字段,如篇名、文摘、著者、叙词、自由词等在检索系统中进行查找的一种检索技术。常用的检索字段包括:篇(题)名字段(title,TI)、文摘字段(abstract,AB)、著者字段(author,AU)、著者机构字段(corporate source,CS)、刊名字段(journal,JN)、叙词字段(descriptor,DE)、自由词字段(identified,ID)、出版年字段(publication,PY)、语种字段(language,LA)、文献类型字段(document type,DT)、分类号字段(classification,CC)等。其中,篇(题)名字段、文摘字段、叙词字段和自由词字段属于基本检索字段,著者字段、著者机构字段、语种字段和文献类型字段属于辅助检索字段。使用字段限制检索时,被检索词仅在特定的限定字段中被检索,对检索结果数量和相关程度产生极大影响,一定情况下能够提高检索结果的查全率或查准率。
不同的检索系统规定使用的检索技术有所不同,而且同一检索运算符的具体表现形式也因检索系统的不同而有所不同,在具体的操作中,只能视具体检索工具的要求来使用。除以上几种基本的检索技术外,还有加权检索、超文本检索、知识发现检索等多种检索技术。