按照不同的标准,可以将信息检索划分为不同的类型。
按照信息的存储和检索手段来划分,可以分为手工检索、机械化检索与计算机检索三种。
按照检索对象来划分,可以分为书目检索、数据检索和事实检索三种。
书目检索以提供和确定文献来源信息为主要内容,即以二次文献为检索对象,用户通过检索获得的是与检索课题相关的一系列文献线索,然后再通过阅读决定取舍,在书目数据库中一般不提供原始文献。书目检索是目前发展较充分的一种检索,可以将其划分为目录检索与文献检索两种。
目录(catalog)对文献的描述比较简单,是以一本或一种出版物(如一本图书、一种期刊等)为其著录对象,并按照一定的次序编排而成的一种揭示与报道文献的工具。目录不揭示出版物的内容,只着眼于报道实有的文献或收藏文献的情况,可分为图书目录、报刊目录、馆藏目录等,其中最为常见的是馆藏目录或馆藏联合目录。在网络上运行的联机公共检索目录(Online Public Access Catalog,OPAC)可提供联机目录查询。Internet把许许多多的图书信息中心连接起来,提供地区性乃至全球性的目录检索服务。例如,世界最大的图书馆自动化网络(Online Computer Library Center,OCLC)向全球用户提供几万家图书馆的馆藏信息。
文献检索(document retrieval)系统提供对参考文献的检索,检索结果往往是一些可提供研究课题使用的参考文献的线索,即来源信息(source),但不是文献本身(原文),所以说它是一种间接的相关性检索。因此,这就涉及获取全文的问题。原始文献包括全文的原件及其复印件,通常由馆藏单位提供。用户可以通过Internet查阅各信息单位的馆藏情况,并通过馆际互借、联机借阅、联机订购及电子传送等系列服务达到资源共享。从性质上来说,文献检索是相关性检索。
数据检索(data retrieval)是指将经过选择、整理和评价/鉴定的数据存入某种载体中,并根据用户需要从某种数据集合中检索出能回答问题的准确数据过程或技术。按查询问题的要求,分为简单检索(即单一因素的检索)和综合检索(即综合条件检索)。数据文件组织方式不同,数据检索的技术方法也不同。
事实检索(fact retrieval)是情报检索的一种类型。广义的事实检索既包括数值数据的检索、算术运算、比较和数学推导,也包括非数值数据(如事实、概念、思想、知识等)的检索、比较、演绎和逻辑推理。它要求检索系统不仅能够从数据(事实)集合中查出原来存入的数据或事实,还能够从已有的基本数据或事实中推导、演绎出新的数据或事实。例如,该系统中存储有如下事实:①李明是A校的学生。②A校的学生都学外语。如果该系统是一个事实检索系统,则它应当能回答某用户提出的“李明学外语吗”这种问题。事实检索是情报检索中最复杂的一种,它要求系统中的数据和事实以自然语言或接近于自然语言的方式存储;不仅要存入各种数据或事实单元,还要存入各单元之间的语义关系、句法关系以及各种有关的背景知识;允许用户用自然语言提问,并能用自然语言作答;更重要的是,系统必须具有一定的逻辑推理能力和自然语言理解功能。
事实检索是一个相当复杂的过程。目前还是依靠人工来完成。具体做法是:首先利用检索工具、参考工具书、数据库或其他途径查出有关的原始数据、事实或文献,然后进行分析比较,去粗取精,去伪存真,最后把得到的“事实”提供给用户。数据检索和事实检索都是确定性检索。
全文(full-text)检索是指计算机程序通过扫描文章中的每一个词,对于每一个词都建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。
按照信息检索的途径来划分,可以将信息检索划分为直接检索和间接检索两种。
直接检索是指以论文作者在文章最后所附的参考文献为基础,进行逐一追踪查找的方法。该方法获得文献针对性强,数量较多,在没有检索系统或检索工作不齐备的情况下,利用此方法能够获得一些所需要的文献资料。不足之处是所获得的文献不够全面,而且往前追溯年代越远,所查获的文献越陈旧。
间接检索是指利用检索系统查找文献,这是一种常规的科学检索方式。根据不同的课题要求,不同的设备条件,可以选择最适当的方案来实施检索,其内容包含检索课题的分析、检索策略的确定、检索技术的应用等方面。