随着信息时代的不断深入发展,人类对信息有了新的要求,不仅在信息种类和数量上要求越来越多,而且在信息质量上要求越来越高。人类在对衣食住行等基本需求的追求过程中常常伴随着相应的信息需求。在对物质需求逐步满足的基础上,人类对信息的需求往往超过了对其他物质的需求。同样,人类自身的发展越来越依赖于对信息的获取和掌握程度。
信息时代的特点是谁能以最短的时间获取最新的、最有价值的信息,谁就能在激烈的竞争中处于有利地位。而现实情况是,随着信息技术、大数据的不断发展,一方面是日积月累的海量信息,而另一方面是信息获取的困难。
在这种情况下,信息检索理论和技术变得越来越重要了。在大数据时代,信息检索理论与技术面临着新的机遇和挑战。
本书是作者在对信息检索相关理论和应用学习及研究分析的基础上,将一些结果和应用加以汇总、总结和整理而成的。
全书共7章,主要内容如下。
第1章,信息检索及其主要研究内容。该章主要介绍信息检索的基本概念、主要研究内容,并对信息检索的研究现状和发展趋势,以及大数据背景下的信息检索进行分析。
第2章,信息检索的需求表达。该章介绍需求表达的含义,分析需求表达的难点及建立信息需求域的方法。
第3章,信息检索的检索模型。该章主要介绍已有的检索模型、查询扩展及相关反馈的发展情况,讨论需求域基础上的信息检索。
第4章,文档索引的建立。该章介绍倒排索引的基本思路和方法。
第5章,信息检索系统的评价方法。该章介绍几种常用的评价模型,包括正确率、召回率、F值指标和平均正确率均值等。
第6章,伪相关文档反馈需求域模型信息检索。该章讨论并分析伪相关文档反馈机制下的需求域模型信息检索,分析伪相关文档反馈机制下需求域的特点,介绍相关模型,设计实验,对实验结果进行分析,并评价模型的性能。
第7章,用户相关文档反馈需求域模型信息检索。该章介绍并分析用户相关文档反馈机制下的需求域及其检索模型,设计实验,并进行模型训练和实验分析。
需要说明的是,信息检索理论方法极其博深,且在不断丰富发展,本书仅是一些初探。
鉴于作者对该领域的浅薄认识及自身知识的局限性,错误和不当之处在所难免,敬请广大同仁不吝批评、指正。
编著者
2015年10月