必须注意的是,随着大数据时代的到来,信息检索面临着新的挑战和机遇见参考文献[16]~[23]。大数据下的信息检索不仅只是从数据集中找到与用户需求相关的信息资料,更重要的是要找到经过分析和加工整理后的信息。例如,一位初学信息检索的用户想查找信息检索的概念的相关资料,基于不同的检索环境将出现不同的检索结果,如下所示。
百度检索:
查询请求:信息检索的概念。检索结果:13800000个。
查询请求: 什么是信息检索。检索结果:58900000个。
Google检索:
查询请求: concept of Information Retrieval。检索结果:12900000个。
查询请求: what is Information Retrieval。检索结果:14700000个。
百度学术:
查询请求:信息检索的概念。检索结果:40700个。
查询请求: 什么是信息检索。检索结果:343000个。
Google 学术。
查询请求: concept of Information Retrieval。检索结果:3430000个。
查询请求: what is Information Retrieval。检索结果:3070000个。
上述检索结果往往出乎用户意料:(1)不需要如此多的资料;(2)在如此多的资料中,哪些是所需要的资料。
面对大数据,信息检索面临的机遇和挑战:(1)能否找出有价值的若干资料;(2)能否经过分析整理后仅生成一份关于问题的最终资料。