万维网有表面网和深层网络之分,它犹如神秘莫测的宇宙充满了暗物质。即使用功能特别强大的搜索引擎,网络上大部分内容仍然会漏掉,这些被漏掉的就是“隐形网络”及其信息资源。 Chris Sherman和Gary Price认为,用常规搜索引擎搜索出来的表面网络资源大约只占网络信息资源的16%,其余的 84%属于深层网络信息,或叫隐蔽网络信息。据闪亮星球(Bright Planet)公司研究表明,互联网上至少有 5500 亿份文件,隐形内容大约有 5000 亿个文档,是有形内容的 400 倍到 550 倍,即使排除因数据类型和格式不同所造成的差异,隐形内容也至少是有形内容的 50 倍。
隐形网络资源不仅数量庞大,增长速度也远非“有形网络内容”所能比拟的。重要的是“隐形网络”的信息质量高,常规搜索引擎却难以获得。尤其是学术隐蔽网络,更是受到国内外学者、研究人员、高校教师和学生的青睐。因此,如何有效检索和利用隐蔽网络信息资源,已成为一个值得研究的重要问题。