购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第一节
隐蔽网络概述

一、隐蔽网络的定义

Invisible Web一词,由Dr.Jill Ellsworth于 1994 年首次在互联网领域使用,意指那些对于常规搜索引擎难以发现的信息内容。自 1999 年开始,国外针对Invisible Web的研究相当热烈,成果众多。从对OCLC First Search数据库系统的检索结果来看,目前在这个研究领域已有数本英文著作,相关论文的数量则达几百篇。与此形成对照的是,我国国内对隐蔽网的研究起步较晚,2003 年才有人发表此方面文章,数量也不多,目前国内所发表的有关隐蔽网的文章约 50 篇左右。 Invisible Web资源无论在质量还是数量上,与可见网络相比,均占优势,具有重要的应用价值。

Invisible Web在国外又有Deep Web、 Dark Net或Dark Matter等说法,中文可译成“隐蔽网络”、“看不见的网络”、“深层网络”、“深网”或“黑色资源”等。美国的互联网专家、图书馆员和信息学者Sherman和Price把“隐蔽网络”定义为:虽然通过互联网可以获取,但普通搜索引擎由于技术限制而不能,或者经审慎考虑后而不作索引的那些文本页、文件或其他通常是高质量、权威的信息。

二、隐蔽网络的规模

Bright Planet公司研究结果显示:深网(即隐蔽网络)的容量有7500TB,而表面网只有 19TB;深网有近 5500 亿个独立文件,而表面网只有 10 亿;深网中的公共信息数量是表面网的 400 ~ 550 倍,即使排除因数据类型和格式不同所造成的差异,隐形内容也至少是有形内容的 50 倍。隐蔽网络是Internet上增长最快的新信息类型,在内容上深网网站比传统的表面网站要更专、更深,深网内容的全部质量价值是表面网的 1000 ~ 2000倍,深网的信息内容与所有的信息需求、市场和领域高度相关,一半以上的深网内容存贮在专题数据库中,95%的深网信息可以公共获取而无需付费或订阅。可以肯定地说:隐蔽网络的规模远远大于表面网,并且将持续性地高速增长。

三、隐蔽网络的类型与内容

Sherman和Price把隐蔽网络划分为不透明网络、私人网络、专有网络和真正的隐蔽网络四种类型。隐蔽网络的形成有技术原因,也有出于商业考虑的经济原因,还有些知识产权方面的因素。根据其形成的不同原因,其内容可分为:①未被链接的网页;②动态生成的网页;③网上可检索的数据库;④实时数据;⑤部分非HTML格式文件;⑥需要密码或注册的网站;⑦其他难以搜索的内容等七种。数据库里的信息内容构成隐蔽网络的核心,见表 3。95%的深网信息可以公共获取而无需付费或订阅,而且隐蔽网络的规模远远大于表面网,并且将持续性地高速增长。

表3 隐蔽网络的类型和内容 hXpS4TKVESlI9SKRI0KVQyiwhnhCHQLjP/qKtuqoD5Zxxakbp8qUdUug5rm3+JA6

点击中间区域
呼出菜单
上一章
目录
下一章
×