购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

从国外分类法看《中图法》对网络信息资源的组织

1 中外文献分类法发展回顾

物以类聚。类是具有某种共同属性的个别事物的集合。分类则是以事物的本质属性作为根据,把各种事物集合成类的过程。文献分类法作为一种情报检索语言,将各种知识领域的类目按照知识分类原理进行系统排列,并以表示类目的数字、字母符号(即分类号)作为文献的主题标识,有效地组织和揭示文献信息资源。国外比较著名和有较大影响的文献分类法是:《杜威十进分类法》(Dewey Decimal Classification,DDC)、《国际十进分类法》(Universal Decimal Classification,UDC)、《美国国会图书馆图书分类法》(Library of Congress Classification,LCC)、和《冒号分类法》(Colon Classification,CC)。国内最著名也是最通行的分类法是《中国图书馆图书分类法》。

《杜威十进分类法》(DDC)为美国的麦维尔·杜威创制,1876 年初版,1989年出第 20版,现已出到第 21 版,并增加了视窗版,是当今世界上通行分类法中历史最悠久、流行最广的一部分类法,被翻译成 30多种语言文字,有 135 个国家的图书馆使用。它以十进制数字号码作为标记符号而著称;首创以号码代表类目的方法——相关排列法;初步应用了组配编号法;体系结构完整、严谨,包罗所有的知识领域。

《国际十进分类法》(UDC)是世界上第一部半分面分类法,较早地应用了概念的分析与综合的原理。1895~ 1905 年出版了第一版,(比)奥特勒主编。其特点是:主题领域广泛,能详尽地概括人类全部的知识,有 60 多万个类目,是现有分类法中明细度最高的,标记制度灵活,并采用了组配轮排等方法。

《美国国会图书馆图书分类法》(LCC)由美国国会图书馆编目部主编,1901年首版,1985 年出到 36 分册,是世界上最大型的列举式分类法。其特点是:根据“文献保证原则”编制,类目详细,采用顺序制,类号简明,便于扩充。

《冒号分类法》由(印度)S.R.阮冈纳赞创编的一部综合性分面组配式分类法。因 1933 年首次出版时用冒号作为组配符号而得名。CC最显著的特点是创制分析综合分类法,即分面组配法,用象征分面连接的冒号“:”作为分面符号。此后,阮冈纳赞从概念、语词和标记符号三个层面对分类法进行系统的理论研究,对其进行多次重大修改。1950 年第 3 版广泛采用了“焦点”、“组面”和“相”等概念。1952 年第 4 版提出本体、物质、动力、空间和时间(分别用P、M、E、S、T为标记)5 个基本范畴和 5 种分面指示符。自 1957 年第 5 版起,同时出版基本分类表(即综合分类表)和深度分类表(即专业分类表)两种版本,后者现已出版200 多种。1960 年第 6 版对类表及标记符号作了全面修改。1963 年出第 6 版的修订重印本。

国内的《中国图书馆图书分类法》,是 1971 年在北京图书馆的倡议下,由全国 36 个图书馆和情报单位组成编辑组进行编制的。1973 年编出初稿,1975 年正式出版了第一版。1980 年出了第二版,1990 年出版第三版,1999 年出了第四版,2000 年 6 月出版了《中图法》电子版。其间,《中图法》编委会于 1994 年出版了《中国分类主题词表》。目前,《中图法》是我国图书馆界使用最广泛的综合性分类法,据统计,全国各级各类图书馆有 96%以上使用《中国法》。《中图法》已成为事实上的中国图书馆的标准分类法。

2 网络环境对分类法的呼唤

网络信息时代,人们上网求知,获取信息的需求越来越大。网络是一个庞大的信息资料库,其信息资源与日俱增,不计其数。据 2002 年 7 月中国互联网信息中心(CNNIC)的统计,我国域名总数就达 692490 个,全国有网页数 15946 万个,上网人数 4580 万人。时隔数年,中国互联网络信息中心于 2008 年 9 月 23日发布的《第 22 次中国互联网络发展状况统计报告》指出,截至 2008 年 6 月底,网民数已增至 2.53 亿人。网民规模超越了美国,跃居世界第一位。中国已成为世界上网民最多的国家,几乎每 5 个人中就有 1 位网民。

随着Internet的飞速发展,网络信息资源呈爆炸性的增长,面对海量的信息资源,人们往往会由于信息过载,使太多的信息无从消化,同时也会出现信息迷失,难以找到自己所需的信息。因此,如何快速、准确地从浩如烟海的网络信息中找到所需要的信息,已经成为人们十分关注和急需探讨的重要课题。

在网络环境下,网上信息纷繁杂乱,其特点是数量大、范围广、种类多、稳定性差、动态性强、质量优劣相杂、分布分散和管理无序。对网络信息进行有序管理,最有效的方法之一是对其进行分类组织。传统的文献分类法在分类标准、类目级次、组织方式、标记制度和更新速度等方面,已不能完全适应网络信息发展的需要。网络信息分类是一个和检索密切相关的领域,通过对网络信息资源的组织整理,可以提供信息的良好组织结构,便于用户进行浏览和过滤信息。但事实上网络信息资源并未得到充分揭示和有效组织。由于涉及各种网络资源,网络信息分类法在处理对象上对类目系统的要求更高。网络系统面向广大终端用户,要求网络信息分类法体系有更强的易用性。技术环境上,网络系统是与各种计算机网络的最新技术直接联系的,要求分类体系能适应技术发展的需要。网络信息分类法要以传统分类法的体系和方法为基础,以网络信息资源为对象,既要充分考虑网上信息量的类型和特点,又要重视网上用户的需求,依托计算机网络技术和环境,建构多维网络信息分类体系。

网络搜索引擎是对网络信息资源进行标引和检索的有效工具。其分类体系多由研究机构、电脑专家面向网络信息、计算机技术和一般用户设计的。搜索引擎中的分类,是先建立一个知识分类框架,然后将每一个大类由宽到窄,逐层细分出若干等级的类目,形成知识树,把信息分门别类地组织起来。目前一些网络搜索引擎中,虽然也采用了分类的方法来组织揭示信息,但其检索结果却不容乐观。原因在于多采用自编分类体系,各行其是,给用户检索造成了诸多不便。例如Yahoo网站提供的分类会出现歧义,分类准确率比较低,同时还存在着更新速度慢的问题。由于各搜索引擎自创的分类体系存在着差异,限制了用户对网络信息资源的充分利用。因此,编制适用于网上信息资源组织与检索的分类体系,具有重要的现实意义。

3 网络信息资源的组织

3.1 中外主要分类法对网络信息资源的组织

传统的文献分类思想对网络信息分类法的建立有着基本的指导作用。例如,杜威分类法中的“实际效用原则”、国际十进分类法中的“多面性原则”和阮冈纳赞的“分面分析理论”等观点,是实现网上分类法的理论基础。在网络信息环境下,分类法已由传统的利用目录、文摘和索引等工具对印刷型文献进行一般特征的描述,发展到了利用数据库、信息库和搜索引擎等工具以二进制电子数据的知识单元和信息单元的描述。分类法除了作为立类标引和排架依据外,将起着联机网络浏览检索工具,组织非文本信息,管理超文本系统,浏览和组织网络信息资源等功能,发挥过滤和评价网络信息,使之有序化的作用。

国内外主要分类法对网络信息资源的组织有了许多的应用。利用《杜威十进制分类法》(DDC)作为网络信息分类检索系统的有OCLC的Net first、加拿大国家图书馆的Canadian Information of Subject(URL:http://nlcbnc.ca/caninfo/esub.htm),加拿大多伦多参考图书馆的“业余爱好者天文学分类检索系统”,英国联合信息系统BUBL LINK等。利用《国际十进分类法》(UDC)建立网络信息分类体系的有英国“BUBL Subject Tree”,英国联合信息系统的NISS Information Gateway,德国的“OMen Burg”大学图书馆研究的GERHARD。宣称应用《美国国会图书馆图书分类法》(LCC)分类网络信息资源的服务系统也有多个,如NISS、INFOMINE等。利用《冒号分类法》(CC)最典型的是Yahoo搜索引擎。采用《中图法》的,如网络指南针采用了《中图法》建立分类检索体系,一级类目共有 60多个学科,类目按字顺排列,并有二级和三级子类目;中国教育与科研网也采用了《中图法》作为分类工具。

3.2 网络信息分类法的类型

各类门户网站应用网络信息分类法来分类网络信息,揭示和组织网络信息资源,并设置在Web页上,存放在Web服务器内。从编制主体来说,目前的网络信息分类体系可分为两类:

1)网络公司编制的分类体系。网络公司设计出的分类体系具有鲜明的网络环境特点,有较好的实用性。但其弱点是知识体系的完整性和逻辑性较差,随意性较大。网络公司编制的分类系统,英文的有Yahoo!(http://www.yahoo.corn)、Galaxy(http://www.galaxy.com)等。中文的有搜狐(http://www.sohu.com.cn)、网络指南针(http://compass.net.edu.cn:8010)等。

2)图书馆编制的分类体系。具有知识体系的完整性和逻辑性,其弱点是对网络技术、网络信息环境和网络用户的研究不够深入,实用性不足。图书馆建立的网络信息分类系统有英国爱丁堡Napier大学图书馆的The Internet Resource(http://www.napier/ae/uk/)、美国伯克利公共图书馆的“图书馆员因特网索引”(Librarians Index to the Internet)等。

从检索系统涉及的领域和传统分类体系思想理论的角度,网络信息分类法可以分为:

①主题分类法。一个主题一个类目,一个上位类又分为若干细目,所有类目按字顺排列。主题分类法的实质是分类法和主题法互相融合的产物。例如,搜狐一级类目为 18 个,细分程度为三、四级。

②学科分类法。以知识分类,按照学科性质组织知识网络信息资源,类目顺序以字顺为标准。学科分类针对性强,更具学术性,能更好地满足科研人员以族性检索的需要。例如,“网络指南针”即采用了学科分类法,分 58 个一级类目,类目展开在四级之内。

③体系分类法。是一种综合类表法。以传统分类法为基础,对网络信息资源进行大规模地组织和整理,提高分类容量。网上的虚拟图书馆多采取体系分类法。目前使用最多的传统分类法是DDC、LCC、UDC和《中图法》等。

④分面组配法。先确定几个分类标准,即分面,再确定每个分类标准中的若干特征,即类目,每一分面的类目与其他分面的类目分别组配,形成许多组配类目,达到细分的目的。

3.3 目前网络信息分类存在的问题

许多门户网站为了满足用户对网络信息的需求,纷纷推出了各自的分类体系。然而分析目前网络信息分类体系,可以发现存在着一些问题。

3.3.1 学科大类设置不全,知识体系不完整

不少搜索引擎在分类时往往只从商业的角度考虑如何吸引用户,并未真正从学科领域和知识体系的角度来进行分类,因而使得分类体系遗漏了许多重要的学科领域,很多网络信息难以入类。同时又有重复列类的现象,分类体系缺乏完整性。例如“搜狐”的分类体系为 18 个基本大类。“雅虎”的分类体系为 14个基本大类。而雅虎的基本大类中没有设置工业类和农业类,不少信息难以归类。

3.3.2 类名不规范,缺乏科学定义

一些搜索引擎在类名在使用上随心所欲,缺乏规范性。如“Internet”,“雅虎”称“因特网”,“搜狐”称“互联网”。规范的类名应为“计算机”,“因特网”。

3.3.3 类目划分和设置随意性大

如“新浪网”对社会科学划分的:心理测试、哲学、历史、经济学、管理学、会计学、心理学、周易、马克思主义和“三个代表”等 10 个类目间类目关系混乱。对“教育”类下的二级类目,新浪分出 44 个下位类,搜狐有 34 个,而网易只有 24个。另外“首都在线”将知识产权法放在科学技术类,“网易”在文学类下列宗教,“搜狐”把留学与移民列入工商经济类。这些分类体系在类目划分和设置上自创和选择热门主题,随意性太大。

3.3.4 类目排列无规律性

在“雅虎”大类中“电脑与因特网”与“科学”并列。这显然是将不同等级的类目等同排列,违反了同位类类目排列的规律性,下位类目超出其外征,缺乏严谨性和逻辑性,从而影响用户的检索效率和准确性。

3.3.5 体系过于复杂,深奥难懂

这主要是图书馆编制的网络分类法,由于过多地强调逻辑性及知识体系的科学性和完整性,因此分类的深度太大,有的类目过细,多达十层。同时专业内容过于陈旧,现实时代感不够,因而不利于用户掌握熟悉和快捷便利地进行检索。

3.4 对《中图法》网络信息资源组织的思考

由于《中图法》体系庞大,专业性强,分类细微,内容陈旧,离鲜活的网络信息太远,因此,应在《中图法》第四版和电子版的基础上,结合《中国分类主题词表》尽快编制出台一部科学实用的网络信息分类法——《中图法网络信息分类表》。

3.4.1 编制机构协作化

成立组织管理机构,理顺关系,编制基本规则,协调发展。由国家图书馆、中科院、中国图书馆学会及中国计算机学会等单位组成。网络信息分类表的编制,单凭一家之力,势必力量单薄,也难免受到自身缺陷的限制,因此要取众之长,使其既突出学科体系又面向事物对象,适于网络信息资源的组织。

3.4.2 分类主题一体化

分类语言能满足族性检索的需要,系统性较强;主题语言能满足特性检索的需要,具有专指性、直接性和灵活性。但分类语言体系复杂,不利于用户掌握使用;主题语言虽方便快捷,却夹杂着大量的无关信息,影响查准率。将分类和主题检索语言融为一体,形成一种兼具两种检索语言功能的新型检索语言,既具有系统性和灵活性,又克服和两种检索语言不足的局限。

3.4.3 分面组配化

即分类法由传统的等级列举式向分面组配式发展,或者是等级列举式与分面组配式相结合。分面分类法的特性更适合计算机处理,分面分类号与深度类名词汇互相连接,在分类检索途径和主题检索途径都能更有效地利用。同时分面分类法容量相当大,只有它能与世界上主题检索的发展趋势融合起来。

3.4.4 类目体系多维化

类目是构成分类体系的基本单元,传统分类法类目展开时,实行多重列类、编制注释和作参见等方式加强类目间的联系。但由于受线性结构的局限,事物的横向联系不能有效地揭示。在网络中,网上超文本技术和链接技术的发展,为构建多维化分类体系提供了技术保证。知识的多重从属关系采用交替和多重列类的揭示方法,在同一类目下,根据需要可从不同的角度、按不同的标准,对同一对象进行多次重复反映,建立若干从属母类的平等子系统,并将从属类目链接起来,多维化界面显示,实现多途径和多视角检索。

3.4.5 类目分级层次简化

传统分类法为树状结构,类目层次过细,虽然知识的系统性较强,但不利于检索,费时费力。网络信息分类系统是依附在网页载体上的,众多网页链接起来就形成了分类分层结构。为增强网络的易用性,网络信息分类系统应将类目作一定的限制,类目简洁、粗略。因此,建议类目层次使用三到四级为宜,专业学科可适当延伸。

3.4.6 类目排列规律化

分类法的类目排列,直接影响同位类之间关系的揭示,尤其是会影响检索的效率和便利性。《中图法网络信息分类表》的类目排列可以采取:1)按类目的字顺排列,形成主题分类法,并附相应的分类号;2)参考检索频率高的词,按类目的检索价值和重要度排,并保留相应的分类号;3)以学科分类为基础,按知识门类之间的逻辑关系排;4)同时兼顾类目的重要性和类目之间的逻辑关系。5)对同位类进行系统排列,即按所有同位类目的相互关系排,以增强类目排列的一致性和可预见性。

3.4.7 类名语言自然化

类名是表示类目概念的名称,分类法的类目体系是通过类名来体现的。类名是用户用来识别和选择检索路径的依据。传统分类法过分强调类名的科学性和专业性,而忽视了用户检索知识信息的方便性和易用性。因此网络信息分类法应在保证类名的科学、确切和简洁的同时,尽量采用自然语言,增强类名的实用性,努力使类名适应网络信息资源以及用户需求动态化的特性,实现人工语言与自然语言的融合。

3.4.8 分类标记制的设置改造

分类标记为类目的代号,记录类目的属性、特征、位置和链接,便于系统进行判断、运算和转换,是一种良好的助检手段。它有助于用户直接跳转到相应的类目下,实现检索的一步到位。目前大多数搜索引擎都没有采用分类标记制。因此《中图法网络信息分类表》应结合网络信息资源的特点,对类目进行改造,保留并编配相应的分类标记,尤其是以《中图法》分类号作为兼容互换基础,建立对应分类号,以便于从分类号来检索。同时加强类目说明,便于用户把握类目范围和资源特点。

3.4.9 现代分类技术的使用

《中图法网络信息分类表》要适应网络检索的特点,并能直观、简明和动态地反映网络信息,就需要合理地使用现代分类技术。比如分面组配技术,叙词法,后控词表,分类主题之间的转换,主题结构显示和增强自然语言语词人口,以增强分类体系组织和揭示网络信息资源的能力。

3.4.10 实现分类标引自动化

由于网络信息呈开放、非线性,多媒体特征,网络信息资源数量大、范围广和动态性强,网站信息更新速度快,分类自动标引是网络信息资源标引的发展方向。分类标引自动化涉及语词的切分和识别;主题概念的分析和提炼;自然语言向受控语言的转换等。根据《中图法》分类表,利用词表和同义词典等工具,组建分类主题规范文档,通过抽词排序,生成分类号——关键词索引,形成归类底表。抽取表达主题内容的关键词,运用数学方法进行相似性比较和匹配,找出关键词涉及的类号,再把各种分类号进行逻辑运算、归并和整理,分类语言与自动语言的对应转化,实现自动化分类标引。

4 结束语

基于《中图法》的《中图法网络信息分类表》将是我国检索语言进入互联网,达到国际先进水平的重要标志。它需要反映网上信息的类型和特点,体现简捷性、直接性、实用性和动态性。它需要图书馆专家计算机与网络专家、情报检索语言专家和信息管理专家的合力攻关,使之成为一部科学完善的网络信息分类法。

参考文献

[1]俞君立、陈树处:《文献分类》,武汉大学出版社 2001 年版。

[2]陈树年:《网络信息的自动分类问题》,载《图书馆杂志》,2001 年第 10 期。

[3]卜书庆:《试论数学信息资源的组织方法》,载《国家图书馆学刊》,2001 年第 4 期。

[4]苏广利:《网络信息分类体系设计》,载《图书馆杂志》,2002 年第 5 期。

[5]吴丹:《网络信息分类体系设计》,载《图书情报知识》,2002 年第 5 期。

[6]许磊:《中文网络信息分类法分析》,载《情报杂志》,2002 年第 9 期。

[7]苏广利:《网络信息分类系统的发展趋向研究》,载《图书馆杂志》,2002 年第 4 期。

[8]郭家义:《网络信息检索效率研究》,载《图书与情报》,2002 年第 4 期。

[9]候汉清、薛春香:《中文搜索引擎分类体系兼容互换工具的设计》,载《中国图书馆学报》,2003 年第 1 期。

[10]贺定安:《论我国讹b版分类法研制开发》,载《中国图书馆学报》,2003 年第 3 期。

[11]司莉、俞君立、贺定安:《我国文献分类计算机化的发展与近期目标研究》,载《图书情报知识》,2000 年第 4 期。

[12]邱燕燕:《网络信息的分类及对策》,载《图书馆论坛》,2001 年第 2 期。

[13]白国应:《中国文献分类学研究 50 年(1949~ 1999)》,载《中国图书馆学报》,1999年第 5 期。

[14]俞君立、吴礼志:《1999~ 2000 年我国文献分类研究进展》,载《图书馆杂志》,2001年第 8 期。

[15]王春芳、石晓华:《网络信息的分类组织》,载《图书馆杂志》,2001 年第 8 期。

[16]石晓华、王春芳:《网络信息分类与传统分类法的优劣分析》,载《图书馆理论与实践》,2001 年第 1 期。

[17]马张华:《文献分类法在网络资源组织中的作用》,载《图书情报工作》,1999 年第12 期。

[18]马张华:《分类搜索引擎类目体系研究》,载《图书情报工作》,2001 年第 12 期。

[19]陈笑辉、范晓虹:《Yahoo的分类体系结构及原理》,载《图书情报工作》,1999 年第9 期。

[20]左少凝、柳晓春:《国际大型图书分类法在因特网上的应用》,载《图书馆杂志》,2001年第 12 期。

[21]左少凝、柳晓春:《网络信息资源分类组织研究进展》,图书馆 2001 年版。

[本文原载于兰州:《图书与情报》,2004(2);在 2004 年 7 月的“云南省图书馆学会第五次全体代表大会暨第八次学术研讨会”上,本文荣获优秀论文二等奖] HmFZwwEkt6YhqnQN78aDqqsmaALX7mU78+dt3snh/KgYKJusIalNahkmoo0Snqob

点击中间区域
呼出菜单
上一章
目录
下一章
×