购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

三、解决异构网互通的组织工具
——元数据

元数据是目前为止图书情报领域公认的比较有效的对信息进行组织的方法,在图书情报领域占据着重要的地位。元数据通常被定义为“关于数据的数据” [11] ,概括地说就是关于“知识的知识”。

既然元数据是一组数据,并且它要用来描述和标识信息实体,因此,元数据必须要为领域所公认,通常这样一组为领域公认的数据及其扩展原则,称之为元数据标准框架。实际上元数据标准就是一组领域内公认并遵循、使用的元数据。元数据标准通常分为核心元数据标准和专门元数据标准,核心元数据标准是一个领域内元数据的最小集合,是经过高度抽象的领域内元数据;根据核心元数据集和核心元数据标准的扩展原则,专业人员可以制定出各种专门元数据。

元数据标准是适用于某一类型的信息对象的。元数据标准框架由已有的核心元数据标准及其扩展原则构成,元数据的研究者根据已有的元数据标准框架制定出专门领域的元数据标准。因此,元数据标准最终会形成一个“标准族”,这个“标准族”和相应的计算机元数据标准管理工具以及相应的元数据著录系统就构成了一个元数据标准体系。

元数据的著录是指著录者(可以是信息的提供者和组织者)根据元数据标准中的元数据元素对具体的信息实体进行描述并记录相关描述信息的过程。元数据著录系统用于组织和管理元数据,提供关于某一计划或组织中所有数据元素的描述。它组织数据元素的信息,提供获取信息的入口,实现标准化、授权复用和数据共享。

元数据标准体系由元数据标准框架、根据元数据标准框架扩展出来的专门元数据标准以及对应的元数据标准管理系统和元数据著录系统构成。其中,元数据标准框架又由核心元数据标准和它的扩展原则构成。目前,运用元数据来组织知识的主要作用体现在以下两方面:

(1)知识发现

知识发现(Knowledge Discovery in Databases,KDD)是近几年兴起的新领域,它是指从大量数据中提取出可信的、新颖的、有用的并能被人理解的模式的高级处理过程。这里的“模式”可以看成是知识的雏形,经过验证、完善后形成知识。KDD是一个高级的处理过程,它从数据集中识别出以模式来表示的知识。高级的处理过程是指一个多步骤的处理过程,多步骤之间相互影响,反复调整,形成一种螺旋式的上升过程。知识发现研究的主要目标是采用有效的算法,从大量现有或历史数据集合中发现并找出最初未知,但最终可理解的有用知识,并用简明的方式显示出来。

(2)知识保存

数字信息与知识以数字载体的形式存储,具有丰富、生动、方便、快捷等优点,但它与物质载体的信息与知识相比寿命却显著下降。目前对于数字资源的长期保存通常有两种策略:一是对原硬件、操作系统和软件进行仿真,二是定期把上一代计算机上的数字信息迁移到下一代计算机上。不管是采用“仿真”策略还是“迁移”策略,数字信息资源的长期保存都与元数据的创建和维护有关。开放档案信息系统参考模型(Reference Model for an Open Archival Information System,OAIS RM)是美国航空航天局下属的空间数据系统咨询委员会制定的一项标准,其目的是对信息资源的存取和长期保存提供一个参考模型框架,2002年1月,此框架正式成为ISO14721标准。OAIS参考模型框架适用于所有致力于长期保存数字资源并提供利用的系统和组织,从而被很多组织和机构包括政府部门和数字图书馆所采用,例如美国国会图书馆、大英图书馆、OCLC等许多组织在其项目中都应用了这一参考模型,我国国家图书馆制定的《中文元数据方案》也采用此模型。在数字信息的形成与管理中使用标准,有助于数字信息在存取与保存时的完整性,也直接降低保存数字信息的费用。目前,在数字信息长期保护方面还没有统一或通用的元数据格式,但有关研究项目已经提出了若干种格式,例如英国的CEDARS、澳大利亚国家图书馆的PANDORA/NLA、欧洲七个国家图书馆和三家主要出版社参与的NEDLIB机制等。 KbAIx7Y8dHmvPcq/VI2XmEVaCXMxX3VhSzONWqdpDKAOZSF8v2K9Ghm9gfquG4u1

点击中间区域
呼出菜单
上一章
目录
下一章
×