本章按照信息空间思想,从广度和深度两个维度构建了融合策略的分析框架,逐一探讨了图书、博物、档案数字化服务融合的12种组合策略,经过综合比较后认为,当前我国应该优先发展“仓储策略”,重点发展“联盟策略”,适当发展“集成策略”,暂缓发展“合并策略”。
图书、博物、档案数字化服务融合是一项复杂的系统工程,是以对服务层要素为外在特征的多种类型资源和要素集合体的整合与优化。按照数字化信息服务“前后台”划分的思想,数字化服务的融合相当于服务体系的“前台整合”,前台的运行模式和特征必须以信息资源、管理机制、制度环境等各类“后台”各类因素为支撑,如果“后台”要素出现问题或者配置不合理,前台的服务“融合”就无法顺利实现。因此,从战略层面上构建图书、博物、档案数字化服务融合问题的逻辑框架,分析与之相关的各类要素之间的互动关系,以此为基础提出适合我国国情的图书、博物、档案数字化服务融合发展策略,有助于改变我国图书馆、博物馆、档案馆业务协作较少信息化项目建设各自为政的局面,有助于更好地满足网络时代用户的集成信息服务需求 。
1989年,美国贝尔实验室执行总监罗伯特-拉奇(Robert Lucky)就在其著作《硅谷之梦》当中提出“信息空间”(Information Space)的概念。按照他的理解,“信息空间”就是供相关机构和个人进行业务处理和信息交互的在线计算机网络环境。图书、档案和博物数字化服务融合是三种类型的信息机构在同一信息空间内部实现资源的优化重组,以实现分散管理所不能有效实现的服务功能,达到“1+1+1>3”的效果。对于图书、档案和博物数字化服务融合问题的分析可以围绕“信息空间”进行。按照信息空间的思想,图书、档案和博物数字化服务融合问题可以通过“广度”和“深度”两个方面进行分析。
图书、档案和博物数字化服务融合的“广度(Scope)”是指被整合数字资源的覆盖范围,例如是实现三类机构当中的两类的数字资源整合,还是进行整体性整合。按照整合的角度,“广度”可以分为垂直和水平两个方面,如图2-1所示。
一般意义上的图书馆、博物馆、档案馆数字资源整合就是指垂直整合,即通过对数字资源进行合并或集成的方式实现服务的融合,其结果是三类机构的数字资源在逻辑上合为一体,供社会大众进行访问。图书馆、博物馆、档案馆数字资源的垂直整合分为合并(Merge)、集成(Integration)和联盟(Alliance)三种策略。其中,合并模式是指以数字图书馆(D-L)、数字档案馆(D-A)和数字博物馆(D-M)三者之一作为整合平台,将两类机构的数字资源集中到这一平台上,相应就会有三种策略,M1是以数字图书馆作为整合平台,M2是以数字档案馆作为整合平台,M3是以数字博物馆作为整合平台。集成模式是指数字图书馆(D-L)、数字档案馆(D-A)和数字博物馆(D-M)保持相对独立,通过建立公共整合平台和门户网站(D-LAM)实现三类机构数字资源的集成服务,图2中简称为I策略。联盟策略与集成策略类似,也是要建立公共交换平台,不同的是信息服务并不是通过公共的集成门户提供的,而是通过数字图书馆(D-L)、数字档案馆(D-A)和数字博物馆(D-M)以三种不同的视角向用户提供信息服务,经过整合以后,通过任何一个平台都能访问到联盟所有机构保存的数字资源,图2-1中简称为A策略。
图2-1 图书、档案和博物数字化服务融合的广度分析
与垂直整合为社会大众提供综合信息服务不同,水平整合是按照特定的主题采集和保存图书馆、博物馆、档案馆数字资源,提供特定领域信息资源的专题服务,其结果是建成一定数量的专题数字资源库,满足特定的社会群体对具体领域信息资源的深度服务需求。在水平整合过程中,需要根据主题的需要检索和保存来自数字图书馆(D-L)、数字档案馆(D-A)和数字博物馆(D-M)的数字资源,根据对特定领域数字信息保存的全面性要求,还有可能采集来自其他机构的数字资源,甚至利用数字化设备进行必要的原始采集,取得特定文化资源的数字化成果。在信息管理领域,这种面向主题的多元化数字资源集成保存体系被称为数字仓储(Digital Repository,DR),因而图2-1中将其简称为仓储策略(R)。
图书、档案和博物数字化服务融合的“深度(Depth)”是指数字资源经过整合以后的一体化程度。根据数字资源整合领域的研究成果,按照整合对象的不同,数字资源一体化程度可以分为数据整合、信息整合和知识整合三个层次。
面向数据的数字资源整合策略是对异构资源系统中的异质、异类数据在逻辑上或物理上的集中,提供统一的表示和查询,以解决多种异构数据资源的互联和共享。数据整合的主要对象是数字资源实体,其核心目标是解决数据的跨系统访问问题,对数据的内容关注较少。例如,应用联邦数据库(Federated Database System,FDBS)、数据仓库(Data Warehouse)、中间件(Mediator)等技术手段将分布在多个信息系统中的数据资源联结起来,为用户提供统一的访问界面。
面向信息的数字资源整合策略是通过某种标准对不同性质、不同来源和不同格式的数字资源进行描述和链接,使相对独立的资源实体产生联系。信息整合的对象主要是数字资源实体之间的关系,其核心目标是揭示、关联和链接信息之间的关系,以满足用户通过单一入口找到所需要的所有数字资源的需求。信息整合必须以信息组织机制为基础,主要依靠数字资源的元数据(Metadata)实现资源实体之间的逻辑关联。在互联网环境下,基于信息整合的策略主要依靠信息链接(Links)、信息门户(Portal)等手段来实现。
面向知识的数字资源整合策略是以知识体系为基础,参照知识体系对数字资源的内容进行深度分析和语义标注,从而使体系当中的数字资源在内容层面建立深度关联,从而为信息服务融合过程中的逻辑推理和智能检索提供支撑。知识整合的对象主要是构成数字对象内容的概念体系及其逻辑关联,以满足用户对数字资源高精度检索的需求。数字资源的知识整合以知识组织体系(Knowledge Organization System,KOS)为基础,目前用来表示知识体系的方式主要有分类表(Classification Schemes)、主题词表(Subject Schemes)、分类主题词表(Classification-Subject Schemes)、词网(Word Net)、概念地图(Concept Map)、主题图(Topic Map)、本体(Ontology)等,其中本体被认为是最具代表性的知识体系表达和组织方式。
图书、档案和博物数字化服务融合深度的三个层次反映了数字资源一体化程度的高低。数据整合关注的是多来源数据的可访问和互操作,是数字资源整合最基础的层次;信息整合关注数字资源实体之间的逻辑联系,相比数据整合而言一体化程度有所提高;知识整合关于数字资源内容的语义联系,是数字资源整合的最高层次,也是数字资源整合的最高目标和最终归宿。在知识整合实现以后,来自数字图书馆、数字档案馆和数字博物馆的信息资源就以共同的知识组织体系为参照系,被紧密地联系在一起,融合成为一个整体。当然,数据整合、信息整合与知识整合三个阶段是密不可分的,后一个层次必须以前一个层次的实现为基础,即信息整合必须建立在数字资源可以被访问的基础上,知识整合必须建立在数据可访问而且数字对象有完整的描述和揭示机制的基础上。在图书、档案和博物数字化服务融合的项目实践中,可以根据项目需求选择合适的目标层次,并充分考虑未来的发展趋势,尽量使用具有可扩展性能的技术架构。
图书、博物、档案数字化服务融合不是单纯的技术问题,而是综合了多种复杂因素的系统工程,需要根据各类整合策略优缺点,结合我国公共文化管理体制的特征做出综合判断。
根据对数字资源整合信息空间的结构分析,图书、博物、档案数字化服务融合问题的策略主要有合并策略、集成策略、联盟策略、仓储策略四种类型,每种策略对应数据整合、信息整合、知识整合三个层次,其策略组织矩阵如表2-1所示:
表2-1 图书、博物、档案数字化服务融合的策略组合
表2-1的策略组合矩阵共有12种不同的策略组合,每种策略内涵概要分析如下:
“数据合并策略”就是将图书馆、档案馆和博物馆当中保存的数字资源实体集中保存到其中的一类系统。D-M1是以数字图书馆作为整合平台,例如,我国学者刘家真曾撰文指出中国数字图书馆工程应当成为整合中华文化资源的平台 ;D-M2是以数字档案馆为整合平台,从社会记忆资源整合的角度推进图书、博物、档案数字化服务的融合;D-M3是以数字博物馆为整合平台,在通过网络展示博物馆藏品的同时,利用网络的虚拟性整合分散保存在不同地点的藏品,收藏与之相关图书和档案资料的数字化成果。
“信息合并策略”是在图书馆、博物馆、档案馆相对独立运行的情况下,利用数字资源的元数据和互联网统一资源定位机制(URL)将异构数字资源链接到数字图书、数字档案或数字博物馆其中一类系统资源的数据库中,实现数字资源的“虚拟整合”。其中,I-M1是以数字图书馆为元数据链接整合的平台,I-M2是以数字档案馆为元数据链接整合的平台,I-M3是以数字博物馆为元数据链接整合的平台。针对异构元数据的转换和保存,三类机构都有相应的标准可以遵循,例如国际图联制定的书目记录功能需求(Functional Requirements for Bibliographic Records,FRBR)标准是可以从数字图书馆的角度整合另外两类机构的数字资源 ;美国空间数据系统咨询委员会制定的开放档案信息系统模型(Open Archival Information System,OAIS)则是从数字信息存档角度出发为包括数字图书馆、数字博物馆在内的各类数字资源的长期保存和读取提供了完整的概念框架 ;国际文献工作委员会制定的概念参考模型CIDOC CRM从数字博物馆角度定义“文化遗产信息本体”,作为整合图书馆、档案馆文化数字资源的语义元数据框架 。
“知识合并策略”是以数字图书馆、数字档案馆和数字博物馆当中的一类作为知识整合平台,参照统一的知识体系本体模型,对整合后的数字资源及其元数据进行语义标注,支持跨系统的知识检索。其中,K-M1是以数字图书馆为语义整合平台,K-M2是以数字档案馆为语义整合平台,K-M3是以数字博物馆为语义整合平台。
“数据集成策略”就是建立公共整合平台,将数字图书馆、数字档案馆和数字博物馆当中的数字资源实体及其元数据保存到公共数据库当中,例如建设大规模的数据仓库,将各类数字资源采集和保存到公共数据仓库当中。
“信息集成策略”是指公共整合平台不保存数字资源实体,只保存数字图书馆、数字档案馆和数字博物馆中数字资源的元数据和链接关系,以信息门户(Information Portal)的形式向用户提供一体化的信息服务。例如,德国的BAMP(图书馆、档案馆、博物馆门户)项目将三类机构数字资源的元数据集中到整合平台,结构转换为都柏林核心集Dublin Core,通过统一的搜索引擎和展示模块向大众提供服务 。
“知识集成策略”是在数据基础或信息集成的基础上,参照知识组织体系对来自数字图书馆、数字档案馆和数字博物馆的信息资源元数据或者内容信息进行语义标注,进而支持高精度语义检索和智能知识检索。近年来得到广泛关注的图书馆、档案馆、博物馆开放关联数据(Linked Open Data in Libraries,Archives and Museums,LOD-LAM)方案通过整合平台建立元数据语义层面的逻辑关联,将三类机构的数字资源以融合视图的方式提供给用户进行知识检索 。
“数据联盟策略”建立在公共数据交换平台的基础上,数字图书馆、数字档案馆和数字博物馆通过数据交换平台各取所需,将原属于另外两类机构的数字资源复制到本地进行保存,同时对其元数据结构进行转换以支持统一的检索。联盟策略没有公共信息服务平台,整合后的信息资源仍然通过数字图书馆、数字档案馆和数字博物馆向用户提供服务。例如,联合国教科文组织2009年4月开通的世界数字图书馆项目(World Digital Library,WDL)所提供的资源除了数字化图书之外,还包括地图、手抄本、影片、照片等档案或文物的数字化成果 ;近年来以武汉、广州、上海、大连等城市为代表的全国50余个城市相继启动的“城市记忆工程”项目 。这些城市记忆工程项目主要收集和保存反映城市发展并具有永久保存价值的文字、照片、录像和实物等资源及其数字化成果,而有相当数量的社会记忆资源是保存在图书馆和博物馆的。
“信息联盟策略”以元数据交换平台为基础,数字图书馆、数字档案馆和数字博物馆向公共元数据交换平台提交各自数字资源的元数据,从平台当中选取需要的元数据链接,经过格式转换后加入自身系统当中,实现数字资源的“虚拟扩张”。按照信息联盟策略,三类机构虽然没有保存“扩张”的数字资源实体,但是可以通过统一定位符URL进行访问,对用户而言与数字资源保存在本地的信息服务差别并不大,用户甚至感受不到这种变化。
“知识联盟策略”建立在数字联盟策略和信息联盟策略的基础上,通过对数字图书馆、数字档案馆、数字博物馆当中的数字资源及其元数据进行语义标注,使三类机构的数据交换和元数据交换在语义层面进行,支持通过三类服务界面提供的知识检索和智能服务。
“数字仓储策略”就是按照用户需求和特定的主题搜集现有数字资源,采集必要的数字资源,建设数字资源的集成保存和服务系统。这个系统在设计之初就考虑到用户一体化检索的需求,数字资源涵盖数字知识资源、数字档案、文化数字化成果等,集数字图书馆、数字档案馆、数字博物馆的功能于一身,可以实现知识学习、事件查证和文化展示等多重功能。数字仓储策略最典型的应用就是我国台湾地区的“数位典藏科技计划”。我国台湾地区于2008年启动了“数位典藏科技计划”,先后召开了四届“数位典藏与数位人文国际学术研讨会”,多所学术研究机构和博物馆参与了此项计划,数字资源覆盖了生物、考古、地质、人类学、档案、拓片、器物、书画、地图与遥测、善本、汉籍、新闻、影音、建筑等主题,通过综合性浏览网站提供给学术研究、教育推广和产业应用使用 。
“信息仓储策略”围绕特定主题,检索和保存数字图书馆、数字档案馆和数字博物馆当中的数字资源的元数据,以主题信息门户方式将其保存在数字仓储系统当中。数字资源物理上分散保存,逻辑上集中保存,为用户构建虚拟专题信息资源库。例如,爱尔兰皇家科学院建立了爱尔兰国家数字典藏馆,由爱尔兰国家科学院和六所著名国立大学参与,目的在于保存爱尔兰的文化和社会遗产,同时使得公民可以有机会接触到这些文化和社会的遗产 。
“知识仓储策略”围绕特定主题,建立在数据仓储和信息仓储的基础之上,在搜集和保存来自数字图书馆、数字档案馆和数字博物馆等来源的数字资源之后,参照统一的知识组织体系对数字资源的内容和元数据进行语义标注,从而从知识层面上构建其数字资源之间的深度联系,支持高精度的语义检索和智能信息服务。
数字资源整合不是单纯的技术问题,推进策略必须与支撑其运行的管理机制综合起来考虑,从多个维度寻求能够平衡各方需求的合理方案。我国的公共文化管理体制当中,公共图书馆隶属于文化行政机构(部、厅、局);综合档案馆隶属于各级档案行政机构(局),历史博物馆隶属于各级文物行政机构(局),自然科技类博物馆隶属于科技行政机构(部、厅、局),军事博物馆隶属于原解放军总政治部。如此复杂的隶属关系是欧美国家LAM资源整合很少遇到的情况,因而其研究所关注的大多是技术问题,然而体制障碍的协调恰恰是我国图书馆、档案馆和博物馆资源整合的关键所在。综合各方面因素对表2-1当中各自类型策略的对比如表2-2所示:
表2-2 图书、博物、档案数字化服务融合的策略比较
(续表)
表2-2当中,从“体制阻力”、“合作意愿”、“技术成熟度”、“技术先进度”、“整体工作量”五个方面进行策略的分析和比较,得到结果如下:“合并策略”要求图书馆、档案馆和博物馆当中的两个机构要将自身采集的数字资源合并到另外一个机构的系统当中,成为其新的组成部分,意味着牺牲前者的利益实现对后者的强化,难以被其行政主管机构所接受,体制阻力巨大,合作意愿低下。在“集成策略”模式下,三类机构共同向公共整合平台提供数字资源或元数据,较合并策略阻力稍小,但是也会因为三类机构自身工作无法有效体现而动力不足,存在不愿意合作的情况。“联盟策略”较好地兼顾了用户的一体化访问和三类机构各自的利益,可以实现三类机构的共赢,因而受到的阻力较小,合作意愿较高。“仓储策略”是按照特定主题新构建的数字资源保存体系,受到现有管理体制制约最少,但是由于需要从数字图书馆、数字档案馆和数字博物馆搜集数字资源,不一定会得到对方的支持,例如按照主题原则需要从数字档案馆搜集的数字资源可能因为公开制度等限制无法提供。就技术成熟度而言,面向数据的整合策略最高,面向信息的整合策略次之,面向知识的整合策略最低。就技术先进度而言,面向数据的整合策略最低,面向信息的整合策略次之,面向知识的整合策略最高。“整体工作量”是衡量整合策略所需投入成本大小的指标,“联盟策略”由于要兼顾整体和部分的利益,要同时考虑资源整合与多维度呈现,工作量最大;“集成策略”侧重于整体利益,不需要考虑多维度呈现问题,工作量次之;“合并策略”属于将两类机构的资源加入另外一类机构的系统当中,不需要新建整合平台,工作量再次之;而“仓储策略”则是新建专题数字资源库,单个数字仓储库的规模要远远小于数字图书馆、数字档案馆以及综合型数字博物馆,工作量最小。
综合上述因素,采用赋值比较法进行图书、博物、档案数字化服务融合策略的综合比较,如果对“最小”赋值0,“小”赋值1,“中”赋值2,“大”赋值3,“最大”赋值4,“体制阻力”和“整体工作量”为负值,“合作意愿”、“技术成熟度”、“技术先进度”为正值,假定各类指标的权重完全一致,则对各类策略赋值进行加总之后得到优先度指数。该指数大致反映了各类策略进行综合权衡以后的关系和排序。其中,对数字资源进行水平整合且对管理体制依赖程度最低的“仓储策略”可以优先发展;在垂直数字资源整合领域可以重点发展以数字化协作和多维度聚合展示为特征的“联盟策略”,在条件具备的领域或者地区可以适当发展以公共整合平台和服务门户为特征的“集成策略”。鉴于我国公共文化管理体制的复杂性,图书馆、博物馆、档案馆三类机构数字资源实现合并的难度较大,应该尽量暂缓发展按照“合并策略”推动的资源整合项目。在同一策略当中,“数据整合”、“信息整合”和“知识整合”三个层次紧密联系,虽然走向知识整合是大势所趋,由于知识组织工作的复杂性,尤其是用来表示知识体系结构的各类技术远没有达到成熟的程度,根据实际需求进行数据层面和信息层面的数字资源整合是未来过渡到知识整合层面的重要基础。需要指出的是,上述结论只是针对作为社会文化服务机构的公共图书馆、公共档案馆和公共博物馆的情况提出的,不一定适用于机构内部的图书馆、档案馆和博物馆。例如,高校内部的图书馆、档案馆和博物馆不存在管理体制的障碍,完全可以按照“三馆合一”的思路来发展,其数字化服务融合也可以应用“合并策略”。
基于上述分析,对我国推进图书、博物、档案数字化服务融合进程提出如下政策建议:
第一,尽快完成国家层面“图书、博物、档案数字化服务融合体系”的顶层设计。由于我国图书馆、档案馆和博物馆隶属于不同的行政体系,数字化服务融合必须在更高一级主管部门的推动下,从国家战略层面分析支持数字化服务的资源和管理体系的构成和互动方式,确立我国公益性信息机构资源整合服务的重点发展方向,为进化这一领域的发展提供战略参照体系。
第二,基于“全国文化信息资源共享平台”,推动各类文化资源数字仓储系统的开发与服务。2002年,文化部和财政部联合启动了“全国文化信息资源共享工程”,目标是建立覆盖全国的文化信息资源传输网络,实现优秀文化信息在全国范围内的共享 。然而,这项工程目前还是采用层级分中心方式推进,缺少对各中心之间数字资源的深层次整合,也没有考虑整合利用数字图书馆、数字档案馆和数字博物馆的信息资源,整体上还处于较为初级的发展阶段。未来可以基于这一平台,通过开发各类专题数字仓库,实现对图书馆、档案馆和博物馆数字资源的整合,推动文化信息资源广度共享和深层次共享,使用户可以通过这一平台访问到与主题相关的各类信息资源。国家相关部门需要出台鼓励各类研究机构开发数字仓储系统的政策,同时参照国际相关组织制定的可信数字仓储(Trusted Digital Repository,TDR)评价标准建立认证体系 。
第三,推动我国“公益性信息机构数字化协作联盟”的建立和发展。基于“知识共享工程”、“社会记忆工程”和“文化共享工程”等信息化项目建设的现实需求,本着“合作共赢”的思想建立公益性信息机构数字化协作联盟,兼顾相关各方的利益诉求,在实现体系整体价值的同时,要保证所有参与协作的各方都能够从协作当中受益。
第四,开展我国“图书、博物、档案领域公共知识本体”相关技术和标准的联合攻关。知识整合是数字资源整合的主流趋势和最终归宿,领域本体的构建是知识整合的研究重心,也是知识组织过程中难度较大的环节。为了促进图书、博物、档案数字化知识服务融合的实现,图书馆、档案馆和博物馆及相关研究机构应该参考现有的WordNet、HowNet等知识本体模型,构建适用于图书馆、档案馆和博物馆的知识组织体系和知识标注方法,为实现知识层面的数字资源整合奠定基础。