纷繁复杂的网络资源为用户提供了多种服务机会,但多样性同时成为资源极大共享的一个瓶颈。以高等教育网络资源为例,计算机技术和网络的飞速发展促使越来越多的教育资源以信息化的形式在网上呈现,国内外的教育机构几乎都有自己的网站及资源建设,教育软件市场中许多厂商也在从事教育资源库的开发,但由于各学校和教育软件公司大都是在自定义标准的基础上进行教育资源及资源库的建设,缺乏统一的规范,难以形成资源共享,系统之间无法实现互操作,使各学校、各公司的资源,以及资源库成为一个个信息孤岛,给用户造成极大不便。
在现有网络资源环境上,建设领域资源共享平台以实现资源共享,是当前广为适用的一种网络资源组织管理方法。以我们所承担的“高等教育资源语义共享平台”项目为例,该项目目标就是要把大大小小的信息孤岛互联,为愿意加入共享平台的学校、公司的资源库提供标准化发布平台,同时周期性地收集网络上分散分布的大众教育资源,建立囊括多样化网络教育资源的统一视图,为领域资源需求用户提供一个统一的资源语义共享的门户,简化用户繁杂的资源查询工作,同时对学习者进行主动知识推荐和导航服务。
要想实现资源极大共享的目标,共享平台需要以一种有效的方式对分散、松耦合、多样且动态性极强的网络资源进行重组,建立有结构的资源虚拟组织视图,对资源进行整合、集成,以利于资源的充分利用。在这个过程中,对资源的有效标注成为解决共享问题的一个核心内容。
通过对当前网络资源现状的调研可以看出,要想最大限度地共享并提供全面、准确、方便的资源服务和智能的知识导航,需要解决三个层次上的资源标注问题:
(1)资源表现形态的多样性。现代网络资源的表现形态多样,同一主题的资源有文本、视频、音频、图片等各种形态;对于不同的资源,管理时所需的资源形态信息也会有所差别,如描述音频资源还需要描述其声道数属性等;由于地域差别、文化风俗等的差异性,不同建设主体在开发资源时对资源表现形态的模式设置也是千差万别。这样就造成了在资源共享平台建立资源虚拟统一组织和管理视图时的困难。
(2)资源内涵知识的语义互联。网络资源承载着知识,知识之间有着丰富的语义关联,从知识层次进行资源共享和协同,可以更好地发挥网络资源共享的服务功能。例如,在查找“人工智能的教育资源”时,如果没有建立知识间的语义互联关系,而仅依靠关键字匹配时,机器就不会把“机器学习资源”列入结果集,而实际上机器学习是人工智能中的一个重要内容。
(3)资源内涵的知识协作。面向领域的网络资源语义共享平台不仅能够屏蔽资源的物理分布性和表现多样性,能够按照内容分类互联关系对资源进行有效组织和利用,而且还针对某些特殊领域的特殊属性,提供智能导航或促进资源间的协作。例如,对于高等教育资源共享平台,它不仅能把不同表现形式的资源互联,建立物理分离、甚至概念独立的网络资源间的知识协作关系,而且还能对学习者进行主动知识推荐和导航。
总之,只有在有效标注情况下,才可能建立资源的有效组织和管理,并提供最大效能的服务。
面对纷繁复杂的网络资源,我们以特定领域的网络资源的信息表示、内容关联和知识协作三个不同维度为基准,利用特定领域的元数据标准规范、领域分类知识、领域中的事件关系理论等,建立了资源的多维语义描述框架,以实现面向领域的网络资源的信息互联、内容互联和知识协作。下面给出形式化定义:
【定义 3-1】 网络资源语义模型为:RSM={profile,content,collaboration_context}。RSM代表网络资源语义模型(Resource Semantic Model),它是一个三元组,分别描述了资源在不同元所代表不同维度上的信息视图,其中,profile是资源的外在元信息描述, content是资源的内容分类描述,collaboration_context描述了资源在不同知识协作过程中的结构关系,即其协作上下文关系描述。
我们所建立的网络资源语义共享平台(NRS 2 ,Network Resource Semantic Sharing platform)中的多维语义共享模型的概念图及技术说明如图 3-2 所示。
图 3-2 多维语义共享模型的概念图及技术说明
建立标准规范统一的共享元数据本体是实现分布、异构资源信息互联的重要保证。在网络上,对于一般的专门领域都有一些标准规范,但是,当存在多个标准规范时,就又形成了新的语义异构。所以,有必要对领域的元数据规范进行研究,并建立其本体模型,以支持不同规范间的映射和集成。
【定义3-2】 网络资源的元数据本体:profileOnto={ U meta , U meta_rel , U meta_attr },其中 U meta 是网络资源的非空有限的元数据词汇全集, U meta = U core ∪ U extend , U core 是元数据核心词汇集; U extend 是扩展词汇集; U meta_rel 是网络资源的元数据关系全集; U meta_attr 是属性全集,它包括了元数据词汇所体现的概念的属性和元数据关系的属性。
由于网络资源的多样性,在描述不同资源形态时,有些属性被忽略,而有些特征描述被特别加入,所以,对于特定形态的资源,其元数据模型为:RSM.profile={MetaC,Meta_Relationship,Meta_Attribute},MetaC是根据领域资源元数据标准规范所建立的元数据词汇集,它包含核心元数据词汇,并根据资源特点有一定的扩展,即MetaC∈
,并且
U
core
⊂MetaC,Meta_Relationship∈
,Meta_Attribute∈
,
代表幂集运算。
网络资源共享平台中资源元数据本体建设和相关领域资源标准规范紧密相关,主要涉及两个方面的规范:表现形态的标准(元数据)和资源形态分类规范。
表现形态的标准分为核心标准和扩展标准,核心标准是描述共享领域资源的共享标准,它是一个领域资源表现形态的公共的内核标准元数据,可以通过继承关系对公共共享内核标准进行按需扩展。
关于资源形态分类,主要是为了建立科学、合理、规范的分类体系,需要根据领域不同建立不同的分类方法。
U meta _rel 是网络资源的元数据关系全集,表征建立在元数据上的资源间关系集。例如,表征资源间的同一作者关系,资源间相同关键词关系等。
U meta _attr 包括了元数据词汇所体现的概念的属性和元数据关系的属性。国际WWW组织推荐的Web本体语言OWL被广泛使用,本体中的概念对应到OWL中是类,概念属性主要分为数据类型属性和对象属性。数据类型属性描述了类或概念在有了实例值时的数据类型信息,如“标题”的数据类型属性是字符串;而两个类的实例间的关系为对象属性。
元数据间的关系属性是对关系的性质进行定义,主要包括自反性和传递性等。例如,在描述文献作者情况的关系中,“同一作者关系”具有对称性和传递性,基于此关系描述,当某一作者具有不同名字或单位信息发生变化时,系统可自动推导出是同一个人。
为了实现网络资源信息互联和内容知识级的互联,在领域本体建设中还需要建立领域的内容本体,这种本体的内容主要是和领域分类、领域概念间的各种关系有关。
网络资源表示规范实现了资源间的结构互通,使得不同来源的资源可以以一种统一的信息表示视图呈现给用户;但这仅是从资源的外在表现形态上进行了互联,缺少内容互联,仍然会出现信息获取不全的情况,这也是传统基于关键词搜索的缺陷。要解决这个问题,一个有效的途径就是建立资源领域本体,对资源所属不同知识体系的分类关系进行定义,在网络资源搜索时,系统可以根据事先已经建立好的知识分类关系,推理得出所有满足需求的概念信息,然后再得到具体的资源。
【定义 3-3】 网络资源的领域(内容)本体:contentOnto = { C , R },其中, C 为领域词汇集; R 为关系集,记录了领域知识点间的各种关系。
按照内容建立网络资源的知识分类体系,不同专家有不同的分类结果。但是,一般的分类体系中,主要关系有子类(或称为“被包含”)关系(Subclass)和父类(或称为“包含”)关系(Supclass)。对于复杂的或者需要更详细信息的资源关系描述,有时需要更进一步描述出资源概念间的并集关系、交集关系、等价关系和互补关系等。
知识通信中的网络资源共享不应该仅是被动的资源呈现,它应该在屏蔽了资源物理位置、数据操作和信息表示异构的情况下,在为用户提供资源共享的同时,能够对用户所关心内容的相关信息进行主动呈现、提示和推荐,并进行知识导航,以提供更智能化的知识服务。
所以,在知识通信基础架构中,网络资源语义模型中包括了知识协作的学习过程本体,对知识互联协作关系进行了定义并建立了其公理化体系,以自动生成知识协作过程。
知识协作过程是一个人类认知的过程,具体场景中的认知活动和认知对象的内容有着密切联系。但认知过程和认知对象又是相互独立的,它们处于不同维度空间,具有一定的相互独立性,为了使机器能为用户提供智能服务,需要对这两个维度空间建模,并对它们之间的关系进行描述。
所以,在知识协作过程本体中,我们建立了两种类:一种是认知协作过程类,它描述了用户在基于网络进行认知和知识学习时的一般规律,是用户主体活动的一般规律的描述;一种是知识协作过程类,由描述领域知识点的知识类经一定协作关系构成,表现了网络资源从内容上所体现出的协作模型,是资源内部动态关联关系的描述。
过程类属性包括描述过程类自体性质的数据属性和描述过程类上下文属性的对象属性。其数据属性主要有目的属性和范畴属性;对象属性较为丰富,分为横向属性和纵向属性,横向属性又分为协作关系属性、协作属性、认知协作过程类与内容协作关系类间的关系属性,纵向属性包括组成关系(part of)和子类关系(subclass of)。知识协作过程本体的基本内容如图 3-3 所示。
图 3-3 知识协作过程本体的基本内容
为清晰说明协作过程本体,以下用Cng表示认知协作过程类的全集,Cot表示内容协作过程类全集。为了区分认知协作过程和内容协作过程,设P代表认知协作过程类, P c 代表知识协作过程类,即P∈Cng,P c ∈Cot。当不区分认知过程和知识协作过程时,以A、B、C表示一般协作过程类。
【定义 3-4】 协作关系定义:协作关系是资源间的组合关系。协作关系操作符集合为:Co_set={Ф,.,+,|,⊙},分别表示空协作关系、顺序关系、选择关系、并发关系、无序关系。
下面给出其巴科斯范式及具体解释:
A表示一个协作过程,也可以是一个无协作关系的原子认知类或知识服务单元。
A 1 . A 2 表示顺序协作关系,先执行A 1 ,再执行A 2 。
A 1 + A 2 表示不相容的选择协作关系,A 1 、A 2 有且仅能有一个知识呈现。
(A 1 | A 2 )表示并发关系,是一种相容选择协作关系,A 1 、A 2 可以同时执行。
A 1 ⊙A 2 表示A 1 、A 2 两个过程需要协作,但在执行时间顺序上是无序关系,即A 1 ⊙A 2 = A 1 . A 2 + A 2 . A 1 。
【定义 3-5】 协作过程属性定义:协作过程属性包括过程的目的、范畴、前置条件集合、后果集合、包含子过程集合,分别记为goal、content、precondition、postcondition、subpro。过程类的目的、范畴属于数据属性,数据类型为字符串型;前置条件集合、后果集合为协作类集合,描述了该协作过程类在协作上下文中的环境信息;子过程集合描述了该协作类的细化过程信息,是一个二元组,subpro={subprocesses,context},分别描述了子过程类及类间协作关系。
【定义 3-6】 知识协作过程类与认知协作过程类间关系:知识协作过程类与认知协作过程类间关系(cog_attri)描述了某知识协作过程在认知协作过程中的归属关联关系。
以上为过程类的横向关系,在介绍过程类的纵向关系前,先进行两个基本定义:
【定义 3-7】 过程等价:A≡B,iff. precondition(A)=precondition(B),并且post condition(A)=postcondition(B)。
【定义 3-8】 过程包含:
式中,∪!C k ≡C 1 ! C 2 !… C k ,!∈ Co _ set ,*∈ Co _ set ,⊂ p 表示两个过程类之间的包含关系。
【定义 3-9】 组成关系(part of):
它表征了两个过程类间的分解、细化,并且这个关系具有传递性,即
【定义 3-10】 子类关系(subclass of):
它表示了两个类间关系的具体化,是一种过程分类角度的细化。
为了能自动生成知识协作过程,我们定义了协作过程本体的公理体系。该公理体系主要包括两种扩展继承关系:一种是认知协作过程的扩展式继承关系,一种是从认知协作过程到内容协作层的扩展式继承关系。
认知协作过程的扩展式继承是对抽象认知过程的细化,其扩展式继承是以组成关系和子类关系为基础展开的。
【定义 3-11】 认知协作过程的扩展式继承关系:
认知协作过程的扩展式继承关系是{→| Cng→Cng},并且符合以下条件的最小集合:
(1)
subclass of P
1
,则称
是P
1
的扩展式继承。
(2)P 11 part of P 1 ,P 12 part of P 1 ,并且P 11 !P 12 ≡P 1 ,则称P 11 !P 12 是P 1 的扩展式继承。!∈Co_set,表示任意协作关系。
(3)P 1 *P 2 ,若P 11 !P 12 是P 1 的扩展式继承,则P 11 !P 12 *P 2 是P 1 *P 2 的扩展式继承。*表示发生在父过程类间的任意协作关系,*∈Co_set。
(4)P
1
*P
2
,若
subclass of P
1
,则
*P
2
是P
1
*P
2
的扩展式继承。
有限次使用以上四条规则,得到的新协作过程是原协作过程的扩展继承。
其中,P
1
、P
2
、
、P
11
、P
12
∈Cng
从第(3)和第(4)条可以看出,在父过程的某子过程被扩展继承后,其间协作关系保持不变,并且可以仅扩展部分父类协作过程。
从认知协作过程到内容协作过程层的扩展式继承关系,不同于认知协作过程的扩展式继承,它是具体对象化认知过程,赋予认知协作过程具体的认知对象内容,对认知协作过程进行派生、分解等具体化工作,以生成某一类知识协作过程。这类扩展关系是以内容协作过程类和认知协作过程类之间的属性关联而发生的。我们的内容协作过程类有“认知上下文(cog_attri)”属性,其值域是认知协作过程类,表明内容协作过程类和认知协作过程类之间的归属关系。通过这个“认知上下文”属性,可以推理得到从认知协作过程层到内容协作过程层的扩展式的继承关系。
【定义 3-12】 从认知协作过程到内容协作过程层的扩展式继承关系:
从认知协作过程到内容协作过程层的扩展式继承关系是{→ c | Cng→ c Cnt},符合以下条件的最小集合:
(1)存在P 1 ,如果cog_attri(P 1 c ,P 1 ),并且cog_attri(precondition(P 1 c ),precondition(P 1 ))&&cog_attri(postcondition(P 1 c ),postcondition(P 1 )),则称P 1 c 是P 1 到C内容层协作关系的扩展继承。
(2)存在P 1 ,如果cog_attri(P 11 c ,P 1 )&& cog_attri(P 12 c ,P 1 )&& cog_attri(P 1 k c ,P 1 ),并且P 11 c !P 12 c !…P 1 k c 符合资源分类(内容)知识C的关联关系,cog_attri(precondition(P 11 c !P 12 c !…P 1 k c ),precondition(P 1 ))&&cog_attri(postcondition(P 11 c !P 12 c !…P 1 k c ),postcondition( P 1 )),则称P 11 c !P 12 c !…P 1 k c 是P 1 到C内容层协作关系的继承扩展。!∈Co_set,表示任意协作关系; k 为任意正整数。
(3)存在P
1
*P
2
,如果P
11
c
!P
12
c
!…P
1
n
c
是P
1
到C内容层协作关系的扩展式继承,必须对P
2
进行C内容维度的扩展,即
P
2
c
或∪!
P
2
ck
是P
2
在C内容层的扩展式继承,则P
11
c
!P
12
c
!…P
1n
c
* P
2
c
或P
11
c
!P
12
c
!…P
1
n
c
*
是P
1
*P
2
在内容层的协作关系扩展。*∈Co_set,表示任意协作关系;
n
和
k
为任意正整数。
有限次使用以上(2)和(3)两条规则,得到的C内容协作关系构成了认知协作类在内容层的扩展继承关系。
其中,P 1 、P 2 ∈Cng,P 11 c 、P 12 c 、P 13 c 、P 2 c ∈Cnt。
以上是协作过程类间的关系定义及公理。在实际使用中,过程实例根据其与过程类间的类属关系,动态生成知识协作过程实例,以适应个性化或特定模式认知的知识学习需求。
网络技术的发展,使得网络上承载了越来越多的资源;对资源进行有效的整合和利用,是提升知识通信中资源服务质量的重要举措。而对这些资源建立有效的语义标注体制,是实现网络知识资源共享的关键前提。本节从三个层次对网络资源的语义标注进行了研究,实现了信息互联互通、知识互联和知识协作,为后续知识通信的知识交互及共享奠定了基础。