知识是人们在长期的生活及社会实践中、在科学研究及实验中积累起来的对客观世界的认识与经验。人们把实践中获得的信息关联在一起,就形成了知识。一般来说,把有关信息关联在一起所形成的信息结构称为知识。信息之间有多种关联形式,其中用得最多的一种是用“如果……则……”表示的关联形式,它反映了信息间的某种因果关系。例如,在我国北方,人们经过多年的观察发现,每当冬天要来临的时候,就会看到一群群的大雁向南方飞去,于是把“大雁向南飞”与“冬天就要来临了”这两个信息关联在一起,就得到了如下知识:如果大雁向南飞,则冬天就要来临了。
知识反映了客观世界中事物之间的关系,不同事物或者相同事物间的不同关系形成了不同的知识。例如,“雪是白色的”是一条知识,它反映了“雪”与“白色”之间的一种关系。又如“如果头痛且流涕,则有可能患了感冒”是一条知识,它反映了“头痛且流涕”与“可能患了感冒”之间的一种因果关系。在人工智能中,把前一种知识称为“事实”,而把后一种知识,即用“如果……则……”关联起来所形成的知识称为“规则”。
知识是人类对客观世界认识的结晶,并且受到长期实践的检验。因此,在一定的条件及环境下,知识一般是正确的。这里,“一定的条件及环境”是必不可少的,是知识正确性的前提。任何知识都是在一定的条件及环境下产生的,因而只有在这种条件及环境下才是正确的。例如,牛顿力学在一定的条件下才是正确的。再如,1+1=2,这是一条妇孺皆知的正确知识,但它也只是在十进制的前提下才是正确的,如果是二进制,它就不正确了。
在人工智能中,知识的相对正确性更加突出。除了人类知识本身的相对正确性外,在建造专家系统时,为了减少知识库的规模,通常将知识限制在所求解问题的范围内。也就是说,只要这些知识对所求解的问题是正确的就行。例如,在动物识别系统中,如果仅仅识别虎、金钱豹、斑马、长颈鹿、企鹅、鸵鸟、信天翁这7种动物,那么,知识“IF该动物是鸟AND善飞,THEN该动物是信天翁”就是正确的。
由于现实世界的复杂性,信息可能是精确的,也可能是不精确的、模糊的;关联可能是确定的,也可能是不确定的。这就使知识并不总是只有“真”与“假”这两种状态,而是在“真”与“假”之间还存在许多中间状态,即存在“真”的程度问题。知识的这一特性称为不确定性。
造成知识具有不确定性的原因主要有以下几个方面。
① 由随机性引起的不确定性。由随机事件所形成的知识不能简单地用“真”或“假”来刻画,它是不确定的。仍以“如果头痛且流涕,则有可能患了感冒”这一条知识为例,其中的“有可能”实际上就是反映了“头痛且流涕”与“患了感冒”之间的一种不确定的因果关系,因为具有“头痛且流涕”的人不一定都是“患了感冒”,因此它是一条具有不确定性的知识。
② 由模糊性引起的不确定性。某些事物客观上存在的模糊性,使人们无法把两个类似的事物严格地区分开来,不能明确地判定一个对象是否符合一个模糊概念;或者某些事物之间存在模糊关系,使人们不能准确地判定它们之间的关系究竟是“真”还是“假”。像这样由模糊概念、模糊关系所形成的知识显然是不确定的。
③ 由经验引起的不确定性。知识一般是由领域专家提供的,这种知识大多是领域专家在长期的实践及研究中积累起来的经验性知识。尽管领域专家能够得心应手地运用这些知识,正确地解决领域内的有关问题,但若让他们精确地表述出来却是相当困难的,这是引起知识不确定性的一个原因。另外,经验性自身就蕴含着不精确性及模糊性,这形成了知识的不确定性。因此,在专家系统中大部分知识具有不确定性这一特性。
④ 由不完全性引起的不确定性。人们对客观世界的认识是逐步提高的,只有在积累了大量的感性认识后才能升华到理性认识的高度,形成某种知识。因此,知识有一个逐步完善的过程。在此过程中,或者客观事物表露得不够充分,使人们对它的认识不够全面;或者对充分表露的事物一时抓不住本质,使人们对它的认识不够准确。这种认识上的不完全、不准确必然导致相应的知识是不精确、不确定的。
知识的可表示性是指知识可以用适当形式表示出来,如用语言、文字、图形、神经网络等,这样才能被存储、传播。知识的可利用性是指知识可以被利用,这是不言而喻的,人们每天都在利用自己掌握的知识解决所面临的各种问题。
知识表示(Knowledge Representation)就是将人类知识形式化或者模型化,实际上就是对知识的一种描述,或者说是一组约定,一种计算机可以接受的用于描述知识的数据结构。
目前已经提出许多知识表示方法,如一阶谓词逻辑、产生式、框架、状态空间、人工神经网络、遗传编码等。已有知识表示方法大多是在进行某项具体研究时提出来的,有一定的针对性和局限性,应用时需根据实际情况做适当改变,有时还需要把几种表示模式结合起来。在建立一个具体的智能系统时,究竟采用哪种表示模式,目前还没有统一的标准,也不存在一个万能的知识表示模式。