购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 数据、信息及知识

1.1.1 知识定义及特征

为了解释与知识相关的服务和系统的含义,首先需要解释一个问题:何为知识?

知识是符合文明方向的,人类对物质世界及精神世界探索的结果总和。知识,至今也没有一个统一而明确的界定。但知识的价值判断标准在于实用性,以能否让人类创造新物质,得到力量和权力等为考量。有一个经典的定义来自柏拉图:一条陈述能称得上是知识,必须满足三个条件,它一定是被验证过的,正确的,而且是被人们相信的,这也是科学与非科学的区分标准。由此看来,知识属于文化,而文化是感性与知识上的升华,这就是知识与文化之间的关系。有关于知识的悖论是:知识如果不能改变行为,就没有用处;但是知识一旦改变了行为,知识本身就立刻失去意义。

——《未来简史》 [1]

知识是人类认识的成果,是在实践的基础上产生的,又是经过实践检验的对客观实际的反映。人们在日常生活、社会活动、科学研究、生产实践中获得对事物的认识,其中可靠的成分即知识。

——《中国大百科全书》 [2]

“信息”一词特指相对“原始的”、特殊的和实际的,以“知识”表示通过深思熟虑的、处理过的或系统化的(解识)。

——《知识社会史》 [3]

知识的定义是一个很复杂的哲学问题,目前很难给出一个准确的、权威的关于知识的定义,但对于知识的主要特征,基本可以总结为以下几点。

(1)知识必须是有确定指向、确定含义的,不能是模棱两可、似是而非的。比如“1+1=2”,受众可能不知道何为“1”,或者不知道何为“+”,甚至连“=”代表什么意思也不知道,而“1+1=2”这个陈述对他来讲甚至不能称为知识。但是,一旦受众对于“1”、“+”、“=”和“2”有了正确的认识,那对这个知识就不会产生误解同样,两个不同的受众,对这个知识也会产生不同的理解,所谓“1000个人心目中可能有1000个不同的哈姆雷特,但1000个人心目中只可能有1个‘1+1=2’”,因而可以在此基础上,根据共同的认知进行沟通,并进一步分享和传递更多的、更深层次的知识,这是人类互相沟通和理解的重要手段。

反过来讲,诸如“张三是个胖子”这种陈述,就不能被称为知识,因为不同的受众很可能会认识不同的张三,并且不同的人对于“胖子”这个概念的认识也不一样,因此“张三是个胖子”这种陈述只能被看作信息,而非知识,二者处于完全不同的概念层次上,个中区别我们接下来会进行进一步说明。

(2)知识必须是被验证过的、正确的,即科学的,而不是虚假的、错误的、非科学的。可验证性决定正确性,进而升华为科学性,与其相对的,不可验证的、虚假错误的、非科学的信息,就不能被称为知识。比如,对于“太阳每天都从西边升起,东边落下”这个陈述,在“太阳”“西”“东”“升起落下”这些概念具备正确的定义的前提下,就不可能称为知识,因为它既是反直觉的、反经验的,也是不可验证的,进而是虚假错误的、非科学的。

(3)知识必须是客观世界在人脑中的主观映像。这个特征具有两层含义,第一,任何知识最初的起源必定是客观世界,因为知识是相对于人类来说的,没有人类的概念,没有人类受众,任何信息都不能被称为知识,而人类是存在于客观世界,与客观世界互动,观察着客观世界的,因而人类得到的任何信息都来自客观世界,这其中的知识也必定源于客观世界;第二,知识必定是主观的映像,即被人类所知道、所理解、所认同的信息才能被称为知识,其不可能凭空存在,必定要经过观察、提取、理解等必要的过程,达到从客观到主观,从客观世界到人脑认识的升华。就拿“1+1=2”这个知识来说,没有人会觉得这个知识是凭空出现的,必定是客观世界的具体体现,比如“1就是只有1个,是从没有到有的最初结果状态,而1个苹果和1个苹果放在一起就变成了2个苹果”这种客观世界的现象,与此同时,“2个在一起的苹果”如果没有人类去观察,那么永远只能是“2个在一起的苹果”,不可能有“1+1=2”这种抽象的、提炼后的知识出现。而人脑中也不会永远只有“1个苹果加1个苹果变成了2个苹果”这个知识而没有“1个橘子加1个橘子变成了2个橘子”这一类的知识的情况出现。

(4)知识是分种类、分层次的,其中分层次尤其重要,它决定了知识由简单到复杂、由直观到抽象、由感性到理性的升华过程。比如“1个苹果加1个苹果就是2个苹果”这个陈述本身就是知识,因为它满足关于知识的上述三个特征(1个苹果加1个苹果只能是2个苹果,不可能变成3个,并且在任何时候都是2个,因而具有确定性;将1个苹果和1个苹果放在一起,重复这个操作无限多次,每次得到的结果都会是2个苹果,因而具有可验证性,同时也具有客观性和主观性)。与此同时,“1+1=2”这个陈述很明显有别于“1个苹果加1个苹果就是2个苹果”这个陈述,因为前者是后者的总结、提炼、升华,在这里我们就能够说“1+1=2”和“1个苹果加1个苹果就是2个苹果”是不同层次的知识。

知识的层次化是很重要的特征,它的重要性体现在:第一,知识的层次化特征决定了知识加工处理的必要性,即如果知识是不分层次的,那么我们只需要实现一个扁平化的知识系统就可以了,无须在此基础上对知识进行进一步加工,即使加工了也只可能是对知识的另外一种转换,比如从“1个苹果加1个苹果就是2个苹果”到“1个橘子加1个橘子就是2个橘子”这样的转换,但对于这种转换,我们直接观察客观世界就可以得到一样的结果,额外的加工过程是没有意义的;第二,知识的层次化特征一定程度上决定了知识服务和对应知识系统的价值,即对知识的不同的层次化操作和服务,会使用户对这种知识服务和对应的知识系统产生不同的评价。比如知识系统A提供的知识服务能够直接从“1个苹果加1个苹果就是2个苹果”这个知识提炼到“1+1=2”这个知识,而知识系统B提供的知识服务需要从“1个苹果加1个苹果就是2个苹果”这个知识提炼到“1个客观物体加1个相同的客观物体就是2个相同的客观物体”这个知识,进而再提炼到“1+1=2”这个知识,对于想直接知道“1+1=2”这个知识的用户来说,知识系统A显然比知识系统B更高效,能提供更加优质的知识服务。

具备了上述四个特征的、被称为“知识”的概念,就是我们整本书中关于“知识”的介绍涉及的内容。

1.1.2 知识升华过程

相较于知识而言,数据和信息具有更加宏大的定义范畴,我们对“数据”定义如下。

简单地说,数据就是我们以某种方式观察客观世界所得到的信息的最基本表现形式,就像光、热、声音、味道等,这些最基本的数据能够以各种各样的方式被感知、表示和存储。

信息,就是数据在传播过程中的另外一种形态,具备在空间及时间的不同位置彼此传递、在各个不同感知主体之间传递、在不同的形态之间转换的能力,数据只有在传递的过程中才能够被称为信息。比如,存储在计算机存储介质中的数据,在人们需要提取它的时候,从计算机主体传递到了用户的认知系统,在这个过程中,被传递的这部分数据就可以被称为信息。数据的可传递性是普遍的,这个世界上绝大多数数据在某种特定的条件下都可以成为信息(少数极端情况下除外,比如宇宙黑洞核心点物质的部分物理属性,宇宙起源时的部分物质属性等)。因此我们可以说,信息集合是数据集合的动态子集,所有信息都是数据,但并不是所有数据在任何时候都是信息。

而知识,就是人类对数据信息进行加工处理所得到的结果,这种加工处理方式中最典型的就是归纳(Induction)和演绎(Deduction),前者表示将局部的、特定的、有限制性的数据转换为全局的、普遍的、无限制性的数据,比如从“1个苹果加1个苹果就是2个苹果”到“1+1=2”,就是一个典型的归纳过程,在逻辑上,我们将其理解为一个自下而上的过程。演绎则表示一个反向的数据转换过程,从“1+1=2”到“1个橘子加1个橘子就是2个橘子”,从层次的上到下,一般到个别。

数据、信息、知识三者的关系:从涵盖范围来讲,所有的知识都是以数据形态存在的,但并不是所有的数据都是知识,只有满足知识的四个特征的数据才能够被称为知识,而这种关系是静态的,一个数据一旦被判定为知识,在有限的空间和时间之内,这种属性就不会变化。比如“1+1=2”这个数据在我们人类所认知的世界的任何空间和时间领域之内永远都会是知识,但“1+1=3”这个数据就永远不会成为知识。相对而言,数据和信息的关系就具有动态性,如前文所说,几乎任何数据都有可能成为信息,但只有在传递的过程中才能被称为信息,而任何情况下信息的表示形式都是数据。需要指出的是,虽然所有的知识都是以数据的形式处理,且数据都是由直接观察客观世界得到的,但并不是所有的知识都能够从观察客观世界而直接得出,比如“1+1=2”这种信息,必须通过对客观世界数据的归纳才能够得到,这体现了知识的层次性。

而信息和知识的关系,同数据和知识的关系类似,满足知识的四个特征的信息可以被称为知识,但知识只有在传递过程中才能成为信息。比如本书的内容,可以被称为知识,以数据的形式保存在书中,而在读者阅读这本书时,书中的知识以信息的形式传递到读者的脑中。

我们将数据、信息、知识三者的关系,以图的形式表达出来。图1.1所示为数据、信息、知识三者的关系。

图1.1 数据、信息、知识三者的关系

从数据到知识,我们需要经历这样一个过程:从客观世界观察到一些数据,存在于我们的主观认知中,经过人类的主观思考,对数据进行初步加工和验证,将其中一些数据直接当成知识去运用,这种运用包括当作信息进行传播,或者指导人类活动等。对于另外一些数据,需要人类进行归纳和演绎的处理过程,将片面的、局部的知识归纳为全面的、涵盖客观世界其他部分的知识,并进一步演绎为其他局部的知识,从而指导人类活动或作为信息进行传播。

一方面,只要符合知识的四个特征的数据都能被称为知识,意味着很多简单的、浅显的、直观的数据都可以被称为知识;另一方面,很多知识并不能够直接通过观察客观世界获得,需要我们对现有的数据进行进一步的加工,主要是归纳和演绎,才能够得出我们需要的高层次的知识,而在这种过程中,知识必定要以信息的形式,经过传递的过程才能实现,无论从知识的存储系统到达用户,还是从一个用户到达另外一个用户,还是在系统之间。建立在以上两个方面的基础上,通过知识的传递过程,知识系统和知识服务的重要性得以体现出来。

从数据到信息,从信息到知识,从低层次的知识到高层次的知识,这一类的过程代表了知识的升华过程。在这个过程中,知识逐渐复杂,逐渐变得难以直观理解,其规模也变得庞大,在这种情况下,我们需要特定的知识系统和知识服务来帮助用户对知识进行学习、理解、存储和传递。

在本书中,除了明确说明其存在歧义或者不真实值,所有被称为“信息”或者“知识”的概念都同时具有信息和知识的属性。一方面,任何被提起的数据都天然具有信息的特性,因为只要被提起,就等同于正在进行从知识系统到人类认知的传递过程;或者说,任何存在于知识系统的数据的最终归宿都是被传递,任何数据,不论真假与否,不论层次高低,在无限的时间、空间之内,都会被传递,毕竟创造这个数据的目的就是使其被传递。另一方面,在本书中,当我们提到数据的时候,由于这种数据会被知识系统所存储和管理,我们默认其具有知识的相关属性,即能够被称为知识,除非提及其值不真。 L7SlZddHWqu+L+gsGPTFRRgG0dITg4cwEF8cHRTqk2jYQCpHQPUut0+6L1SwGrT4

点击中间区域
呼出菜单
上一章
目录
下一章
×