DIKW是一个英文首字母缩略词,代表着数据(Data)、信息(Information)、知识(Knowledge)和智慧(Wisdom)四个层次。每个层次都至关重要,值得深入研究。现在,这个研究领域变得越来越深奥,区分这四个概念已经成为该领域的核心问题,即知识是如何从数据和信息这两个相似但又彼此独立的概念中衍生出来,或以其他方式与它们相关联的,以及这三个概念与智慧这一概念有何关系,后者是靠知识加持并在岁月中积淀的思想的终极表达,前三者之间的相互作用完全可以在此进行解释。然而,在一个数据、信息和知识规模庞大、呈指数级增长且严重过剩的世界中,智慧的问题以及对其未来的担忧或许最好留到本书最后一章来讨论。
这么做是符合逻辑和理性的,也是有正当理由的。人类智慧的未来存在问题,从某种意义上说,这是我撰写本书的首要原因。若想评估那些想成为智者的人所需的条件,我们就需要对那些据说使智慧得以存在的因素加以讨论。数据和信息是知识构建的两个先决条件。如果没有数据和信息,我们就无法构建知识。如果不首先评估知识的构建以及数据和信息的作用,我们就无法对智慧问题进行讨论,也无法对智慧的未来做出预测。那么,什么是数据?什么是信息?就这两点而言,知识又是什么呢?再次提出第三个问题时,我有些迟疑,但为了完整起见,我还是这样做了。
在艾略特无意中催生的这种分层解释中,数据位于金字塔的底部,可以算作基本的构件,本身没有意义,更像是信息的符号或信号。信息位于数据之上,是有用的数据。信息是从数据中推断出来的,收集的数据越多,从中推断出来的信息就越完整。我们获取数据并对其进行分析。这些数据代表什么人?他们出现在哪里?有多少人涉及其中?相关事件是什么时候发生的?通过这种提问的方式对原始数据进行处理,信息就会显现出来,就像孩子通过连点画出一幅画或者通过数字涂色创作一幅肖像画一样。
有时,未经过滤或由太多数据构成的信息会让人目不暇接。人们可能会说数据太多了,但不会说知识太多了。人们也会说信息太多了,这已经成为一种司空见惯的现象、一种模因 ,也可以说是一种陈词滥调。关于这一点,有一个很有名的例子。很久以前,英国学者兼神学家罗伯特·伯顿(Robert Burton)在《忧郁的解剖》( The Anatomy of Melancholy )中大肆抱怨信息过多。该书出版于1621年,但在今天似乎仍有现实意义。伯顿在书中谈到信息过剩造成了巨大的混乱:
我每天都听到新的消息,还有那些常见的传言,后者涉及战争、瘟疫、火灾、洪水、盗窃、谋杀、屠杀、流星、彗星、幽灵、异兆、幻影,城镇被占领,法国、德国、土耳其、波斯、波兰等国的城市被围困,每天的集结和准备,等等,都是这个动荡的时代可能会有的传言,还有战斗、杀戮、决斗、沉船、海盗、海战、和平、联盟、战略以及新的警报。每天都有许许多多纷乱的誓言、愿望、行动、法令、请愿、诉讼、抗辩、法律、公告、抱怨、冤屈传到我们的耳朵里。每天都有新书、小册子、信息简报、故事、各种书籍的完整目录,以及哲学、宗教等领域中新出现的悖论、观点、分歧、异端、争议等。现在传来了婚礼、化装舞会、哑剧表演、娱乐活动、庆典、使团、比赛、战利品、凯旋、狂欢、体育活动、戏剧的消息,然后画面一转,又传来了叛国、骗局、抢劫、各种重大恶行、葬礼、下葬、王室成员死亡、新发现、远征的消息,既有喜剧性事件,也有悲剧性事件。今天我们听说新的贵族和官员被任命,明天又听说权贵被罢免,然后又听说新的荣誉被授予某人;有人被释放,有人被监禁;有人成功,有人失败;有人发财了,而他的邻居破产了;今天丰衣足食,明天缺吃少穿;有人跑着,有人骑马;有人争吵,有人笑,有人哭;等等。我每天都会听到诸如此类的私人消息和公共消息。世间的英勇和悲惨中充斥着欢乐、傲慢、困惑、忧虑、单纯、邪恶、狡诈、欺骗、坦率和正直,相互交织,不断呈现。我勉强过着严格意义上的私人生活。
在有了大量数据以及从数据中推断出的信息之后,知识便应运而生。那些奉行某种思维经济的人认为,知识是经过处理和加工并置于某种背景中的信息,是得到充分理解的信息。知识完全是主观的,一个人可能会声称对某件事有所了解,拥有相关知识,另一个人则可能对完全不同的事物有所了解,对前者所知道的事情一无所知。那么,第一个人所知道的事情是否会因第二个人不知道而变得不是知识呢?不为他人所知的知识是否会像无人踏足的森林中倒下的树一样遭到忽视呢?有些研究者毕生都在思考这样的问题。在信息科学领域,有些人认为知识是一种难以捉摸的东西,被过度定义、过度思考、过度分析。知识显然与数据和信息有所不同,更易于辨识而非描述,更容易用范例来解释。或许知识只是一种假设、幻想和理论,但又似乎为真。
假设有这样一页纸,上面印了两张图片。第一张图片中有一张桌子,桌子上摆放着一本书。第二张图片中是同样的桌子和同样的书,只不过书掉到了地上,看起来有些凌乱。这页纸上没有其他内容,没有标题、文字或说明。这两张图片只是呈现了纯粹的数据,没有传递任何有用的信息,没什么意思。这就是数据,仅仅是缺乏意义和理解的信号、符号、标志和密码。
接着,我们将这两张图片换成一个简短的电影片段,现在就有了桌子和书的动态图像。一只手出现在画面中,把书从桌子上推下来,让它掉到地上。尽管没有字幕或说明,但这段视频比前面两张图片提供的信息多一些,因为它似乎让观看者有了一定程度的理解。我们现在知道了那本书是怎么掉到地上的。换句话说,我们掌握了一定程度的事件信息,从而将两张静态图片提供的两个数据点联系在一起,但仅此而已。我们现在的处境与4个世纪前的伯顿差不多,信息纷至沓来,其含义却无法确定。这些信息可能并不是原始数据。实际上,它们是未经处理的信息,是我们一眼就能看到的事实的总和,是数据编织成的可识别的图案,就像棉线或羊毛线可以编织成一匹布一样,它本身还不是一件衣服,而是各种成分、组分、信号、符号、数据的集合。
最后,画面变大,我们看到了那个用手把书推到地上的人,还看到了书名。新增加的这两条信息也许本身并不是特别有用,却能将前面两个数据点拼接成一个完全可以理解且合理的故事,为视频中所发生事件的后续展开提供了理由和解释。既然知道是谁把什么书推到了地上,我们就掌握了所有的要素,可以说我们现在拥有了关于这件小事的知识。我们知道了事件发生的背景,在一定程度上确定了是谁把书推到地上的,确定了是什么东西发生了什么事情,也确定了事件发生的地点。如果画面中某个地方有时钟或时间戳,我们就可以从这些额外的信息碎片中推测出事件可能发生在何时。这样一来,我们所不知道的就只有事件的起因了。最终了解事件起因本身就是最终智慧的根源,或许我们离它还很遥远,但这个概念为事件的展开提供了理由,并使贱金属般的普通知识变得越来越珍贵。