购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

信息是数据吗?

在提到数据挖掘时,我引入了另一个非常相关的术语:数据。尤其是在计算机科学界,这个术语是我们对信息概念产生模棱两可理解的一个原因。

早在1966年,计算机科学家高德纳就曾评论过,这种模棱两可的理解,本质上是一种混乱的理解。当时,计算机科学本身就是一门科学学科,它要求发明新概念并澄清旧概念。高德纳指出,在科学中,“信息”和“数据”这两个术语似乎存在一些混淆。当科学家执行一项涉及测量的实验时,引发的可能是以下四种实体中的任何一种:被测量的“真实”值;实际获得的值—真实值的近似值;值的表示;以及科学家通过分析测量得出的概念。高德纳断言,“数据”一词最适用于这些实体中的第三个。因此,对于计算机科学家高德纳而言,数据是通过以某种精确方式观察或测量所获信息的表示。因此,在他看来,信息先于数据。在实践中,信息和数据之间的关系就像信息和知识之间的关系一样模糊不清。在这里,我只能列举一些关于这种关系的不同观点。

对于著名的系统和管理科学家罗素·阿科夫来说,数据构成了观察的结果。它们是对象和事件的表示。至于信息,阿科夫想象有人问一些数据问题,然后这些数据会被“处理”(可能是由人或机器)以提供答案,而后者就是信息。因此,根据阿科夫的说法,与高德纳相反,数据是先于信息的。

对于卢恰诺·弗洛里迪来说,数据也是先于信息的,但他是在不同的意义上讨论的。根据弗洛里迪的说法,只有当系统的两种状态之间缺乏一致性时,数据才会存在。正如他所说,只要有两个变量x和y,使得x≠y,就存在数据。因此,对于弗洛里迪来说,数据是一种条件,它本身没有任何意义,只是表示差异的存在。例如,当我接近红绿灯时,我观察到的红色信号是一个数据,因为它本来可以是其他情况:黄色或绿色。

鉴于数据的这一定义,弗洛里迪将信息定义为一个或多个根据某些规则结构化且有意义的数据元素。用语言学家的行话来说,当信息同时具有语法和语义时,它就是数据。因此,我对红色交通信号的观察—一个数据—变成了信息,因为红灯的含义是“驾车者必须在红绿灯处停车”。如果我不将此动作与红灯联系起来,后者将只是一个数据。

最后一个例子,对于人工智能研究人员杰弗里·施拉格和帕特·兰利来说,数据不是观察得来的。相反,观察就是数据;更准确地说,观察到的东西被选择性地记录下来以作为数据。信息是不在他们讨论之中的。 T+N3GH9x6Z11L0cD5oXPWQOLohK+Bu9apw1Yhpbouw7aK+aJK7ul9JqNFRbkQmu9

点击中间区域
呼出菜单
上一章
目录
下一章
×