购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

5.3 数据科学理论的基础概念和基本特质初探

在摸索以上数据生产要素理论和数据创新理论的过程中,我们发现对于两者更为准确的定位是数据中观理论和数据微观理论,必须要建立一个较为完整和宏观的数据科学体系,前两者都要在一个宏观理论的基础上才能更加深入和拓展。

我们认为,如果放大至数据科学宏观理论,就必须着眼于3点:一是要有一个广泛和详尽的基础概念;二是要了解数据的基本属性;三是要以全新的思想和眼界,去观察并发展一个近乎于全新的科学体系。

5.3.1 广义数据的定义

数据的原有基础概念是科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等方向的数值,或者是进行各种统计、计算、科学研究或技术设计等所依据的数值。

在信息技术高速发展的今天,各个行业对数据的要求日益发生质变,数据原有的基础概念已经不能满足社会发展的需要,必须及时地加以修正和扩展。我们的初步定义如下。

广义数据指的是在自然界和人类文明的发展中,所有物质和意识的存在,当以某种形式或语言记录及传承下来时,都会形成可见和不可见的载体或媒介,这些载体或媒介所承担的内容存在,都将视为广义数据。

而原有的数据概念,我们可以定义为狭义数据。

这个概念将是数据科学的起点、基础和核心,它的生成将极大地促进数据概念本身的内涵和外延的丰富,使人类文明的延续和发展有了更强有力的武器,甚至可以全面覆盖语言和文字的历史包容量和意义。而对于科技发展已经支撑新生价值80%的当今社会,广义数据这个理念和思想,一定会给人们以巨大的想象空间,进而融合、激发、再造出更多的创新思想、生产方式和新型的生态链、生态圈。

5.3.2 数据的基因特质

数据有许多人类没有关注到的特性,最鲜明的特性是数据具备包括基因特质的7大特性。

1.数据的准确性、实时性、全面性

这是原有狭义数据概念就包含的属性,但这些属性在原有概念中没有占据重要地位,通常以样本数据和事后分析来预估和推理事物的发展。在大数据发展的今天,这3个属性的功能和意义都极大提升,甚至将成为人们永久奋斗的目标。

2.数据的可复制性和继承性

在广义数据概念中,随着数据自身主观和客观的演变,复制性和继承性的含义也将被无限放大。这是一个能令人引起无限遐想的理念。

3.数据的可见和不可见的规律性

可见和不可见的规律性,彻底打破了数据的传统理念,使数据上升为既是物质存在又是意识思想的客观事物。

4.数据的跨界、跨领域的关联性和重组性

跨界、跨领域的关联和重组,将是数据自身发展的天性。随着技术的进步,这种数据主观或者客观被无限放大的蔓延方式,将是创新与创造最直接的发展路径,但人类也将面临前所未有的挑战和危机。

5.事物的泛数据化倾向特性

所有事物在理论上均可数据化,这是数据科学的基础概念和终极目标。从某种意义上理解,数据科学将是所有自然科学和社会科学的载体和媒介,是一切科学传承的外在表现。

6.数据的安全性、可靠性

广义数据使人们有了巨大无比的想象空间,但由于安全性和可靠性所带来的问题也将成为文明发展最大的衍生物,这将是目前数据时代面临的最大障碍。

7.数据的突变性及裂变性

裂变是病毒式发展的基本路径,有助于速度的实现。但突变是数据最可怕的敌人。随着人工智能等各项信息技术的发展,突变性将越来越不可发现和不可预见。从生物界可以看出,突变中99%的结果都是恶变,仅有1%的结果是进化。但这个进化一定是革命性的。可以预言,广义数据也具有这种属性,需要我们高度关注和严防死守。

信息系统是数据应用的平台和工具,在实际运行中对系统的各种需求,其实质就是人们对数据的需求。数据作为信息的最基础的细胞要素,是目前所知的、现实存在的、最小物质的规律性信息单元,其作用是决定性的。如果人们将这个最小单元进行科学化、系统化的研究与丰富,发现和应用好数据的规律和属性,这将极大地促进人们了解和把握事物的发展规律,为诸多预言提供理论依据和佐证,这是新型信息化建设的基础和核心。

利用这个理论,我们就可以解释为什么新一代信息技术会以超出想象的速度在发展,其本质就是数据的重组、隐含性展现和突变等属性在发挥积极的作用,进而创造出令人咋舌的新生事物和发展模式。 u9FJqPUcLEjLsEgvJv7vFdq6sFHLcOyHyz7vufF7QezcsBgqkpzs/74RDhzSM1+K

点击中间区域
呼出菜单
上一章
目录
下一章
×