购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

二 数据要素的技术特征

(一)以“大数据”为存在形态

数据要素以“大数据”为存在形态,具有大数据所具备的技术特征。IBM公司提出的规模海量(Volume)、来源和类型多样(Variety)、流转快速(Velocity)、价值巨大(Value)的4V特征得到广泛认可。

1.规模海量,完整性增强

巨大的数据规模是数据成为生产要素的内在要求。在数字经济时代,政府、企业乃至个人都是数据的“一次生产者”,数据在互联网、移动终端以及传统文字、音视频等线上和线下的媒介中产生,爆发势不可当。Hilbert和Lopez试图估算人类所创造、存储和传播的一切信息,1986~2007年,人类大约存储了超过300EB的数据,其中93%为数字数据 [1] 。据国际机构Statista预测,全球数据产生量将在2020年超过50ZB

巨大的数据量增强了数据要素的完整性。物理学家Toyabe等 [2] 认为,信息而非原子才是一切的本原;换言之,本质上世界是由信息构成的。通过数据化,人们能够全面采集和量化有形物质和无形物质,并对其进行处理。数据要素的完整性使得传统随机采样(即样本=随机抽样)和统计推断的分析范式日益弱化,而通过采集、处理与某个特定现象有关的所有数据(即样本=总体)进行总体性分析将成为主流。

2.来源和类型多样,异质性凸显

数据要素来源复杂、类型繁多。随着互联网、移动通信、传感器、智能终端等技术的飞速发展,数据要素的来源、类型和格式越来越复杂多样,不仅包括传统的、结构化的数据,还包括记录和量化的文字、图像、音频、方位、沟通、行为、感知、流量、传感器数据等原始的、半结构化或非结构化的数据。

数据要素的多源性和类型多样性极大地保留了数据中所蕴含信息的异质性,也降低了数据要素之间的可替代性。在现实中,几乎没有两组数据要素是完全一样的,或者可以相互替换,很多数据要素组合中的任意一条数据都是不同的。类似专利等无形资产,更是高度异质性的,彼此可替代性弱。 但是,数据要素的异质性同时为人们提供了更多价值创造的可能性,辅以“模糊”数据处理技术发展,满足定制的、个性化的需求,以使人们从纷繁复杂的数据中受益。

3.流转快速,时效性提升

数据要素的流转快速包含数据产生快和数据处理快两个层面。一是数据产生快。与印刷机问世带来的信息爆炸相比,1453~1503年,欧洲的信息存储量在50年间增长了一倍,而如今数据量每3年将增长一倍 。据国际机构Statista预测,全球数据量在2017年以来的年增长率均超过20%

二是数据处理快。目前,对于数据实时性和智能化的要求越来越高。大数据处理技术以实时数据处理、实时结果呈现为导向;数据挖掘技术也趋于前端化,即提前感知和预测。数据要素的流转速度加快,时效性将大幅提升。

4.价值巨大,随时效性和真实性增加

合理利用数据要素带来的价值回报很高。若以大数据市场 的收入规模来衡量数据要素的价值,据国际机构Statista预测,全球大数据市场的收入规模将在2020年达到560亿美元,2018~2020年的年均增速为15.47%;在各细分市场中,大数据相关服务的市场规模最高,到2020年将达到210亿美元,2018~2020年的年均增速为14.56%

数据要素的价值随其时效性和真实性的增强而增加(见图1)。数据时效性越强,据此做出的市场判断、商业行动和政府决策等越及时,也越能避免由于时滞产生的风险,数据要素所体现或创造的价值就越高。同样,从数据中提取的真实信息越多,越有助于发现规律,从而促成正确的决策和行动,数据所体现或创造的价值也越高。

图1 数据要素的价值与其时效性、真实性的关系示意
资料来源:〔美〕托马斯·埃尔等著《大数据导论》,彭智勇、杨先娣译,机械工业出版社,2020。

(二)以网络设施为流动载体

随着互联网、移动互联网、物联网、工业互联网、5G等信息技术的突破和信息基础设施的完善,云网端一体化程度不断提升,数据采集、存储和处理能力也得以不断突破,网络空间成为继物理世界之后人类新的重要活动空间。数据要素则成为连接物理世界和网络空间的关键纽带,网络基础设施则是海量数据生产、传输及存储及交叉应用的主要通道和载体,提升物与物、人和物、人同人之间实时数据交换和通信,促进数据资源的高速流动和高效汇聚,提升了数据资源采集、积累和配置效能,为人、机等联网主体成为数据生产者提供技术和物质支撑,使得数据要素生成、存储、流转、交易、使用、管理实现高度网络化互联。华为《全球产业展望GIV2025》白皮书指出,2018~2025年,预计全球互联网用户数将从43.9亿增长至62亿,所有联网设备总数将从340亿增长至1000亿。网络基础设施的不断完善,联网用户和联网规模的快速增长,带动全球数据资源总量和数据流量迅速增长。

表2 全球数据流量规模增长

(三)以拓展聚合为利用方式

数据具有来源渠道多样、类型层次复杂的特点,既有传统的、结构化的数据,还包括记录和量化的文字、图像、音频、方位、沟通、行为、感知、流量、传感器数据等原始的、半结构化或非结构化的数据。数据这种多源、多维、复杂的特性,在保留了数据中所蕴含信息存在异质性的同时,有效降低了数据要素之间的可替代性,但在很大程度上也提升了数据要素应用的拓展性,为满足定制化和个性化的需求提供了可能,也对聚合利用提出了更高的要求。

与土地、劳动力和资本等传统生产要素的拓展性相对有限不同的是,数据要素具有更强的拓展性。依托大数据、云计算、人工智能等高度可拓展的技术架构,在大数据、云计算、超大型数据中心和服务器、人工智能、物联网等信息基础设施的支持下,可以对人类活动所产生的几乎所有的结构化和非结构化的数据,实现大规模数字化编码、存储、加工、处理、深度分析和聚合应用,转变为生产性资源,增进人类社会的知识积累和认知能力,降低生产和交易成本,提升生产和流通效率,并创造更高的经济社会价值。

数据要素的高聚合性有力支持了其创新性利用,包括:数据再利用;数据重组,即通过与其他数据集整合,碰撞出新的利用价值;数据扩展,即寻求单一数据集的多种用途;数据废气,即利用数据“噪声”训练和优化数据集;以及开放数据等。 f5nJHe3ybdO02J9p4fslVNeoOBOgFRyWgYITBx/fs2n3hCRaIiT4625iBj/TeDe0

点击中间区域
呼出菜单
上一章
目录
下一章
×