购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.3 状态类、事件类、混合类数据

2.3.1 状态类数据

我们经常会用数据来描述客观世界。首先,可以描述客观世界的实体,也就是说一个个对象,如草、花、动物、纸张、人类、蛋糕、账户等。不同的实体或者不同的对象具有各自不同的特征,如花的特征包括花名、颜色、品种、花期、形状以及味道等,再如人的特征包括姓名、性别、身高和年龄,纸张的特征包括用途、材质、大小等。对于同一种对象的不同个体,其特征值会具有差异,如同样描述花,具有45片花瓣的红色卡罗拉玫瑰花和30cm长的蓝色妖姬,它们的特征差异就很明显。同样,描述人类,30岁的成年女士和80岁的老先生也具有不同的特征。有些特征稳定不变,而另一些则会不断发生变化,如鲜花的颜色一般不变、人类的性别一般不变,但年龄则随着时间会发生变化。因此,可以使用一组特征数据来描述每个对象,这些数据可以随时间发生变化,每个时点的数据反映这个时点对象所处的状态,这就是所谓的状态类数据。

2.3.2 事件类数据

事件类数据是用来描述客观世界中对象之间的关系,它们之间如何互动以及互动会带来什么样的影响和作用。通过记录这些互动以及相互作用等,实现更精准的数据分析。如在当前电商平台中,可以记录到一个用户先后在同一个商家买了3次大米,在这个时间里,出现了用户、商家以及大米,那么,这3个对象之间产生了一次交易。通过分析这个交易数据,得出的结论是这个用户比较喜欢该商家的大米,从而可以预判出用户可能会进行更多的购买行为。

2.3.3 混合类数据

混合类数据理论上也属于事件类数据的范畴,两者的差别在于,混合类数据所描述的事件发生过程持续较长,记录数据时该事件已经发生、还没有结束,可能还将发生变化。如客户消费积分,从客户的零积分到后面持续的消费,每一次消费过后,消费积分都会发生变化,从零开始一直在发生变化,后续可能还会有更多次的变化。 22XVipjJWvCU9Zj3s9NjK4RjXh+5W7SEoNkl1+ODvo1SiXulpBWzLbbjlLl6+LXT



2.4 数据来源

2.4.1 个人数据

地球人口已达80亿,而且还在继续增长。联合国一份有关人口趋势的报告显示,世界人口将在2050年达到97亿。基于庞大的人口数量,消费者、用户个人数据的增量已经成为全球数据的主要来源之一。

随着企业不断提升其业务的数字化水平,并持续改进用户体验,消费者正在接受个性化的实时互动,并重新设定他们对数据交付的期望值。由于消费者的数字化世界与现实生活重叠,因而他们期望在任何位置,借助任何设备,通过任何连接都能访问各种产品和服务。消费者希望得到实时、移动和个性化的数据,这就对边缘和核心存储提出了更高的要求,以提供消费者所需要的精确数据,且常常是实时数据。

目前,每天50多亿消费者与数据发生互动。到2025年,这一数字将上升到60亿,相当于全球人口的75%。2025年,每个联网的人每18秒就会有至少1次数据交互。这种交互大多源自全球联网的数十亿台物联网设备,而这些设备预计在2025年将产生超过90ZB数据。IDC预测,随着数据融入我们的业务工作流程和个人生活,到2025年全球数据圈将有近30%的数据是实时数据。如果想要提供一流的客户体验并扩大市场份额,企业的数据基础设施必须能满足实时数据的增长需求。

随着越来越多的个人数据以及人们对数据归属和数据安全等问题的加倍重视,消费者个人数据其实在Web 3.0时代已经可以当作个人资产了。不同于Web 2.0时代的数据由个人产生、收益归平台、所有权归平台,在Web 3.0时代,数据都归属于数据所有者,数据是可以由其所有人进行标价的,每人的数据都可以转换为个人资产,并且数据也可以根据个人的意愿去进行交易和让渡,而这个数据价值让渡,并不是指将数据的所有权、使用权全部让渡给买家,这种让渡是指将一定的知情权给予买家。我们认为,不管是珍贵的照片、精心拍摄的视频、熬夜奋斗出来的剧本,或是其他形式的内容,每一个人的数据都是由个人一定时间所创造出来的,都耗费了不同的时间与精力,基于个人的创造和构思而成,都凝聚着脑力价值,因此,个人数据在未来变成个人资产,也就变得不难理解了,并且也会是一种无法阻挡的趋势。

2.4.2 企业数据

5G、物联网、边缘计算、边缘数据中心、人工智能等技术不断普及,促进了企业数据以光速增长,此外,新冠肺炎疫情催生了更多居家办公的需求,所有这些都是导致企业数据激增的重要因素。IDC统计,2020—2022年,企业数据预计以每年42.2%的速度增长。不过,根据统计,在可用的企业数据中,仅32%投入使用,剩余的68%并未得到利用。而未被利用的这些数据中,预测可能潜藏着更多的商业价值。

数据的管理和利用对于企业的重要性越来越凸显,而消费者生成的数据份额将从2017年的47%下降到2025年的36%。驱动这种转变的是7×24小时的运行环境,在这个环境中传感器始终处于在线状态并不断获取、分析环境并创建数据。在过去,消费者负责管理自身的大部分数据,而随着数据日益集中于企业核心和边缘基础设施,维护和管理数据的责任正转移到企业/云提供商的数据中心。企业已经成为数据创建和存储的主要来源和管理者,而且这一趋势将会继续强化全球企业的数据保护责任,数据安全的责任很大一部分将转嫁于企业。

到2025年,预计企业存储的数据圈将增至13.6ZB,占全世界数据圈的80%以上。现在每小时创建的数据要比20年前一整年创建的数据还多,并且数据中的价值也越来越被更多企业看到,数据是人类的潜能,最敏锐的企业会尝试去驾驭数据的力量。 22XVipjJWvCU9Zj3s9NjK4RjXh+5W7SEoNkl1+ODvo1SiXulpBWzLbbjlLl6+LXT

点击中间区域
呼出菜单
上一章
目录
下一章
×