购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

Chapter 5
第5章
数据开发:数据价值提炼工厂

汇聚联通到中台的数据,基本是按照数据的原始状态堆砌在一起的,是企业对过往所有IT信息化建设积累的成果的融合。这些数据构成了原始数据资源。

数据开发是数据资产内容建设的主战场,是数据价值生产过程中的核心环节,可以支撑大批量数据的离线处理、实时处理和数据挖掘等。

业务沉淀的数据就像原始的矿石或商品的原材料,数据开发这个环节就像是“商品”生产的流水线,通过这条流水线将数据转换成数据资产,让数据能根据业务的需求转换成新的形态,将原本看起来没有价值的数据变成对业务有价值的资产,为前端业务源源不断提供其所需要的“商品”。

数据开发涉及的产品能力主要包括3个部分,分别是离线开发、实时开发和算法开发,如图5-1所示。

图5-1 数据开发的产品能力

离线开发 主要包括离线数据的加工、发布、运维管理,以及数据分析、数据探索、在线查询和即席分析相关的工作。

实时开发 主要涉及数据的实时接入和实时处理,简化流数据的加工处理过程。

算法开发 主要提供简单易用的可视化拖曳方式和Notebook方式来实现数据价值的深度挖掘,并将产生的算法模型在数据开发中使用。

常见的加工场景有离线和实时数仓建设、算法模型训练、数据化运营分析、数据探索等。在这个过程中,通过数据开发套件对大数据的存储和计算能力进行封装,通过产品化的方式让用户更容易地使用大数据。计算能力与第4章中提到的存储能力是紧密联系的,由于数据规模不断增大,不仅存储能力需要细分,计算能力也需要细分。因此在建设过程中,需要对不同场景下的计算能力有一定了解。 k00N4j5A95Nu+axgAB1PZBCvZHuXNHEdBxs67mjIwoOSz5UYkPVq2CcWZS3RiXxa

点击中间区域
呼出菜单
上一章
目录
下一章
×