购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.3 标签在数据系统中的定位

标签是面向业务的数据资产组织方式,因此标签在数据系统中处于核心位置。可以说,对标签的来源加工、体系管理、服务应用串联起了数据系统的功能架构与模块连接。

2.3.1 标签在数据资产中的位置

原始数据加工成标签,即可认为是简单意义上的数据资产化过程。数据不再是业务、信息系统的记录或存储,而是转化成带有商业价值的标签,标签是具有业务含义或对业务有指导意义的数据定义,可以说,完成了标签类目体系的组织和标签设计开发,才算是真正建立了数据资产的本体。数据资产价值主要通过资产服务化生成相应的数据服务,帮助业务增值或企业降本增效来证明。

从广义上讲,企业拥有的所有数据资源,包括原始数据、中间数据、临时数据、数据类目体系、标签类目体系、标签、标签类目体系方法论等都是数据资产。对于广泛意义上的数据资产来说,标签、标签类目体系及方法论是其重要的组成部分。在方法论的指导下,原始数据、中间数据、临时数据可以按需加工、挖掘成标签,标签按照类目体系的方式进行规划、串联和管理。对于一家企业来说,其长期积累和建设的数据、标签、标签类目体系及经实践修正后形成的自有方法论都是其数据资产。图2-11为广义数据资产范畴。

图2-11 广义的数据资产范畴

从精准定义上讲,数据资产是指由企业拥有或控制的、能够直接为企业带来经济利益的数据资源。以标签形式组织的数据资源就是数据资产的最佳呈现方式。由于标签是业务导向的组织方式,通过元标签信息能让数据资源变得可阅读、易理解;同时标签态的数据组织方式是最小使用和管理单元,能让数据资源兼具好使用、有价值的核心特点。通过标签对数据资源进行转化和组织,才能最佳实践数据资产看、选、用、治、评的完整运营链路,如图2-12所示。

图2-12 数据资产运营闭环

以标签为组织载体的数据资产区别于传统的数据资源,具有8个显著而独特的重要特征,如图2-13所示。

图2-13 数据资产8大特征

1. 能确权

所有的数据资产都应该是由某企业或机构合法取得或有效管理的数据源清洗加工而来,否则不能称为资产。企业对其合法获得并构建的数据资产拥有归属权、管理权、使用权等权利。

一些企业将私下采购或不合法收集的数据源加工和包装成自己的“数据资产”,进行不当使用或资产估值,最终被举报、清查、法律惩处。因此企业或机构必须重视自身数据资产来源的合法性并合规使用,将确权工作与数据安全工作联动开展。

在大型集团公司中,会划分拥有数据资产归属权、管理权、使用权的角色:数据源采集、提供部门拥有数据资产的归属权;数据资产的设计、加工、管理、运营部门拥有数据资产的管理权;数据资产的使用、消耗部门拥有数据资产的使用权。

2. 可阅读

通过数据标签化,将难以触碰的数据信息转化为前端业务可获取的标签信息,实现对象类型可筛选,类目体系可折叠查看,标签列表可阅读:数据人员或业务人员可以按需调取任一标签的所属类目、标签名称、标签定义、标签逻辑、标签取值等基本信息,同时在标签详情中可以看到该标签适合的数据应用场景、历史业务端服务调用情况、数据资产消费方的评价反馈等使用信息。标签化使得数据可阅读,推动了业务侧参与数字化转型的建设过程。

3. 易理解

在将数据标签化的同时,利用元标签将难以理解的数据术语转化为通俗的业务术语,并通过标签创建、设计时的规范操作使元标签信息都得以完整记录。

以往在数据仓库建设时,表或字段的备注、元数据信息往往由数据人员登记,对业务人员并不友好。并且由于数据人员较多关注在实现层面,对文档、信息类的管理登记工作不够重视,经常会出现数据表、字段已经开发完成但信息备注和元数据信息并没有同步关联登记的情况。等到业务人员想要了解数据信息,或数据部门自查数据规范性,又或者若干年后数据人员更迭交接的时候,就会发现存在非常多的数据信息缺项和填写不规范的问题,最终只能进行信息补录或元数据管理。很多大型集团企业每隔几年就需要开展一次大型的数据治理。

元数据是对数据对象的信息解释,因此非常重要。元数据如果缺失较多,数据对象的指向或属性就会模糊不清,甚至影响该数据项的可信度,从而影响其使用。从数据到标签的转化,不仅实现了数据术语向业务术语的转化映射(元标签采用业务视角对标签概念进行充分解释),而且在标签设计的过程中,标签方法论要求每个标签设计师都按照规范填写《标签详细设计文档》(元标签信息的规范填写和完整登记是标签创建和开发任务下发的前提条件)。

4. 好使用

标签化的数据资产将数据可用单元切割到最小粒度。使用标签的思路也向业务端靠拢:将数据最小可复用单元封装成“商品”。数据管理部门负责将标签商品上架展示,业务部门作为消费方可以在标签集市中搜索、查看、收藏、下单。申请审核通过后,业务部门就可以在服务管理中导入、配置标签的使用方式,最终创建完成一个数据服务接口或数据应用系统。

这种使用数据的方法摒弃了传统代码开发的弊端:所有数据项的开发逻辑都写在同一段代码中,出现数据故障时难以排查;数据服务所产生的价值难以溯源衡量。标签创新了一种数据使用模式:将数据打散到最小粒度单元,每次使用时,以搭积木的方式灵活选取所需零件,通过工具或平台支撑快速完成某一数据服务或数据应用的装配。

5. 可计量

通过标签将最小可复用单元数据进行了“商品化”的转换,因此某一项标签数据的搜索量、浏览量、申请量、调用量等都可以被系统记录和计量。可计量的特性有利于标签的优化和运营,帮助控制标签的安全使用,评估标签的业务使用价值。

6. 有定价

数据资产一定有价值,其价值如何衡量?数据要素如何参与价值分配?这些都是当前大数据领域中热门讨论的话题。随着数据标签化,数据资产的价值衡量迈出了商品化的第一步。数据资产的定价由市场决定,成本决定,还是由利润决定?这个问题可能在不远的将来就能得到解答。

此处提到的“有定价”不是指数据资产一定要通过“金钱”购买,而是其一定存在可衡量的价值裁定。在数据价值探索的商业世界中,必须关注成本支出与利润回报:数据资产有采集、生产、管理、运营等成本,数据资产的使用方需要为数据资产的使用“记账”或“买单”,同时数据管理方必须从价值的考量出发,不断优化和更新数据资产的最佳配置。

7. 可管控

数据资产必须是可管控的,否则会有巨大的安全风险和管理成本。

标签化的数据资产可以通过标签管理系统进行全生命周期的运营管理,包括元标签信息管理、标签标准管理、标签安全管理、标签质量管理、标签成本管理、标签价值管理等。业内已有非常多的成熟工具可以对标签进行基本的管理控制,例如阿里云的DataQuotient、数澜的标签中心、百分点的用户标签管理、神策的用户画像、易观的方舟智能画像、个推的个像等。

8. 可增值

数据资产是一种越用越多的特殊资产。这种可增值性并不像风险投资一样具有很大的不确定性。只要按照标准动作规范建设数据资产,并以数据价值为导向运营数据资产,其价值就会不断迭代,具有不可限量的增值空间。

2.3.2 标签在数据中台中的位置

伴随着云计算、大数据、人工智能等技术的快速发展,企业数字化、智能化转型步伐逐渐加快。数据中台是2018年逐渐兴起的数据概念,核心要义在于增援未来,以发展的眼光解决企业未来可能面临的各种场景问题。面对不确定的未来,企业需要组织沉淀可复用的标签资产,加强数据服务能力,构建出自己的数据中台,才能符合数字化转型的时代要求。

1. 什么是数据中台

从定义角度看,数据中台是一套可持续“让企业数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,以有形的产品和实施方法论为支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。

从架构角度看,数据中台上承业务数据积累,通过自己的数据平台工具,将原始数据加工成数据资产,并通过数据资产服务化下启数据应用场景,帮助业务端或管理端降本增效。数据中台不只是一套生产加工的流程,它对企业的战略定位、组织保障、基础设施等方面都产生了深远的影响,如图2-14所示。

图2-14 数据中台架构图

从实施角度看,数据中台是以数据资产为核心,以实现数据资产可见、可懂、可用、可运营的系列目标为出发点,配以平台工具、流程规范、应用建设等必要环节,最终落地的数据解决方案,如图2-15所示。

图2-15 以数据资产为核心的实施配套

2. 标签在其中的重要位置

将企业的完整技术架构图抽丝剥茧,可以看到“标签”在数据中台中的具体位置:数据中台位于云底座与上层业务应用之间,即位于稳定厚重的技术大后台与灵活多变的业务小前台之间。通过数据中台对底层复杂技术能力的抽象封装,前端业务可以自由、轻便地使用数据能力,弥合前后端步伐不一致的问题。

在数据中台内部,具体又细分出开发工具层、数据资产层、资产管理层、数据服务层、数据运营体系、数据安全体系等模块,如图2-16所示。原始汇入的数据通过开发工具层转变为企业自有的数据资产;在资产管理层对数据资产进行不断的治理优化;最终通过资产服务化将数据资产输送到业务各端,实现数据价值;统一的运营体系和标准安全管理主要从流程机制层面保障整个数据中台的平稳有序运行。在数据中台中,开发或管理工具是可以直接采购的,运营体系和标准安全规范的方法论是可以学习的,但是数据资产和数据服务必须是企业自行建设和实施的结果,它们是数据中台的核心部分,没有捷径可走。

图2-16 标签在数据中台中的位置

数据资产和数据服务中最核心的是标签:数据资产本身以标签为组织载体,而数据服务本质上是一种将标签传递给业务端使用的价值管道。标签是数据中台价值链路中“核心的核心”。 N53ZNTh45KtBpUtf+WQTiS2+x0P2ruovbtRISZEqGufbC1I3RuStovhV13rMNrCU

点击中间区域
呼出菜单
上一章
目录
下一章
×