在后续章节中会出现非常多的数据专有名词和术语。为方便读者阅读,统一在本节对这些名词术语进行定义和解释,做好铺垫。
数据
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态及相互关系等进行记载的物理符号或这些物理符号的组合 。数据可以是连续的,比如声音、图像,称为模拟数据;也可以是离散的,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元0和1的形式表示。
在本书所论述的方法论中,“数据类目体系”概念中的“数据”是狭义的定义,单指企业原始拥有的、未经整理的信息载体。
数据资产
在传统概念中,企业认为其所拥有的所有数据资源都是数据资产,例如存放了好几十年的纸质文件、光盘、视频、音频等。这些资源还停留在原始数据阶段,必须从中整理和提炼出可用的信息项,才能真正为企业产生价值。
因此当前对数据资产主要关注其精准定义(狭义): 由企业拥有或控制的,能够直接为企业带来经济利益的数据资源 。通常需要有较好的组织形式,数据资产才可以被编目、被管理、被高效使用。
数据中台
数据中台是一套可持续“让企业数据用起来”的机制 。数据中台是依据企业特有的业务模式和组织架构,以有形的产品和实施方法论为支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。
标签
标签指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体 。从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式,是一种概念、逻辑定义,因此标签必须是可阅读、易理解的。
从粒度上来讲,标签往往映射为某一对象的属性,包括固有属性和动态属性,一般都需要结构化到字段粒度,保障可被后续数据服务便捷使用。它面向数据应用的业务端,核心解答的是数据怎么用、资产价值在哪里的问题。根据加工方式的不同,标签可以分成基础类标签、统计类标签和算法类标签。
元标签
元标签是标签的标签,即对标签的属性信息(特别是业务化属性信息)梳理 。通过元标签,业务人员可以快速理解标签定义,获取标签设计、加工、管理、使用等相关信息。
类目体系
类目体系指的是对某一类item(事物)的分类、架构、组织方法 。类目体系结构可以用树状结构来类比,第一级分支称为一级类目,从第一级分支中长出的第二级分支称为二级类目,从第二级分支中长出的第三级分支称为三级类目,以此类推。没有上一级类目的叫一级类目,没有下一级分类的类目叫叶子类目,挂在叶子类目上的具体叶子就是item。有下级细分类目的类目是下一级类目的父类目,有上级类目的类目是上一级类目的子类目。图2-17所示为标签体系类目。
图2-17 标签体系类目
类目体系设计好之后,可以将item分入合适的类目中。例如对商品的组织梳理可以形成商品类目体系,对标签的组织梳理可以形成标签类目体系。
数据类目体系
数据类目体系是将企业原始拥有的数据字段,采用类目体系的方式进行梳理所形成的目录结构 。
标签类目体系
标签类目体系是将企业业务上所需的标签,采用类目体系的方式进行梳理所形成的目录结构 。
对象
标签类目体系方法论中的对象指 现实世界中所需要研究的目标 。结合数据库理论,实体(Entity)和关系(Relationship)在标签类目体系方法论中都属于对象,因此从对象类型上可以分为实体对象和关系对象,其中实体对象还可以细分为“人”和“物”。
数据世界中的对象可以和现实世界中的事物相映射,“人”“物”“关系”是对现实世界所有事物的数据抽象。
人
标签类目体系方法论中的“人”指 会主动发起行为动作的对象 。人包括自然人、自然人群体、法人、法人群体等,例如消费者、消费者协会、电商企业、电商企业联合会等。
物
标签类目体系方法论中的“物”指 行为动作中的被动对象 。物包括物品、物体、物品集合等,例如商品、仓库等。
关系
标签类目体系方法论中的“关系”指 人和物、人和人、物和物等两个对象间发生的某种连接 。关系包括行为关系、归属关系、社交关系、同好关系等各种强、弱关系。
场景
标签类目体系方法论中的场景指 某环境下,具体对象(人、物、关系)在时空中的表现 。在某场景内,对象可能是某个人或某群人,可能是某个物或某群物,也有可能是发生着的某种关系或某系列关系集合。因此任何一个事件,无论简单还是复杂,都可以用场景来表达。例如,“午后我在发呆”“机器设备异常运行”“消费记录源源不断产生”等都是场景。
前台标签类目体系中的场景往往指的是前台业务使用数据资产服务解决自身业务问题、提升业务效率的数据应用场景。
后台类目体系
标签类目体系在企业实际应用过程中可以拆分为后台类目体系和前台类目体系。 后台类目体系面向数据资产管理人员,是企业数据资产的全集,较为稳定,按照统一的分类方式进行标签的挂载、查看、管理 。资产设计师或管理员可以创建、维护后台类目体系,业务人员只能查看使用,无法修改后台类目体系的类目格式。只有拥有一定权限的数据资产管理员才可以在经过审批的情况下低频修改后台类目体系。
前台类目体系
业务人员通过后台类目体系选择并获得标签使用权后, 可以根据场景需要,将标签按照前台场景组织新类目,形成前台类目体系 。例如在后台类目体系中,“性别”属于【基本属性】分类,“消费力”属于【能力价值】分类,但前台业务想通过“性别”“消费力”等维度对会员进行客户洞察分析,那么可以在前台创建一个【客户洞察】的分类,将“性别”“消费力”等标签挂入这个前台分类中。前台类目与后台类目仅存在映射关联,并不直接挪动标签的物理位置,因而前后台是相互隔离的。因此前台类目可以灵活多变,并不影响后台类目的稳定统一。