随着数字技术的飞速发展,数据管理的历程犹如一幅波澜壮阔的画卷徐徐展开。其间,数据的形态也经历着深刻变化。本节深入剖析了数据管理的发展历程,并以此为脉络,揭示了不同历史阶段下数据形态的演变。
纵观组织数据管理的发展历程,一般来说,组织的数据管理会经历1.0数据电子化、2.0数据资源化、3.0数据资产化、4.0数据资本化四个阶段,如图2-6所示
。
图2-6 组织数据管理的发展历程
(1)1.0数据电子化 在这一阶段,组织主要通过建设信息系统,如ERP(Enterprise Resource Planning,企业资源规划)、CRM(Customer Relationship Management,客户关系管理)等,将传统的纸质文档、记录等转化为电子格式存储于数据库中。数据电子化主要关注数据的录入、存储和基本检索功能,使得数据能够方便地以电子形式被访问和初步处理。
该阶段的主要特点如下:
● 技术基础:依赖于关系数据库等存储技术,以及基础的IT基础设施。
● 数据形态:数据从纸质转变为电子格式,但多为结构化数据,是原始数据。因为信息系统建设没有统一规划数据架构,经常存在数据标准不统一、质量不好等问题。
● 应用层次:主要用于简单的数据记录、查询和报表生成,数据分析较为基础。
● 数据价值:数据主要用于支持日常运营,价值挖掘有限。
(2)2.0数据资源化 进入数据资源化阶段,组织开始重视数据的整合、标准化和全生命周期管理。组织开始建立数据管理专业团队,通过建立数据仓库、数据湖等环境,实现数据的集中存储、清洗、转换和标准化处理,原始数据转换为数据资源。同时,引入BI(Business Intelligence,商务智能)工具和多维度统计分析方法,以及初步的大数据分析技术,提升数据的应用价值。
该阶段的主要特点如下:
● 技术升级:采用更高级的数据处理和分析技术,如ETL、OLAP等。
● 数据治理:注重数据的跨部门整合与标准化,提升数据的一致性和可用性。
● 应用深化:数据分析从简单的统计报表扩展到复杂的业务洞察和决策支持。
● 价值提升:数据开始成为组织的重要资源,支持更高级别的业务决策和战略规划。
(3)3.0数据资产化 在数据资产化阶段,经过认定,数据资源转化为数据资产,组织将数据视为核心资产进行管理,建立数据资产管理体系,明确数据的权属、价值评估、流通与共享机制。数据以数据集、数据产品、数据服务等形式进行流通,支撑组织内部业务利用数据开展数据分析,并在确保安全合规的情况下进行外部流通和交易。
该阶段的主要特点如下:
● 管理体系:构建完善的数据资产管理制度和流程,确保数据的安全、合规和高效利用。
● 价值量化:数据价值得到明确量化,成为组织绩效评估的重要指标。
● 流通共享:数据在内部业务间及外部市场间实现高效流通与共享,促进数据价值的最大化。
● 技术创新:引入AI(Artifical Intelligence,人工智能)、机器学习等先进技术,提升数据处理的智能化水平。
(4)4.0数据资本化 在数据资本化阶段,数据被赋予金融属性,成为可增值的金融性资产。组织通过数据证券化、数据银行、数据质押融资、数据信托等方式,实现数据的金融化运作,共享数据经济收益。
该阶段的主要特点如下:
● 金融化运作:数据成为金融市场上的交易对象,支持多种金融工具和产品的创新。
● 价值最大化:通过金融手段,实现数据价值的最大化释放和增值。
● 法律保障:建立完善的法律法规体系,保障数据交易和流通的合法性、安全性。
● 生态构建:构建数据生态体系,促进数据产业链的协同发展。
常见的数据资本化主要包括四种方式:数据证券化、数据银行、数据质押融资和数据信托。
1)数据证券化:将数据资产未来可产生的现金流作为偿付支持,通过结构化设计,发行资产支持证券专项计划的过程。它涉及数据资产的未来预期收益,将这些收益作为证券化的标的物,从而获得融资。数据证券化可以促进数据资产的流通和市场化,帮助企业或个人将持有的数据资产转化为可以在金融市场上交易的证券产品。
2)数据银行:一种数据管理和服务的概念,通常指的是一个机构或平台,负责收集、存储、管理、分析和共享数据。数据银行可以为数据所有者提供一个安全、可靠的环境,同时允许数据的商业化利用。数据银行包括三层含义:①作为满足隐私保护要求的可信技术底座;②提供数据要素流通的服务;③作为数据价值实现的平台。
3)数据质押融资:企业或个人以自身合法拥有或控制的数据资产作为质押物,向金融机构申请贷款的一种融资方式。这种融资模式允许数据资产的所有者利用其数据资产的市场价值来获得资金支持,从而促进数据资产的货币化和金融创新。
4)数据信托:一种法律结构,通过这种结构,数据资产的所有者(委托人)将数据资产的管理和运用权限委托给一个受托人(通常是专业机构),由受托人按照信托合同的约定进行管理和运用,以实现数据资产的保值增值。数据信托允许用户行使其作为数据生产者的权利,通过信托财产制度有效设计和落实数据资产的各项权能安排。
这些概念体现了数据资产在现代经济中的价值和重要性,以及如何通过不同的金融工具和法律结构来实现数据资产的商业价值和融资功能。
组织数据的形态与组织数据管理的发展历程对应,组织数据的形态变化如表2-1所示。
表2-1 组织数据的形态变化
(1)1.0数据电子化 这一阶段,即信息化建设时代,数据都分布在各个业务系统中,数据是无序的,主要是以原始数据的方式存在。
这一阶段,数据的特点如下:
● 原始性:数据多为业务活动的直接记录,未经深度处理。
● 单一性:数据主要服务于特定业务流程,缺乏跨部门的整合。
● 静态性:数据更新依赖于人工录入,实时性较差。
● 非标准化:数据的标准化程度差,没有组织级统一的数据架构或数据标准。
(2)2.0数据资源化 这一阶段,无序的数据资源经过了治理,形成了标准化的企业级数据集,即企业数据资源。
这一阶段,数据的特点如下:
● 标准化:原始数据经过了治理,数据标准化程度高。
● 多样性:数据类型不仅包括结构化数据,还开始涉及半结构化和非结构化数据。
● 动态性:数据更新更加频繁,实时性增强。
● 价值挖掘:通过数据分析,数据开始展现其潜在的商业价值。
(3)3.0数据资产化 这一阶段,组织数据呈现出多样化,由标准化的企业级数据集衍生出其他产品,共同组成企业数据资产。
这一阶段,数据的特点如下:
● 高价值:数据成为组织的核心竞争力之一,具有显著的经济价值。
● 可交易性:数据在保障安全合规的前提下,可进行外部交易和流通。
● 灵活性:数据以多种形式存在,满足不同场景下的应用需求。
企业数据资产主要包括以下类型:
● 符合数据资产条件(详见数据资产的定义)的经过治理的数据集及其衍生数据(例如指标数据等),可以以实时交换数据、离线数据包等形式进行内部共享和外部交易。
● 数据产品与服务,包括数据库商品、各类数据应用程序、数据查询接口、数据核验接口、数据模型结果、数据分析报告等。
● 数据分析模型与挖掘算法。
● 算力。
(4)4.0数据资本化 这一阶段,组织数据仍然是其数据资产,只是运作方式变了。
这一阶段,数据的特点如下:
● 金融属性:数据具有明确的金融价值,可作为融资和投资的对象。
● 流动性增强:数据在金融市场上的流通性显著提高,促进资本与数据的深度融合。
● 风险与机遇并存:数据资本化在带来巨大机遇的同时,也伴随着数据安全、隐私保护等风险挑战。
这一阶段实际上是组织真正管理数据的起点,即将数据从OLTP类的业务系统迁移到OLAP类的数据环境中进行治理,将来自多个数据源的原始数据转化为有序的数据资源。
数据资源化阶段的数据流动如图2-7所示。图2-7在《DAMA数据管理知识体系指南》
中数据仓库/商务智能和大数据架构的基础上略加改动(只增加了OLTP、OLAP划分),从中可以看出数据流动及资源形成的过程。
图2-7 数据资源化阶段的数据流动
注:DaaS(Database as a Service,数据库即服务)
MDM(Master Data Management,主数据管理)
IoT(Iternet of Things,物联网)
ODS(Operationnal Data Store,操作型数据仓储)
1)各类OLTP系统中产生了很多数据。这些数据包括组织常见的各类业务系统含有的各类结构化数据,以及各类接入设备(例如传感器、计算机、手机等)接入的各类结构化、非结构化数据。此时,数据没有标准化,为无序数据集。
2)组织为了使用各类系统中产生的数据,利用各类数据采集设备,将已有的存量数据或者新增数据,接入可以利用数据进行分析的数据环境,即OLAP(例如数据仓库、数据中台、数据湖等)中。
3)在OLAP环境中开展数据治理,将数据转换为满足需求的高质量数据。此时的治理主要是利用ETL工具,将数据转换为通用格式。
4)数据存储,数据仓库包含以下多个不同用途的存储区域:
①暂存区。暂存区是介于原始数据源和集中式数据存储库之间的中间数据存储区域。数据在这里短暂存留,以便可以对其进行转换、集成并准备加载到仓库。
②存储库。参考数据和主数据可以存储在单独的存储库中。数据仓库为主数据系统提供数据,这个单独的存储库为数据仓库提供一致性维度数据。
③中央数据仓库。完成转换和准备流程后,数据仓库中的数据通常会保留在中央或原子层中,在这一层保存所有历史的原子数据以及批处理运行后的最新实例化数据。该区域的数据结构是根据性能需求和使用模式来设计和开发的。
目前,数据已经从业务系统中格式不统一、不标准的情况转化为有序的数据资源。
数据资源经过治理以后,会经过多种途径转化为数据资产,此时数据进入数据资产化阶段,该阶段会逐渐挖掘数据资产的价值。在对数据资产进行管理之前,我们先了解一下数据资产的生命周期,如图2-8所示。
图2-8 数据资产的生命周期
(1)登记前准备 数据资产的形成有以下三种可能的情况。
1)经过治理后的数据资源,当满足一些条件后,可以被认定是数据资产。此时,数据管理组织将数据资产(含数据产品)从数据资源中剥离开来,识别出能够提供应用价值或产生业务影响的数据资源,进行分类登记(需要首先定义资产种类,进行资产科目管理),认定并确认数据资产的归属权限。明确数据的产权、使用权等权利形式和权利主体,避免数据被滥用或不当使用。
2)当有数据应用需求提出时,数据管理组织进行响应,组织相关人员开发,形成衍生数据(指标数据等)、数据产品与服务、相关模型与算法供需求方使用,形成对应类别的数据资产,进行分类登记,认定并确认数据资产的归属权限。这种需求可能是组织内部需求,也可能是外部组织的商业化需求。
3)当有相关算力方提出需求时,数据管理组织进行响应,购买设备,搭建数据算力环境,进行响应,形成对应类别的数据资产,进行分类登记,认定并确认数据资产的归属权限。
(2)登记 识别出来的数据资产经过确权和登记后会形成数据资产目录,数据管理组织可对数据资产目录进行管理,调整数据资产分类框架,应用标签+分类的方式来展示、区分、索引数据资产。
1)数据管理组织通过数据资产目录对数据资产进行系统的管理、展示和索引。为了提升目录的实用性和易用性,数据管理组织可以不断调整和优化数据资产的分类框架,使其更加符合组织的业务需求和技术特点。
2)数据管理组织采用标签+分类的方式对数据资产进行多维度标记和分类,提高数据资产的可发现性和可理解性。用户可以通过标签快速定位到所需的数据资产,提高数据使用的效率和准确性。
(3)审核数据资产 在数据资产正式投入使用之前,必须经过严格的合规性审核。这一环节旨在确保数据资产的使用符合相关法律法规和政策要求,避免潜在的法律风险。审核内容可能包括数据的来源合法性、处理过程的合规性、使用权限的明确性等方面。通过合规性审核的数据资产才能被纳入组织的数据资产库中,供内外部用户访问和使用。
(4)数据资产的发布 经过合规性审核的数据资产会正式发布,并提供明确的访问路径。用户可以通过内部平台、应用程序编程接口等多种渠道访问数据资产,进行数据查询、分析和应用。为了方便用户的使用和管理部门对数据资产的监控,组织可以建立数据资产的盘点机制,定期对数据资产进行清查和核对,确保数据的完整性和准确性。
(5)使用前准备 经过上述过程,数据资产已正式形成。但是要使用数据资产,组织还需要明确数据资产的价值(价值评估),针对不同种类和安全级别(数据资产的分类分级)的数据资产制定管理策略和使用策略,对数据资产的内部共享和外部使用进行策略设计。
1)数据资产的价值评估是数据资产管理的重要环节之一。通过成本法、市场法等多种评估方法,组织可以较为准确地估算出数据资产的经济价值和社会价值。这些评估结果不仅为数据资产的内部定价和外部交易提供了依据,还为后续的数据资产流通和运营打下了基础。
2)针对不同种类和安全级别的数据资产,组织需要制定差异化的管理策略和使用策略。这些策略应充分考虑数据资产的特性、业务需求、技术条件以及法律法规要求等因素,确保数据资产在合规合法的前提下实现价值的最大化。
(6)数据资产的使用 为了满足内外部用户对数据集、数据产品、数据模型以及算力等数据及产品的需求,组织需要建立需求的全流程管理机制。这一机制应包括需求收集、需求分析、需求匹配、服务提供等多个环节,从而精准把握用户需求和市场动态,更加高效地提供数据资产服务。对于内部用户,组织可以通过建立内部数据共享平台或数据服务门户等方式提供数据资产服务;对于外部用户,则可以通过数据交易市场或数据服务提供商等渠道进行数据资产的运营与流通。
(7)数据资产的维护 数据资产的维护是保障其持续有效性和价值的关键环节。当数据资产不再具有使用价值或需要被替换时,组织应及时归档、销毁或迁移。这些操作应遵循相关的法律法规和政策要求,确保数据资产的安全性和合规性。同时,还需要建立数据资产的更新迭代机制,根据业务需求和技术发展,及时更新和优化数据资产库中的内容和结构。
(8)数据资产的管理 数据资产管理是一个持续优化的过程,随着业务的发展和技术的进步,组织需要不断调整和完善数据资产管理的各个环节和流程,引入先进的管理理念和技术手段,提升数据资产管理的效率和效果;加强与其他部门的协作和沟通,形成数据资产管理的合力;建立完善的反馈机制和评估体系,及时发现和解决问题并持续改进数据资产管理工作。
整个数据资产生命周期管理旨在加强资产管理,降低维护检修成本,延长使用时间,并提高数据资产的利用率。不同的组织或项目可能会根据实际需求对生命周期的环节进行微调或扩展,以适应特定的业务场景和技术要求。