购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.3 数据中台建设与架构

3.3.1 数据中台定义

目前,数据中台还没有统一和明确的定义。有人认为数据中台是云平台的一部分,同时包括业务中台和技术中台;有人认为数据中台是数据的共享、整合和深度分析;还有人认为数据中台是“计算平台+算法模型+智能硬件”,不仅有云端,还需要智能设备帮企业在终端收集线下数据,从服务方到客户方,对数据中台的理解并不相同。目前普遍认为数据中台是一套可持续“让企业的数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。数据来自业务,并反哺业务,不断循环迭代,实现数据可见、可用、可运营。

通过数据中台把数据变为一种服务能力,既能提升管理、决策水平,又能直接支撑企业业务。数据中台不仅仅是技术,也不仅仅是产品,而是一套完整的让数据用起来的机制。既然是机制,就需要从企业战略、组织、人才等方面来全方位地规划和配合,而不能仅仅停留在工具和产品层面。

在产业互联网背景下,医疗健康产业需要从传统业务模式向数据驱动模式进行转型,从而寻找新的产业动能和产业突破点。数据中台是推动这个正在重塑的产业实现数字化、智能化建设的关键所在。数据中台是一个连接数据与产业业务的枢纽,它实现了数据采集、数据管理、数据分析、数据驱动业务完整的数据赋能体系。医疗健康产业的数据中台建设为产业解决“看病难、看病贵”问题提供了新思路。在产业横向协同上,通过原材料数据、药械流通数据等数据,上游生产商可以采取药械原材料价格管理、制造过程优化等方式降低成本,同时协调药械中间环节的竞争,在下游医疗服务机构中,通过数据中台监管临床诊断过程,从而降低医药成本;在产业纵向延伸上,产业利用数字中台实现患者电子病历、用药记录、个体健康数据等数据的上下级连通,帮助医疗服务体系中分级诊疗制度更好地落实并发挥作用,促进医疗资源在患者间、地区间的合理配置。

3.3.2 数据中台的核心能力

数据中台需要具备数据汇聚整合、数据提纯加工、数据服务可视化、数据价值变现4个核心能力,让企业员工、客户、伙伴能够方便地应用数据。

1)汇聚整合:随着业务的多元化发展,企业内部往往有多个信息部门和数据中心,大量系统、功能和应用重复建设,存在巨大的数据资源、计算资源和人力资源的浪费,同时组织壁垒也导致数据孤岛的出现,使得内外部数据难以全局规划。数据中台需要对数据进行整合和完善,提供使用、适配、成熟、完善的一站式大数据工具平台,在简便有效的基础上,实现数据采集、交换等任务配置以及监控管理。

2)提纯加工:数据中台必须联通全域数据,通过统一的数据标准和质量体系,建设提纯加工的标准数据资产体系,以满足医院业务对数据的要求。

3)服务可视化:为了尽快让数据用起来,数据中台必须提供便捷、快速的数据服务能力,让相关人员能够迅速开发数据应用,支持数据资产场景化能力的快速输出,以响应客户的动态需求。

4)价值变现:数据中台通过打通各部门数据,提供以前单个部门或者单个业务单元无法提供的数据业务能力,以实现数据的更大价值变现。

3.3.3 医疗健康产业数据中台设计

目前医疗健康产业内成体系的数据来源于医疗服务机构、互联网医疗平台以及医药电商平台。医疗服务机构以医院为例采用综合管理系统(HIS)、以电子病历为中心的管理信息系统(EMR)等管理信息系统对医疗业务数据进行存储和管理,平均一个三甲医院平均每天产生约90~100TB的医疗数据。互联网医疗平台以及医药电商平台中多采用SaaS建站,数据存储在SaaS系统服务商的数据库中,包括用户数据管理、交易记录管理、药品管理、库存管理等。

在确定数据来源后,采集数据进行数据资产沉淀,形成数据池。从各系统、数据库、互联网、本地文档等途径采集数据得到原始数据,然后对原始数据进行一定的数据处理,主要分为数据清洗和数据标准化。通过数据清洗完成对错误数据的清除和对重要数据的修复,通过数据标准化完成异构数据的结构化,在医疗健康产业中多源异构型数据十分常见,例如症状报告、诊断报告、基因数据等,数据标准化利用数据词典、人工标识、机器学习等方式对这些数据进行标准化的处理,得到经过结构化的标准数据集。规范化的数据资产才能在后续的数据分析与挖掘中发挥更大的价值。

有了数据沉淀模块,中台就具备了基本的数据存储、处理、调用能力,在此基础之上,以数据池数据为基础建立数据资产体系。数据资产体系的建立,将数据进行多维度的分类和分层,可以提高数据的一致性和可复用性,方便数据的管理和维护。一般而言,中台数据资产体系分为4层:贴源数据层、统一数仓层、标签数据层、应用数据层。将数据资产分层对应到医疗健康产业,贴源数据层包含不同业务系统中的基本数据,包括MIS数据、HIS数据、PACS数据等;统一数仓层将数据按照类别进行划分,分为顾客域、药品域、员工域、疾病域、生物组学域、运营域、患者域、财务域、物品资源域等;标签数据层是在统一数仓层的基础上,将数据标签化便于数据筛选和分析,例如患者标签包括性别、年龄、地域、患病类型等患者基本属性,临床路径标签包括诊断次数、诊断时间、症状、用药记录、入院记录、手术记录等临床诊断和治疗数据;应用数据层即根据具体应用需求构成的不同数据集,包括病人数据、预算分析数据、临床路径数据、销售预测数据等。数据资产体系建设帮助中台庞大的数据集转化为统一标准的、方便应用的数据资产。数据中台设计的顶部为数据分析与服务层。数据分析与服务作为数据资产转化为业务价值的中介是数据中台对于数据资产的应用,在医疗健康产业中,主要的数据分析与服务方法包括NLP处理、医疗影像挖掘、建模与评估、数据可视化等。在完成数据中台的基本架构后,为了保障数据中台的平稳安全运行并持续发挥数据应用价值,还应建设数据运营体系和数据安全管理体系。

最终的医疗健康产业数据中台模型如图3-6所示:医疗健康产业数据中台实现了医疗数据的标准化、数据资产的层次建设、数据资产的管理与监控、指标体系建设以及统一的对外服务。数据中台作为枢纽,向下发展可以提高数据性能、保障数据的应用能力,向上拓展可以实现数据资产的价值、赋能医疗健康产业具体环节。

图3-6 医疗健康产业数据中台模型 v7wjPnJrie/eqycuSF+GT+S7JYedhwPVgAeAWfgsc5+j3PXnXpOBDfJ4ik3wBq94

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开