购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

4.1 医疗数据建模概述

4.1.1 医疗数据建模的困难与挑战

由于医疗数据往往分散在各种设备、系统和平台等数据源中,要通过医疗数据建模实现多源医疗数据的汇集、处理和整合并不是一件容易的事。

1)数据源越来越多,并且分散异构。随着医学工程技术的发展,医疗数据的数据源种类越来越多,包括医疗机构内的电子病历系统、医院管理信息系统、医学检验信息系统、影像信息系统、各种随访系统;不断涌现的用于检查、诊断、治疗的新型医疗设备;医疗机构的体检中心以及第三方体检机构的健康体检信息系统;移动医疗和穿戴式健康监测设备;各种组学数据库,如核酸序列数据库、蛋白质组序列数据库、基因信息数据库。这些数据源在空间位置上是分散的,在数据存储结构上由于来源于不同的制造商,具有较大的差异性。

2)数据内容越来越复杂。医疗领域是一个知识密集型的领域,医疗数据内容复杂。据统一医学语言系统UMLS(Unified Medical Language System)统计,医学涉及的概念超过382万种,与之相关的概念名称超过了1218万种,而由这些概念所构成的信息结构更是复杂多样。随着医疗科技的进步,越来越多新的检验设备、检查设施和治疗手段进入临床,也在不断增加医疗数据内容的复杂程度。不要说技术人员很难理解如此复杂的数据内容所蕴含的医学知识,就算是医生甚至是整个机构也难以完全掌握,很难定义一个完整的信息模型来汇集各类医疗数据,这也是医疗大数据很难整合和有效利用的重要原因。

3)对于数据语义要求越来越高。随着医疗数据应用的不断深入,对医疗数据语义的要求在不断提高。早期的医疗数据应用只需要用户能够读懂数据的含义,随着人工智能技术和大数据分析技术的不断应用,不仅要求用户能够读懂数据语义,而且需要计算机能够理解数据的语义,因而对医疗数据的标准化和结构化提出了更高的要求。同时,随着医疗专科分化越来越细,不同专科对数据的应用差别很大,对数据语义上的要求也会大相径庭,这为数据的标准化和结构化带来了更大的难度。此外,在没有事先约定的前提下,针对相同的医疗信息内容,不同的建模场景和建模人员构建的医疗信息模型可能差异性较大,难以达成一致,不能满足医疗信息语义互操作对医疗信息模型的一致性要求。

4)模型更新越来越频繁。医疗领域是一个知识密集型的复杂领域,包含众多的领域概念并且还在不断地变化,这对医疗信息模型的扩展性提出了高要求。此外,伴随着健康医疗大数据的发展和有效利用,医学模式正在加速变革,出现了许多需要利用信息模型来进行信息融合,从而对大数据进行获取、存储、管理和有效应用的场景。医疗数据的类型、关联和规模正在以前所未有的速度进行增长,导致医疗信息模型需要具备灵活的扩展能力来适应领域的变化。

通过医疗信息互操作来实现多个数据源的医疗数据关联和共享一直是医疗信息化领域的常用方法,在医疗大数据时代,更好地通过医疗信息互操作的技术和方法成为解决该问题的重要途径。

4.1.2 医疗数据模型的结构演变

医疗信息模型按照模型结构可以分为医疗信息单层模型和医疗信息分层模型两类。

医疗信息单层模型将信息语义和领域语义都表达在同一个层次模型中,包括数据类型、数据结构和数据元素的定义和组织方式,它是最常见的信息模型,其构建方法已经在之前的章节中进行过叙述。但是,由于缺乏必要的约束,导致单层模型的构建过于灵活随意;由于医学知识被“硬编码”进信息模型中,导致单层模型的维护和扩展需要巨大成本。

医疗信息分层模型则将医疗信息模型分层表达,通常可以分为参考模型和临床信息模型。方法的核心思想是通过“抽象-约束”结合的方式实现信息模型分层。“抽象”是以一种特定的逻辑为框架对医疗信息的通用、共性属性进行定义,其产物是稳定的底层信息模型。“约束”是通过对底层信息模型添加约束的方式定义出语义清晰的上层信息模型。底层信息模型为医疗信息的表达提供最小的必要约束和最大的信息表达范围,以保证对领域内医疗信息的表达能力。上层模型则可以保证对医疗信息的精细语义的表达能力,可以满足特定医疗信息需求的表达,其具有最紧密的约束和最精细的语义表达。参考模型是表达医疗信息通用属性的稳定的模型,其用来表达信息语义,包括数据类型、数据结构和逻辑结构。临床信息模型是通过对参考模型添加约束来定义领域语义。参考模型可以用来表达通用的信息语义,并且为上层的临床信息模型的构建提供语义约束。通过参考模型和添加约束的方式,可以对复杂环境下的医疗信息语义进行分层表达,可以实现医疗信息共性和特异性的表达,即保证医疗信息表达的灵活性,并且都能在一定程度上保证约束信息的一致性。因此,基于医疗信息分层模型满足医疗信息语义互操作需求逐渐成为一种趋势。

最终,分层模型实现了清晰的责任划分。领域专家负责对领域知识和临床需求进行原型模型的定义和术语绑定,软件开发技术人员负责基于参考模型的软件编程而不用考虑其中涉及什么样的临床知识,系统开发与信息建模工作的分离,使得技术人员与医疗人员的协作更为容易。这就带来了四点好处:其一,用户可参与,软件工程师可以基于参考模型进行系统的实现而无需充分学习和理解领域知识,领域专家可以通过编辑原型和模板来实现对信息系统或功能模块的控制;其二,易维护,原型驱动的方法可以通过动态加载原型的方式满足由领域知识变化而带来的需求变更;其三,支持语义互操作,稳定的参考模型可以支持信息系统的句法互操作,而可共享、重用的原型提供领域语义的表达,结合二者可以实现语义互操作,然而语义互操作能力很大程度上取决于原型的共享和重用;其四,领域知识共享,原型作为一种可共享的、计算机可处理的领域知识既能够促进厂商和临床专家之间的沟通交流,又能作为一个领域知识源为领域的发展提供知识服务,如标准的制定、指南的编写、信息模型的构建等。

4.1.3 医疗数据建模的模式演变

伴随着医疗数据模型结构从单层结构向多层结构的演变,随之而来的是从集中的统一数据建模向受控的协作数据建模方法的演变。

协同建模机制是从建模机制的维度来保障复杂且动态环境下医疗信息模型的一致性和完备性。面对医疗领域本身的复杂性和动态性,医疗信息语义互操作对应的医疗信息分层模型的构建必然是一个协同的过程。医疗信息建模所需的领域知识是非常庞杂的,已经远远超过个人所能够表达的地步。只有通过多区域跨领域的领域专家的协同建模,才能够满足医疗信息语义互操作对医疗信息分层模型的需要。除此之外,医疗信息建模需要涵盖的医疗健康数据范围越来越大,标准滞后数据有效利用的现象越来越明显,进而影响数据的集成、共享和有效利用。因此,以往的标准组织完全掌控的、封闭式的医疗信息建模方法已经不能够完全满足医疗信息需求,开放式的医疗信息建模已经成为一种必然趋势。这种具有一定约束的开放式的医疗信息建模,使得建模团队有可能找到模型统一性和需求个性化的平衡点,实现不同专业、不同需求的建模协同,同时保证数据的互操作性。 Nqvtq7nm8Rgq6BchPJmJShUVg25YgPMcCfE+DDwwgL+MvaWrnl2JXzRHzLmD7x6k

点击中间区域
呼出菜单
上一章
目录
下一章
×