购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

医疗数据

医疗数据组成复杂。除了电子病历,患者经历、生命体征、实验室结果、处方等,还包括先进的医疗影像资料(如MRI、CT扫描、超声心动图和血管造影等) [1] 。结构化数据通常是以组织清晰的表格或关系数据库(如电子表格中的整数、字符串等)的形式呈现。这样的形式可以节省储存空间,并便于非结构数据区分(通常以文字、媒体图片、音频、视频等形式呈现)。非结构数据占用储存空间大。然而据估计,大约 80%的医疗数据是非结构化的 [2] (见图 4.1)。

国际疾病伤害及死因分类标准是由世界卫生组织制定的疾病分类清单。目前已经更新到第十版,不仅收录了疾病的详细描述(包括疾病的症状和体征),还详细记录了异常发现、伤害、社会状况等(与第九版相比,新版标准的计费代码更多,超过 69000 个)。国际间的互操作性和HIE交换依赖 3-7 位字母数字的诊断字符和程序代码(如,H91.21 代表右耳突发性特发性听力损失)。医疗编码的另一个参考标准是当前的程序术语,它是美国医学会编写的一组用于医疗、外科和诊断服务的代码。与ICD-10 中的代码表示诊断不同,5 位数的CPT代码表示的是提供的服务(例如,93303 或 93306 都代表经胸超声心动图,后者指在医保范围内的服务)。

《系统化临床医学术语集》是临床文献中医学术语的本体集合,包括了临床发现、症状、诊断、程序、解剖结构等各个方面。《系统化临床医学术语集》由四个核心部分组成,分别是要素概念、描述、关系和属性。此外,美国国立医学图书馆的一体化医学语言系统整合并区分了关键的术语和标准,提供了包括电子病历在内的可互操作的生物医学信息系统。为了统一对完全相同的医疗状况的描述,统一“字典”至关重要。观测指标标识符逻辑命名与编码系统专门用于医学实验室观察的数据库(见图 4.1)。完整的LOINC名称包含多个组成部分:属性:时间特征:体系/样本:标尺精度(如,2951-2 SOIDUM:SCNC:PT:SER/PLAS:QN)。

图 4.1 生物医学数据

此外,医学数字成像与通信标准是一种用于医学图像传输和管理的公认标准。用于存储、显示、处理和传输医学图像,以集成医学图像设备,从而实现图像的互操作。医学影像存档与通信系统是电子医学图像和报告的计算机网络系统。医学数字成像与通信标准由成像数据、传输信息的安全网络、审查图像的工作站和存储图像的档案组成。

大数据

数据经过各种方式的升级到超出传统的数据处理应用的处理范围的数据称为“大数据”。大数据的四个“V”特性常被提及,即(1)大量性(volume),到 2020 年,预计将有超过 40ZB,或相当于 40 万亿个千兆字节的数据,并且物联网将加速这一增长;(2)多样性(variety),视频、可穿戴技术、图像、结构化与非结构化的数据类型带来了数字“海啸”;(3)高速性(velocity),5G技术的支持下,在不久的将来,人们可以快速访问流媒体数据,容纳超过 200 亿的网络连接;(4)确定性(veracity),数据的不确定性不仅会提高成本,还会导致结论的不确定性 [3] 。此外,大数据的其他特征也在不断涌现,如价值、可视化、可变性等。

目前医疗数据的突出问题在于非结构化异质性的医疗数据量不断增加,以及缺乏嵌入预测分析或机器学习 [4,5] 。从生物医学数据的大小来看,尽管电子病历的大小范围仅在 5-10MB之间,但放射学和心脏成像研究的数据量则成 10-100 倍地增加,超过 50-100MB,然而这些数据仍远远没有临床基因组数据大,可能达到 20GB的数据量。总的来说,目前整个卫生保健数据量估计在150EB以上,并且这一数字还在快速增长 [6]

自动驾驶汽车、电子健康记录、床下的怪物:对影响患者结局的重要数据进行操作

理查德·弗兰克

西门子医疗集团

理查德·弗兰克是一位拥有数十年行业经验的内科医生,他撰写了这篇关于人工智能的评论,并指出人工智能将卫生保健数据转化为可操作元件,从而实现了四重目标,改善了患者的治疗效果的能力。

患者和医生都认为他们害怕增强智能事出有因。从改善疗效、提高患者体验和降低成本这“三重目标”来看,患者有理由怀疑增强智能会带来效率过剩,而对患者来说其重要的结局并不会得到改善。这类似于自动驾驶汽车,相对于行人的安全,它更注重行驶的平稳性;当传感器检测到一个步行的行人时,为了减少车辆行为不稳定的可能性,计算机控制下的车辆不会启用紧急制动操作 [1] ,尽管会带来致命的后果,汽车还是不会停下,而是直接进行撞击。

医生们有理由担心电子病历的缺点会再次出现,如过度承诺、不可互操作性等。医生们深受警报的骚扰,并为遵守电子病历的行政要求所累。最终要求采用电子病历的规定引起了人们的不满。在预先授权出现之前,电子病历是导致医生倦怠和自杀想法的主要原因。基于这一情况,医生们提出了“四重目标” [2] ,把“改善包括临床医生和工作人员在内的医疗服务提供者的工作生活”作为目标之一。

好消息是人工智能并不是电子病历。或者说,如果我们能吸取教训,它就至少不会成为电子病历。患者可以放心,医疗保健人工智能是用于临床决策的增强,而不是被它支配。为了跟上医学文献的更新速度,一位医生每天必须阅读 13 篇文章。过去的几十年里,在这种认知负担和收入激励的促进下,医生完成了从初级护理向专业护理的转变。如今,即使是专家也会遭受这种认知负担的痛苦,因为他们自己成功地创造了如此多高质量、可操作的知识。又因为医生日益短缺,这种情况变得更加复杂,这在部分地区尤为严重。

患者可以放心。医生通过咨询人工智能,可以获得丰富的医学知识,最大程度解决他们的问题。同时,医生也因为提供了更好的护理而获得成就感。

医生们可以放心,至少可以对传统的医疗设备创新者放心。在我们实现数据价值的过程中,将实现互操作性(见证DICOM成像)、简化工作流程,以及在护理点的可用性 [3] 。实现人工智能 [4] 承诺的资源节约和健康结局的关键是以人工智能增值所保证的支付形式进行激励,而不是压制对电子病历行政负担的抵制。

医生们乐意看到结局的改善,而且他们可以为有资格在临床实践中广泛采用的人工智能盖上批准章,将它们确定为“标准疗法” [5] ,在实际上授权,提供更好的护理。因为有更好的结果,除了能减少用药错误,医疗保健专业人员还有希望减少责任索赔。

激励措施将保证各个地区和社会经济内的公平获取。平衡三级学术医疗中心和社区诊所、世界级城市和农村环境的获取环境。由于医生的日益短缺,获得医疗照护变得困难,尤其是在服务不足的人群间。然而这一问题可以通过人工智能来缓解。作为护理路径的伴侣,人工智能将医生从单调的常规任务中解放出来,减轻他们的行政和认知负担。

除了DICOM的简化互操作性,成熟的创新者正在建立一个数字生态系统。这个系统不仅重视网络安全、患者隐私和工作流程,还参照大多数疾病的多学科共性促进整合。床下的怪物——对成本效益的过度追求和强制遵守医嘱——可能会阻碍患者结局和医生满意度的有益改善。相反,让我们通过评估、投资和支付机器在增强临床决策方面所做的工作来战胜怪物,从而收获基于对患者重要结局的可操作数据的新护理标准的好处。

参考文献

[1] NTSB. Preliminary report highway HWY18MH010. Available from https://www.ntsb.gov/investigations/ AccidentReports/Reports/HWY18MH010-prelim.pdf ; 2015 [Accessed 05.04.19].

[2] Bodenheimer T,Sinsky C. From triple to quadruple aim: care of the patient requires care of the provider. Ann Fam Med 2014;12(6):573-6. Available from http://www.annfammed.org/content/12/6/573.full[Accessed 05.04.19].

[3] Daniel G,Silcox C,Sharma I,Wright MB,Blake K,Frank R,et al. Current state and near-term priorities for AI-enabled diagnostic support software in health care. Available from https://healthpolicy.duke.edu/news/ white-paper-release-current-state-and-near-term-priorities-ai-enabled-diagnostic-support; 2019[Accessed 05.04.19].

[4] Collier M,Fu R. Technology; ten promising AI applications in health care. Harvard Business Review May 10,2018. Available from https://hbr.org/2018/05/10-promising-ai-applications-in-health-care [Accessed 05.04.19].

[5] JASON report. Artificial intelligence for health and health care. Dec 2017. Section 2.3. Available from https:// fas.org/irp/agency/dod/jason/ai-health.pdf [Accessed 05.0419].

尽管生物医学领域的大数据数量大、种类多、速度快、不确定性强,但从医疗大数据中获得的信息几乎没有任何好处 [7,8] 。然而,医疗大数据的利用在降低成本、减少复发、改善分诊、预测失代偿、预防不良事件、引入治疗优化等方面有相当大的机遇 [9] 。随着数据“海啸”的出现,目前的情况很快将变得更加复杂和艰巨:基因组数据(来自高通量的下一代测序) [10] 和生理学数据(来自家庭监测和可穿戴生理学设备) [11]

医疗数据的难题

医疗数据在很多方面存在独特性,这使数据对人工智能应用来说充满挑战性。

1.数据大小——医疗数据,尤其是基因组数据和一些图像数据,以及未来可能出现的可穿戴技术数据,在不断扩大。数据的管理和储存变得越来越困难。

2.数据位置——数据的形式丰富(临床数据与医保支付数据等)。通常这些数据存在于不同位置的数据仓库中,如诊所、医院、其他部门(放射科、实验室等)。

3.数据结构——大部分医疗数据(大于 80%)仍然是非结构化的,如手写的医嘱、超声心动图等。因此,医疗数据很难作为一个数据包来处理。

4.数据完整性——医疗数据中部分或大量缺失或不准确是很正常的事情。但这些问题可以通过数据挖掘和数据分析策略的方法弥补。

5.数据一致性——数据的记录方式因诊断的不同而存在差异,并且因为缺乏统一的规定,医生对病情的定义也不尽相同,即使是最简单的医学术语也可能不一致。

寻找相关数据

皮尔特·沃瑞坎普

皮尔特·沃瑞坎普是一位电气工程师,他的孩子死于癌症。通过这篇评论,他讲述了自己为了提高孩子的癌症存活机会,获取和管理儿子的医疗记录数据的艰难过程。

相比于成人癌症,儿童癌症更加特殊并极其罕见(图 4.2)。CI5-X数据库 [1] 显示,超过九成的癌症患者的诊断时间超过 45 岁。仅有 1%的癌症患者在 20 岁及以下时确诊。

图 4.2 总癌症人群的累积标准化人数

此外,成人癌症类型和儿童癌症类型有根本的不同。如图4.3所示,排名前五的成人癌症(包括肺癌、乳腺癌、前列腺癌、结肠癌和膀胱癌)和排名前十的儿童癌症(包括淋巴性白血病、脑癌、非霍奇金淋巴瘤、霍奇金病、骨癌、骨髓性白血病、结缔组织和软组织癌、肾癌、甲状腺癌和睾丸癌)之间完全没有关联性。

图 4.3 成人癌症和儿童癌症的关系

聚焦滑膜肉瘤

滑膜肉瘤是结缔组织和软组织癌的一个分支,初步诊断通常是在青少年和年轻人。大多数肿瘤最早发现四肢关节附近。滑膜肉瘤具有独特的染色体易位t(X;18) [2,3] 。转移常见于肺部,并且转移诊断后的平均生存率会下降到不足 5 年。

因上述原因,很少有制药企业研发相应的药物,且研究程度有限。此外,大多数儿童癌症领域的研究通常集中在“成功案例”上。这些案例运用新型实验性的治疗方法,观察到的中位总生存率有所改善,但它们的样本量通常在统计学上不显著 [4] 。不幸的是,那些“不成功的故事”总被遗忘和忽视。通常,因为那些未能治愈的患者的记录和治疗史的消失和不被关注,隐藏在这些患者病历中的重要数据也就很难找到。这些数据通常是非结构化的,常常包括手写的笔记。然而,目前还没有任何工具能够从这些有潜在价值的数据中提取完整的患者病史。此外,尽管这些数据包含了重要的信息,但它们并没有在临床医生和研究团队中共享。问题是:“我们如何访问和利用这些信息?”更重要的是:“之后的滑膜肉瘤患者如何从过去的患者以及他们的病史和接受的治疗方案中获益?”

扩展数据集

我们坚信,通过纳入并分享少数“成功案例”和其余这些“非成功案例”的相关信息,并利用DNA和RNA的研究突破,以及临床与研究团队的强大合作和专项基金会的支持,我们可以找到其中的模式和共同点,从而开发出相关的统计模型,向治愈疾病更进一步,甚至能在罕见病治疗方面有所突破。

2017 年,助人基金会建立了一个患者登记处,作为ShareMD合作倡议的一个组成部分。这个以收集滑膜肉瘤患者的数据为基础的概念,不仅受到患者及其父母的支持,也备受研究人员和肿瘤学家欢迎。迄今为止,助人基金会已经注册了 80 多名患者,并且人数还在迅速增长。

助人基金会——L4OF.org

助人基金会由蒂姆·沃瑞坎普于 2015 年创立,是一个非营利性组织,旨在帮助提高人们对滑膜肉瘤的认识,并为治愈滑膜肉瘤的研究提供资金。蒂姆与这种极其罕见的癌症斗争了5年,在此期间,他逐渐化身为意识和希望的灯塔。蒂姆当时只有 18 岁,但他积极的精神和对生活的无限热情吸引了大量关注。为了建立基金会,他一直努力工作直到最后一天。借助这个基金会,他能帮助他人并将自己的使命传递下去。为了实现蒂姆的愿望,同时也为了满足该病患者和他们家人的迫切愿望,我们坚信,通过将医疗记录与遗传信息结合进行分析共享,我们能迈出突破性的一步。

作为ShareMD合作的一个组成部分,助人基金会已经创建了滑膜肉瘤患者登记处,也是机构审查委员会批准的患者登记处,专门为滑膜肉瘤患者服务。患者信息将匿名处理(完全遵守HPPA的要求),并且未经允许,不会与任何人分享。基金会也期望在未来能将这一平台扩展到滑膜肉瘤之外的患者,把更多的医疗专业人士和研究人员也纳入进来。

生命是一场旅行,为同道之人而活。——蒂姆·沃瑞坎普

参考文献

[1].Forman D,Bray F,Brewster DH,Gombe Mbalawa C,Kohler B,Pineros M,et al.,editors. Cancer incidence in five continents,Vol. X,IARC scientific publication no. 164. Lyon: International Agency for Research on Cancer; 2014.

[2].Ren T,Lu Q,Guo W,Lou Z,Peng X,Jiao G,et al. The clinical implication of SS18-SSX fusion gene in synovial sarcoma. Br J Cancer 2013;109:2279-85.

[3].Coindre JM,Pelmus M,Hostein I,Lussan C,Bui BN,Guillou L.“Should molecular testing be required for diagnosing synovial sarcoma?”A prospective study of 204 cases. Cancer 2003;98(12):2700-7.

[4].Krieg AH,Hefti F,Speth BM,Jundt G,Guillou L,Exner UG,et al. Synovial sarcomas usually metastasize after .5 years: a multicenter retrospective analysis with minimum follow-up of 10 years for survivors. Ann Oncol 2011;22(2):458-67. Qp2LlKB9h44oFsYhUq+8empNF3w5m3QjTucQfPLkJaWm+f1DwR/BSXKSKvuLhWaj

点击中间区域
呼出菜单
上一章
目录
下一章
×