购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.3 医疗大数据分析

医疗大数据在临床实践与研究上已经得到很多应用,而且应用的场景还在不断增加。大数据分析的基本目标是找出数据中的某种规律,这个规律可以是回顾性的,可以是追踪性的,也可以是预测性的,但我们必须注意对经过数据分析得出的结论加以思考。

回顾性分析又称回归分析,目的是分析数据是否揭示了在过去发生或没有发生的某个事件。回顾性分析的一个缺点是我们通常对数据的完备性(比如入选病例是否吸烟和酗酒这类因素)无法控制,对数据分组(如入选病例在年龄和性别上的分布)也缺乏控制,这些因素在大数据分析里相当于噪声,有可能会对分析结果造成不利影响。例如,我们想要知道作为一种常用药,羟氯喹在类风湿性关节炎患者的治疗中有没有副作用。在2020年的一个回溯性研究上,人们通过健康保险数据和电子病历统计了100万名羟氯喹使用者的心血管并发症的长期风险数据,并与30万名柳氮磺吡啶使用者的数据相比较。结果显示,在不超过30天的短期使用者中,没有发现羟氯喹带来心血管并发症的额外风险,但长期使用羟氯喹与心血管死亡率增加有关。从比例上说,使用羟氯喹的病人并发心血管疾病的风险是使用柳氮磺吡啶病人的两倍。如果回溯性分析到此为止,那么我们看到羟氯喹组有明显更高的心血管并发症风险。但如果我们看这两组间的绝对数值,每十万个服用羟氯喹的病人中,死亡原因与心血管相关的人数为439,而服用柳氮磺吡啶的病人中,该数值为200,这个绝对值上的差别就没有那么大了。我们希望通过这个例子说明大数据分析必须全面,否则可能会得到不准确的推断。

追踪性分析,又称实时分析。这里的实时可以有不同的时间尺度,比如在医疗机构的管理上可以实时地追踪医院就诊的病人数量,并通过分析得知某一天或某一段时期医院的就诊人数是否出现异常,这种情况下考虑的时间尺度可以是每小时、每天或每星期;而在可穿戴设备上,可以根据人们穿戴的血氧仪、血压计来实时跟踪一些生理信号。在现在的一些研究中,可穿戴设备通过网络与人们的电子病历相关联,可以综合实时的测量并考虑电子病历里的信息来检测人们的健康状况,这种情况下我们关心的时间尺度可能是分钟。追踪性分析的一个重要用途是临床试药,在这种情况下我们通常建立用药组和对照组,然后追踪两组人群在服用药和安慰剂的情况下对某种疾病的预防或治疗效果。追踪时间的长短取决于两组里出现病灶的人数,当这些人数达到统计所需要的数目时,试药的过程就可以结束了。在这种情况下,我们对数据的完备性可以有更好的把握,可以在建立用药组和对照组时保证两组人群在统计特征上是相匹配的,包括年龄、性别、有无基础病,以及有无其他用药史等。

预测性分析是根据已有数据对将来做出预测,这在医疗上是重要的应用。例如,在指定治疗方案时都是根据以往的数据选择对病人最有利的疗法,预测在这种疗法下病人的预后将是最好的。而预测的模型则是基于对以前结果的大数据分析。举例来说,在肿瘤治疗中,一个重要的指标是病人的总生存期和疾病无进展生存期,所采用的药物是根据病人的肿瘤类别和分级、肿瘤的基因组学和病人的临床指征来选择的,医生的期望是病人有最好的预后。通过定期对病人进行随访,医生的期望有可能会修正,也许会发现以前的用药不是最好的,病人出现了耐药性。这时医生就会更换用药,希望在保持对肿瘤进行治疗的同时还能尽量避免耐药性。如果耐药性再次出现,那么医生可以更换另一类药物。例如,在乳腺癌的治疗中,根据对癌症病人的大数据分析,临床上已经设计了针对不同亚型的用药指南。在这个指南中,对治疗方案从一线疗法一直到四线疗法都有明确的指示,前提条件就是病人获得最好的预后。另外一个例子是大数据也被用于预测心脏衰竭。研究人员通过对电子病历的分析开发了人工智能系统来预测具体病人心脏衰竭的风险,目前已经可以做到提前一至两年预测心脏衰竭的发生。

需要指出的是,以上3种类型的分析并不是相互排斥的,针对同一个大数据可以同时用不同类型的分析。例如,对于可穿戴设备,个体用户关心的可能是他本人在某个时刻的健康状态,比如实时检测自己的心率,检测自己每天步行或跑步的距离;而保险公司可能会根据其受保人群是否使用可穿戴健康设备来预测、分析这些人是否更关心自己的健康,对那些坚持使用可穿戴设备来检测自身健康的人群,保险公司会通过大数据分析得到结论——这些人相对普通人群会更健康,因此会给他们提供奖励,比如降低保费。 29qasOuuSnJ4X1Pfy68baf58vLLH1kDUVAmWygDPUwwf9BzQQahdp2n8t6yIHUfB

点击中间区域
呼出菜单
上一章
目录
下一章
×