购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

一、临床大数据的来源

临床大数据研究中有针对特定研究目的收集的数据,但耗费时间长、费用高,也有没有事先设计的HIS数据,利用这样的数据开展研究具有样本量大、不断更新、研究时限长、评价指标多、研究成本低的特点,但是这样的数据在回答研究问题时处于次要地位,在某些情况下甚至不适宜进行临床大数据研究。因此,临床研究中更多的时候是采用两者结合的办法进行数据采集。

(一)针对特定研究目的采集的数据

基于医院或社区的原始数据开展的病例对照研究,可以获得有关复杂疾病的药物-疾病关联评价信息。而罕见病研究往往需要联合几个国家获得大样本基础人群和临床专家深入评估个案而实现。某些情况下,这种既有的病例对照监测网络可用于信号生成和鉴别的特定研究中。由国际制药工程协会(International Society for Phannaceutical Engineering,ISPE)发布的《优良药物流行病学规范( Good Pharmaco Epidemiology Practices ,GPP)指南》和国际流行病学会(International Epidemiological Association,IEA)发布的《流行病学实践指南》( Good Epidemiological Practice Guidelines ,GEP),提供了开展前瞻性的基于患者研究的相关指导建议。

监管机构在批准药品上市时有时要求开展患者注册登记研究,以进一步确定临床疗效,并监控其安全性。注册登记是一种可取的设计类型,例如,以某种数据源为结构开展研究,通过某种疾病诊断(疾病注册登记)或某种药物处方,(暴露注册登记)的选择,而进入该数据源开始研究。在有关疾病流行病学和风险最小化研究领域,药物流行病学的调查在不断增加。这样的调查需要抽样策略,允许外部有效性和最大化的应答率。当然RCT也是原始数据采集的一种形式。

在过去几年,欧盟委员会一直在大力鼓励和资助跨国合作的药品安全性研究。资金支持成为需要克服各国之间数据共享障碍的基础。网络化意味着研究者之间的合作,这是基于信任、与人分享的意愿,并最大限度地发挥专长优势。从方法学角度来看,数据网络有许多优点:①通过研究人群的规模增大,数据网络可以缩短获得所需样本的时间,便于罕见事件研究,加快药品安全性问题的研究;②跨国的药物暴露的异质性可供研究更多的单个药物的效果;③跨国研究可提供一些有关某种药物在一些国家是否存在安全性问题及其不同国家存在差异原因的额外信息,从而为监管机构和药品生产企业提供重要信息;④来自不同国家的专家参与数据库中和研究实践中的病例定义、术语、编码,这将有利于增加不同观察性研究结局的一致性;⑤数据的共享要求数据分析的精确和透明性以及数据管理标准的统一。

ADR的自发报告仍然是药物警戒的基石,主要从包括医疗人员、医学文献,特别是近来直接从患者处采集的信息。Eudra Vigilance是欧盟可疑ADR报告和评价的数据处理网络和管理系统,它处理个案病例安全报告(individual case safety reports,ICSRs)的电子交换,早期发现可能的安全信号,并持续监测和评价报告ADR有关的潜在安全性问题。

随着使用诸如Eudra Vigilance大型电子数据库系统地收集ICSRs的增加,数据挖掘和统计技术在检测安全性信号中得以应用。自发ADR报告系统有众所周知的局限性,已知或未知的外部因素可能影响报告率和数据质量。ADR数据在使用上可能是有限的,由于缺乏对某些事件发生频率的准确量化或对于其发生的危险因素不能明确,导致了ADR报告在利用上存在局限性。出于这些原因,现在一致公认,任何源于自发报告数据中的信号在进一步探讨之前需对其进行临床验证。

(二)日常医疗电子数据

HIS是指“利用电子计算机和通讯设备,为医院所属各部门提供病人诊疗信息和行政管理信息的收集、存储、处理、提取和数据交换的能力,并满足所有授权用户的功能需求”。HIS目前应用于我国各级医疗机构中,三级甲等医院基本普及HIS,县级医院中HIS覆盖率也达到60%。HIS数据包含医院日常诊疗信息、医疗管理信息等,主要包括门诊记录、急诊记录、住院信息、诊断信息、实验室检查信息、影像信息、药物使用信息、随访信息、手术记录、费用信息等。根据记录的信息量,我国每天产生的HIS数据将以TB甚至PB计算,长年积累的数据量更加庞大,是医疗大数据的典型代表,这些信息是患者就诊过程的全部真实记录,以信息化手段被详细记录下来,是疾病诊疗最真实、最基本的数据,与疾病或治疗关系最为密切,将这些数据进行整合分析,能够发现隐藏其中的大量具有重要医学价值的信息。

(三)医疗保险数据

医疗保险数据是保险报销过程中重要的一环,目前医疗保险已经覆盖了我国大部分人口,因此,其中所包含的数据也可以用于临床大数据研究。对于医疗保险有不同类型的数据库,如我国的省级医保、市级医保、生育保险、大病保险、个人医保等。医保数据具有覆盖面较广、数据记录详细、数据具有可追踪性、监管力度大、质量较高等优点,但缺点在于目前我国各类医保系统独立运行,医保数据还无法实现联通与交换,而将医保数据用于研究目的,尤其将医保数据库进行合并开展研究,编码的正确性就变得十分重要,否则对于某些内容则无法进行合理利用。

(四)医疗卫生服务平台数据

基于医疗电子数据化发展,我国目前已建立了各类医疗卫生服务平台,在建立标准医学数据库基础上,通过互联网传输,分别设立了在线的医学影像中心、电子健康档案中心、远程医疗信息共享系统,通过开展交互式诊断及管理系统,实现多个医疗机构资源互通与共享。其中国家卫生综合管理平台在刚刚开始运营阶段,已经采集并存储了突发公共卫生事件20万余条、传染病信息逾5千万、建立了5百万人的电子健康档案、存储新农合数据近4千万条、保存了1千万人的医疗数据。医疗卫生服务平台通过整合各类医疗资源,存储了海量医疗电子数据,为临床研究提供了新的数据来源。

(五)大样本临床医学研究或监测大数据的再次利用

医学的发展离不开临床试验,药品上市前有Ⅰ期、Ⅱ期、Ⅲ期临床试验积累的研究数据,药品上市后有Ⅳ期临床试验以及上市后再评价研究所获得的研究数据,大型疾病研究中的随机对照试验数据、大型队列研究数据、注册登记研究试验数据等。其中有些研究数据量可能达到几万例甚至数十万例,较其他数据类型可能具有更加丰富的信息。对于这些数据应进行二次挖掘,或与其他来源的医疗数据资料相关联,将极大地扩充研究的信息量,同时由于这类临床试验数据是专为某项研究而收集,数据质量较高,更利于知识的发现。

(六)公共卫生普查数据

我国开展过大量的疾病普查工作,如对24万余例恶性肿瘤患者的普查、近49万例鼻咽癌患者的普查、对11万余例妇女疾病普查等,通过普查积累了海量的医疗数据,信息收集方向明确,方法固定,通过分析与挖掘这些数据可以获得大量信息为临床提供参考。 aQXoev+IEEUE1oXCNyF+V4wGjQzs3Dfw4qpRAGFp7FSkAZuivZNnKD+LyR6dhlfX

点击中间区域
呼出菜单
上一章
目录
下一章
×