运用流行病学研究方法,关注并探索老年人群中健康与疾病问题的重要性日益凸显。目前,流行病学研究方法已深入老年医学研究的各个领域,包括老年疾病病因探索、老年人健康促进和老年公共卫生服务政策和措施制订等方面。流行病学研究方法可以探索目前存在于老年人群中的诸多问题,如老年人口健康指标的构建与评价、老年人卫生保健系统或医疗措施变革的效果评价、老年人口慢性病的危险因素、筛检和预防策略等。本章介绍了常用的流行病学研究设计,包括横断面研究、队列研究、病例对照研究、治疗性研究、真实世界研究以及诊断试验,并总结了流行病学研究设计在老年人群中应用的注意事项,旨在为老年卫生保健、疾病防治实践和相关科学研究工作提供参考。
横断面研究是研究在特定时间和特定范围内人群中有关因素与疾病或健康状况的关系。横断面研究收集的资料既不是过去的暴露史,也不是未来的发病或死亡情况,只是调查当时所得到的资料,故又称为现况研究。其特点是在特定时间内同时调查收集是否患病和可能的影响因素或特征信息,这样研究时疾病和相关因素或特征是同时存在的,故一般不能进行时间上的因果关系判断。
横断面研究的目的和用途包括了解疾病的现况和描述疾病的分布,了解影响疾病分布和健康状况的相关因素,衡量人群患病程度和健康水平,及早发现患者,了解疾病和人群健康水平的变动趋势以及致病因素对人群的危害;评价疾病防治和有害健康行为干预措施的效果;为卫生决策的制定和卫生资源的合理利用提供依据。
横断面研究包括普查和抽样调查两种。普查即全面调查,指在特定时间、特定范围内的将全部人群(总体)作为研究对象的调查;抽样调查,指通过随机抽样的方法,对特定时间、特定范围内人群的一个代表性样本进行调查,以样本的统计量来估计总体参数的范围,即通过对样本中研究对象的调查研究,来推论其总体的情况。实际工作中,若不是为了早发现和早治疗患者,而是要揭示疾病或健康状况的分布规律,就不必进行普查。两种方法的具体适用范围、优点及局限性见表2-1-1。注意抽样调查是一种以小测大、以局部估计全体的调查方法。抽样调查的基本要求是能将从样本获得的结果推论到整个群体(总体)。因此,抽样必须随机化,样本量要足够,且调查分布要均匀。目前常用的抽样方法有:简单随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样,每种抽样方法均有各自的优缺点,故应结合调查目的、调查对象与调查内容的特点来选择。
表2-1-1 普查和抽样调查的适用范围、优点及局限性比较
这是一种最简单、最基本的抽样方法,是指总体中的每一个成员都有完全同等的机会被抽出来,可应用掷硬币、抽签或借助随机数字表抽取样本。
这是一种按照一定顺序,机械地每间隔一定数量单元抽取样本的方法。这种抽样方法适于现场应用,总体人群内分布比较均匀,有较好的代表性。在较大范围内进行老年流行病学调查时常用此法。
这是一种先按总体不同的人口学特征或疾病的病情分成若干层次,然后再从每个层中进行简单随机抽样构成样本的方法,分层可以修匀总体内个体差异,然后随机抽样,可提高样本的代表性。如在进行老年人流行病学调查中,常按照5岁或10岁分为若干个年龄组,然后在各年龄组中按随机原则或规定一定比例抽取研究对象,各年龄组抽取成员的数量,一般应按各层在总体中所占的比重来抽取。
这是以群体为单位进行抽样,对被抽样群体内所有成员进行全面研究。这种调查方法比较简便,在老年流行病学调查中亦常采用,如对某工厂、某乡村、某学校的全体老年人进行调查。但是,这种方法易破坏抽样成员在总体中的分布均匀性。有时,与社会上同龄的老年人相比,某些单位被调查的老年人,往往具有受教育程度和经济收入优势,因而可能造成偏倚,应引起调查者的注意。
在一项大型调查中,将上述几种抽样方法综合使用,常把抽样过程分为不同阶段进行,如先进行分层随机抽样,再行整群抽样,甚至还可以继续进行二级整群抽样。
主要因抽样方法选择不当,未遵守随机抽样原则,从而产生偏倚。抽样方法和抽样样本一旦确定以后,不可随意变动或用他人代替;出现选择偏倚的另一个原因是调查对象的依从性差或各种原因回避问题的无应答,造成了不应答偏倚,如应答率低于90%就较难通过调查结果来估计整个研究人群的整体情况了。
指在收集调查信息时所发生的系统误差,这种偏倚主要来自调查对象、调查者和仪器检测手段3个方面:①调查对象对个人的暴露史记忆不清或认为与己无关、不以为意而造成的回忆偏倚和对所调查的问题不了解、回答不准确或出于顾虑而回避实情造成报告偏倚;②信息偏倚也可来自调查者,对调查对象的询问和检查不能同等对待,持有个人的意愿而失去调查的客观性;③因仪器不准确、操作不规范,缺乏实验室质量控制而产生的系统误差,又称为测量偏倚。信息偏倚的控制无外乎针对以上原因,严格执行计划,做到调查员的培训,并进行考核,必要时可进行预调查,及时修改调查表、询问的方式等,减少信息偏倚的产生。
队列研究是将人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自结局,比较不同亚组之间结局频率的差异,从而判定暴露因素与结局之间有无因果相关性及相关性大小的一种观察性研究方法,主要观察与暴露因素可能有关的结局。队列研究的特点为:①研究开始时,研究对象均无所研究的疾病或事件,需经一段时间随访才能发现病例(或事件结局);②研究对象按暴露与否分组,其暴露状况已客观存在,研究者不能将其随机化分配;③人群的暴露及其变化由研究者调查与记录;④从因果关系来看,因在前,果在后,由因寻果;⑤可计算两组的发病率、发生率、治愈率、死亡率和相对危险度(relative risk, RR )。
队列研究的基本原理是在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组、高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期结局(如疾病、死亡或其他健康状况)的发生情况,比较各组结局的发生率,从而评价和检验危险因素与结局的关系。如果暴露组某结局的发生率明显高于非暴露组,则可推测暴露与结局之间可能存在因果关系,其结构模式见图2-1-1。在队列研究中,所选研究对象必须是在开始时没有出现所研究的结局,但在随访期内有可能出现该结局(如疾病)的人群。暴露组与非暴露组必须有可比性,非暴露组应该是除了未暴露于某因素之外,其余各方面都尽可能与暴露组相同的一组人群。
图2-1-1 队列研究的结构模式图
队列研究根据研究对象进入队列时间及终止观察的时间不同,分为前瞻性队列研究、历史性队列研究和双向性队列研究3种。队列研究类型示意图见图2-1-2。
图2-1-2 队列研究的类型示意图
前瞻性队列研究是队列研究的基本形式。研究对象分组是根据研究对象显示的暴露状况而定,此时研究结局尚未出现,需要前瞻观察一段时间才能得到,这种设计又称即时性队列研究。前瞻性队列研究的最大优点是研究者可以直接获取第一手资料,资料的偏倚较小,结果可信;缺点是所需观察的人群样本很大,观察时间长、花费大,因而影响其可行性。
历史性队列研究是一种受欢迎的快速的队列研究方法。研究工作是从现在开始,研究对象是过去某个时间进入队列的,即研究的起点是过去某个时间。研究对象的确定与分组是根据进入队列时的暴露情况进行的,研究结局在研究开始时已经发生。尽管收集资料与结局资料的方法是回顾性的,但从暴露到结局的方向是前瞻性的,仍是从因到果的前瞻性观察,这种设计又称非即时性队列研究。历史性队列研究具有省时、省力、出结果快的特点,因而适宜于长诱导期和长潜伏期的疾病,也经常用于具有特殊暴露的职业人群的研究;缺点是因资料积累时未受到研究者的控制,常缺乏影响暴露与疾病关系的混杂因素资料,从而影响暴露组与未暴露组的可比性。
双向性队列研究也称混合型队列研究,即在历史性队列研究的基础上,继续前瞻性观察一段时间。这是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式,因此兼有前瞻性队列研究和历史性队列研究的优点,且在一定程度上弥补了各自的不足。
由于队列研究常常是有一定规模的研究,需要观察一个较长时期,实施起来较为复杂,因此在实施队列研究前,应根据具体情况审慎选择。
选择前瞻性队列研究时,应重点考虑以下几点。
(1)应有明确的研究目的和检验假设。
(2)所研究疾病的发病率或死亡率一般不应低于5‰。
(3)应有把握获得观察人群的暴露资料。
(4)应明确规定结局变量,如发病或死亡,且要有确定结局的简便而可靠的手段。
(5)应有把握获得足够数量的观察人群,且该人群能被长期随访观察而取得完整可靠的资料。
(6)应有足够的人力、物力和财力支持该项研究。
历史性队列研究完全依赖于暴露、疾病和生死状况完整真实的历史记录,因此足够数量的完整可靠的记录或档案材料是实施历史性队列研究最重要的前提;此外,也应考虑前瞻性队列研究中所考虑的上述六点,在条件具备的情况下,历史性队列研究备受关注。
当基本具备进行历史性队列研究的条件时,如果从暴露到现在的观察时间尚不能满足研究的要求,还需继续前瞻性观察一段时间,则选用双向性队列研究。
队列研究现场选择的基本要求包括:①研究对象数量足够;②当地配合程度高;③交通便利;④现场代表性好。研究对象的选择包括暴露人群和对照人群。根据研究的便利性和可能性,暴露人群通常有下列4种选择:职业人群、特殊暴露人群、一般人群和有组织的人群团体。对照人群选择的基本要求是尽可能保证其与暴露人群的可比性,即对照人群中除未暴露于所研究的因素外,其他各种影响因素或人群特征(年龄、性别等)都应尽可能与暴露人群相同或相近。注意:由于队列研究多是前瞻性的,随访过程中可能会出现失访,要求样本量计算时考虑失访率。
队列研究资料的收集主要包括基线资料的收集和随访资料的收集。基线资料的收集,指在确定研究对象后,详细收集每个研究对象在进入队列时详细的基本情况,包括暴露的资料(有无暴露及暴露程度)及个体的其他信息。而随访资料的收集,指对暴露人群与对照人群采用相同的随访方法(如面访、电话访谈等),坚持追踪到观察终止期,收集内容一般与基线资料内容一致(如持续收集暴露状况的资料,以便及时了解其变化),但随访收集的重点在于结局变量。
由于可以实际计算发病率和死亡率,常用衡量关系强度的指标包括相对危险度( RR )和归因危险度(attributable risk, AR )等, RR 代表暴露者的疾病危险性为非暴露者的多少倍,而 AR 为暴露组发病率与对照组发病率相差的绝对值,表示危险特异归因于暴露因素的程度。
队列研究同样在设计、实施和资料分析等各个环节都可能产生各种偏倚,最常见的类型为失访偏倚,因此结果解读时同样需要慎重。
如果研究人群在某些重要因素方面与一般人群或待研究的目标人群存在差异,即研究人群(样本)不是目标人群(总体)的一个无偏的代表,将会引起选择偏倚。在队列研究中,如果暴露组和非暴露组在某些影响研究结果的主要特征上不一致,就会产生选择偏倚。虽然在队列研究设计阶段会采取各种措施以保证暴露组和非暴露组的均衡性,但由于最初选定的研究对象有人不能参加了;进行历史性队列研究时,有些人的档案丢失或记录不全;研究对象为志愿者,他们往往是具有某些特征或习惯的;某些早期患者在研究开始时未能发现等;或暴露与疾病的定义不严格、执行不当等均可能造成研究对象的选择偏倚。
避免和减少选择偏倚的唯一方法是尽量提高研究对象的应答率和依从性;在进行历史性队列研究时,要求目标人群的档案资料齐全,丢失或不全的记录必须在一定的限度之内,否则应谨慎选用。
在研究过程中,某些选定的研究对象因为种种原因脱离了观察,研究者无法继续随访他们,这种现象叫失访,因此而造成对研究结果的影响称为失访偏倚。队列研究由于观察人数较多,观察时间长,失访是不可避免的,主要原因是研究对象迁移、外出、不愿再合作而退出或死于非终点疾病。失访产生的偏倚大小主要取决于失访率的大小和失访者的特征以及暴露组与非暴露组两组失访情况的差异,如果暴露组和非暴露组的失访人数相等,且各组中失访者和未失访者的发病率相同,则可以认为通过该研究获得的各组发病率可以反映该研究人群的实际情况,失访对研究结果无影响;如果暴露组失访者的发病率高于未失访者,则从继续观察者中获得的发病率要低于所有受试者的实际发病率,使暴露与结局的相关性被低估;如果暴露组失访者的发病率低于未失访者,则其偏倚效应相反。失访率一般不应超过10%。
控制失访偏倚主要靠尽可能提高研究对象的依从性,在选择研究对象时选择那些符合条件且依从性好的研究对象。当失访率超过10%时,则应对失访可能造成的影响做进一步评估。首先,要比较两组失访率的差别及不同程度暴露组失访率的差别,比较失访者与未失访者基线调查时获得的某些基本特征有无差别,如果这两点差别不显著,则可认为失访是随机的,对于研究结果的影响可能不大,只是减少了样本量。还可以从各种途径了解失访者的最后结局,与被随访到的人群的结局进行比较,以推测失访的影响。应注意的是,上述方法仅是对失访者和未失访者间发病率差异的一种推测,而不是测量,控制失访偏倚的最好方法还是尽可能地减少失访,若失访率达到20%以上,则影响该研究结果的真实性。
性别、年龄、工龄等均可能成为混杂因素,可用匹配法、分层分析与多因素分析消除混杂因素,也可通过计算标准化发病率与死亡率加以控制。
病例对照研究是一种由果及因的回顾性研究方式。它是先按疾病状态确定调查对象,分为病例和对照两组,然后利用已有的记录,用询问或填写调查表的方法,了解其既往(发病前)的暴露情况,并进行比较,推测疾病与暴露之间的联系。病例对照研究主要研究潜隐期长的罕见病,或容易漏诊、误诊疾病的危险因素,也适用于几种因素与一种疾病有关时,或多种因素之间有交互、协同、效应修正作用时。病例对照研究的特点包括:①在疾病(事件)发生后进行,已有一批可供选择的病例;②研究对象按疾病(事件)发生与否分成病例组与对照组;③调查的被研究因素或措施的暴露情况,由研究对象从现在对过去的回顾;④从因果关系的角度看,结果已经发生,由果推因;⑤仅能了解两组的暴露率或暴露水平,不能计算发病率。
在设计所规定的病例和对照人群中,分别抽取一定量的研究对象,一般对照数目应等于或多于病例人数,此外没有其他任何限制与规定。
匹配即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰。如以年龄做匹配因素,在分析比较两组资料时,可免除由于两组年龄构成的差别对于疾病和因素的影响,从而更正确地说明所研究因素与疾病的关系。匹配分为频数匹配和个体匹配。
又称成组匹配,匹配的因素所占的比例在对照组与病例组一致。如病例组中男女各半,65岁以上者占1/3,则对照组中也如此。
以病例和对照的个体为单位进行匹配称为个体匹配。1∶1匹配又称配对,1∶2、1∶3、…、1∶R(或1∶M)匹配时,则称匹配。
在病例对照研究中采用匹配的目的,首先在于提高研究效率,表现为每一位研究对象提供的信息量增加;其次在于控制混杂因素的作用。因此,匹配的变量必须是已知的混杂因子,或有充分的理由怀疑为混杂因子的变量,否则不应匹配。应注意的是,匹配的同时也增加了选择对照的难度,而一旦某个因子再做匹配,不但使它与疾病的关系不能分析,而且使它与其他因子的交互作用也不能充分分析;把不必要的项目列入匹配,企图使病例与对照尽量一致,则可能徒然丢失信息,增加工作难度,结果反而降低了研究效率,这种情况称为配比过度,应注意避免。
巢式病例对照研究又称套叠式病例对照研究或嵌入式病例对照研究,也称为队列内病例对照研究,是将队列研究与病例对照研究相结合的一种研究方法。首先进行队列研究,收集每个队列成员的暴露信息以及有关的混杂资料,确认随访期内发生的每个病例,然后以队列中的病例作为病例组,对照组来自同一个队列,进行病例对照研究。该方法的优点包括:①病例与对照的暴露资料均在发病或死亡之前获得,暴露与疾病的时间先后顺序清楚,且无回忆偏倚;②病例组与对照组可比性好;③因队列成员的暴露率较高,且队列成员接受暴露的开始时间相同,这样可提高统计效率和检验效率,而一般的病例对照研究仅取整个暴露期的一个横断面。
具体包括病例组和对照组。病例组的选择原则是,所选病例应是所有病例的无偏代表,且必须具有统一、明确的诊断标准;病例来源包括新发病例、现患病例或死亡病例,最好选择前者。对照组的选择比较复杂,原则要求除了未患所研究疾病外其他条件尽可能与病例组相同;对照组来源包括病例所在医院的其他患者、病例所在地区的其他人群,分别对应称为以医院为基础的病例对照研究和以社区人群为基础的病例对照研究。注意选择研究对象应保证足够的数量,以保证研究结束时能出现统计学的差异。
资料来源一般包括医院病历、登记报告资料、人口普查数据、职业史记录等,其中大部分是由调查员采用统一的调查表入户询问调查、信访或电话询问完成。注意调查病例和对照的项目、检查方法和标准应完全相同,调查员对两组调查应同样认真,且不宜提出倾向性问题。
常用分析包括:①判断暴露与结局有无关联,可以利用卡方检验判断病例组和对照组中有某因素者分别占总例数的比例差异有无统计学意义,若差异有显著性,则表示疾病与某因素的关联并非偶然发生的;②评价暴露与结局关联强度的大小,病例对照研究适用的关联强度指标为比值比(odds ratio, OR ),具体含义指暴露者的疾病危险性为非暴露者的多少倍。
对于病例对照研究结果的解读,特别是当分析得到某因素与疾病存在关联的结论时,应考虑该结果到底由何种原因造成,因为病例对照研究是回顾性观察研究,容易产生偏倚,常见的偏倚包括选择偏倚、信息偏倚和混杂偏倚。
(1)选择偏倚:
指由于选入的研究对象与未选入的研究对象在某些特征上存在差异而引起的系统误差,常发生于研究的设计阶段,如入院率偏倚、现患病例-新发病例偏倚等。
(2)信息偏倚:
指在信息的收集整理过程中由于测量暴露与结局的方法存在缺陷而造成的系统误差,如回忆偏倚等。
(3)混杂偏倚:
指潜在混杂因素在比较的人群组中分布不均衡,缩小或夸大研究因素与疾病之间真实联系的现象。在设计阶段利用限制、匹配、随机化方法,在分析阶段利用标准化、分层分析、多因素模型,可适当控制混杂偏倚。
传统的病例对照研究与队列研究的优缺点很大程度上是互补的,见表2-1-2。近年来新开发的一些研究类型,分别从不同角度克服了病例对照研究的固有缺陷,如巢式病例对照研究不存在推论真实性差的问题,其关键在于资料的可获得性。病例对照研究是分析流行病学的重要工具之一,有着巨大的潜力及应用价值。
表2-1-2 病例对照研究与队列研究的优点及局限性比较
病例对照研究是回顾性的观察研究,较易产生偏倚,可通过严谨的设计和细致的分析识别、减少和控制偏倚。常见的偏倚有选择偏倚、信息偏倚和混杂偏倚。
由于选择的研究对象不能代表总体人群而产生,最常见的选择偏倚是伯克森偏倚(Berkson's bias),又称入院率偏倚,这是由于选择医院的患者作为病例与对照,而这些患者可以因为种种原因造成入院率的差异,如高血压患者、肿瘤患者与阑尾炎患者的入院率显然各不相同,入院率的不同可造成偏倚。避免选择偏倚的主要方法是尽量合理地选择病例与对照,如果不能从整个总体人群中选择全部或绝大多数符合诊断标准的病例,就需尽可能地从各种各类医院中选取病例,并从多科室的多病种中选择对照。
主要有回忆偏倚,由于病例对照研究是回顾性调查,回忆偏倚难以避免,但有些方法可以在一定程度上减少回忆偏倚,如采用直接询问调查,对病例和对照均应使用同一问卷、同一询问调查员、同一询问方式、同一询问时长,最好采用盲法;选择起病不久的新病例作为调查对象可以减少回忆偏倚;调查药物服用史应使用药物图片辅助询问,最好有病史卡、服药记录等客观凭证来佐证患者的回答资料。
混杂偏倚指外部变量全部地或部分地掩盖或夸大了所研究的暴露因素和研究结果间的真实联系,控制方法可考虑:①用匹配法进行研究,把混杂因素作为匹配因素;②分析时,用分层分析法,按混杂因素进行分层;③进行多因素分析。
治疗性研究是指在临床实践中以人为研究对象,应用医学科研的理论和方法,通过进行科学严谨的设计和精确的测量对所研究或选择治疗的效果进行客观的评价,以达到提高治愈率、降低病残率及病死率,提高生存质量,改善人体健康的目的。由此可见,临床治疗性研究与评价往往是通过临床试验完成的。
治疗性研究具有以下基本特点。
(1)属于前瞻性研究:
即必须干预在前、效果在后,直接跟踪研究对象,这些受试者虽不一定从同一天开始,但必须从一个确定的起点开始跟踪。
(2)以患者为研究对象:
常用于评价药物或治疗方法的效果。
(3)具有均衡可比的对照组:
研究中的对象均来自同一总体的样本人群,其基本特征、自然暴露因素和预后因素应相似;严格的研究设计应采用随机方法把研究对象分配到试验组或对照组,以控制研究中的偏倚和混杂,如果条件受限不能采用随机分组方法,应使试验组和对照组的基本特征均衡可比。
(4)有干预措施:
干预措施是研究者为了实现研究目的而施加于研究对象,可以是一种或多种干预处理,作为处理因素可以是预防某种疾病的疫苗、治疗某病的药物或干预的方法措施等,因此治疗性研究应注意医学伦理学问题。
适用于治疗性研究的设计方案首推随机对照试验(randomized controlled trial,RCT),其次为随机交叉试验、前后对照试验、前瞻性队列研究、非随机对照试验以及系列病例的疗效分析等;而RCT设计是被公认的治疗性研究试验设计的最佳选择。
随机对照试验是在人群中进行的、前瞻性的、用于评估医学干预措施效果的实验性对照研究。它把研究对象随机分配到不同的比较组,每组施加不同的干预措施,通过适当时间的随访观察,比较组间重要临床结局发生频率的差别,以定量评估不同措施的作用或效果的差别。除对照和随机分组外,随机对照试验通常还会采用分组隐匿、安慰剂、盲法、提高依从性和随访率、使用维持原随机分组分析等降低偏倚的措施。随机对照试验是目前评估医学干预措施效果相对严谨、最可靠的科学方法。
通常情况下,用一种干预措施(可以是安慰治疗或无治疗)作为比较的标准或参照,接受该措施的研究对象则被称为对照组。理想的对照群组必须完全可比,也就是说除评估的干预措施外,在研究的自始至终,所有可能影响有关临床结局或疾病转归的因素在各比较组间均可比或无差别,从而在各组都不施加干预措施时,组间临床结局不存在差别;只有这样,在组间施加不同干预时,组间临床结局的差别才能归因于不同干预措施效果的差别。
设立对照组的方法有以下几种。
(1)标准疗法对照:
是最常用的一种对照方式,是以常规或现行的最好疗法(药物或手术)作为对照,适用于已知有明确疗效的疾病;
(2)安慰剂对照:
安慰剂通常用乳糖、淀粉、生理盐水等成分制成,不加任何有效成分,但外形、颜色、大小、味道与试验药物或制剂极为相近,在所研究的疾病尚无有效的防治药物或使用安慰剂后对研究对象的病情无影响时才使用;
(3)自身对照:
即试验前后以同一人群作对比,如评价某预防规划实施效果,在试验前需要规定一个足够的观察期限,然后将预防规划实施前后人群的疾病和健康状况进行对比;
(4)交叉对照:
即在试验过程中将研究对象随机分为两组,在第一阶段,一组人群给予干预措施,另一组人群为对照组,干预措施结束后,两组对换试验,这样,每个研究对象兼作试验组和对照组成员,但这种对照必须有一个前提,即第一阶段的干预一定不能对第二阶段的干预效应有影响,这在许多试验中难以保证,因此,这种对照的应用受到一定限制。
此外,尚有历史对照、空白对照等非均衡对照,由于这类对照缺乏可比性,除某种特殊情况外,一般不宜采用。
影响转归的因素在组间可比是准确估计和比较干预效果大小的前提。要获得组间的可比性,分组的程序必须与任何已知和未知的可能影响患者转归的因素无关,这种分组方式就是常说的随机分组。随机分组是获得组间可比性最可靠的方法,是随机对照试验的重要的科学基础之一,目的是使非研究因素在组间分布均衡,以减少偏倚。
常用的随机化分组的方法有以下3种。
(1)简单随机分组:
可将研究对象按照个人为单位用掷硬币(正、反两面分别指定为试验组和对照组)、抽签、使用随机数字表,也可采用系统随机化法,即用现成的数据(如研究对象顺序号、身份证号、病历卡号、工号、学号等)交替随机分配到试验组和对照组中去。
(2)分层随机分组:
按研究对象特征,即可能产生混杂作用的某些因素(如年龄、性别、病程、病情等)先进行分层,然后在每层内随机地把研究对象分配至试验组和对照组。
(3)整群随机分组:
按社区或团体分配,即以家庭、学校、医院、村庄或居民区等为单位随机分组,这种方法比较方便,但必须保证两组资料的可比性。
盲法是一种避免知晓研究对象获何种处理的策略,根据盲法的程度不同,一般可分为单盲(研究中只对研究对象设盲,即研究对象不知道自己是试验组还是对照组)、双盲(研究对象和给予干预或结局评估的研究人员均不了解试验分组情况,而是由研究设计者来安排和控制全部试验)、三盲(在双盲基础上对负责资料收集和分析的人员也设盲),其中应用较多的有单盲和双盲。
(1)单盲:
这种盲法的优点是研究者可以更好地观察了解研究对象,在必要时可以及时恰当地处理研究对象可能发生的意外问题,使研究对象的安全得到保障;缺点是避免不了研究者方面带来的主观偏倚,易造成试验组和对照组的处理不均衡。
(2)双盲:
双盲的优点是可以避免研究对象和研究者的主观因素所带来的偏倚,缺点是方法复杂,较难实行,且一旦出现意外,较难及时处理,因此,在试验设计阶段就应慎重考虑该方法是否可行,一般地,双盲法不适用于危重患者。
(3)三盲:
三盲的优缺点基本同双盲,从理论上讲该方法更合理,但实际实施起来很困难。与盲法相对应的是非盲法,又称开放试验,即研究对象和研究者均知道试验组和对照组的分组情况,试验公开进行,多适用于有客观观察指标的临床试验,如关于外科手术、生活习惯改变(包括饮食、锻炼、吸烟等)的干预效果的观察,优点是易设计和实施,研究者了解分组情况,便于对研究对象及时处理,主要缺点是容易产生偏倚。
根据研究目的确定研究对象,研究对象包括试验组和对照组。选择研究对象时应制定严格的入选标准和排除标准,以避免某些因素影响研究的真实效应或存在医学伦理问题。选择研究对象的主要原则有以下几点。
(1)选择对干预措施有效的人群:
如对某疫苗预防某疾病的效果进行评价,应选择某病的易感人群为研究对象,要防止将患者或非易感者选入。
(2)研究对象要具有代表性:
样本应具备总体的基本特征,如性别、年龄、疾病类型、病情轻重比例等均要能代表总体。
(3)选择预期结局事件发生率较高的人群:
如评价疫苗预防传染病的效果,应选择在相应传染病高发区人群中进行。
(4)选择容易随访的人群:
如可选择有组织的人群、离实验中心不太远的人群。
(5)选择干预措施对其有益或至少无害的人群:
要充分估计干预措施可能产生的不良反应,若干预措施对其有害,一定不能作为研究对象,有些药物对某类人可能会产生严重不良反应,这些人也应予以排除。
(6)选择依从性好、乐于接受并坚持试验的人群:
为防止和减少不依从者的出现,对研究对象要进行宣传教育,讲清试验目的、意义和依从性的重要性;要注意设计的合理性,试验期限不宜过长,要简化干预措施等,以便取得研究对象的支持与合作。
干预措施应有科学的证据,要有临床前期的观察,证明该措施有效性和安全性,应具有一定的创新性且符合医学伦理;研究计划中研究者应针对干预的实施细节进行具体详尽的限定和描述,如药物的给药途径、给药时间、给药剂量和用药时间、停药时间、出现严重不良反应时的处理原则,以及其他注意事项;须说明措施的实施方法,实施应该有统一的标准。
对所有的研究对象,不论是试验组或是对照组,都要同等地进行随访,并要求对所有的研究对象坚持随访到终止期,不可中途放弃或遗漏。随访时间的长短需要兼顾科学性和可行性原则,观察期过长会造成浪费,观察期过短则可能会使药物或措施导致假阴性效果。一般情况下,临床试验应该在预先计划的中止时间结束,但是如果中期分析发现试验组和对照组结局事件发生的频率已出现显著的差别,可以考虑提前结束试验;试验中出现严重的不良反应,也是提前中止试验的一个常见原因;相反,在研究计划的随访时间结束时,两组比较提示治疗可能优于对照,但又不足以作出肯定的结论,这时可以考虑适当地延长随访时间。总之,随访时间的长短与临床结局有密切关系,随访时间必须允许足够的临床结局出现。有学者认为,随访的失访率低于5%,偏倚的影响不会太严重,如失访率超过20%,将会严重影响研究的有效性和真实性;也有学者建议,失访率不应该超过结局事件的发生率;除了总体失访率外,还应注意不同组间失访情况的比较,如失访率,尤其是组间失访患者的可比性,如不同组间失访的原因是否不同;当失访与干预措施的有效性、不良反应有关时,可能会引入较严重的偏倚。
治疗性研究可能使用的结局有很多不同的特征和属性,在确定使用什么结局时,可以从以下几个方面进行分析。
(1)相关性:
如血压是抗高血压药的相关指标,血脂则不是。
(2)特异性:
如心血管病是抗高血压药的特异指标,全因死亡则不是。
(3)重要性:
如对抗高血压药来说,心血管病事件比血压更重要。
(4)好处和害处:
如抗高血压药降低血压是益处,而引起头晕则是害处,必须兼顾重要的益处和害处的指标。
(5)综合性:
如死亡为单一指标,生命质量为综合指标,脑卒中康复治疗时,综合指标可能优于单一功能指标。
(6)病人相关性:
如癌症治疗中患者可能认为生活质量比生存时间更重要。
(7)准确性:
如有些仪器测量的客观变量优于患者自己报告的主观变量。
(8)时间性:
对任何结局的测量必须有明确的时间范围,如3个月内几乎无法看出降血压治疗预防心血管病事件的作用。
(9)统计特征:
如血压是连续变量,死亡为二分变量。
(10)敏感性:
越容易测量出干预效果的指标敏感性就越高。一项临床试验不可能测量所有相关的结局,结局的确定和测量是研究成功的关键之一,研究者必须对干预措施在各种可能结局方面的作用进行分析,确定并测量相关、重要、敏感的结局。此外,结局指标的选择还必须兼顾可行性和伦理性要求。
治疗性研究以人作为对象开展研究,因此在研究中必须遵循伦理道德,如果进行药物试验,药物须批准才可以开展临床试验,试验前还要向医学伦理委员会提交申请。
在正式试验前,尤其在大规模试验前,应先在小范围进行一次小规模人群的预试验,以评估设计理念和假设有无可行性,是否值得并可以做下去;此外,预试验可以先取得一些资料和数据,作为正式试验时修订试验设计的参考。
在治疗性研究中,随机化分组很重要,但要注意的是,因为人群生物学和社会学特征的多样性,随机化只能较好地保证大样本研究分组的均衡性,对于小样本的研究,随机化并不能保证分组的均衡性。
真实世界研究(real world study,RWS)是对临床常规产生的真实世界数据进行系统性收集并进行分析的研究。
RWS的开展须从临床问题的确定、现有数据情况的评估切入,采用既往回顾性数据或是前瞻性采集数据,进一步到研究设计的选择以及统计分析方法的确定、数据的管理、统计分析、结果解读和评价,以及根据需求判断是否加入事后分析(post hoc analysis)等步骤(图2-1-3)。由于RWS可能存在一些内在的偏倚,这些偏倚可能限制了真实世界数据在因果关系上的推理和解读。因此,为了减少潜在的偏倚,需要谨慎而周密的研究设计,并且应该确定研究问题后尽早开始制定研究方案和统计分析计划。
图2-1-3 真实世界研究的思路与流程
注: * 偏倚的控制在整个研究过程中都需要时刻关注,无论是基于既往数据还是前瞻性数据,从研究设计的选择,研究管理流程直到统计分析。
RWS通常会围绕着病因、诊断、治疗、预后及临床预测等相关的研究问题展开。病因研究主要是研究危险因素与疾病之间的关系,并研究引起人体发病的机制,如研究幽门螺杆菌感染与十二指肠溃疡的关系。诊断研究主要是研究某类新方法对特定疾病诊断的准确度研究,以判断新诊断方法的临床价值。治疗性研究主要是研究某类治疗方案对特定疾病的疗效及副作用研究,主要包括两方面:①治疗方案对特定疾病的疗效研究;②治疗方案的不良反应研究。预后研究是对疾病发展的不同结局的可能性预测以及与影响其预后的因素研究,主要包括三大类:①对疾病的预后状况进行客观描述;②对影响预后的因素进行研究;③对健康相关生活质量的研究。临床预测研究则是寻找出最佳的对疾病诊断或疾病转归的预测指标或症状等,主要包括诊断预测研究和预后预测研究。除上述研究外,RWS也会涉及药物经济学研究等其他研究类型。
RWS包括观察性研究和实验性研究。其中观察性研究进一步分为描述性研究(病例个案报告、单纯病例研究、横断面研究)和分析性研究[(巢式)病例对照研究、队列研究],实验性研究即实效性随机对照试验。除此以外,一些新型的研究设计如病例交叉设计和序贯设计等也被用在基于现有数据的研究中。常见研究类型对应的临床应用场景及优劣势比较见表2-1-3。
表2-1-3 真实世界研究常见研究类型的优劣势比较
续表
RWS是对临床常规产生的真实世界数据进行系统性收集并进行分析的研究,与RCT是互补的关系,并不对立。RWS和RCT一样,都需要科学合理的研究设计、研究方案以及统计计划。另外判断RWS和RCT的标准不是实验设计和研究方法,而是研究实施的场景。RWS数据源自医疗机构、家庭和社区等,而非存在诸多严格限制的理想环境。RWS和RCT相比,各具特点,见表2-1-4。
表2-1-4 随机对照试验与真实世界研究区别
续表
选择偏倚是在RWS中比较常见的偏倚,大多数情况下可以通过科研设计来减少或者消除,如采用匹配或者随机的方法。对于选择偏倚需采取的控制方法如下。
未患有与研究因素有关的其他疾病,如研究吸烟和肺癌的关系,那么就要将慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)患者从研究人群中排除;在某些方面与病例组可比,如对照组和病例组在基线信息上尽量可比,如年龄、性别、病情严重程度、经济状况等。
提高应答率从而减少失访率,并对失访的患者进行评价。
理想的是以人群中全体病例和非病例(或有代表性的样本)作为研究对象,如以医院病例为研究对象,宜在多个医院选择对象,且最好有两个对照组,其中一个对照组来自社区一般人群;在队列研究中,最好也应设多种对照,以减少选择偏倚对结果的影响。
PRCT的设计也可以视为控制选择偏倚的一种手段,通过随机分组平衡组间已知和未知的预后因素,最大限度提高组间的可比性,将偏倚最小化,从而增强论证强度。后续的随访过程遵从观察性研究的原则,即研究在常规临床实践下进行,尽可能减少对常规治疗的干预,反映真实临床实践中的情况。
信息偏倚主要来自资料收集和解释过程中的错误信息,如问卷、生物标本、数据管理、设计与分析的问题等。而产生这些不正确信息的原因可能是研究对象本身的记忆误差,也可能是研究者的态度或方法不当。更重要的是,在研究设计过程中,对调查表设计、指标设立和检测方法的选择缺乏科学性和合理性,因此要在研究的不同阶段控制和消除影响信息准确性的各种因素。
在研究设计中对暴露因素必须有严格、客观的定义,并力求指标定量化。要有统一、明确的疾病诊断标准,调查表的问题应易于理解和回答。调查前应开展预调查,充分估计调查实施过程中可能遇到的问题以及各调查项目的可行性。研究对象应清楚地了解研究的目的、意义和要求,以获取其配合和支持。调查员需经过严格培训,能正确理解调查的意义、方法和内容,能严谨客观地从事资料收集工作。研究者应定期检查资料的质量,并设立质量控制程序。
信息偏倚与调查对象的记忆程度有关。在研究中,可对同一内容以不同的形式重复询问,以帮助调查对象回忆并检验其应答的可信性,为了避免主观诱导对象,除了严格培训调查员外,在临床试验和某些现场研究中,应尽可能采用“盲法”,以消除主观因素对研究结果的影响。但在采用“盲法”的同时,需考虑其伦理学可行性。研究中的各种测量仪器、试剂和方法均应标准化,检测方法要统一,由专人测定。
对于信息偏倚,除了在方法学上消除其来源外,对其所致的错误的分类信息,可进一步在资料分析过程中加以测量、校正,并进行相应的灵敏度分析。
混杂是一类在RWS中值得全程关注却又无法完全避免和控制的因素,只能尽可能地识别和控制以减小混杂对结果的影响。对于混杂的常用控制方法有以下几种。
研究设计开始阶段,针对某些可能的混杂因素,对研究对象的纳入标准加以限制是常用的控制混杂的方法。然而,这样会使得研究对象减少。其优点在于筛选了大量个体,只选择其中一部分,增加了研究对象的同质性,提高了研究的内部有效性,但缺点是降低了研究效率,可能会影响结果的外推,而限制范围如果太宽或不当又可能有残余混杂。
队列研究中,匹配是暴露者与非暴露者针对某因素进行匹配,一旦匹配,原则上即可完全控制匹配因素引起的混杂,不必在统计分析阶段进一步控制;而病例对照研究中,匹配后还需要按照匹配因素进行分层分析,这是控制混杂的必要条件,并且,匹配并非直接控制混杂,而是提高了控制混杂的效率;值得注意的是要防止匹配过度。
目的在于估计和控制混杂因素的影响,评估和描述效应修正因子不同水平分层中的研究结果,方法是将研究资料按照混杂因素来进行分层。分层分析的缺点在于:一次只能分析一种暴露与疾病的关联;连续性变量转变为离散性变量,一定程度的信息丢失,可能造成残余混杂;需要控制的混杂较多时,分层则不是最明智的选择。
将多个可能的混杂因素变量引入分析模型,可以是多元线性模型、Logistic回归、Cox比例风险模型、因子分析等,要点在于在设计阶段和数据采集阶段将可能的混杂因素收集,以便后续纳入分析,有效地控制混杂。
为了同时控制多种不同混杂因素在两组人群分布中的不平衡,可以采用使用倾向性评分的方法。倾向性评分是指在一定协变量条件下,一个观察对象可能接受某种处理(或暴露)因素的可能性。当研究涉及的混杂因素过多时,如20~30个,进行匹配则变得不现实,严重影响了样本量。但是,如果将所有混杂因素都输入统计模型,由于共线性等问题,统计模型无法正常估计效应。在观察性研究中,通过对倾向性评分的分层分析、匹配、回归分析、权重等方法,以期达到控制混杂的目的。
对RWS的证据等级评价应该依据选取的研究设计与研究问题之间的相关性、研究质量控制程度,以及选取的研究数据的可靠性进行评价。依据循证医学金字塔证据分级方法,将常见的RWS类型按照证据等级由低到高进行排序,分别为单纯病例研究、横断面研究、病例对照研究、历史性队列研究、前瞻性队列研究、实用性临床研究;同时建议研究者参照影响证据等级的关键因素来客观评估真实世界证据的证据级别,见表2-1-5。
表2-1-5 提高真实世界研究证据等级的关键因素
在临床工作中,医生要根据就诊患者的临床症状、体征、实验室化验和影像学检查结果等资料,对疾病作出临床诊断。如果前来就诊的患者确实患有某种疾病,医生所用的诊断方法能正确诊断出来的可能性有多大;如果前来就诊的患者确实未患某种疾病,医生所用的诊断方法能正确排除的可能性有多大,要解决这些问题就要进行诊断试验的评价。在应用某一诊断方法之前应对其进行诊断试验并对其试验的结果进行评价,这不但能提高临床诊断的效率和水平,对疾病的准确、合理的临床治疗也能提供有力的依据。
当评价一种诊断性试验方法时,要对参加试验的对象同时应用金标准方法和诊断性试验方法进行检查或测验。如果诊断性试验所得的结果与金标准试验所得结果符合程度越高,这个诊断性试验的诊断价值就越高,反之亦然。用金标准进行检查或检验后,可将试验对象分为两组,即金标准确诊的患某病组及金标准排除的未患某病组;诊断性试验结果用阳性表示患病,阴性表示未患病。用诊断性试验进行的诊断试验所得出的患病与未患病的结果与金标准方法所得出患病与未患病的结果不完全相同。诊断试验结果与金标准诊断结果的关系,见表2-1-6。
表2-1-6 诊断试验结果与金标准诊断结果的关系
指用金标准方法确诊患某病,并且通过诊断性试验亦判定为阳性者。
指用金标准方法确诊未患某病,而用诊断性试验却判定为阳性者。
指用金标准方法确诊患某病,而用诊断性试验却判定为阴性者。
指用金标准方法已确诊未患某病,而用诊断性试验也判定为阴性者。
灵敏度也称真阳性率,表示用金标准方法已确诊患某病的试验对象中,用诊断性试验方法判定为阳性部分所占的比例,即灵敏度是指实际患病的患者被正确诊断的可能性,灵敏度= a /( a + c );漏诊率也称假阴性率,表示在金标准方法已确诊患某病组中,诊断性试验方法将其错判为阴性的比例,漏诊率= c /( a + c );两者关系是:漏诊率=1-灵敏度,即灵敏度愈高,则漏诊率愈低,试验阴性时的结果更为可靠,有助于排除诊断,当因漏诊会造成不良后果时应选择灵敏度高的试验方法。
特异度也称真阴性率,表示用金标准方法确诊的未患某病组中,用诊断性试验方法判定为阴性的部分所占的比例,即特异度是指实际未患病的患者被正确判断为非患者的可能性,特异度= d /( b + d );误诊率也称假阳性率,表示用金标准方法已确诊未患某病组中,用诊断性试验方法将其错判为阳性的比例,误诊率= b /( b + d );两者关系是:误诊率=1-特异度,即特异度愈高,则误诊率愈低,试验阳性时的结果更为可靠,有助于肯定诊断,对于某些预后不良、治疗本身会给患者造成危害的疾病,且假阳性结果会给患者带来较大风险及较大的医疗支出时应选择特异度高的试验。
准确度又称符合率,指诊断性试验所得的全部真阳性者和真阴性者占整个试验对象的百分率,反映了诊断试验结果与金标准试验结果符合或一致的程度,准确度=( a + d )/( a + b + c + d );准确度越高,诊断试验的漏诊和误诊比例越低。
一旦得到诊断性试验的阳性或阴性结果,借以判断受试者是否患病,则与诊断性试验的预测值有关。这种根据诊断性试验的结果来判断受试者的患病概率称为预测值,预测值也称验后概率。预测值分为阳性预测值(positive predictive value,PPV)和阴性预测值(negative predictive value,NPV)。阳性预测值是在诊断试验结果阳性的受试者中,金标准诊断证实患病的病例(真阳性)所占的比例,对于一项诊断性试验来说,这个值越大越好,阳性预测值= a /( a + b )。阴性预测值是诊断试验结果为阴性的受试者中,金标准诊断证实未患病的受试者(真阴性)所占的比例,该值也是越大越好,阴性预测值= d /( c + d )。
患病率也称验前概率,指试验对象中患某病的概率,即经金标准方法确诊患某病的病例数占接受金标准方法检验或检查对象总数的百分率,患病率=( a + c )/( a + b + c + d )。
表示一个诊断试验结果出现在患病受试者和出现在未患病受试者的比值大小,代表了一个诊断性试验区分患病和未患病的能力大小。似然比分为阳性似然比和阴性似然比。阳性似然比为出现在金标准确定患病的受试者阳性试验结果与出现在未患病受试者阳性试验结果的比值大小或倍数,即真阳性率和假阳性率的比值,这个比值越大说明该诊断试验方法越好,阳性似然比 =[ a ÷( a + c )]/[ b ÷( b + d )];阴性似然比为出现在金标准确定的患病的受试者阴性试验结果与出现在未患病的受试者阴性试验结果的比值,即假阴性率和真阴性率的比值,这个比值越小说明该诊断试验方法越好,阴性似然比=[ c ÷( a + c )]/[ d ÷( b + d )]。
又称正确诊断指数,指敏感度与特异度之和减1(100%),该值越接近100%就越理想。它可用于两种诊断方法的比较。约登指数=(敏感度+特异度)-100%或100%-(假阳性率+假阴性率)。
确定合适的金标准是进行诊断试验的前提,如果金标准的选择不当,就会造成对受试者诊断分类上的错误,使整个试验的评价失去准确性的基础,因此金标准的选择至关重要,所选的金标准既要准确,又要可行。临床常用的金标准包括组织病理学检查、外科手术所见、特殊的影像学检查、病因学诊断方法,以及因缺乏特异性诊断方法而采用的医学权威机构颁发的或临床医学共同制定的公认诊断。
研究对象应为临床某病的疑似病例;病例组应包括所研究疾病的各临床类型,如轻中重型、典型与非典型、病程长短等,以使病例组对该病患者群体有较好的代表性;在未患该病的对照组中,应纳入与病例组有相似临床表现的其他临床易混淆的疾病患者,以利于测试诊断试验的鉴别诊断能力。
在进行正式诊断试验之前,应在不同的时间或由不同的观察者重复进行该试验,检验新试验在观察者内部或观察者之间的变异情况,如计算变异系数和一致率等。如果观察者内部或观察者之间的变异系数较小或检测结果的一致率较高,则表明该诊断试验方法的可靠性较好。在正式试验前,还应检查试验条件、仪器、试剂等是否符合标准,还应制定相应的质量控制措施,对观察者要进行严格的培训,只有达到设计的要求时,才能正式开展诊断性试验的研究。
观察者应采取盲法判断诊断试验结果,要在不知道金标准诊断结果的情况下观察结果,以避免过高或过低估计诊断试验与金标准的符合程度,避免观察者偏倚。
许多诊断试验尤其是实验室诊断多为连续性的生化指标,对于这种连续变量需要选择一个区分正常与异常的诊断临界值,在诊断试验中经常用到的确定界值的方法有下列几种。
对于正态或接近正态分布数据确定正常和异常的界限时,正常值范围常用均数±2个标准差(SD)表示。这样95%测量值均在正常范围内,两端各2.5%的测量值被定为“异常”。对某些指标,只有过高或过低为异常时,则其单侧5%被定义为“异常”。
适用于偏态分布或分布类型尚不能确定的数据,将观察值从小到大排列,累积计数次序,通常确定为百分范围在2.5%~97.5%的测定值为参考值,对于单侧指标可以确定第5百分位数或第95百分位数为参考值。
许多生理和生化指标达到或超出一定的范围即可能导致有严重后果的疾病发生。因而需要治疗使之维持在一个安全的范围内。这在临床上称为某项指标的危险水平,需要流行病学研究来确定;如舒张压<90mmHg为安全界限,高于安全界限的患者发生脑血管疾病意外的风险明显增加。这个参考值的确定是基于长期的临床观察和流行病学研究得出的,对指导临床治疗有很大的实用价值。
ROC曲线也称为受试者工作特征曲线(receiver operating characteristic curve),诊断性试验用计量资料表达结果时,将测量值按大小顺序排列,并将诊断试验的连续变量设定出多个不同的临界值,从而计算出一系列的灵敏度/特异度对子,再以灵敏度为纵坐标、1-特异度(误诊率)为横坐标绘制出曲线,即为ROC曲线。ROC曲线的优点是简单、图形化、能直观地表示灵敏度和特异度,ROC曲线可用来决定最佳临界点以及比较两种或两种以上诊断试验的价值;在ROC曲线上,距坐标图左上角最近的一点,即为正常值的最佳临界值,用该点数值区分正常与异常,其灵敏度及特异度之和最大,而误诊及漏诊例数之和最小,应用ROC曲线确定诊断试验的阈值对临床医生做出合理选择很有帮助;ROC曲线下面积(area under curve,AUC)反映了诊断试验的诊断价值,面积越大准确性越高;一般来说,AUC<0.5说明该试验无诊断价值,当0.5≤AUC<0.7说明该试验准确性较低,0.7≤AUC<0.9说明该试验准确性较高,AUC越接近1,说明该试验准确性越高,这对两个及以上诊断试验的比较很有意义。
预测值的大小受诊断试验灵敏度、特异度及待诊断疾病患病率(先验概率)的影响,但当灵敏度和特异度不变时,主要受患病率影响。诊断试验的灵敏度、特异度是相对稳定的指标。在临床上,患病概率为50%左右时,最需要应用诊断试验以达到确诊或排除诊断的目的。在这种情况下进行诊断试验,诊断效能较高。
为了提高临床诊断效率,根据诊断的客观需要及可能性,可采用联合诊断试验方法。联合诊断试验有两种方法,即平行试验和序列试验。
也称为并联试验,是指同时进行几种目的相同的诊断试验,只要有一种试验的结果为阳性,即可判断为患者。联合应用多项试验可以提高诊断的灵敏度,减少漏诊病例;却使特异度及阳性预测值降低,增加误诊病例。临床应用平行试验是在缺乏灵敏度高的诊断性试验,而漏诊会导致患者产生严重后果时采用,故对所诊断的病例,应认真作好鉴别诊断,尽量减少病例的误诊。平行试验也可用于群体的筛查试验,以便增加筛查的阳性率。
也称为串联试验,是指按顺序进行检验,当全部检验结果均为阳性时,才确定为真阳性的情况。序列试验增加了特异度和阳性预测值,但降低了灵敏度和阴性预测值,即减少误诊是以牺牲可能增加的漏诊为代价,因此,序列试验适于单一的诊断试验并不具有非常高特异度的情况。
尽管各种流行病学研究方法的基本原理不会因为研究对象的不同而改变,但不容忽视的是,随着研究对象的改变,各种研究方法的设计、实施、分析和解释均会有各自特殊的注意事项。对于以老年人为研究对象的研究,需要特别注意的事项如表2-1-7所示。
新兴的比较效果研究在一定程度上克服了传统RCT研究纳入排除标准过于严格的局限,在真实世界人群中探讨不同治疗方案对于不同共患病组合老年人的治疗效果,为相关干预研究的发展提供了契机。当然,真实世界人群中探讨上述问题,还需要大规模人群数据的支持,如医保数据、医院病案资料、保险公司数据、大规模人群调查数据等。相信随着人们对问题关注度的增加,相关研究也会越来越多。
表2-1-7 老年人群流行病学研究设计的注意事项
续表
续表
(石 婧 于普林)
[1]王家良.临床流行病学:临床科研设计、测量与评价[M].3版.上海:上海科学技术出版社,2009:75-146.
[2]王家良,王滨有.临床流行病学[M].3版.北京:人民卫生出版社,2008:65-108.
[3]王建华.流行病学[M].5 版.北京:人民卫生出版社,2001:59-109.
[4]吴一龙,陈晓媛,杨志敏.真实世界研究指南[M].北京:人民卫生出版社,2018:9-44.
[5]李立明.老年保健流行病学[M].2版.北京:北京大学医学出版社,2015:109-122.
[6]李立明.流行病学[M].6 版.北京:人民卫生出版社,2008:40-163.