购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第二节
临床肾脏病学中的常用研究方法

临床研究问题总是围绕着诊断和治疗两个方面,肾脏病研究也不例外。其研究方法涉及临床观察、基础实验及临床流行病学研究等。临床流行病学是从群体的角度研究疾病的诊断和治疗问题,该类方法既可做探索性研究,也可做确证性研究,是目前临床研究的最常用方法。本章除了简要介绍系列临床流行病学研究方法的主要特点外,将重点介绍用于治疗方法研究的随机临床对照实验和诊断方法研究。

一、临床流行病学研究方法概述

根据是否原始研究,临床流行病学研究方法可分为一次研究和二次研究,一次研究主要有描述性研究、分析性研究、实验性研究和理论研究,二次研究主要有系统综述和Meta分析。这些方法在临床研究中有不同的用途。

(一)描述性研究

描述性研究(descriptive study)是指利用已有的资料(如各种临床累积的资料)或特殊调查的资料,包括实验室检查结果,按不同地区、不同时间及不同人群特征分组,把疾病或健康状态或暴露因素的分布情况真实地描述出来。通过比较分析存在分布差异的可能原因,提出进一步的研究方向或防治策略的设想。

描述性研究具有以下特点:①收集的往往是比较原始的或比较初级的资料,影响因素较多,分析后所得出的结论往往只能提供病因线索;②一般不需要设立对照组,仅对人群疾病或健康状态进行客观的反映,一般不涉及暴露和疾病的因果联系的推断;③描述性研究中常常既有描述又有分析,在描述中分析,在分析中描述;④常用来进行社区诊断及疾病病因和危险因素探索。

描述性研究主要包括历史或常规资料的收集和分析、病例调查、现况研究、纵向研究及生态学研究等。其中历史或常规资料的分析及病例调查常用于临床研究。

1.历史和常规资料的收集

常规资料的收集多数是以医院为基础的,包括医院的病历、健康档案及部分随访数据等。临床医师是常规资料收集的主要参与者、质量保证者和利用者。这些资料常可用来研究病因、疾病的临床特征及估计预后等。

2.病例报告与系列病例研究

病例报告(case report)是有关单个病例或10个以下病例的详尽临床报告,包括临床表现(症状、体征和实验室检查结果)、治疗、治疗后的反应及结局,最后是作者对病因的分析及治疗的经验。病例报告是对新发病例和罕见病例进行临床研究的一种重要方式。系列病例研究(series case study)与病例报告相似,但报告病例较多,多在10例以上,有时是对多年积累的病例的一种总结。虽然系列病例研究的样本增加了,但由于缺乏对照,所获得的结论仍有局限性,仅能代表所报道的病例,对病因研究而言,依然只能提供线索。

(二)分析性研究

分析性研究常用于对有因果线索的关系做深入探讨,如临床上的病因研究、疾病预后的影响因素研究、药物不良反应研究等。分析性研究主要包括队列研究和病例对照研究。

1.队列研究

队列研究(cohort study)的基本原理是首先在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组、高剂量暴露组和低剂量暴露组等,然后随访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病、死亡或其他健康状况),比较各组结局的发生率,从而评价和检验危险因素与结局的关系。如果暴露组某结局的发生率明显高于非暴露组,则可推测暴露与结局之间可能存在因果关系。在队列研究中,研究对象在被选择时必须是没有出现,但有可能出现所研究结局的人群。暴露组与非暴露组必须有可比性,非暴露组应该是除了未暴露于某研究因素之外,其余各方面都尽可能与暴露组相同的一组人群。

队列研究依据研究对象进入队列时间及终止观察的时间不同,分为前瞻性(prospective)队列研究、历史性(historical)队列研究和双向性(ambispective)队列研究三种。三种队列研究方法原理示意如图6-1。

图6-1 队列研究类型示意图

队列研究具有如下一些基本特征:①属于观察法:队列研究中的暴露不是人为给予的,不是随机分配的,而是在研究之前已客观存在的;②设立对照组:队列研究必须设立对照组,对照组的设立使之有别于描述流行病学而成为分析流行病学的共同特点之一;③由“因”及“果”:在队列研究中,一开始(疾病发生之前)就确立了研究对象的暴露状况,而后探求暴露因素与疾病的关系,即先确知其因,再纵向前瞻观察而究其果;④能确证暴露与结局的因果联系:由于研究者能切实知道研究对象的暴露状况及随后结局的发生,且结局是发生在确切数目的暴露人群中并在暴露之后,所以能据此准确地计算出结局的发生率,估计暴露人群发生某结局的危险程度,因而能判断其因果关系。

队列研究的主要用途包括:①检验病因假设:深入检验病因假设是队列研究的主要用途和目的。通常一次研究只检验一种暴露与一种疾病的因果关联,但也可同时检验一种暴露与多种结果之间的关联,即检验多个假说,如可同时检验吸烟与肺癌、心脏病、慢性支气管炎等的关联。②评价预防和治疗效果。③研究疾病的自然史:临床上观察疾病的自然史只能观察单个患者从起病到痊愈或死亡的过程;而队列研究可以观察人群从暴露于某因素后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的变化与表现。

2.病例对照研究

病例对照研究(case-control study)的基本原理是选择一组病例和一组与病例具有可比性的对照,通过询问,查阅现存记录、体格检查或实验室检查,搜集既往各种可能的危险因素的暴露史,测量并比较病例组与对照组中各暴露因素的暴露比例。如某因素在病例组的暴露比例明显高于对照组,则推测该因素为该病的危险因素或病因,反之,则为该病的保护因素。病例对照研究的原理示意如图6-2。

图6-2 病例对照研究原理示意图

注:阴影区域代表暴露于所研究的危险因素的研究对象

病例对照研究具有如下几个基本特征:①属于分析流行病学;②必须设立对照;③在时间上是回顾性的;④在逻辑上是从果求因的;⑤一次可研究多个因素与疾病的关系,因此可用于病因的筛选。

病例对照研究的用途可概括为:①探索或验证病因和流行因素;②评价预防和治疗措施效果;③项目评价。病例对照研究是临床研究中最重要的方法。

(三)实验性研究

在不干预的自然情况下认识自然现象的本来面目属于“观察”(observation)性研究,而采用一些人为方法改变自然现象的条件下研究事物的规律则属于“实验”(experiment)性研究。以人群为研究对象,以医院、社区、工厂、学校等现场为“实验室”的实验性研究称为实验流行病学(experimental epidemiology)研究,或称为流行病学实验(epidemiological experiment)。实验流行病学是流行病学研究的主要方法之一,也是临床研究的重要方法。

在实验流行病学研究中,研究对象被随机分为两组或多组,分别接受不同的干预(处理或对照)措施,随访观察一段时间,然后比较各组的某(些)结局(outcome)或效应(effect)的差异。如果干预组的结局与对照组的结局有差异,而且实验前两组是可比的,则这种差异可能是干预的效果。实验性研究的原理示意如图6-3。

图6-3 流行病学实验研究原理示意图

实验流行病学研究具有以下基本特点:①属于前瞻性研究:实验流行病学必须是干预在前,效应在后;②随机分组:严格的实验流行病学研究应采用随机方法把研究对象分配到实验组或对照组,以控制研究中的偏倚和混杂;③具有均衡可比的对照组:实验流行病学研究中的对象均来自同一总体的样本人群且经随机分组,因此,其基本特征、自然暴露因素和预后因素(prognostic factor)应相似;④有干预措施:这是与观察性研究的一个根本的不同点。缺少一个或多个上述特征的实验称为类实验(quasi-experiment)。

实验流行病学研究,一般根据干预和分组的单位的不同分为以个体为干预单位的试验和以群体为干预单位的试验,前者又根据研究地点是在医院还是在社区分为临床试验和现场试验两大类。以群体为干预单位的试验又称为社区干预实验,主要用于对社区干预措施(多为预防性的)的效果考核。临床试验(clinical trial)是以患者为研究对象,以个体为单位进行随机化分组的实验方法。其目的是评价某种新药或新疗法对某种疾病的疗效,包括是否能防止复发和延长寿命。临床试验是本章的重点,将有专节做详细介绍。

(四)理论流行病学研究

理论流行病学(theoretical epidemiology)也叫数学流行病学(mathematical epidemiology)。理论流行病学是在了解了某疾病(或事件)的本质特征,并对其发生发展规律及主要影响因素有深入细致了解的基础上,将各因素在事件发生中的作用量化,并用不同符号代表有关病因、环境和机体等各因素,通过数学表达式定量地阐述疾病流行过程的本质特征,模拟(simulate)流行过程,并以实际流行过程的相关资料对模型涉及到的参数进行恰当的估计、检验、调整和修正,从而在理论上探讨疾病流行的发生机制和评价预防措施的防治效果。简言之,流行病学数学模型是用不同符号代表有关病因、环境和机体诸因素,把掌握到的某种疾病规律性通过各种符号和数字组成的数学表达式表述出来,当此表述结果与实际相符合时,即上升为理论,可作为理想状态下的抽象研究。

理论流行病学研究具有如下重要特征:①属于理论性研究:是借助于某些字母来代表对研究疾病发生、流行有重要影响的因素,用数学符号通过表达式将其对疾病的影响表现出来。②研究对象标准化:研究对象是假定在某种理想状态下存在的彼此无差异的相对独立个体。③研究状态理想化:研究因素、研究对象和研究空间均在理想的状态下。具有相对的独立性、不受干扰性。④研究资料的完整性:理论流行病学研究是比较研究对象的理论期望值与实际人群的观察值之间的符合程度,因此,需要有完整的实际人群的资料。包括发病时间、诊断、治疗及预防措施。⑤研究结果对事件发展的预测性:理论流行病学研究是为了预测疾病发生、发展趋势,探讨对疾病影响的本质因素及内在规律。研究结果代表疾病在未来的变化趋势,因此,具有对将来的预测性。

理论流行病学研究的主要用途包括:①可定量地研究各种因素对疾病流行的影响:如不同地区人口的年龄构成、免疫状况、文化水平、生活习惯不同或时间、季节、传染源数量不同,将导致某传染性疾病的流行规模、流行面貌、流行强度以及年龄分布等不同,这些都可能通过模型进行演绎。如果是一个临床疾病发展模型,则可用来对不同状态的患者的发展结局进行预测。②设计和评价治疗和控制疾病的方案:将不同控制措施输入模型,观察各种可能出现的结果。在评价各种疾病治疗和控制方案的流行病学效果时,还需评价方案的卫生经济学效益,在这方面流行病学数学模型的研究起着不可替代的作用。在临床,可利用临床疾病发展模型,预测各种治疗措施的效果和效益,从而作出科学的临床决策。③研究疾病流行的动力学特点:数学模型在计算机上可以随意改变模型中各种参数,如易感者比例、潜伏期和传染期的长短、传染力的大小、有效接触率的多少等,从而获得不同参数下的各种流行动力学过程。④数学模型在临床的另一个重要用途是建立计算机模拟诊断系统。⑤模拟疾病流行过程用于教学和培训:利用数学模型可在远离疾病流行现场的环境中,再现各种疾病在人群中的流行过程,生动地阐明重要的流行因素在传播机制及流行动力学中的作用,并通过改变重要的参数值来观察这些因素在流行过程中的效应;也可以在严格定量意义上正确而有预见性地判断各项可选措施的预防效果,并对之作出科学全面的评价;还能够对某病的各种病因假设进行模拟评价,并利用现场资料作拟合检验及验证。

(五)二次研究

二次研究是相对于原始研究而言的,它是指对一系列的原始研究结果进行再次研究、综合和创新。二次研究是随着循证医学的发展而发展,其主要方法和技术支持包括流行病学、统计学、高速互联网和计算机以及大量的原始研究成果。目前在临床研究中常用的二次研究方法包括系统综述(systematic review)和meta分析(meta-analysis)。系统综述已被公认为客观地评价和合成针对某一特定问题的研究证据的最佳手段,是对某一专题全球范围内的所有文献,采用清楚的方法,系统检索、严格评价,并进行合成的医学文献总结。meta分析作为系统综述中使用的一种统计方法,过去20年间在医学研究领域得到了广泛的应用。

系统综述是指针对某一主题进行的二次研究,在复习、分析、整理和综合针对该主题的全部原始文献的基础上进行,综述过程要依照一定的标准化方法。其主要原理是通过合并所有同类研究,使新的研究的样本大于任何单一的研究,从而减少抽样误差,提高研究的精确性。其基本过程是:①提出问题,问题通常来自临床实际,提出的问题要明确具体,一次只能提出一个问题。②检索针对该问题的全部原始文献,文献检索的重点是要尽可能全面,包括不同杂志、不同语种,甚至包括未发表的研究。③依照一定的标准评价和选择研究,标准要统一,选择要严格,保证被选择的文献是同质的。④提取所有被选文献的数据,并对数据进行重新统计分析。一般采用meta分析的方法对资料重新进行统计分析,如果所选文献的同质性很高,可用固定效应模型合并效应;反之,如果所选文献的异质性很高,则需用随机效应模型合并效应。⑤结果报告。系统综述和meta分析的结果报告需遵循国际推荐的PRISMA标准(preferred reporting items for systematic reviews and meta-analysis,PRISMA),该标准包括一个含27个条目的清单以及一个4阶段的流程图。

系统综述和meta分析的主要特点包括:①是某个主题的二次研究;②是在该主题基础上,收集大量关于该主题的原始文献资料,综合整理、分析的结果;③此综述过程需要一些标准化的方法;④“海量信息需要整合”是该方法广泛应用的动力;⑤能避免“只见树木不见森林”,从而得出科学的综合性结论;⑥克服传统文献综述的缺陷,即系统综述是系统的、可重复的、客观的、定量的综述,能提高原始结果的统计效能,解决研究结果的不一致性,改善效应估计值。

系统综述和meta分析的主要用途是合并文献,从而得到一个稳定和可靠的结果。在循证医学中使用较多,特别是当针对某一问题有很多同类研究,而每个单个研究的样本都比较小,结果不稳定时特别适用。特别值得注意的是,系统综述只能克服原始文献样本小、误差大、结果不稳定的问题,而不能克服原始文献中的设计错误和资料收集中的信息偏倚。

meta分析的主要应用指征:①需要做一项紧急决定,而又缺乏时间进行一项新的试验;②目前没有能力开展大规模的临床试验;③有关药物和其他治疗,特别是副作用评价方法的研究;④研究结果矛盾时。

然而,meta分析的结果对指导临床个体治疗还有一定困难,因为临床试验的meta分析所得汇总结果是指该治疗方法用于一系列患者时的“平均”效果,而不一定对每个患者都能得到这样的结果。虽然总的效应估计值通常能够用于大部分患者,但患者之间个体差异是客观存在的,临床医师更关心这种治疗对某个指定患者的疗效如何。

二、随机对照临床实验

临床试验(clinical trial)是以患者为研究对象,以临床治疗措施为研究内容,按照随机的原则分组,评价临床各种治疗措施有效性的方法。临床试验的目的有三个:①对新药进行研究,新药在取得新药证书前必须经过临床研究,确定安全有效后,才能被批准进行批量生产,进入市场广泛应用;②对目前临床上应用的药物或治疗方案进行评价,从中找出一种最有效的药物或治疗方案;③评价预防措施的效果,有些临床治疗措施属预防性的,如老年患者给予抗凝药物就是为了预防血栓,这些措施亦需通过临床试验进行验证。

临床试验研究主要是帮助临床大夫寻找有效的治疗措施,它可以是对一种药物、外科手术或理化因素的效果进行研究,也可以对一组完整的治疗方案或综合治疗措施进行研究。临床实验研究具有以下特点:

1.具有实验性研究的特性

因此,在实验设计时要掌握以下几条原则:①对照的原则:因为临床试验的研究对象很复杂,存在很多干扰或混杂因素,通过设立对照组,就可去除非研究因素的干扰作用。②随机化的原则:随机化可以使研究样本具有很好的代表性,并可以提高组间的均衡性,使研究结果具有良好的可比性。随机化包括随机抽样和随机分组。③盲法原则:通过盲法观察结果就可减少或避免因主观心理因素对试验造成的误差,能得到客观真实的结果。④重复原则:要获得研究因素的真实效应,除用随机方法缩小抽样误差外,重复是消除非处理因素影响的又一重要手段。

2.研究对象具有特殊性

临床试验的对象是患者,因其个体之间的生理特点、心理状态、文化水平及所处的自然和社会环境不同,疾病的严重程度、病变部位、病变范围大小不同,对治疗的反应也会因人而异。因此,即使同一种疾病,其临床表现因个体差异可能相差十分显著。研究对象的个体差异不仅影响疾病的表现,也可影响治疗效果;因其心理状态、文化和经济水平等,还可影响患者对研究的依从性。所以,为了保证研究结果的真实性,除了使用随机方法选择研究对象和分组及使用盲法观察结果外,在实验过程中还必须采取一些措施保证研究对象的依从性。

3.要考虑医学伦理学问题

因为临床试验是以人作为研究对象,所以必须面对医学伦理学问题,严格遵守医学研究国际伦理标准。赫尔辛基宣言中指出:“凡涉及人的生物医学试验,必须遵循科学的原则。应建立在足够的实验室和动物试验及科学文献认识的基础之上。”因此,用于人的治疗性药物或措施,必须有充分的依据,并经过药效学、药代动力学和毒理学等基础研究证实安全有效后,才能用于临床研究。

4.要科学评价临床疗效

研究者对临床试验的效果进行实事求是的科学评价,科学评价应包括试验的真实性、重复性及实用性三个方面。

临床试验的方法概括起来可分为两大类:一为随机对照试验,另一为非随机对照试验。随机对照试验是最常用的研究方法,其结果真实可靠,但设计和实施复杂;非随机对照试验虽然设计和实施简单,但结果的可信性差,在不能进行随机对照试验时可以选择非随机对照试验。

(一)基本原理

随机对照临床试验(randomized controlled clinical trial,RCT)是将研究人群(临床患者)随机分为试验组与对照组,将研究者所控制的措施(各种待评价的治疗方法与措施)施加给试验人群后,对照组不施加待评价的措施,随访观察并比较两组人群的结局,以判断干预措施的效果。其基本原理示意如图6-4。

图6-4 随机对照临床试验原理示意图

(二)实验步骤与设计

1.制订实验计划

随机对照试验在实施前必须制订科学、严谨的研究计划,否则研究结果可能出现误差,影响结果的真实性。制订研究计划应包括以下几方面内容:

(1)明确实验的目的:即本研究要解决的问题是什么。

(2)明确实验对象的具体要求和来源:选择研究对象时,要使用统一的疾病诊断标准,并严格遵照执行;同时,要注意研究对象的代表性,即研究对象的年龄、性别、病情、病变部位、病变的范围和试验的样本量。

(3)明确规定研究因素:如药物的剂量、用药的时间或疗程、给药的途径等。

(4)确定观察指标:即反映干预措施效果的指标。选择研究指标时,最好选择客观的或定量的指标。

(5)确定随访观察时间及如何进行资料的收集并做好记录,根据药物的治疗效果、疾病严重程度和结局,确定药物治疗后随访观察的时间。

(6)资料的整理和分析:资料收集后要对资料进行整理和分析,设计时应说明要采用的统计分析方法。

2.确定研究人群

在制订试验计划时,应考虑选择哪些人做研究人群。所谓研究人群是指符合研究对象入选标准的人群,既包括试验组,也包括对照组,两者均属研究人群。选择研究对象时应注意以下几点:

(1)研究对象的选择必须使用统一的诊断和排除标准,并严格遵照执行,以确保实验组和对照组的可比性及最终结果的真实性。

(2)入选的研究对象应能从实验中受益,即参加研究,当实验结束时患者的疾病被治愈了或症状得到缓解,如以泌尿系感染患者为研究对象,首先要求对试验用药的作用机制有清楚的认识,即应该知道哪种抗生素是通过泌尿系统消灭细菌的,其次要求我们选的对象是同质的,即都是感染了该类型菌株的。这样才能使治疗对象真正受益。

(3)尽可能选择已确诊的或症状和体征明显的患者做研究对象,如研究治疗心肌梗死药物的药效时,试验对象最好是近期心绞痛频繁发作的患者,而不是病情稳定的患者,这样才能容易获得要观察的实验效应。

(4)尽可能不用孕妇作为研究对象,临床试验中,任何药物不可能不产生副作用,有些药物的副作用对正常人虽然很小,但对孕妇或对胎儿可能影响很大,所以试验前要充分估计副作用的程度,衡量其得失后再选择恰当的对象。能不用孕妇作研究对象的,要尽量避免。

(5)尽量选择依从者作研究对象,临床试验研究特别要求研究对象能服从实验设计安排,并坚持合作到底,这叫依从性好。如果很多研究对象在中途退出,或不遵守规则,就会给结果带来很大的影响,最终导致研究结果偏离真实情况。因此,选择的研究对象要注意保证较高的依从性。

3.样本含量的确定

(1)影响临床实验样本量大小的因素主要包括:

1)如果效应观察指标为计数资料,如治愈率、有效率、缓解率、生存率,也可以是病死率等,总之是反映药物疗效的指标,假设该指标的预期发生频率为P,P值越低,所需的样本量越大。

2)如果效应观察指标为计量资料,则实验组和对照组的效应均数差值的大小d是重要的影响因素,差值越小,所需的样本量越大。

3)检验的显著水平α(第Ⅰ类错误的概率)和检验效能1-β(β为第Ⅱ类错误的概率)。α和β规定得越小,所需样本量越大。

4)单侧检验还是双侧检验,单侧检验所需样本量小,双侧检验所需样本量大。

(2)在考虑上述因素后,可根据资料性质的不同采用不同的样本量大小计算公式,准确计算出所需的样本量。

1)计数资料样本量大小的计算:按式6-1计算:

(式6-1)

P c :对照组发生率;P 1 :试验组发生率(估计值),P=(P c +P 1 )/2;Z α :水平相应的标准正态差;Z β :水平相应的标准正态差;N:样本量。先确定α和β后,再查表确定相应的标准正态差(表6-1)。

表6-1 标准正态差分布的分位数表

2)计量资料样本量大小的计算:样本量大小的计算公式为:

(式6-2)

σ:估计的标准差;d:两个样本均数之差(一般为估计值),Z α 、Z β 和N与上述相同。

(3)样本量计算后需要注意几点:

1)以上计算所得到的N是一组人群(实验组或对照组)的大小。如果两组人数相等,则全部实验所需要的样本量为2N。

2)实验中α和β值一般由研究者根据需要确定,如果要使样本大些以保证结果的可靠性,可选择数值小的α和β值。

3)最后还要考虑失访对实验结局及检验差异所带来的影响,这一点可用增大样本量来补救。确定样本数目时,应对失访有个预先的估计,在计算的样本量基础上增加10%~15%作为实际应用的样本量。

4.设立严格的对照

设立对照的目的是消除非研究因素干扰而产生的偏倚,以便得出正确的结论。在临床上,由于多数疾病的自然病程还不能准确地预料,当有的疾病自然恢复时,如果没有设立阴性(不用治疗的)对照,则易误认为是某药的治疗结果。若设立对照就可消除这些因素对实验产生的干扰,可得出正确的结论。另外,设立对照还有助于确定治疗的副作用或疾病本身产生的并发症。常用的对照方法有:

(1)标准对照(standard control)或称阳性对照(positive control):

是临床上最常用的一种对照方法。此种对照设立的方法是以现行最有效或临床上最常用的药物或治疗方法作为对照,用以判断新药或新疗法是否优于现行的药物或疗法。应用时要注意,不能为了提高试验药物或疗法的效果而选用疗效低的药物或疗法作对照。

(2)安慰剂对照(placebo control)或称阴性对照(negative control):

药物常具有特异和非特异效应,为了排除非特异效应的干扰,可采用安慰剂作对照。安慰剂是指没有任何药理作用的物质(如淀粉、乳糖、生理盐水等)。使用安慰剂对照时,要注意两点:第一,要求安慰剂的剂型和外观尽量与实验药物相同,而且对人体无害,以利于进行盲法实验;第二,要掌握安慰剂的使用指征,此种对照由于患者未得到治疗,故应限于研究那些目前尚无有效药物治疗的疾病,或在使用安慰剂期间,对病情和预后基本没有影响,否则不能应用安慰剂对照。

(3)交叉对照(crossover control):

这是一种特殊的随机对照,即按随机方法将研究对象分为甲、乙两组,甲组先用实验药,乙组先用对照药。一个疗程结束后,间隔一段时间以消除治疗药物的滞留影响,然后甲组再用对照药,乙组用实验药,最后分析和比较疗效。这样既有自身前后对比,又有同期组间比较,还可消除实验顺序带来的偏倚。两次治疗的间隔时间因疾病的症状或药物残留的时间长短而不同。

(4)互相对照(mutual control):

如果同时研究几种药物或治疗方法时,可以不设专门的对照,分析结果时,各组之间互为对照,从中选出疗效最好的药物或疗法,此种对照也是最常用的一种对照方法。

(5)自身对照(self control):

试验中研究对象不分组,在同一研究对象中进行实验和对照,如比较用药前后体内某些指标的变化情况,以判断药物的疗效;或研究皮肤科用药时使用左右肢体做实验和对照,分析何种药物疗效更好。

5.随机分组

研究对象和使用的对照方式确定之后,下一步的工作就是随机将研究对象分配到实验组与对照组。

(1)随机分组的原则:

研究对象确定后,每位研究对象被分配到实验组或对照组的机会相等,而不受研究者或受试者主观愿望或客观原因所影响。随机化是为了使对照组与实验组具有可比性,提高研究结果的真实性,减少偏倚的重要手段。

(2)随机分组方法:

在临床试验中常用的随机分组方法有三种:

第一种,简单随机法(simple randomization):

最常用的方法是利用随机数字表或随机排列表,也可用抽签或抛硬币等方法。简单随机法应用和操作简单,但分配到各组的样本量可能不等,当分配到各组的样本量差异较大时有必要再次经随机化原则调整。多中心试验研究时,不适合用单纯随机法。

第二种,区组随机法(block randomization):

当研究对象人数较少,而影响实验结果的因素又较多,简单随机化不易使两组具有较好的可比性时,可以采用区组随机化法进行分组。其基本方法是将条件相近的一组受试对象(如年龄、性别、病情相近)作为一个区组,每一区组内的研究对象(通常4~6例)数量相等,然后应用单纯随机分配方法将每个区组内的研究对象进行分组。该法的优点是在分组过程中,任何时刻试验组与对照组病例数都将保持相对一致,并可根据试验要求设计不同的区组。该法适用于样本量小的研究。

第三种,分层随机法(stratified randomization):

将对研究对象治疗效果影响较大的特征(如年龄、性别、病情、临床分型等)找出,按此将研究对象分为若干层,再运用简单随机化方法将每层内的研究对象随机分配到实验组和对照组。当影响因素较多时,如果不使用分层随机法,试验对象的个体差异较大,需要对较多的患者进行对比才能显示两组的差别。而使用分层随机化方法能将影响疗效的因素按影响程度的大小依次分层加以考虑,就使得两组的临床特征比较相近,增加组间可比性,结论更可靠。分层随机法的优点是所用样本量小,效率高;缺点是分层不可太多,分层越多选择可比性的研究对象越难,需要的样本量越大。

6.盲法的应用

临床试验中的研究对象一般都是人,为了去除人(包括研究对象、观察者及资料整理和分析者)的主观心理因素对研究结果可能产生的某些干扰作用,观察结果时最好使用盲法。盲法分单盲法、双盲法和三盲法。

(1)单盲(single blind):

单盲是指研究对象不知道自己所在分组和所接受的处理,但观察者和资料收集分析者知道。单盲方法简便,容易进行,观察者知道受试者分组的情况,对受试者的健康和安全有利。观察者可根据病情变化,调整药物剂量,更换药物种类或采取其他的处理措施,做到心中有数。单盲法可以减少来自研究对象的偏倚,但不能防止来自观察者的观察性偏倚。

(2)双盲(double blind):

研究对象和观察者都不知道分组情况,也不知道研究对象接受的处理措施,称为双盲。患者与医师只知道药物的编号,如A和B。待试验结束和资料分析后才宣布A药和B药何为试验药、何为对照药。双盲法能同时控制来自研究对象和观察者的可能偏倚,但执行起来也比较困难,应用时必须考虑其可行性,在执行中要有严格的管理制度和方法。在实验过程中,双盲状态可因种种原因遭到破坏,因此在使用时应注意一些问题:①试验药的制剂应防止破密,试验药和安慰剂两种制剂的颜色、气味、大小、外形要相同,甚至容器和外包装也要一样,一般常用胶囊制剂。②保证试验对象的安全,在双盲试验中,当医师发现患者出现了严重的副作用、治疗无效或病情加重时,不能单纯为追求完整的资料而继续试验,必须从医德的观点出发,对该患者应立即停止盲法治疗,并公开该患者所用的真实药物。因此,在盲法试验之前,应由设计者预先制定出停止盲法的指标和条件,以利观察者执行,避免给患者带来不良影响或严重后果。③不适用于危重患者,双盲法的缺点是在管理上缺乏灵活性,因而不适于危重患者的抢救。此外,有特殊副作用的药物容易破密。

(3)三盲(triple blind):

三盲法是研究对象、观察者和资料整理分析者均不知道研究对象分组和处理情况,只有研究者委托的人员或是药物的制造者知道患者分组和用药情况,直到试验结束时才公布分组和处理情况。这种方法除了具有双盲法的优点外,在理论上还可减少资料分析时可能产生的偏倚,使研究结果更符合客观情况。该法减弱了对整个科研工作的监督作用,使科研的安全性得不到保证,应用并不普遍。在实际应用中通常用双盲随机对照试验。

7.资料的收集与分析

收集资料前,应该根据研究目的设计不同的调查表,在实施过程中仔细记录调查表中的各项内容。资料收集的方法包括访问、体检和实验室检查等。对门诊患者的随访可用信访法或电话访问法收集资料。

研究结果是否具有真实性,除了要做好严谨的科研设计外,还需收集高质量的资料,即具有可靠性、完整性及可比性的资料。要对研究的全过程实行质量控制。

资料收集后,首先要对资料进行仔细核对,然后确定分析的指标和分析方法。

(1)仔细核对资料:

对收集到的资料要进行仔细的核对,首先剔除不合格的调查表,如填写不合格的调查表或有缺项的调查表。资料核对后,进行分类整理,即按分组和结果的阴阳性进行整理。在资料整理过程中,要防止差错、偏倚和混杂发生。

(2)确定评价指标:

临床试验最终目的就是比较两组或多组结果之间孰大孰小、孰高孰低。一般来说,仅用绝对数值相比是不合适的,如治疗组死亡8例,对照组死亡10例,认为疗效是减少2人死亡,这样的评价是没有意义的。因为死亡、好转或治愈等都是以概率为基础表达的。因此,常用指标是一些率,如有效率、治愈率、病死率、n年生存率等。有些情况下,反映干预措施有无效果的指标是计量资料,如抗高血压的药物以血压数值下降的幅度作为疗效标准,抗高血脂的药物以血脂下降的幅度作为疗效标准;也可将这些数据转换成计数资料进行统计分析,如应用有效率、治愈率等指标表示药物的疗效。

实际应用时选择哪种指标,要根据研究目的和研究内容的具体性质来决定。无论是哪种指标,最重要的是要对指标有明确的规定,如什么情况是好转、恶化、复发。除了对观察指标的性质进行严格规定外,还应该规定观察起止时间等。对使用的指标规定后,要严格执行,否则各组间就无法进行比较。研究治疗措施效果常使用的指标如下:

1)有效率(effective rate):

(式6-3)

治疗有效例数应包括治愈人数和好转人数。

2)治愈率(cure rate):

(式6-4)

3)病死率(fatality rate):

(式6-5)

4) n 年生存率(survival rate):

(式6-6)

5)不良事件发生率(adverse event rate):

(式6-7)

此外,治疗措施效果的考核还可用病情轻重、病程长短及病后携带病原状态、后遗症发生率、复发率等指标评价。

(3)主要的分析方法:

临床试验资料分析的主要形式就是比较两组或多组指标之间有无差异,如果有差异,检验其差异有无统计学上的显著性。

一般来讲,资料经过整理后可分为两大类。一类为计量资料,即用定量方法测定某些指标所得的数据(有度量衡单位的数据),如身高、体重、血压、血脂、白细胞数等,也称连续性数据;另一类为计数资料,此类资料是将观察单位按某种类别或属性分组,再计算各组的数据,如好转、恶化、死亡、治愈等,也称归类性数据,描述该类数据可用率和构成比。进行统计分析比较时不同性质的资料要用不同的统计方法。计量资料统计时用 t 检验或 F (方差)分析,大样本正态分布资料还可用 U 检验。计数资料统计时用 X 2 检验或非参数检验,后者适用于计数资料呈等级顺序关系时。如果比较的指标是生存率,特别是用寿命表法计算的生存率,需要用 Log-Rank X 2 检验(时序检验)。大样本正态分布的资料,还可用 U 检验进行两个率的显著性检验。

8.偏倚及其控制

偏倚可以发生在研究工作的任何阶段,从而影响结果的正确性。临床疗效研究中常见的偏倚有:

(1)选择偏倚:

主要是选择研究对象和分组时,由于人为干预而导致的偏倚,使研究结果偏离真实情况。防止的方法就是严格掌握研究对象的入选标准和排除标准,并使用随机抽样和随机分组法。

(2)测量偏倚:

收集资料过程中,因仪器或试剂的问题所产生的误差,以及观察者操作的误差和被观察者主观的误差均可导致测量偏倚的发生。防止的方法主要是实验前对所使用的仪器进行标定,实验过程中使用统一的试剂,而且对操作规程进行规范。盲法是控制测量偏倚的重要手段。

(3)干扰和沾染:

干扰是指实验组或对照组额外地接受了类似试验药物的某种制剂,从而人为地夸大疗效的假象。如实验组接受了“干扰”药物,导致疗效提高,引起实验组与对照组疗效差异的增大;反之,如果对照组接受了“干扰”药物,则可引起对照组疗效增高,使两组间的疗效差异缩小。沾染是指对照组的患者额外地接受了试验组的药物,从而人为地造成一种夸大对照组疗效的现象。干扰和沾染的控制办法就是使用盲法,并严格按治疗方案进行,不要随意增加和减少药物种类。

(4)依从性:

临床试验中所涉及到的一种特殊情况就是依从性。要提高患者的依从性,可在实验的设计和实施阶段采取措施。实验设计阶段:尽可能缩短研究持续的时间,在水平较高的医院开展研究,选择居住地离医院近的患者等;实验开始后充分做好宣传工作,让患者了解研究的重要性,与研究对象保持密切联系,联络感情争取合作,随访时尽量给患者方便,多提醒研究对象按时服药或定期检查,与患者的家属搞好关系等。

三、诊断试验研究

正确的诊断是临床医疗服务的首要前提,是临床医师必备的技能,而正确诊断本身却依赖于灵敏可靠的诊断试验。

(一)概念

1.筛检(screening)

筛检是运用快速、简便的实验、检查或其他手段,自表面健康的人群中去发现那些未被识别的可疑患者或有缺陷者。用于筛检的试验称为筛检试验。由于许多疾病在临床症状和体征出现以前,体内的组织器官已经发生了病理学上的改变,或体内的生化代谢或免疫等已出现异常反应,因此我们有机会在该时期通过某些检查,早期发现这些患者,以利早期诊断和早期治疗。应该注意的是,筛检不是诊断,筛检试验阳性者只是某病的可疑患者或某种可疑有缺陷者。因此,还需作进一步确诊后才能开始治疗。

2.诊断(diagnosis)

诊断不同于筛检,筛检是把患者及可疑患者与无病者区别开来,而诊断则是进一步把患者与可疑有病但实际无病者区别开来。因此,诊断对指导下一步治疗有决定意义,诊断正确与否至关重要。用于诊断的试验称为诊断试验。临床医师掌握科学的研究和评价诊断试验的方法可为其选择合理的诊断方法奠定基础,因而可避免单凭经验诊断造成的错误。

筛检与诊断既有联系,也有区别。其共同点都是通过试验对健康状况进行判断,其差别是:筛检是自表面健康的人群中去发现那些未被识别的可疑患者或有缺陷者,其阳性者只是可能有病,其目的是为了早期发现患者,以便早期治疗;而诊断是自可能有病者中将实际有病与实际无病者区别开来,其阳性者是真正有病需要治疗者,其目的主要是疾病诊断,当然还可用于疾病随访,确定疾病的转归,用于疗效考核时的疾病状态的诊断,或用于药物毒副作用的监测等。一项试验首先必须安全可靠,有较高的灵敏度和特异度,能有效地区别患者和非患者,才能用于筛检和诊断。另外,还需考虑价廉和易于被群众所接受。一种价格昂贵,对被检查者有创伤或造成被检查者痛苦的试验一般不能用于筛检,用于诊断也要慎重。

(二)诊断试验的研究方法

对诊断试验和筛检试验必须进行科学的研究与评价,制定出符合实际的应用条件和标准,才能使其具有最大的诊断和筛检价值。两者的研究方法相同,具体步骤如下。

1.选择“金标准”

金标准(gold standard)即标准诊断方法,是指可靠的、公认的、能正确地将有病和无病区分开的诊断方法。不同的疾病有不同的金标准,如诊断冠心病的金标准可能是冠状动脉造影,诊断肿瘤的金标准是病理学检查,诊断肾结石的金标准是外科手术所见。对有些诊断困难的疾病,可能暂时没有真正意义上的金标准,此时只能选择一个相对公认的方法作为金标准。对用这种相对标准诊断的病例,可采用长期随访病例,以获得肯定结果的办法进行复核。为了避免外界环境因素的干扰,要求待评价的诊断或筛检试验与标准方法应在同一时间在相同条件下进行试验。要对诊断或筛检试验作出正确评价,金标准的选择至关重要。

2.选择病例

病例除要求用金标准正确诊断外,同时要求所选病例应有代表性,应包括临床各型(轻、中、重)、各期(早、中、晚)及有或无并发症的病例。病例代表性的好坏,将直接影响对筛检或诊断试验的评价结果的普遍性和推广价值。

3.选择对照

对照应在年龄、性别及某些重要的生理状态等方面与病例具有可比性,对照不仅包括健康人,还应包括一些确实未患该病但患有其他疾病的病例,特别是那些在临床上极易与该病混淆的病例。

4.确定样本量

影响研究样本量的因素主要有:①待评价筛检试验的灵敏度;②待评价筛检试验的特异度;③要求的显著性检验水平α;④容许误差δ。一般可用公式6-8。

(式6-8)

式中:n为所需样本量;Z α 为正态分布中累积概率等于α/2时的Z值,如Z 0.05 =1.96或Z 0.01 =2.58;δ为容许误差,一般定在0.05~0.10;p为待评价的筛检方法的灵敏度或特异度,通常用灵敏度估计病例组所需样本量,特异度估计对照组所需样本量。

5.盲法检测

对选择的病例和对照,同时应用金标准方法和待研究的筛检或诊断试验盲法地对该人群重复检查,将两种方法对两组人群的检查结果进行分析比较后,就能对诊断或筛检试验进行评价。

6.确定正常值

比较金标准和待评价方法的检查结果,一般选择检查结果最接近金标准判断结果的界值作为正常值标准。常用的确定正常值的方法是统计学的方法,一般包括标准正态分布法、对数正态分布法和百分位数法三种方法。正常值的确定是否恰当,将对诊断或筛检试验的真实性产生明显的影响。

(三)诊断试验的评价

对诊断试验和筛检试验的评价,除考虑安全可靠、简单快速及方便价廉外,主要从试验的真实性和可靠性两个方面进行评价。

1.真实性

真实性(validity)又称准确性(accuracy),它是指测定值与实际值符合的程度,是指将患者和正常人正确区分开的能力。在对一项筛检或诊断试验进行评价研究时,受检人群将出现如表6-2所示的真阳性、假阳性、真阴性、假阴性四种情况,据此可计算出一系列评价真实性的指标。

表6-2 试验检查结果真实性评价模式表

(1)灵敏度(sensitivity):

又称真阳性率,是指将实际有病的人正确地判断为患者的能力。理想的试验应为100%。

(式6-9)

(2)特异度(specificity):

又称真阴性率,是指将实际未患某病的人正确地判断为未患某病的能力。理想的试验应为100%。

(式6-10)

(3)假阴性率:

又称漏诊率,是指实际有病者而被判定为非病者的百分率。理想的试验应为0。

(式6-11)

(式6-12)

(4)假阳性率:

又称误诊率,是指实际无病者而被判定为有病的百分率。理想的试验应为0。

(5)约登指数(Youden’s index):

又称正确指数,是指灵敏度和特异度之和减去1,是综合评价真实性的指标。理想的试验应为1。

如在一次糖尿病的诊断试验的评价中,共检查1000人,其中糖尿病患者20人,非糖尿病患者980人,检查结果真阳性18人,假阳性49人,假阴性2人,真阴性931人。根据该结果计算该试验的真实性指标如下:

灵敏度=18/20=90%

特异度=931/980=95%

假阴性率=2/20=10%,或1-90%=10%

假阳性率=49/980=5%,或1-95%=5%

约登指数=0.90+0.95-1=0.85

(6)预测值:

有两个反映诊断试验的实际临床诊断价值的重要指标,即预测值(predictive value),预测值可分为阳性预测值和阴性预测值。阳性预测值是指试验为阳性者真正患有该病的可能性,阴性预测值是指试验为阴性者真正没有患该病的可能性。

预测值的计算公式如下:

(式6-13)

(式6-14)

预测值不但受到试验的灵敏度和特异度的影响,同时,还会受到人群患病率或验前概率的影响。当某试验的灵敏度和特异度一定时,当所用人群的患病率升高时,阳性预测值升高,阴性预测值下降,反之亦然。预测值与患病率及灵敏度和特异度之间的关系亦可用下式表示:

(式6-15)

(式6-16)

当患病率很低时,即使一个试验的灵敏度和特异度均很高,仍会出现许多假阳性,使阳性预测值降低。如用ELISA法检测AIDS病的HIV抗体,假设该法的灵敏度和特异度均达到99%,如表6-3所示,在感染率为1/万时的阳性预测值仅为0.99%,而当感染率升至10%时,其阳性预测值则升至91.67%。该结果提示,临床医师在判断一张化验单的阳性结果的临床价值时,必须事先考虑被检人群的患病率高低,才能作出正确评价。同样的试验在基层门诊部和在高级专科医院应用时,其阳性预测值有很大差别。

表6-3 灵敏度和特异度均为99%的试验在不同患病率人群中的阳性预测值

2.可靠性

(1)可靠性(reliability)又称可重复性(repeatability)或精密度(precision),是指在完全相同的条件下,重复进行某项试验时获得相同结果的稳定程度。常用的评价指标有:

1)变异系数(coefficient of variance):当某试验是作定量测定时,可用变异系数来表示可靠性。变异系数越小,可靠性越好。变异系数的计算见式6-17。

变异系数( CV )=(标准差/算术均数)×100%

(式6-17)

2)符合率:当某试验是作定性测定时,可用符合率来表示可靠性,符合率越高,可靠性越好。

(式6-18)

(2)影响一项诊断或筛检试验的可靠性的因素包括试验条件、观察者及被观察者三方面的变异。

1)试验条件的影响:包括试验的环境条件,如温度、湿度等;试剂与药品的质量及配制方法;仪器是否校准等。因此,必须严格规定试验的环境条件,试剂与药品的级别,仪器必须先校准,才能保证试验的可靠性。

2)观察者的变异:包括不同观察者之间的变异和同一观察者在不同时间、条件下重复检查同一样本时所得结果的不一致性。如由几名观察者同时测量同一人的血压值,即使观察者训练有素,差异在2mmHg以内当属允许范围。为此,观察者必须经过严格的培训,增强责任心,统一判断标准,使观察者的变异降低到允许范围以内。

3)被观察者的个体生物学变异:生物个体的各种生理、生化测量值均随测量时间、条件等变化而不断变化。如血压值在上下午、冬夏季不同,并随测量体位和部位的不同而变化;血糖值在饭前、饭后不同时间有明显差异。因此,要严格规定统一的测量时间、条件等,以使被观察者在相同条件下进行比较。同时,临床医师应对个体的生物学变异给予足够的重视。

(谭红专) qfhaFU1i3NrP39+ROlbyUUuMbOMPnZLhIACf/W/0Z6ckIMbc5lcXOla9OtahQcMK

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开