随机对照试验(randomized controlled trial, RCT)是一种对医疗卫生服务中的某种疗法或药物的效果进行检测的手段,特别常用于医学,生物学,农学。随机对照试验的基本方法是,将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。具有能够最大程度地避免临床试验设计、实施中可能出现的各种偏倚,平衡混杂因素,提高统计学检验的有效性等诸多优点,被公认为是评价干预措施的金标准。
国际上第一个RCT是1948年由英国医学研究会组织实施的,验证了链霉素治疗肺结核的疗效。1967年Schwartz和Lellouch最早提出了临床试验有两种截然不同的态度,实用性与解释性态度的区别,当时并没有引起人们的重视。随机对照试验已被国际上公认为临床防治性研究方法的金标准,主要有两种设计形式:解释性随机对照试验(Explanatory randomized controlled trials, explanatory clinical trials)和实用性随机对照试验(Pragmatic randomized controlled trials, pragmatic clinical trials)。在临床试验发展中,思考研究本质是“解释性的”还是“实用性的”是一个重要的里程碑。Schwartz等最早对比了这两种试验性质,指出解释性试验竭力探寻一项治疗效应是否存在,干预是如何起到治疗效果的,对明确有效的机制具有较高价值,但很少能告诉我们结论能否推广到更宽的现实环境中及更宽范围的不同人群中。而实用性试验则是在临床实际中的不同治疗方案中比较,朝向提供最佳治疗决策。实用性研究更关心在真实条件下治疗病人的效果怎么样,很少洞察为什么能治疗或怎么样治疗。
根据2001年英国Cochrane中心联合循证医学和流行病学领域权威专家制定的循证医学临床证据的分级,随机对照试验(Randomized controlled trail, RCT)证据是Ⅰ级证据,被公认为评价某种药物或治疗方式疗效和安全的金标准,是指南中主要推荐的证据。
RCT就是从目标人群中选出合适的研究对象(Participants),进行随机化分组(Randomization),对不同组实施不同的干预(Intervention),随访一段时间,然后比较试验组和对照组(Control)之间的结局(Outcomes),以比较干预效果的不同。实验性研究之所以优于观察性研究,在于RCT具备阐明某个特殊干预措施和结局之间因果关系的能力,而采用随机分配的干预措施可以降低混杂因素的影响,设盲(Blinding)可以降低在结局确认和疗效判定时产生的偏倚。因此,把握RCT的设计就是要关注如何选择合适的研究对象、设立恰当的对照、具体的干预措施、定义合理的结局,以及把握随机化和盲法的实施方法。
随机对照试验遵循随机、对照和重复的三原则,利用统计学知识,通过设定一系列的研究程序和管理措施,消除医生和患者对药物疗效的主观影响,达到与已经上市的药物之间的有效比较,进而对其有效性和安全性做出相对客观的评价。西医之所以能够建构出这种试验方法来对新药的有效性和安全性进行相对可靠的评价,本是由其内在的理论特征决定的。下面我就结合西医西药的理论特征来对随机对照试验内涵的原理进行论述。我们知道随机对照试验在进行设计和结果分析时,主要依赖的数学工具就是统计学知识,而统计学知识所处理的对象就是那些可重复发生的独立事件,体现在医学临床研究中就是可重复性的治疗案例。
随机化分组是指在参与RCT研究中的每个受试者能够有同等机会接受任何一种治疗或干预,平衡试验组和对照组之间的混杂因素。随机化的重要特征是操作过程是真正的随机分配治疗(Allocates treatments randomly),并且分配过程是不受干扰的,从而使随机化不受有意或无意的因素影响。
常见的随机策略有简单随机化、区组随机化、分层随机化、协变量适应随机化等。通常情况下,首选的方式是将纳入的受试者个体采用简单的随机化方法分配到每个干预组。区组随机化,是指预先确定好一个“区组”,比如6个人(也可以是4或8个人等),在这个区组内进行随机化,对每个区组内的6个人进行随机化分配,是一种可以平衡对照组和试验组受试者人数的常用方法。分层区组随机化是为了确保组间与结局紧密相关的变量水平均匀分布,比如研究心血管疾病发病率的试验中,根据有无心血管疾病病史、合并心血管风险因素的个数等进行分层,因而能确保基线每组分配的受试者发生心血管疾病的风险组间均衡,也能提高小样本试验的效能,而对于受试者超过1000名的大型试验中,分层随机化则获益甚微,因为随机分配可以保证基线变量的均匀分布。
分组隐匿(Allocation concealment)指在诊断患者、审核患者合格性、征求患者加入、随机分配的阶段,使患者、医师和分组人员都不知道随机序列以及相对应的组别的一种方法。随机化的精髓在于其不可预测性,只有同时采用分组隐匿才可以彻底避免选择偏倚,在最大限度上使各项已知和未知的预后因素在组间达到可比,最终可以将组间结局的差异归因为干预措施效果的差异。
中心随机分组的方法属于典型的含有分组隐匿的随机分组方法,即当确定了一个患者的合格性,并征得患者书面同意参与研究后,才向中心分组人员或部门索取随机数字,并对此给予治疗。通过互联网进行中心随机分组是目前最常用和最佳的方法。不透明的密封信封不是可靠的分组隐匿的方法,因为分组者可以预先打开信封,并根据里面显示的治疗和患者的情况决定是否纳入下一个患者或是否参与研究,从而破坏了随机序列,导致随机分组的失败。
盲法指为了使患者、医师或资料搜集人员不知道患者接受的是什么治疗而采用的一种程序或方法。当结局指标是主观评价的指标,如疼痛,乏力时,使用盲法尤为重要,采用盲法可以消除患者、医师和资料收集者的期望偏倚,因此最好采取双盲。除了一些十分客观的结局指标,如死亡和仪器自动测量的结局外,都应该尽可能对资料收集或结局评价人员采取盲法,以降低测量误差,减少信息偏倚。实施盲法,可以减少进入不同研究组的患者对干预措施心理上或生理上反应的差异,也使患者更易遵守试验方案,从而减少寻求其他治疗措施的机会,也可减少失访。对实施研究的医师,盲法可避免他们对不同组别的患者区别对待,从而使随机分组获得的组间可比性在治疗和观察阶段得到维持和延续,减少可能发生的混杂和信息偏倚。
eRCT要求在尽可能理想的临床医疗环境中进行试验,多采用偏倚最小化的标准化干预,并且要求有周密详尽的质控措施,试验结果具有很强的内部真实性、可重复性较高。但其标准化干预限制了整体观念、辨证论治、随症加减的中医临床实践,所以解释性RCT试验环境特点一定程度上影响了中医药临床疗效展示及展示的力道。较低的外部准确度决定了其研究结果对实践的影响较小。这种情况通常不能在真实世界的临床实践中推广。
pRCT要求尽可能在真实世界进行临床试验,多采用临床方案,鼓励受试者积极参与、与治疗者充分沟通,试验结果具有很强的外部真实性和外推性。这种设计强调在现实世界中,对异质性较高的人群采用以患者为中心的结局指标来检测某种疗法的实际效果。中医具有整体观念、辨证论治、随症加减的诊疗特点,符合pRCT内在特性,研究结果对实践的影响较大。但正因为pRCT尽可能接近临床实践,所以其的内部真实性和可重复性都很低,以至于实用性RCT内在特性要求样本量尽可能大。
单病例随机对照试验通过随机方法安排治疗期和对照期顺序,进行三轮或三轮以上的治疗周期,应用于单个病例的自身对照双盲治疗研究。每一轮治疗之间可有一段时间的空白期,也称为“洗脱期”,以消除前一次干预措施残余的影响,使患者和实施治疗的医生对治疗顺序处于未知状态的双盲法是试验必不可少的重要条件。鉴于大样本随机对照试验的最终结果可能不适用于单个或特殊患者,单病例试验的优点在于,短时间内从多种治疗中选出最有效者,患者从试验中可直接获益,易被患者接受,失访率低,从而减少伦理学的争议。但是这种方法的试验结果并不能推论到其他患者,而且一个阶段干预治疗的效果可能被带入下一个阶段,这有可能是非常重要的混杂因素。
加载设计指的是在使用安慰剂的对照试验中,设计方案为所有受试者在接受标准疗法的基础上,试验组加用试验药物,对照组加用模拟试验药的安慰剂。
在标准治疗基础上的对照研究是指在接受标准治疗的人群中进行的新药的安慰剂对照研究。当已知标准治疗可以降低死亡率或不可逆转的病态时,不会对已知可以从中获益的人群停止治疗;当采用标准治疗作为阳性对照的非劣效性试验无法进行或难以对结果进行解释时,这类研究是有效的。
加载设计的标准疗法应该根据当前治疗该疾病的指南、规范、路径、专家共识的建议来确定。尽可能按照循证医学的原则与方法,采取当前研究中被证明是最佳成果(证据)应用于临床加载设计的临床试验中。只有采用符合最佳论证强度的干预措施和药物,在此基础上加载试验药物,其临床疗效才可能被认可。但是所有研究都采取最佳成果(证据)往往不太现实,因为很多疾病的研究还没有取得确实的证据,许多治疗措施和药物,往往还是传统的临床经验。所以选择这类干预性措施应慎重,至少应该具有专家水平之共识标准。
方案设计时应规定选择的受试者,应该是既往已经服用标准药物,而且达到最大剂量,疗程也已经足够,但未达到治疗目标(即治疗无反应者)的,同时病情保持稳定的那部分病人。如果治疗不是采用标准药物,或者是虽然是使用标准药物,但其剂量和用药时间还未达到要求的病人不应纳入研究,因为这部分病人如果更换成标准药物、或者调整剂量、用药时间,不用加载其他就可能是取得疗效。
整群随机试验适合评估在医疗实践、医院或整个医疗保健系统层面应用的治疗方法的有效性。它将受试者以群组为单位随机分配,一个群组内的所有受试者要么接受干预,要么成为对照。它和RCT的区别是,RCT的每一个受试者本质上都是独立的,随机发生在个体水平,而整群随机试验的随机发生在群组水平。两者的共同点是,无论随机方式如何,每一个受试者的研究结果都会被记录下来。
尽管临床试验采用整群随机有理论和现实原因,但这对试验结果的分析和解释都是根本挑战:与不同群体的受试者相比,同一群体的受试者更为类似。这一普遍事实违背了绝大多数统计检验的共同假设,即个体观测值彼此独立。为了获得有效结果,整群随机试验用到的统计方法必须能说明同一群体内部的受试者之间相似性更大。在中医药临床研究中,这种方法可以用于掩盖真药和安慰剂草药味的差异,避免破坏受试者盲法的实施。
析因设计,又称全因子试验设计。适用于各试验因素对观测指标影响的重要程度相同,并且所有试验因素同时作用于受试对象的研究。这种方法是一种非常好且有效的研究设计类型,可以同时回答多个研究问题。从统计学计算上来看,这样的设计可以降低样本量。以中药和安慰剂对照试验为例,在各组基线水平可比的情况下,治疗方案分为辨证个体化治疗或标准化治疗方案,而同种治疗方案下中药剂型分为汤剂和胶囊。通过这样的设计可以实现多种比较,如汤剂与汤剂安慰剂,粉末胶囊与安慰剂胶囊,个体化汤剂与标准汤剂,个体化胶囊与统一标准化胶囊等多种比较。