在临床试验数据的统计分析中,哪些患者应该包括在内,哪些患者不应该包括在内,是分析试验结果时必须考虑的问题,即“分析集”问题。用于统计分析的分析集需在统计分析前明确定义,并在盲态审核时确认每位受试者所属的分析集。针对疗效评价的分析集可分为全分析集和符合方案分析集,用于药物安全性评价的分析集则称为安全性分析集。临床试验受试者大致分为4类:所有进入随机化分组的受试者、接受试验药物治疗的所有随机化受试者、遵循研究设计方案的受试者、安全性/耐受性分析的受试者。意向性治疗原则(intention to treat,ITT)指主要分析应该包括所有进入随机化的受试者。如果临床试验中所有随机化了的患者都符合入选标准而没有一项符合排除标准;并且试验过程之中一切都符合试验方案的要求,没有失访和任何数据缺失,则所有病例均可包括在分析集中,但是实际临床试验中很难做到。那么,对于这些对方案有所违反的病例是否应当包括在分析集中是需要认真考虑的问题。在试验方案中应该考虑如何减少这些对方案的违反,也要说明对违反方案的类型和频数的规定及其处理方法,并描述其对试验结果可能的影响。因此,在定义分析数据集时,需遵循以下两个原则:①使偏倚达到最小;②控制Ⅰ类错误的增加。
全分析集(full analysis set,FAS)是指尽可能接近符合意向性分析(intention to treat,ITT)原则的理想的受试者集,是以最少和合理方法剔除受试者后得出的。有少数情况可能导致从“全分析集”中排除已随机化的病例,包括不满足主要入组标准(违反合格性),没有用过一次药以及在随机化后没有任何数据。这类排除总是需要证明其合理性的。不符合入组标准的病例可以从分析中排除而不会引入偏性的包括以下一些情况:①在随机化之前已经进行入组标准判定;②可以完全客观地作出有关违反合格性的检测;③所有病例接受相同的违反合格性的检测;④所有违反特定标准的病例已被排除。在某些情况下,从所有随机化病例集中除掉任何未用过试验药的患者是合理的。尽管排除这些病例,仍然保持了意向性治疗的原则,在另外一些情况下,有必要从所有随机化患者集中去除任何在随机化后没有数据的患者。有些受试者是在接受处理的过程中出现了因其他原因造成的失访,结果使某次随访后的数据缺失了,这些受试者应该保留在“全分析集”中。因为这些受试者在失访前的数据还是很有价值的。如果这些受试者被剔除,则可能严重削弱信息的真实性。
在选择全分析集进行统计分析时,对主要指标缺失的估计,可以采用最后一次观察值进行结转(last observation carry forward,LOCF),或者可以事先确定一些派算方法对缺失值的主要指标进行填补。全分析集是为了保持原始随机化数据集的完整性,防止偏性,并为统计检验提供合理的基础。在实际工作中,通常是将随机化后接受过至少一次治疗,并且有一次疗效指标(除基线时的记录外)的病例纳入全分析集。
符合方案分析集(per protocol set,PPS)是全分析集的一个子集,是指将未完成的和违反方案的病例排除在外的受试者所组成的分析集。进入符合方案分析集的病例被称为“可评价病例”或“完整病例”。进入该数据集的受试者对方案更具依从性,并且有符合如下准则的特征:①完成某一个预定的处理规程的最小规定部分;②测定主要变量的可能性;③没有任何大的违反方案的地方,包括违反入组标准。该数据集分析的结果能够显示药物按方案使用的效果,应在揭盲前以文件的形式写明未进入该数据集的病例情况及排除理由。应用符合方案分析集可能使新的治疗方案在分析中显示出附加效果的机会最大化,并且更密切地反映了对作为方案的基础的科学模型。在实际工作中,通常将依从性好、完成方案中规定的治疗、疗效指标无缺失、试验期间未服禁用药物、完成病例报告表的病例纳入该分析集。另外,有些受试者虽然在试验前的条件不符合入组标准,或试验中有一些违反方案的情况出现,如年龄超出1~2岁等,只要研究者认为对试验结果没有重大影响,还是不要排除在“符合方案分析集”之外。
在很多临床试验中,全分析集方法是保守的,但更能反映以后实践中的情况。符合方案分析集可以显示试验药物按规定方案使用的效果,但较以后实践中的疗效可能偏大。在确证性试验中,应同时用全分析集和符合方案分析集进行药物的有效性评价。当二者的分析结论一致时,可以增强试验结果的可信性。当不一致时,应对其差异进行清楚的讨论和解释。若符合方案分析集排除受试者的比例太大,会质疑试验总的有效性。在优效性试验(superiority trial)中,全分析集用于主要分析,以防止符合方案分析集的分析效果过于最优化估计。在等效性试验(equivalence trial)和非劣效性试验(non-inferiority trial)中,因全分析集中包括依从性不良者,所得结论一般并不保守,会减少估计的处理效应。
安全性分析集(safety set,SS)是用于分析药物安全性的数据分析集。与全分析集和符合方案分析集的定义范围不同的是,安全性分析集通过安全性指标判断受试者能否被选中。药物安全性评价的常用指标为生命体征、实验室检查、心电图检查和不良事件发生情况等。
实际工作中,安全性分析集包括所有经过随机化分组、接受过一次或以上药物治疗的受试者。在进行安全性分析时,只要患者用过≥1次药物,就应当研究其不良事件或不良反应,不管此患者是否包括在符合方案分析集中,这是为了能全面反映药物的安全性。
在药物临床试验中,研究者关心的不仅是试验药与对照药的疗效是否有差别,还需要评价其差别的大小是否具有临床意义。而传统的差异性假设检验关注的是两组的差别有无统计学意义,往往难以满足临床实际中需要评价疗效差别的要求。因此,在临床试验中建立了有别于传统的检验假设,根据临床研究的目的和对照的类型,可分为:非劣效性试验、优效性试验和等效性试验。
非劣效性试验、优效性试验和等效性试验与传统的假设检验最大的差别就是考虑了临床意义,以具有临床意义的界值 Δ 来进行假设检验,因此如何确定 Δ 的大小至关重要。一般来说,界值不能依赖于生物统计学专业人员单独指定,由临床专家和统计学家联合确定比较合适。而且界值的确定必须在试验设计阶段完成并在试验方案中阐明。如有修订,则必须在揭盲之前进行并陈述理由,一旦揭盲,不得更改,否则很容易陷入“数字游戏”危险。
样本量的估计原则是在保证“研究结果”具有一定可信度(1- α )及把握度(1- β )的前提下,估算出能够达到“主要研究目标”所需要的“最少样本数”,以便通过样本研究结果来推断总体特征。如果考虑到失访(或丢失、脱落),可以根据不同情况增加10%~20%的样本量,但是这一比例不能够太大。如果失访率超过20%时,可能需要对失访原因、状况等进行分析,在对研究结果下结论时当需慎重,有时失访率太高常会导致研究失败。
对于临床试验中非劣效性试验、优效性试验和等效性试验的假设检验及样本量估计,可咨询药物临床试验统计学家或参考药物临床试验统计学专著。
(许林勇)