检验一种药物是否优于另一种药物的试验,称为优效性试验。一般以安慰剂为对照的试验应做优效性试验。
优效性试验的原假设为试验药总体疗效小于或等于对照药的总体疗效,而备择假设为试验药总体疗效优于对照药。拒绝了原假设即可得出试验药比对照药优效的结论。
以两种药物有效率比较为例,优效性试验(统计优效)的检验假设为:
H 0 : π T ≤ π C (两药疗效相等或试验药劣于对照药)
H 1 : π T > π C (试验药优于对照药)
检验假设中, π T 为试验药的总体有效率, π C 为对照药的总体有效率。本章中所涉及的评价指标均为高优指标(数值越高表明疗效越好,如有效率),特别说明的除外。如果为低优指标,原理同高优指标,定义相反,如两组死亡率的比较,其对应的检验假设 H 0 : π C ≤ π T ; H 1 : π C > π T 。
有时研究者希望试验药比对照药优于某一具有临床意义的数值时才认为是优效,这时优效性试验称为临床优效性试验,其检验假设为:
H 0 : π T - π C ≤Δ(临床上两药疗效相等或试验药劣于对照药)
H 1 : π T - π C >Δ(临床上试验药优于对照药)
其中,Δ为某一具有临床意义的数值,在此称之为优效性界值。Δ为0时临床优效性检验即为统计优效性检验。
优效性试验的统计检验方法与差异性检验的统计检验方法相同,但所用的是单侧检验。
两样本率比较的优效性检验可用 χ 2 检验或 u 检验,以检验试验药是否优于对照药。 u 检验统计量的计算可用差异性检验的两样本率比较的公式。
上式中, p T 和 p C 分别为试验组和对照组的样本率; n T 和 n C 分别为试验组和对照组的例数; p 为两组合计的率; S pT - pC 为两个率之差的标准误。
因为只有当试验药疗效较高且结果有统计学意义时才可做出试验药优于对照药的结论,所以采用单侧检验。在优效性试验中,为控制假阳性错误,一般 α 取单侧0.025,以 α =0.025的 u α =1.96为临界值。根据样本信息计算出来的 u 值如果大于临界值,则拒绝 H 0 ,接受 H 1 ,得出试验药优于对照药的结论。
对于临床优效性检验, u 检验公式可变化为公式(4-2),即在公式(4-1)分子上减去一个优效性界值Δ,即分子为 p T - p C -Δ。
同样,只有根据样本信息计算出来的 u 值大于对应的临界值,才可以得出试验药临床上优于对照药的结论。
优效性检验可以采用假设检验方法进行统计推断,也可以通过置信区间法进行统计推断。ICH相关指导原则中推荐采用置信区间法,它可以提供总体参数值范围的信息,便于比较,易于说明问题。对于两样本率比较的优效性试验,按单侧100(1- α )%的置信度,计算 π T - π C 的单侧置信区间下限 C L ,如下:
若( C L ,∞)不包含0,即 C L >0,可得到试验组比对照组统计优效的结论。若( C L ,∞)不包括Δ即 C L >Δ,可得到试验组比对照组临床优效的结论。例如,根据某资料计算出试验组与对照组两组率差的单侧97.5%的置信区间为(8%,∞),而预先规定的临床优效性界值为5%,由于该区间不包含5%即8%>5%,可得出试验组临床优效于对照组的结论。
同理,若评价指标为低优指标(数值越低代表疗效越好),可按单侧100(1- α )%的置信度,计算 π T - π C 的单侧置信区间上限 C U , C U =( p T - p C )+ u α S pT - pC 。若(-∞, C U )不包含0,即 C U <0,可得到试验组比对照组统计优效的结论;若(-∞, C U )不包括-Δ,即 C U <-Δ,可得到试验组比对照组临床优效的结论。
两样本均数比较的优效性检验可用 t 检验,以检验试验药是否优于对照药。 t 检验的公式可用差异性检验的两样本均数比较的公式。优效性检验中 α 一般取单侧0.025,以 t 0.025, v 为临界值。当 t > t 0.025, v ,即试验药疗效较高且结果有统计意义时,才可做出试验药优于对照药的结论。
上式中,
和
分别为试验组和对照组的样本均数;
n
T
和
n
C
分别为试验组和对照组的例数;
v
为自由度;
和
分别为试验组和对照组的样本方差;
为两组合并方差;
为两均数之差的标准误。
对于两样本均数比较的临床优效性检验,可在公式(4-4)分子上减去一个优效性界值Δ,即原公式分子变化为
,原
t
检验公式变化为公式(4-6)。
两样本均数比较的优效性试验可以采用假设检验进行统计推断,同样也可以进行置信区间估计。按单侧100(1- α )%的置信度,计算 μ T - μ C 的单侧置信区间下限 C L ,如下:
若( C L ,∞)不包含0,即 C L >0,可得到试验组比对照组统计优效的结论;若( C L ,∞)不包含Δ,即 C L >Δ,可得到试验组比对照组临床优效的结论。
例4-1 有3项临床试验,试验组与对照组疗效之差的双侧95%置信区间结果如图4-1(高优指标,数值越高代表疗效越好),Δ为优效性界值。从图中可以看出,研究3两组疗效之差置信区间下限大于Δ,提示试验组临床优效于对照组;研究2置信区间下限大于0,提示试验组统计优效于对照组,但其置信区间下限小于Δ,不能认为试验组临床优效于对照组;研究1置信区间下限小于0,不能得出试验组优效的结论。
图4-1 优效性试验置信区间示意图(高优指标)
例4-2 有3项临床试验,试验组与对照组疗效之差的双侧95%置信区间结果如图4-2,Δ为优效性界值。从图中可以看出,研究1两组疗效之差置信区间上限小于-Δ,提示试验组临床优效于对照组;研究2置信区间上限小于0,提示试验组统计优效于对照组,但其置信区间上限大于-Δ,不能认为试验组临床优效于对照组;研究3置信区间上限大于0,得不出试验组优效的结论。
图4-2 优效性试验置信区间示意图(低优指标)