检验一种药物是否与另一种药物的疗效“相等”(实际为相差不超过一个指定的数值Δ),称为等效性试验,Δ为等效性界值。例如,以一种仿制药与原研药进行比较,如果其疗效被判为“相等”,则仿制药可被接受。或研究能否用小剂量代替大剂量以减少药物的不良反应和节约费用;用不良反应小的药物代替不良反应大的药物;用疗程短的药物代替疗程长的药物以及用口服药物代替注射药物等。等效性试验的应用多见于对同一活性成分的生物等效性以及血浆无法测定时的临床等效验证。
等效性试验的原假设为总体参数间差别超过或等于一个研究者规定的等效性界值Δ,而备择假设为总体参数间差别小于研究者规定的Δ。由于需要在两个方向上同时进行两次单侧检验,故需分别推断,只有两个原假设均被拒绝,才可得出两药为“等效”的结论。
以两种药物有效率比较为例,等效性试验的检验假设可表述为:
H 0 :| π T - π C |≥Δ(试验药优于对照药,其差值大于或等于Δ;或试验药劣于对照药,其差值小于或等于-Δ)
H 01 : π T - π C ≥Δ H 02 : π T - π C ≤-Δ H 1 :| π T - π C |<Δ(试验药与对照药之差不超过Δ)
H 11 : π T - π C <Δ H 12 : π T - π C >-Δ
等效性界值Δ是一个具有临床意义的数值,该值由临床专家来确定。Δ一般较难确定,若Δ选大了,可能会将疗效达不到要求的药物推向市场;若Δ选小了,则可能会埋没一些本可推广使用的药物。在生物等效性研究中,当评价两种剂型的药代动力学参数平均值是否足够接近时,两者比值90%置信区间在80%~125%成为可接受的标准。当用生物等效性试验不可行时(例如仿制的吸入药或外用药等局部用药),可进行临床等效性试验,得出双侧95%置信区间,其等效性界值的确定仍然是统计学推理和临床判断相结合,具体药品具体分析,而无恒定的界值数值。
两样本率比较的等效性试验可以采用双单侧检验,即
则可认为等效。这里 α 常取单侧0.05。
两样本率比较的等效性试验也可以用置信区间法来评价,但常用双侧90%置信区间(即双侧 α 取值为0.10)。按双侧100(1- α )%的置信度,计算 π T - π C 的置信区间下限 C L 和置信区间上限 C U ,如下:
若( C L , C U )完全在(-Δ,Δ)范围内,可以得出等效性结论。例如,根据某资料计算出两组率差的90%置信区间为(-9%,8%),该区间完全包含在预先规定的等效区间(-10%,10%)内,可得出两组等效性的结论。
两样本均数比较的等效性试验也可以采用双单侧检验,即
则可认为等效。这里 α 常取单侧0.05。
对于两样本均数比较的等效性试验,也可以用双侧90%置信区间来评价。按双侧100(1- α )%的置信度,计算 µ T - µ C 的置信区间下限 C L 和置信区间上限 C U ,如下:
若( C L , C U )完全在(-Δ,Δ)范围内,可以得出等效性结论。
例4-3 有3项临床试验,试验组与对照组疗效之差的双侧90%置信区间结果如图4-3,Δ为等效性界值。从图中可以看出,只有研究3的置信区间上下限在(-Δ,Δ)范围内,可以得出等效性结论,其余两项研究均不能下等效性结论。
图4-3 等效性试验置信区间示意图