在某种新药的疗效测试实验中,把新药分给处理组的患者,把其他患者作为对照组,对照组的患者不接受新药的治疗,然后比较这两个组的反应。整个实验是在双盲的情况下实施的,即不管是患者还是医生,都不知道谁在处理组,谁在对照组。
接受新药治疗的处理组有100个患者,其中有32个患者得到康复。对照组也有100个患者,他们接受安慰剂的治疗。服用安慰剂的对照组中有25个患者得到康复。具体为:
处理组未康复68人,康复32人,康复率为32%;
对照组未康复75人,康复25人,康复率为25%。
从实验结果看,接受新药治疗的患者康复率大于没有接受新药治疗的患者。据此,能说新药有效吗?审视实验过程发现,参加实验的患者有男有女。通常,男性和女性得病后康复情况有差异。因此,又将实验结果按性别区分,得到新药疗效实验数据如下。
男性:处理组未康复18人,康复2人,康复率为10%;
对照组未康复65人,康复15人,康复率为18.75%。
女性:处理组未康复50人,康复30人,康复率为37.5%;
对照组未康复10人,康复10人,康复率为50%。
从按性别区分的实验数据看:无论是男患者还是女患者,接受新药治疗的患者康复率都小于没有接受新药治疗的患者。对男患者和女患者来说,新药都是无效的。合起来看和分开来看的结论不一样,即产生了辛普森悖论,其中的混杂因素是“性别”。就这个例子而言,性别之所以起混杂作用,根本原因在于新药疗效实验方案的设计有缺陷。因而我们既不能合起来认为新药是有效的,也不能分开来认为不论是对男患者还是女患者,新药都是无效的。新药疗效实验必须做到双盲和随机分组,使混杂因素如“性别”不起作用。这个实验没有做到随机分组,导致男患者在对照组多、在处理组少,而女患者在对照组少、在处理组多。随机分组要求处理组中的男、女患者分别和对照组中的男、女患者一样多。
资料来源:整理自《魅力统计》——对照比较实验数据分析的辛普森悖论。