随机对照试验的证据等级很高,但实施过程中会遇到不少困难。比如,可能很难对作为研究对象的个体或企业进行人为随机分组。研究对象可能会强烈反对,或者很多情况下出于伦理考虑,无法进行随机对照实验。
让我们用珠宝店的例子设想一下。你所在的珠宝店在全国共有100家店铺。如前文所述,你想明确广告给销售额带来的因果效应。如果可以组织随机对照试验,只需把100家店铺随机分成投放广告的店铺(干预组)和不投放广告的店铺(对照组),进行比较即可。然而实际上这恐怕不会这么轻易实现。
被分入不投放广告组的店铺可能会有意见,在重视速度的销售最前线,恐怕也没有充足的时间等待随机对照试验的结果出来之后再做决定。
再者,如今已是大数据时代。对很多情况,我们手头已经掌握了各种各样的数据。如果对这些数据视而不见,只会感叹“不做随机对照试验,就无法测定广告效果”,这样的人实在称不上有能力的企业人。
无法实施随机对照试验等人为实验时,我们只能用手头现有的数据进行分析。通过随机对照试验得到的数据称为“实验数据”,通过日常经济活动得到的数据以及从政府统计调查等渠道获得的数据称为“观测数据”。
采用观测数据进行分析时,首要工作是从观测数据中找出“与人为实验相类似”的环境。本章介绍的“自然实验”,便是通过法律或制度变化、自然灾害、战乱等人们无法预测的变化,找到与随机对照试验类似的环境,从而明确两个变量之间的因果关系。
此处重申,这种方法的目的同样也是“制造可比较的组,用最贴切的值替换反事实”。事先无法预测的某些因素(经济学称其为“外生冲击”)可以在不经意中将研究对象自然而然地划分为干预组和对照组,自然实验就是要利用这种环境。根据研究内容的不同,可以利用的外生冲击包括制度变革、自然灾害等。
那么回到上面的例子,考虑到实施随机对照试验的难度,你决定为所有的100家店铺统一投放报纸折页广告。可是,负责印刷广告的某家企业印刷机出现故障,导致部分店铺未能投放广告。
于是你想到了一个主意:利用这种情况,对如期投放广告的店铺和未能投放广告的店铺进行比较,是不是就能评估出广告给销售额带来的因果效应呢?实际上,这正是自然实验的思维方式。