我们知道,不能把表格中的数字解读为辍学对犯罪行为的因果效应。首先,到底是辍学使得人们 去 犯罪,还是待在学校里使得人们 不去 犯罪?这在2×2表里是一回事,但是在现实世界中是两回事。辍学 引发 犯罪,这指的是人们辍学后去找工作,发现没有文凭根本找不到,然后开始犯罪生涯。上学 抑制 犯罪,这指的是上学让你整天有事干,所以尽管上学者有着与辍学者同样的犯罪动机,但是他没有机会去犯罪。
其次,在横截面的数据分析方法中,原因是 可逆 的(reversible)。当原因倒过来时,它会施加一个方向相反但影响程度相同的作用。 加上 一个“因”,效应就 增高 ;然后减去这个“因”,效应就 降低 。但是,在现实世界中有些原因是 不可逆 的。咱们都听过一个童谣:“矮胖子,坐墙头;栽了一个大跟斗;国王呀,齐兵马;破蛋重圆没办法。”矮胖子从墙上掉到地上,结果摔断了腿;你把他从地上再抬到墙上,他的腿也不会因此愈合。国王的兵马再多,对此也无济于事。
举一个社会学的例子:我们可以用一些特征来预测人的政党身份,但是在现实世界中,让一个人 放弃 对原来政党的认同而成为中立派,要比让一个中立派对这一政党产生认同要更难。一个温和的共和党人(weak Republic)要放弃自己的立场变成中立派,这要比一个中立派演变成温和的共和党人更难。假定收入与政治立场分布(一条政治立场的数轴:坚定的共和党—温和的共和党—中立派—温和的民主党—坚定的民主党)正相关,那么一个温和的民主党人在收入增加2万美元之后也不太可能因此就变成中立派,但是一个原本的中立派在收入降低2万美元之后很可能会变成温和的民主党人。
使用传统的数据分析方式,你就很难把握现实世界中的这种不对称性。汉比奈克、扎布洛克和我(Habinek, Zablocki and Martin,2015)研究过关系格局(你的朋友是谁、他们的朋友又是谁)如何影响人们之间朋友关系的聚散。我们发现,如果A搬到与B接近的地方,那么他们的共同朋友越多,他们之间就越可能建立起友谊来。这个结论非常合乎情理(如果你想对此有更多了解,请参看第9章)。但是,如果A和B原本是朋友,A搬到与B远离的地方,那么他们之间交情 中断 的可能性并不受他们的共同朋友数量的影响。多数数据分析方法的前提假定,都是效应的对称性;我们出于懒惰,因此也往往就以为它是对称的(与此不同的路数,请参看York and Light,2017)。
社会学家在思考非对称性时,往往指的是“因果倒置”(reverse causality)的问题。对此有一种解决办法,旧是对关系双方进行时间排序,然后依时间排序来判断因果的方向。但是麻烦在于,有时候现实世界中的因果关系方向与数据中表现出来的时序方向是相反的。比如说,在现实世界中,也许并不是辍学引发了犯罪,而是犯罪生涯的开始使你更容易辍学:既然你已经要当小偷了,为什么要浪费时间待在学校里呢?你可能认为没有关系,那就让我们看一下数据中的时间顺序:辍学和犯罪生涯的开始,哪件事发生在先呢?但是在数据当中,所有的犯罪记录都发生在辍学之后,因为最初的那些小偷小摸太微不足道没人会记录,或者因为这位小偷苗子在辍学之后才有了时间大展身手。
再举一个例子吧。我们可能认为,高中毕业之后你才能上大学,因此高中毕业是上大学的原因。但是反过来也成立:如果上不了大学,何必要念到高中毕业?当一位马里兰州的百万富翁斯图尔特·贝纳姆(Stewart Bainum)承诺说,某一所贫民高中的孩子只要能进入大学,他就将为他们支付学费时,高中毕业率就上升了。在现实世界中,是因为他们能上大学了,所以高中毕业率才会上升。但是,如果你去看数据,高中毕业在先,上大学在后。你很可能就会误以为,是因为他们高中毕业率提高了,所以上大学的人才多了起来。
现实世界的因果方向与数据中的时序方向相反,还可能发生在所谓的 系统性 行为当中。这是一种最容易让人上当的情形。 系统 指的是一组关系或变量,它在受到扰动时有返回到初始状态的倾向。在上一章中,我提到过你要知道数据中的变异落在哪里:你想要解释的是系统 内部 不同人在分层结果上的差异,还是系统本身的差异?李伯森(Lieberson,1985)指出,有时候你不能只关注前一问题,而完全忽略后一问题。如果你完全忽略后者,那就可能上当受骗,找了一堆表面原因来进行解释。那些表面原因其实根本不是原因,而是结果——总得有原因,所以没有这些,就有那些。用李伯森的原话来说:“制订规则的人,会制订那些让他们可以继续制订规则的规则。”(Lieberson,1985:167)
一个很好的例子就是大学申请中个人陈述的引入。最初,那些精英学校可以通过姓名来分辨出哪些人是犹太人,因此就不会让太多犹太人进来破坏他们的精英世界。但是后来犹太人开始改用盎格鲁人的姓名,因此精英世界感觉大学里到处都是缺乏所谓“精英特性”的犹太人。于是他们发明了个人陈述。如果你的个人陈述写的是如何骑着纯种马拼尽全力赢得马球比赛,那你就是他们的人。如果你的个人陈述写的是在犹太小村庄里玩棍子球(stickball),他们就不会要你。如果你提问说:“为什么1920年代哈佛大学里犹太人那么少?”你研究之后得出结论说:“因为他们的个人陈述写得不行。”(在数据中,写个人陈述在前,大学录取在后。)但是,我们其实真正该问的是“为什么大学申请里会有个人陈述这一项?”答案是:“就是因为犹太人不擅长这个。”
原因是为了达到某一后果才存在的,这种“逆流”(backflow)是功能主义解释的本质特点。你可能认为功能主义是一种糟糕的理论路数,你说得有道理。但是,那并不意味着现实生活中不存在功能主义的现象。如果你对它们视而不见,只去讲那些最为表面的因果故事,往好里讲,你只讲了一半的道理;往坏里讲,你是个糊涂人。
我们已经明白,“草率因果”分析会引发很多复杂问题,因此要使研究尽可能地接近于实验分析。下面我们会从这个角度来讨论选择性的问题。但是在此之前,我们再开一次脑洞:让我们从看待因果关系的 不同 路数,来思考选择性问题。假如我们的实验者发现卸妆水 确实 会导致肿瘤,他坐在实验室里兴奋地讲述着自己的研究报告。这时一只会说话的小猫在笼子里气愤地抗议道:“你居然还在问什么引发了我的肿瘤?给我们注射了那堆玩意的是谁呢?引发肿瘤的明明就是 你 !”
这只怒气冲冲的小猫说得很对。他在思考因果关系时,采用了另一种方式;我们通常称之为“致因能力”(causal powers)的方式。他要找的是,现实世界中有能力让事情发生的是谁。我认为,小猫的做法非常有道理。在社会学当中,多数情况下牢记“原因需要有致因的能力”要比只盯着统计数字更好。
这样我们就不会隐含地以为,有能力让事情发生的是事物的某种 属性 (好像即便你不去工作,“教育程度”也会让你挣到钱一样),或者更糟糕地,把那些原本的 直接对象 当成了让事情发生的主导者(例如用实验来证明,就业歧视的原因是被歧视者的种族)。转向致因能力的思考方式还有一个特别的好处。当我们从实验模型出发来思考时,选择性是 阻挠 我们确定因果关系的东西。人们做各种事情,这妨碍我们得到因果效应估计,这些东西真是讨厌!但是从致因能力出发来思考时,因果关系指的就是(也应该是)人的选择行动。在研究中,我们要学会同时用这两种思考方式,让它们互相对质。如果你的统计中用到某些变量,那就去思考一下,会不会有些家伙会想办法操纵这些变量?此时会发生什么情况?其他人又会作何反应?这种思考会引导你找到那些重要的遗漏变量。这就涉及了对选择行动的过程进行一些理论推敲。