你在生活中是否也曾被这样劝导过:我母亲让我锻炼延迟满足的能力,她说因为有实验证明,懂得延迟满足的小孩会更成功;还有朋友拿着一张10年前的照片跟我说:“阿庞,你看照片上的你那么瘦,显得年轻10岁,所以你快减肥吧。”他们的心情我可以理解,但他们说服不了我,因为这些劝导有一个共同的逻辑错误,就是错把相关性当因果性。相关性是指两件事有关系、会同时发生,而因果性代表一件事是另一件事发生的原因。
为什么开篇就要讲相关和因果?因为“错把相关当因果”是我们生活和工作中最常见的逻辑错误之一。两件事情到底有没有因果关系,也是许多科学研究要重点区分和解决的问题。比如吸烟与患肺癌有因果关系吗?低雌性激素水平与高心脏病发病率有因果关系吗?这一季度的销量增长是因为花了钱做广告,或仅仅是巧合?
让我们先用一个最简单且真实的例子来看看相关性和因果性的差别。
20世纪初,美国暴发过一场非常严重的小儿麻痹症,那时还没有人能确定病因,科学家通过数据分析终于发现了所谓的“罪魁祸首”——冰淇淋。为什么是冰淇淋?因为他们发现,冰淇淋的销量和小儿麻痹症发病率这两条曲线的起落在时间上几乎一致。有些人以为冰淇淋太凉或太甜导致小孩得了小儿麻痹症,吓得当时家长禁止小孩吃冰淇淋。
但这个结论正确吗?其实不。两者虽然看似相关,但并没有因果关系。只是因为在夏天小孩更喜欢吃冰淇淋,而在夏天小孩与病毒接触的机会也更多,所以小儿麻痹症容易在夏天高发,因此这两者在时间上完全契合。但小孩并不是因为吃了冰淇淋而得了小儿麻痹症,就算家长不让小孩吃,也不能减少或预防小儿麻痹症。
通过这个例子,我们应该已经意识到了相关性和因果性的差别:相关性只代表A和B同时发生,不代表A是B的因。这也就是说,如果A和B只有相关性,我们是不能通过改变A去影响B的。但相关性有一定的预测作用,我们可以通过看到了A来预测B也会发生。例如,当发现冰淇淋的销量在上涨,这意味着小儿麻痹症的发病率可能也要上升了,因此相关部门可以提前做好相应的医疗准备。
你或许听过一个非常有名的关于延迟满足的实验,叫斯坦福棉花糖实验。心理学家告诉一群小孩:“面前这个棉花糖,你要是能坚持15分钟不吃,我就会再给你一个。”然后他们发现那些能够忍住不吃的小孩在未来获得成功的概率会更高,所以他们得出结论:延迟满足与获得成功之间有因果关系。因为你可以做到延迟满足,所以你会获得成功。
如果接受这个结论,那就代表如果我想要获得成功,我就可以通过培养自己的延迟满足能力来达到。乍一听这是老生常谈,很多成功学、育儿经都在讲如何提高延迟满足的能力,比如把好饭好菜端到餐桌上但不让孩子吃,诸如此类的“训练”。
但如果这个实验并没有成功地证明这两者的因果关系呢?的确,这个实验在后来受到很多挑战。最常见的挑战是:延迟满足与获得成功之间并没有因果关系,它们仅仅有相关性,真实因素是孩子家庭所属的社会经济地位。
简单来说,富人家的小孩平时想啥有啥,糖果并不是稀缺品,对他们来说,忍耐15分钟太小意思了。但穷人家的孩子平时吃个糖果就像过年,棉花糖对他们的吸引力太大了,这种忍耐更加困难。所以富人家的小孩更能忍住不吃,看上去延迟满足的能力也就更高。同时,由于家庭条件优越,他们有机会接受更好的教育、拥有更好的资源,成功的概率自然更大。这样看来,延迟满足的能力和获得成功这两者只有相关性,它们是同一个因产生的两个果:因为富有,所以可以不吃那个棉花糖;因为富有,所以成功的概率更大。这也就意味着,我们并不能通过锻炼延迟满足的能力来获得更高的成功概率。
这个案例也展示了一旦错把相关性当成因果性可能会出现的问题:它会指引我们采取错的行动。既然它指引了错的方向,那么行动也会是徒劳无功的,甚至有时会耽误实施真正重要的解决方案。
曾经有一个这样的辩题:父母决意要离婚,要坚持到孩子高考结束吗?我是反方,支持该离就离,不要刻意坚持和拖沓。我知道正方一定会举很多父母离婚后孩子受到重大负面影响的例子和数据,来证明离婚这个行为本身对孩子的伤害非常大,所以要拖到孩子长大一些,不要影响孩子高考。
可是让我们想一想,单亲家庭对孩子的伤害一定是离婚这个行为本身造成的吗?“离婚”这个行为和“对孩子造成伤害”这个结果,它们真的有因果关系吗?还是仅仅只有相关性?
比如单亲妈妈带着孩子,爸爸不闻不问,一找他要抚养费就吵架,我们觉得没爹的孩子真可怜。可问题是这跟离婚有关系吗?这样的爹没离婚的时候也不负责任啊!爹不靠谱,所以爹妈离婚了;爹不靠谱,所以孩子受伤;所以爹妈离婚和孩子受伤都是结果,它们同时发生,但没有因果关系,这是归因错误。伴侣不靠谱的时候,靠延迟离婚就能争取到幸福吗?不能啊!快点离开ta,或者找伴侣时不能太凑合才是真正的解决之道。
再比如,我们或许见过一些离异家庭的孩子不信任亲密关系,然后得出结论:因为父母离婚,所以孩子不信任亲密关系了。但真的是这样吗?有没有可能是因为父母的婚姻观、教育观落后,所以处理不好感情导致婚姻破裂;同样也因此没有能力去引导孩子,让孩子感受到爱、学会爱?所以这也是一个因产生的两个果。
不懂得如何处理感情、教导孩子,仅靠推迟离婚就能避免对孩子的伤害吗?不能啊!只有改变那个真正的因,才有可能影响那个果——唯有改善自己的婚姻观和提升自己的教育能力,才能降低对孩子的伤害。如果不能解决这个因,拖着不离,只会加大伤害。
为什么相关性特别容易被解读为因果性?因为当我们看到两件事情同时发生,直觉上就觉得它们一定有点什么关系,尤其是当这种因果的解释符合某种预设或者偏见时。但实际上,当我们在日常观察或数据中看到A和B有相关性时,两者关系不一定是“因为A所以B”,还有其他三种可能性。
第一种,因为B所以A,因果倒置。第二种,C导致A和B同时发生,所以A和B没有因果关系。第三种,A和B的相关仅仅是巧合。
所以,当我们看到相关性时,需要三连问:是巧合吗?是不是因果倒置?有没有第三个因素导致A和B同时发生?关于巧合的情况这里就不具体展开,毕竟能被我们看到的数据绝大多数都经过了回归分析,排除了巧合的可能性。其他两个可能性,接下来通过举例来逐一讨论。
先看“因果倒置”:不是“因为A所以B”,而是“因为B所以A”。
有一个说法,“女人到了中年收入会下降,所以一定要成家,依靠婚姻才会有保障”。这符合很多人的想象——女人不善于挣钱,得靠男人和家庭。但其实,“女人到了中年收入会下降”的说法并不准确,其实女职工是生育后工资才下降的。据统计,有34.3%的女职工生育后工资待遇下降,其中降幅超过一半的人数达42.9%。
所以是因为女性收入下降了才要依靠家庭的吗?不是。恰恰是因为女性投入了家庭,为家庭付出过多,导致在工作上投入的时间减少了,所以收入降低了。并不是家庭解决了女性收入降低的问题,反而是家庭导致了女性收入降低的问题,这是因果倒置。
类似的逻辑在工作环境中也有很多。比如有数据显示,数字化程度高的企业业绩更好,但这是否意味着企业可以通过投资数字化转型来提升业绩呢?不一定,这个数据本身只证明了相关,没有证明因果。说不定是因为业绩好的企业才有钱去做数字化转型,并不是因为做了数字化转型所以业绩好。
但这代不代表这个数据就完全没有意义?也不是。回想一下,相关性的作用是什么?是预测性。如果今天我想找一个业绩好、前途好的公司,当看到他们的数字化程度高,甭管它因果,我至少确定这两件事情同时发生。
另一个“相关不等于因果”的可能性,是C同时带来A和B的结构,这种例子其实是最隐秘的。
比如有数据显示,哈佛大学毕业生的收入比其他学校毕业生的要高。如果把这种关系直接理解为因果关系——它非常符合我们的预设或直觉:因为上了哈佛,所以未来收入提高了,也就是说哈佛的教育能够提高人赚钱的能力。
但是这个数据考虑了那个可能的、背后的因C吗?如果看看哈佛毕业生的家庭条件,15%的哈佛学生的父母收入属于全美前1%。请问,这些学生毕业之后收入高,到底是哈佛教育的功劳,还是人家父母的功劳?因为父母水平高,所以孩子上了哈佛;因为父母水平高,所以孩子毕业之后收入高。完全有可能是C导致了A和B同时发生。如果我们控制变量,比较同等家庭收入水平的孩子——他们分别去了哈佛和其他学校——他们未来的收入差距有这么大吗?有真实的数据证明,没有那么大。
还要强调的是,因果关系不一定是有或者无,而是有程度的差别。我们并不否认哈佛教育对提高学生毕业后收入的作用,只是说在没有控制学生父母的收入情况这一变量前,它的作用看起来非常大,如果控制了变量,它的作用就变得小了很多。
这就像许多公司的HR招聘时都青睐名校毕业生,甚至将其设为硬性门槛。但这真的代表HR认为名校培养人才的能力更高吗?不一定。名校和人才之间可能只有相关性。入学门槛高才是背后真正的因C。因为入学门槛高,所以这个学校被定义为名校;因为入学门槛高,所以毕业生的人才密度就更大。好学生进来,好学生出去。所以HR倾向于招名校毕业生,不一定是因为他们相信背后的因果关系,很可能仅仅是利用了相关性所带来的预测作用。
认识到这三种可能性后,我们该如何识别和反驳相关与因果的混淆?
第一,要有辩手一般的质疑精神,听到两件事同时发生或呈正相关时,先问问:真的吗?一定吗?您说了相关,您证了因果吗?怎么证的呢?控制了哪些变量?
第二,如果对方说A带来B,我们就尝试反着说B带来A,听听能否说得通。如果能,问问对方排除这个可能性了吗?
第三,想想可能有什么样的C会同时带来A和B?问问对方控制这个变量了吗?
这里我们还可以简单引入两个统计学的概念。
第一个概念叫“all else equal”,即控制变量。像最常见的家庭背景、收入、教育、族群等这些因素,肯定都要被控制,在这些因素相同的情况下,再去比较我们想考察的那个变量。但是兴许还有一些我们未知的C,我们无法主动地挑出这个变量去控制。
最简单的达到“all else equal”的场景,就是利用随机性。我们随机选出两个实验组,所以理论上讲,它们是一样的,然后,在其中一个实验组中只改变我们要考察的变量,再去比较两组各自的结果,就可以判断这个变量对结果的影响了。
第二个概念叫“difference in differences”,在不同中的不同。什么意思?举个例子,比如我们公司季度销量的增加有多少归功于季节因素,又有多少归功于我们新请的形象代言人呢?
比如从春季到夏季,整个市场的销量涨了50%,但我司的销量涨了70%,而这期间我们只做了一件特别的事情,就是请了一个形象代言人,所以大概率那20%就是我司跟市场比起来做出的额外努力的成果。如果我们知道了请代言人花了多少钱,我们也知道了20%的销量有多少利润,这就很容易能比较出来请这个代言人到底划不划算。
总之,有数据很好,但是我们要保有思辨的精神和习惯。
有时科学研究的论文里会诚实地写道,这个实验只证明了相关性,因果性还未知。但是一到新闻报道和寻常人的理解中,这个相关性瞬间就变成了因果性,尤其当这个因果关系特别符合我们的直觉、思维定式、思维惰性或先入为主的观点时。
再回到开头的例子,有人拿着我10年前的照片跟我说:“阿庞,你看照片上的你那么瘦,因为瘦,所以显得年轻10岁,所以你快减肥吧。”
因为瘦显得年轻,所以人就应该减肥,这也很符合我们的思维定式。但这张照片本身就是一张10年前的照片,“10年前”其实是那个C:因为10年前我代谢快,所以我瘦;因为是10年前,所以我当然看上去就年轻10岁。因此,瘦和年轻10岁本身呈相关性,并非因果性。现在你让我减肥,本来脂肪让我的脸显得很饱满,我这一瘦,坏事了,脸塌了,皮松了,看着更老了。
当相关性和因果性被混淆时,我们的行为会被误导,所以我们说“尽信数据不如无数据”。相关性和因果性有时的确很难被区分,但它们的差别却十分重要。最后再重复一次,相关性可以帮助我们推测,但只有建立了因果性,我们才能通过改变因去影响果。