几年前,在我供职的一个研究所,有五个同事在很短的时间内,先后得了一种罕见的非传染性疾病。这引起了恐慌,病因调查随之展开。起初,我们以为可能是研究所的楼里有某种化学污染,因为这里过去曾被用作生物实验室。但是调查并没有发现任何污染源。后来恐慌情绪升级,并蔓延开来,有些人甚至开始准备换工作。
在一次晚宴上,我把这件事说给一个数学家朋友,他大笑起来。他问我们说:“这个房间的地板上有四百块瓷砖,如果我往空中扔一百粒大米,我会在任何一块瓷砖上找到五粒米吗?”我们回答说不会,算起来应该是每四块瓷砖上有一粒米才对。但我们错了。事实上我们试着扔了无数次大米,实验的结果是,总有那么一块瓷砖,上面有两粒、三粒、四粒、五粒甚至更多大米。为什么?为什么“随意扔”的大米不能落得整整齐齐,每粒落下时都和之前已经落下的大米保持同等距离?恰恰是因为它们的落下纯属随机,后落下的米粒才总是可能会落在那些已经聚集了几粒米的瓷砖上。突然,那五位同事的案例似乎变得很不一样了。五粒米落在同一块瓷砖上,并不意味着这块瓷砖拥有某种“吸引大米”的能量。研究所内五个人得病,并不能说明建筑一定受到了污染。
对统计思维缺乏了解,即使在受过良好教育的人群中都是普遍的,也是极有害的。我供职的研究所隶属于一所大学。就连我们这些号称博学的教授也犯了低级的统计学错误。我们确信,“高于平均数”的人生病,这需要一个解释。一些人甚至就因此而选择换工作。在生活中,这样的故事比比皆是。
我们常听到新闻节目报道,说某个地区某个东西的比例超出平均水平,这是一个需要重视的因素。但事实是,任何事物的比例在这些地区差不多一半的区域都是高于平均水平的,而在另一半则低于平均水平。几年前,意大利人在电视报道中看到,经过一位叫迪·贝拉的医生使用替代疗法治疗后,许多癌症患者的身体恢复了健康,人们因此感动落泪。对医生治疗效果最好的证明,不就是看到那些患有严重肿瘤的病人恢复健康吗?但这其实是一个愚蠢的预设。因为不管有没有经过治疗,即使是最严重的肿瘤,也确实存在自然康复的可能性。表现出康复的迹象完全不等于证明治疗有积极效果,即使这样的案例数不胜数。要判断治疗是否有效,我们需要分别计算它见效的次数和失效的次数,还要将治疗结果与那些未经治疗的患者作比较。如果不这样做,就无异于跳舞求雨:总有一些日子我们跳完舞后会下雨,于是我们就可以指着雨说,这是跳求雨舞灵验的证明。
正是因为对统计学缺乏了解,许多人才会相信法国著名的卢尔德圣母朝圣地的圣水能够治疗癌症,服用糖和水制成的药物,或是在危险的游戏中丢掉性命,就因为之前他们看到其他人这样做而毫发无损。
如果教孩子们一点基本的概率论和统计学知识,我们就可以避免很多蠢事,社会也会受益良多。小学时可以教一些简单知识,初中和高中可以深入一些。概率和统计上的推理是做评估和分析时的一把利器。不掌握它们,我们就毫无防御能力。不了解诸如平均数、方差、波动和相关性这些术语,就像不知道怎样做乘除法一样。
不熟悉统计学,人就容易将概率误认为不精确。相反,概率和统计学是求精确的工具,让我们能够用可靠的方式应对精确的问题。没有它们,我们就不会拥有有效力的现代医学、量子力学、天气预报、社会学……事实上,我们就不会有从化学到天文学这整个的实验科学。没有统计学,我们就不会知道原子、社会和银河系是怎么运转的。重要的例子俯拾即是,比如,正是因为有了统计学,我们才能了解到吸烟有害健康,而石棉会要我们的命。
我们每天都在运用概率推理。在做决定之前,我们会评估它的各种后果发生的概率。我们大致了解汽油的均价和它的波动幅度,也就是说,我们清楚有多少经销商遵守或者不遵守这一均价。我们本能地期待,变量的波动是与其他事物相关联的:加油站离市中心越近,汽油的费用可能越高。我们试图区分不大可能和有点可能的事实,比如遇到火车相撞的概率是很小的,所以我们倾向于坐火车;在使用封闭式平交道口时,被火车碾压的概率也很小(大多数冒这个险的人都安然无恙),但是风险足够大到我们需要劝服自己不要做此尝试。我们还很理解,“偶然”发生的巧合与“事出有因”的事实之间的不同。但是我们对这些概念的使用都是建立在大约估计上的,经常犯许多错误。统计学让它们更加精确,给它们下精确的定义,让我们能够做出可靠的评估,比如判断一种药物或者一栋建筑是否危险。它这样做,是基于对概率这个概念量化和严格的应用。
但什么是概率呢?尽管统计学有很强的实践效力,但概率的本质是一个有争议的话题,在哲学上也引发了热烈争论。对它的一个传统定义是基于“频率”:如果我掷了很多次色子,那么掷出数字1的概率是1/6。但这个定义是经不起推敲的。因为我们在“事件”不会重复的情景下也会用到概率。比如我认为,基于概率,我正在写的这篇文章有很大机会被我为之供稿的那份报纸的编辑采用;但我不会反复投稿,那样做毫无意义,因为他一定不会发表我的文章两次。对概率的另一种理解是将其看作一种“倾向”。如一些物理学家认为,一个放射性原子在接下来的半个小时有衰变“倾向”,这是对其发生的概率做出的评估。这个解释也不令人满意:它听起来有点像莫里哀《无病呻吟》里讽刺的经院哲学的“催眠的力量”,说安眠药让我们睡觉,是因为它有“催眠的力量”,而原子衰变是因为它有衰变的倾向。
对概率这个概念的澄清,在我看来,可能要归功于一位杰出的意大利知识分子,他就是哲学家和数学家布鲁诺·德福内梯,他在自己的国家没有得到应有的承认。20世纪30年代,德福内梯提出了一个观点,这后来被证明是理解概率的关键:概率指的并非系统本身(比如色子、报纸编辑、衰变的原子、明天的天气),而是指我对这个系统所拥有的知识。如果我说,明天下雨的概率是1/3,我谈论的不是关于云的任何事情,因为它已经被目前的风力情况决定。我描述的是自己对大气情况的所知或无知的程度。而这就是概率的全部内涵。
我们生活在一个无知盛行的宇宙中。我们知道很多事情,但不知道的更多。我们不知道明天在街上能遇到谁,我们不知道许多疾病的病因,我们不知道主宰宇宙的终极物理法则,我们不知道谁会赢得下次选举。我们不知道什么对我们来说是好的,什么又是坏的。我们不知道明天是否会发生地震。在这个不确定的世界上,要求绝对的确定性是愚蠢的。那些在夸口自己拥有确定知识的人通常是最不可靠的。
这并不意味着我们完全处在黑暗中。在确定性和完全的不确定性之间,有一块宝贵的中间地带,正是在这个中间地带,我们的生活和思想得以展开。
(《24小时太阳报》周日版2013年1月20日)