购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

最简单概率论的五个智慧

我认为人人都应该学点概率知识。在日常生活中,概率论比万有引力公式和基因的复制机制都重要,它是现代社会的公民必备的知识。现在的世界比过去复杂得多,其中有大量的不确定性。是否理解概率,直接决定了一个人的“开化”程度。当不懂概率的人大惊小怪的时候,懂概率的人可以淡定自若。

大多数人在中学就学习过概率,但掌握概率的计算方法不等于真正理解概率。实际上,概率论中的几个关键思想,是多数数学老师没有讲明白,甚至根本就没有讲的。理解这些思想甚至不需要会做任何计算,但是它们能让我们看世界的眼光发生根本性的改变。

这些思想的逻辑都很简单,我们可以从最简单的概率论中得到五个智慧。

1.随机

概率论最基础的思想是,有些事情是无缘无故地发生的。

这个思想对我们的世界观具有颠覆性的意义。古人没有这个思想,认为一切事情的发生都是有原因的,甚至可能都是有目的的。人们曾经认为世界像一个钟表一样精确地运行。但真实世界不是钟表,它充满不可控的偶然。

更严格地说,有些事情的发生,跟它之前发生的任何事情,都可以没有因果关系。你不管做什么都不能让它一定发生,也不能让它一定不发生。

如果一个人考上了好大学,人们会说这是她努力学习的结果;如果一个人事业成功,人们会说这是他努力工作的结果。可是如果一个人买彩票中了大奖,这又是为什么呢?答案就是没有任何原因,这完全是一个随机事件。总会有人买彩票中奖,而这一期彩票谁中奖,跟他是不是好人,他在之前各期买过多少彩票,他是否关注中奖号码的走势,没有任何关系。

如果有一个人总买彩票,他中奖的概率总会比别人大点吧?的确。他一生之中中一次奖的概率比那些只是偶然买一次彩票的人大。但是当他跟上千万个人一起面对一次开奖的时候,他不具有任何优势。他之前所有的努力,对他在这次开奖中的运气没有任何帮助。一个此前从来都没买过彩票的人,完全有可能,而且有同样大的可能,在某一次开奖中把最高奖金拿走。

中奖,既不是他自己努力的结果,也不是“上天”对他有所“垂青”;不中,不等于任何人在跟他作对。这就是“随机”,你没有任何办法左右结果。这很容易理解,对吧?

大多数事情并不是完全的随机事件,却都有一定的随机因素。偶然和必然如果结合在一起,就没那么容易理解了。人们经常错误地理解偶然,总想用必然去解释偶然。

体育比赛是最典型的例子。球队赢了球,人人有功,记者帮着分析取胜之道;球队输了球,人人有责,里里外外都要进行反思。但比赛其实是充满偶然的事件,你所能做的只是尽可能地争取胜利。哪怕你准备得再好,总有一些因素是不确定的,也就是我们通常说的运气。我很少听到记者把输球或赢球的原因归结于运气,人们被随机性所迷惑,狂喜狂怒从不淡定,甚至不惜人身攻击。实际上,现代职业化竞技体育中参赛者之间的实力差距往往并没有天壤之别,决定比赛结果的偶然因素非常大。强队也能输给弱队,是现代体育的重要特征,也是其魅力所在。如果强队一定胜利,比赛还有什么悬念?从这个意义上说,我们看比赛看的就是这个随机性。这就难怪《黑天鹅》的作者塔勒布(Nassim Nicholas Taleb)在《黑天鹅语录》( The Bed of Procrustes )一书中说:

Sports are commoditized and,alas,prostituted randomness.

体育是商品化,甚至是卖淫化了的随机性。

所以对智者来说偶然因素是不值得较真的,这场输了下场可以赢回来,只要输少赢多你还是强队。

理解随机性,我们就知道有些事情发生就发生了,没有太大可供解读的意义。我们不能从这件事中获得什么教训,不值得较真,甚至根本就不值得采取行动。比如民航客机非常安全,但再完美的交通工具也不可能百分之百的安全。你会因为极小的事故概率而不坐飞机吗?我们只要确定事故概率比其他旅行方式更低就可以了——甚至连这都不需要,我们只要确定这个概率小到我们能够容忍就可以了。为偶然事件大惊小怪,甚至一朝被蛇咬十年怕井绳,是幼稚的表现。

管理者有个常见的思维模式,一旦出了事就必须全体反思,制定相关政策以避免类似事故再次发生,但极小概率事故其实是不值得过度反应的。哪怕是因为员工犯了错而引起的,也没必要如此。37signals公司的两位创始人弗莱德(Jason Fried)和汉森(David Heinemeier Hansson)在2010年出了一本书《重来》( Rework ),讲公司创业和管理之道。在我看来此书一个亮点就是它强调不要一看有人犯了错就为此大张旗鼓地制定政策来纠正错误。那样只会把错误变成伤疤,而且会让公司越来越官僚主义。正确的办法是告诉犯错的员工这是一个错误,然后就完了。

偶然的错误不值得深究,成绩也不值得深究。现代概率论的奠基者之一雅各布·伯努利,甚至认为我们根本就不应该基于一个人的成就去赞美他 [1] 。用成绩评估一个人的能力,来决定是否让他入学、是否给他升职加薪,是现代社会的普遍做法,对此人人都服气,童叟无欺非常公平。这还有什么可说的?问题在于,成绩可能有很大的偶然因素。失败者没必要妄自菲薄,成功者也应该明白自己的成功中是有侥幸的。

2.误差

既然绝大多数事情都同时包含偶然因素和必然因素,我们自然就想排除偶然去发现背后的必然。偶然的失败和成就不值得大惊小怪,我根据必然因素去做判断,这总可以吧?

可以,但是你必须理解误差。

历史上最早的科学家曾经不承认实验可以有误差,认为所有的测量都必须是精确的,把任何误差都归结于错误。后来人们才慢慢意识到偶然因素永远存在,即使实验条件再精确也无法完全避免随机干扰的影响,所以做科学实验往往要测量多次,用取平均值之类的统计手段去得出结果。

多次测量,是一个排除偶然因素的好办法。国足输掉比赛之后经常抱怨偶然因素,有时候是因为裁判不公,有时候是因为主力不在,有时候是因为不适应客场气候,有时候是因为草皮太软,有时候是因为草皮太硬。关键是,如果你经常输球,我们还是可以得出你是个弱队的结论。

国际足联的世界排名,是根据各国球队多次比赛的成绩采用加权平均的办法统计出来的,这个排名比一两次比赛的胜负,甚至世界杯赛的名次更能说明球队的实力。但即便如此,我们也不能说国际足联的排名就是各个球队的“真实实力”。这是因为各队毕竟只进行了有限次数的比赛,再好的统计手段,也不可能把所有的偶然因素全部排除。

即便是科学实验也是如此。科学家哪怕是测量一个定义明确的物理参数,也不可能给出最后的“真实答案”——他们总是在测量结果上加一个误差范围。比如最近的一个重大物理发现是用实验证实了希格斯粒子的存在,物理学家说希格斯粒子的质量是125.3±0.4(stat)±0.5(sys)GeV。这句话的意思是说,质量是125.3,但其中有±0.4的统计误差,还有±0.5的系统误差。真实的质量当然只有一个,但是这个数是多少,我们不知道——它可以是这个误差范围内的任何一个数字。事实上,真实质量甚至可以是误差范围外的一个数字!这是因为误差范围是一个概率计算的结果,这个范围的意思是说物理学家相信真实值落在这个范围以外的可能性非常非常小。

所以“真实值”非常不易得,而且别忘了科学实验是非常理想化的事件。大多数事件根本没机会多次测量。既然如此,我们对测量结果的解读就又要加一层小心。如果只能测一次,那么对这一次测量的结果应该怎么解读?我们可以根据以往的经验,或者别处、别人的类似案例,来估计一个大致的误差范围。

有了误差的概念,我们就要学会忽略误差范围内的任何波动。

中国只有一个,任何关于中国此时此刻的统计,都只能测一次。2014年1月,国家统计局公布了2013年全国居民收入基尼系数为0.473,新闻报道说:“该数据虽较2012年0.474的水平略有回落,但仍显示居民收入差距较大。”这个“回落”有多大?0.001。从统计角度来说其实没什么意义,可能你的测量误差就大大超过0.001。

考试成绩也是如此,假设一个同学考了两次才过英语四级,第一次57分,第二次63分。他说这是略有进步,我说你这不叫进步,叫都在测量误差范围之内。

3.赌徒谬误

假如你一个人在赌场赌钱,比如玩老虎机。你一上来运气就不太好,一连输了很多把。这时候你是否会有一种强烈的感觉,你很快就该赢了呢?

这是一种错觉。赌博是完全独立的随机事件,这意味着下一把的结果跟以前所有的结果没有任何联系,已经发生了的事情不会影响未来。我们举一个简单的例子,假设瓶子里装着六个球,上面写着1到6,作为每一次的中奖号码。每次抽奖的时候,你要从六个球中随便拿一个,而这六个球被你拿到的机会是相等的,都是1/6。现在假设前面几期抽奖中6出现的次数的确比2多,那么这一次抽奖的时候,你是否就会有更大机会抽到2呢?不会!这些球根本不记得谁曾经被抽到过,2号球不会主动跑过来让你抽。它们被抽到的概率仍然都是1/6。

概率论中的确有一个“大数定律”,说如果进行足够多次的抽奖,那么各种不同结果出现的频率就会等于它们的概率——对上面这个例子来说就是如果你抽取足够多次,你得到“2”的结果数应该跟得到“6”的结果数大致相等。

但人们常常错误地理解随机性和大数定律——以为随机就意味着均匀。如果过去一段时间内发生的事情不那么均匀,人们就错误地以为未来的事情会尽量往“抹平”的方向走,用更多的“2”去平衡此前多出来的“6”。但大数定律的工作机制不是跟过去搞平衡,它的真实意思是说如果未来你再进行非常多次的抽奖,你会得到非常多的“2”和非常多的“6”,以至于它们此前的一点点差异会变得微不足道。

我曾经看到有自以为懂概率的人写道“比如号码2已经连续出现了3期,而号码6已经连续出现了5期,则再下一次号码中2再出现的概率明显大于6”,这完全错误。下一次出现号码2和6的概率是相等的。这是一个著名的错误,被称作“赌徒谬误”(Gambler's fallacy),全世界的赌场里每天都有人在不停地犯这个错误。现在我们再回过头来看,这其实是一个很简单的道理。

但是这个错误在生活中还可以以不同的方式上演。比如有个笑话说一个人坐飞机的时候总是带着一颗炸弹,他认为这样就不会有恐怖分子炸飞机了——因为一架飞机上有两颗炸弹的可能性应该非常小!再比如战场上的士兵有个说法,如果战斗中有炸弹在你身边爆炸,你应该快速跳进那个弹坑——因为两颗炸弹不太可能正好打到同一个地方 。这都是不理解独立随机事件导致的。

4.在没有规律的地方发现规律

理解了随机性和独立随机事件,我们可以得到一个结论:独立随机事件的发生是没有规律和不可预测的。这是一个非常重要的智慧。

“彩票分析学”是深受彩民喜爱的一门显学。这门学问完全合法地出现在各种晚报、新浪网、搜狐网甚至人民网上,认为彩票的中奖号码跟股票一样,存在“走势”。它使用“双色历史号码”“余数走势”“五行码”等五花八门的数字曲线,使用“奇偶分析”“跨度分析”“大中小分析”,帮助彩民预测下一期中奖号码。彩票分析师信誓旦旦地声称他们能在一定程度上预测中奖号码,最起码也能评估最可能出现的号码范围。

这些分析学跟赌徒谬误不同。赌徒谬误是认为前面多次出现的号码不会继续出现,而彩票分析学则认为中奖号码存在“走势”,分析师相信这里面有规律——所以近期多次出现的组合可能会继续出现,或者按照这个趋势可以预测下一个号码。

但是我们知道中奖号码是纯粹的随机现象,根本没有规律。没错,有时候赌场里的某个赌具可能存在缺陷,使得一个号码中奖的可能性略高于其他号码,如果你能发现并利用这个缺陷的确可以因此获利。但要想发现这个缺陷必须统计成百上千次开奖,要想利用这个缺陷也必须玩上成百上千把。而且这个缺陷是简单的:无非是某个特定号码出现的可能性略大一点,完全谈不上什么复杂规律。

明明没规律,这些彩票分析师到底是怎么看出规律来的呢?也许他们并不是故意骗人的,而是很可能真的相信自己找到了彩票的规律。

我上小学的时候,有一次数学课上讲到“素数”这个概念。老师列举素数,班上一个同学突然非常兴奋地举手说:“我发现了一个规律!”老师就问他发现了什么规律,他说:“你看素数3、5、7、13、17、19……它们的结尾都是这几个数字!”他发现的这个“规律”其实是除了2以外的素数都是奇数。这的确是一个“性质”,并不是真正的“规律”,因为你无法用它去预测下一个素数,比如9和15都是奇数,符合这个“规律”,却都不是素数。

发现规律是人的本能——春天过后是夏天,乌云压顶常下雨,大自然中很多事情的确是有规律的。有一种逻辑题,给你几个数字或者图形,让你发现它们排列的规律并指出下一个出现的数字或图形是什么。比如这道题:1,2,1,2,__,任何人都一眼就能看出来下一个数字是1。我儿子在连10以内加减法都算不顺溜的时候就已经非常善于做这种题了,根本不用教,一看就会。

我们的本能工作得如此之好,以至于我们在明明没有规律的地方也能找出规律来。人脑很擅长理解规律,但是很不擅长理解随机性。发现规律任何时候都可以帮助我们更好地生存下去,而理解随机性却是只在现代社会才有意义的一个技能。

在没有规律的地方硬找规律是个相当容易的事情,只要你愿意忽略所有不符合你这个规律的数据。9和15不是素数?那叫意外!你完全可以说你的理论是科学但更是艺术,只有神秘的经验才能告诉你忽略了哪些数据——别人用这个规律预测不准那是因为他们功夫不到家——再者,毕竟连天气预报都不敢保证一定准确,不是吗?

如果数据足够多,我们可以找到任何我们想要的规律。比如说圣经密码。有人拿圣经做字符串游戏,在特定的位置中寻找能对应世界大事的字母组合,并声称这是圣经对后世的预言。问题是,这些“预言”可以完美地解释已经发生的事情,等到预测尚未发生的事情的时候就没有那么好的成绩了。关键在于圣经里有很多很多字符,你如果仔细找,尤其是在借助计算机的情况下,总能找到任何想要的东西。在这个精神下我建议搞一个“毛泽东密码”,在标准版《毛泽东选集》中寻找中文字词的排列组合,也许会“发现”他早就预测了中国后世发生的所有大事。

彩票无规律,圣经密码是无稽之谈,那么我再问一个问题:地震发生的年份有规律吗?

地震不是彩票,并不是完全的随机事件。有些地区地震会比较频繁,我们大概可以知道平均每隔若干年就会发生一次。但是这样的“规律”是非常模糊的,就算是地震高发区也有可能连续好几年都不地震,不常地震的地区也可能一年内发生好几次地震。地震不会精确地按照一个特定的数字顺序发生。

可是,有一门学问却认为地震和各种自然灾害会严格按照某种数学规律发生,甚至用研究数学——确切地说是做数字游戏——的办法去预测地震。这个方法叫作“可公度性理论”,它的创始人是中国科学院院士翁文波。翁院士早年在石油勘探方面做出过杰出贡献 ,而根据互动百科 ,他曾经多次预测了国内外的地震。

我对“可公度性理论”持非常怀疑的态度。这个理论跟地震没有任何关系,它只是简单地把一些年份数字进行加减组合。有记者拿着翁文波所著的《预测学》一书给中科院物理所院士何祚庥和研究员李淼看,二人均完全持否定的态度 。李淼说:“感觉就是把东西堆砌在一起,相互之间没有关联,逻辑之间也没有连续性。”何祚庥说:“说白了就是没什么道理的。”方舟子和新语丝网站则更直接地指出翁文波的理论是伪科学。

事实上,就算我们相信冥冥之中有一种神秘的机制在左右地震,且这个机制可以纯粹由数学决定而与地质学无关,“可公度性理论”也是站不住脚的。这个理论根本就没有一个自洽的操作规则,对一次具体的预测到底应该采用什么数字组合非常随意。假设让两个最好的学生同时使用这个理论去预测,他们将有极大的可能性得出完全不同的结果——就如同你从《圣经》的字母排列组合里可以找到任何想要的东西一样。

未来是不可被精确预测的。这个世界并不像钟表那样运行。

5.小数定律

现在,我们知道,在数据足够多的情况下,人们可以找到任何自己想要的规律,只要你不在乎这些规律的严格性和自洽性。那么,在数据足够少的情况下又会如何呢?

如果数据足够少,有些“规律”会自己跳出来,你甚至不相信都不行。

人们抱着游戏或者认真的态度总结了关于世界杯足球赛的各种“定律” ,比如一个著名的定律是“巴西队的礼物”——只要巴西队夺冠,下一届的冠军就将是主办大赛的东道主,除非巴西队自己将礼物收回,这一定律在2006年被破解;另一个著名的“1982轴心定律”——世界杯夺冠球队以1982年世界杯为中心呈对称分布,也在2006年被破解。还有一些定律是没有被破解的,比如“凡是获得了联合会杯或者美洲杯,就别想在下一届世界杯夺冠”。中国的职业联赛也有自己的定律,比如“王治郅定律”——只要王治郅参加季后赛,八一队就必然获得总冠军(已破解),以及“0∶2落后无人翻盘定律”(尚未破解)。

如果你仔细研究这些定律,你会发现不容易破解的定律其实都有一定的道理。王治郅和八一队都很强,0∶2落后的确很难翻盘,而获得世界杯冠军是件非常不容易的事情,更别说同时获得联合会杯、美洲杯和世界杯了。但不容易发生不等于不会发生,它们终究会被破解。那些看似没有道理的神奇定律(正因为没道理才更显神奇),则大多已经被破解了。之所以“神奇”,是因为其纯属巧合。世界杯总共才进行了80多年,20多届。只要数据足够少,我们总能发现一些没有被破解的“规律”。

如果数据少,随机现象可以看上去“很不随机”,甚至非常整齐,感觉就好像真有规律一样。

如果你曾经被河南人骗过,如果你恰好听说自己的一个朋友也被河南人骗过,如果你进一步发现网上也有个人被河南人骗过,你是否会得出结论说河南骗子多呢?如果去年有个清华大学毕业的硕士被查出来抄袭,今年又有个清华大学教授被查出来抄袭,你是否会得出结论说清华大学纵容抄袭呢?

即使考虑到河南是个人口大省,而清华大学这样的名校的媒体曝光率比较高,这两个地方的坏消息似乎也比相同量级的省份或相同知名度的大学高了一点。所以,结论难道不是明摆着的吗?如果骗子是在中国各个人口大省随机分布的,如果抄袭者是在中国各个名牌大学随机分布的,那为什么恰恰是河南和清华大学“脱颖而出”?

在下结论之前,我们先考察1940年的伦敦大轰炸 [2] 。当时伦敦在德军V2导弹的攻击下损失惨重,报纸公布标记了所有受到轰炸地点的伦敦地图之后,人们发现轰炸点的分布很不均匀。有些地区反复受到轰炸,而有些地区却毫发无损。

难道德军在轰炸伦敦的时候故意放过了某些地区吗?

对英国军方来说这是一件非常恐怖的事情,因为这意味着V2导弹的精度比预想的要高得多,以至于德军可以精确地选择轰炸目标。而伦敦居民则相信,那些没有遭到轰炸的地区是德国间谍居住的地方。有些人甚至开始搬家。

然而事后证明V2导弹是一个精度相当差的实验性质的武器,与其说是导弹还不如说是大炮——德军只能大概地把它打向伦敦,而根本无法精确地控制落点。也就是说,伦敦各地区受到的轰炸完全是随机的。一直到1946年,有人从数学角度分析了轰炸数据,把整个可能受到轰炸的地区分为576个小块,发现其中229个小块没有受到任何轰炸,而有8个小块受到了4次以上的轰炸。这些数据虽然不均匀,但完全符合随机分布。实际上,科学家可以用计算机模拟的办法得到更多“看上去很不随机”的随机结果。

问题的关键是随机分布不等于均匀分布。人们往往认为,如果是随机的,那就应该是均匀的,殊不知这一点仅在样本总数非常大的时候才有效。当初 iPod(苹果公司推出的便携式数字多媒体播放器)最早推出“随机播放”功能的时候,用户发现有些歌曲会被重复播放,他们据此认为播放根本不随机。苹果公司只好放弃真正的随机算法,用乔布斯本人的话说,就是改进以后的算法使播放“更不随机以至于让人感觉更随机”。一旦出现不均匀,人们就会认为其中必有缘故,而事实却是这可能只是偶然事件。

如果统计数字很少,就很容易出现特别不均匀的情况。这个现象被诺贝尔经济学奖得主丹尼尔·卡尼曼戏称为“小数定律”。卡尼曼说如果我们不理解小数定律,我们就不能真正理解大数定律。

大数定律是我们从统计数字中推测真相的理论基础。大数定律 说如果统计样本足够大,那么事物出现的频率就能无限接近它的理论概率——也就是它的“本性”。所以,如果抽样调查发现一个地区某种疾病的发病率较高,我们就可以大致认为这个地区的这种疾病发病率真的很高。

而小数定律说如果样本不够大,那么它就会表现为各种极端情况,而这些情况可能跟本性一点关系也没有。

哪怕一个硬币再完美,你也可能会连投4次都是正面朝上,这个结果看似有点怪,但跟连投10次都正面朝上不可同日而语。一个人口很少的小镇发现对某种疾病有较高的发病率,跟一个大城市有同样大小的发病率,不应该引起同样的重视。一个只有20人的乡村中学某年突然有2人考上清华大学,跟一个有2000人的中学每年都有200人考上清华大学,完全没有可比性。

如果你的统计样本不够大,你什么也说明不了。

正因为如此,我们才不能只凭自己的经验,哪怕是加上家人和朋友的经验去对事物做出判断。我们的经验非常有限。别看个例,看大规模统计。有的专栏作家听说两三个负面新闻就敢写文章把社会批得一文不值,这样的人非常无知。

所以,理解随机现象最大的一个好处就是你不会再轻易地大惊小怪了。


[1] 这是大概的意思,伯努利的原话是“One should not appraise human action on the basis of its results.”出自 The Drunkard's Walk:How Randomness Rules Our Lives 一书。

[2] 这件事在蒙洛迪诺的《醉汉的脚步》( The Drunkard's Walk )和卡尼曼的《思考,快与慢》中都有论述。 zd4y/wKQEoy01kpSiveyMd6NaemN2gKWtV0ZyllCcCezbFdzJPvwk3dGXOpWvlBE

点击中间区域
呼出菜单
上一章
目录
下一章
×