购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

大数定律

帕斯卡和费马通信的内容,标志着现代概率论的开端,尽管当时概率论并不叫概率论,而是叫“机会学”。你完全可以这样去理解概率:某件事发生的概率,就等于所有符合条件的结果的数量,除以所有可能发生的结果的数量。

瑞士数学家雅各布·伯努利将概率论的发展推向了新阶段。继续用刚才的例子来看,假如你真的把“连续抛7次硬币”这件事重复了128次,那么最终“出现0次正面的结果有1个、出现1次正面的结果有7个、出现2次正面的结果有21个……”的可能性其实很小。

但如果将这件事重复1.28亿次,那最终你很可能会发现“出现0次正面的结果有100万个、出现1次正面的结果有700万个、出现2次正面的结果有2100万个……”,可能有误差,但误差非常小。再举一个更简单的例子:如果你连抛2次硬币(每次出现正反的概率相等),那你会有很大可能性没有遇到“1正1反”这种结果——具体来说,你有50%的概率遇不到这种结果,这意味着你看到的要么是2个正面,要么是2个反面。但如果你连抛100万次硬币,那你就会有很大可能遇到“50万次正面,50万次反面”这种结果,误差非常非常小。

伯努利通过数学证明,你抛硬币的次数越多,其分布越接近“真实”概率。

你可能会说:“这不是明摆着的吗?我也知道会这样,那又怎样呢?”答案就是,你不需要真的抛100万次硬币,就可以准确预测正面朝上的次数基本上占总次数的一半。

不过目前为止,我们研究的都是已经确切知道概率的事件——抛硬币、掷色子皆是如此。我们事先就知道游戏各种结果的概率(至少理论上是知道的)——抛硬币的概率显然是五五开,掷色子出现1的概率显然是1/6。

但是有时候我们会对游戏的公平性产生疑问:硬币会不会被动了手脚?色子里面会不会有机关?我们怎么才能判断是否有人作弊?又或者,我们没有在玩色子,而是在研究现实生活中某些事件发生的概率。为此,我们必须离开规则确定的游戏,走进充满偶然性和模糊性的真实世界。

雅各布·伯努利主要生活在17世纪的瑞士,他的家族中出现了好几位数学天才。首先我们要知道,雅各布·伯努利提出的是大数定律(也就是本小节的主要内容),而不是伯努利定律,后者是他的侄子丹尼尔·伯努利提出的,两个定律完全是两码事。除了他们两人,17—18世纪伯努利家族中比较有名的人还有3个约翰、2个尼古拉斯,以及另一个雅各布。

我们的主人公是雅各布·伯努利,他感兴趣的不只有概率明晰的赌博游戏,还有那些事先并不知道概率的事物。

设想下面这种情形。 桌上有一个密不透光的盒子,盒子里面有许多黑球和白球,事先我们并不知道黑球和白球的比例。现在你拿出了几颗小球,其中有黑有白。假设你具体拿了5颗球,其中有3颗黑球、2颗白球。利用这一结果,你能分析一下盒子里黑白小球的分布情况吗?

现在我们讨论的不再是“根据已知事实推测某些结果的概率”,而是一个完全相反的问题——根据观测到的结果推测真实世界是某种可能性的概率。前者是“概率推断”——根据对整体的认知情况推测个别事件的概率,后者是“统计推断”——根据抽样调查的结果推测整体的情况。

为了把问题说清楚,这里我要多说两句。虽然乍一看这两个问题没多大区别,但实际上这种区别至关重要。后者其实就是现代统计学家每天所研究的问题,他们才不会闲坐在办公室里,没事算一算德州扑克中抽到同花顺的概率,因为这种事情实在太简单了。只要知道一共有多少张牌,任何一个数学成绩不错的学生都能算出来。他们也没时间关心你到底在色子游戏中能掷出几次6,因为杨辉三角形几秒钟之内就能给出具体概率。这些统计学家真正关心的是手中数据与某种假说之间的关系。假如我们现在给500人注射新冠疫苗,给另外500人注射安慰剂,结果疫苗组只有1人感染新冠病毒,而安慰剂组有10人感染新冠病毒。这能说明什么?我们有多大把握相信疫苗起了作用?

这就是雅各布·伯努利想搞清楚的事情。不过,虽然他的观点很有创造力、洞察力,但本质上却是错误的——至少《伯努利的谬误:不合逻辑的统计学与现代科学的危机》一书的作者奥布里·克莱顿是这样认为的。对奥布里·克莱顿,以及以他为代表的学术流派来说,虽然伯努利的确是个天才,但他却不知不觉地将统计思想引入了歧途,以致统计学在接下来的5个多世纪都没能走上正轨。奥布里·克莱顿的观点并非独创,相关讨论已经在学术界持续了100多年,具体情况我们在其他章节另做讨论。现在我们先来看看伯努利到底做了什么,为什么会引起这么大的争议。

伯努利想知道,在我们抽取一定数量的小球之后,能够有多大把握确定盒子里面黑球和白球的数量。假定现在盒子里面仍旧有数量不明的黑球和白球,但抽球的规则变了:每次只抽一颗,然后把它放回去,摇匀了接着抽 (这一点很重要,因为只有摇匀了,才能保证每次抽到黑球或白球的概率都一样)。此外,我们还要保证初始状态下黑球和白球也已经被摇匀,且每颗球的大小、重量均相等。这意味着在把球拿出盒子之前,你无法判断它是黑球还是白球,也没有理由去预测某个颜色出现的概率比另一个颜色大。然后你开始抽球,一共抽了 X 次,其中有 Y 次是白球。这种情况下,你认为盒子里面黑球和白球的比例是多少?

样本越大,我们抽到的结果越接近真实比例。假定盒子中白球与黑球的真实比例是3 ∶ 2,那么你只抽5次球的时候,刚好抽到3次白球、2次黑球的可能性并不大。但如果你抽50次球,就算白球与黑球的比例不是30 ∶ 20,也不会差太多。伯努利自己也承认:“即便某个人已经笨到家了,他也可以在没有接受任何概率知识的前提下,仅凭本能认识到这一点。” (事实还真是这样,1951年的一项调查发现,就连幼童都可以凭直觉掌握这一事实。

但伯努利并没有止步于此。他认为我们还有3个问题没有搞清楚:我们到底需要多大的样本?我们离真实的答案有多近?我们对自己的结论到底有多自信?他发现,我们永远不可能百分之百确信自己的结论就是真实答案,只能“尽可能地”接近真实答案——不同结论具有不同的置信度。

比如,有时我们需要结论有99%的可能性让它与真实情况的误差保持在1%以内,有时我们也需要让结论有70%的可能性让误差保持在10%以内。伯努利证明,无论是前者还是后者,抑或其他什么情况,我们都可以取特定次数的小球让结果达到所需的置信度。此外,他还证明,没有哪个特定次数可以让结论的置信度达到100%;也没有哪个特定次数让置信度达到最大值,也就是继续增加样本数量无助于继续提高置信度。

用数学语言来表达该定理就是(这些语言并不是伯努利的原话,而是现代概率学优化后的表述):假定我们想要的置信度为大写的 P ,事件发生的真实概率为小写的 p ;总实验次数为 n ,其中事件发生的次数为 m 。对于任何一个正数ε,任何一个大于0、小于1的 P ,都存在一个 n ,使得 m / n p 的绝对值小于等于ε。

这里面的 P n 、ε均为变量,改变其中任何一个变量,都至少会影响到另一个变量的数值。假定 n 足够大,可以让置信度 P =90%,实验结论与真实概率的误差为10%。如果你想把 P 提高到99%,那么你要么提高误差,使其大于10%;要么继续扩大样本,提高 n 的数值(正如奥布里·克莱顿所言,这就像项目管理中的那句老话一样,“高速度、高质量、低成本,三者不可兼得”。放到这个案例中就是“精确估计、高置信度、低样本量,三者不可兼得”)。

成功证明该定理后,伯努利还想继续弄清几个变量之间具体的数值关系——他想知道在给定的样本下,置信度到底能有多高?一番计算之后他发现,如果盒子中白球与黑球的真实数量分别为3000、2000,且取球次数为25500,那么每1000次这样的实验中,会有999次可以让你得到的实际结果与真实概率的误差小于2%。

[对一个生活在近代早期的欧洲人来说,这个样本量实在太大了,他既没有电脑,也没有只需要一杯啤酒的钱就可以雇来参加社会实验的廉价本科生。正如史蒂芬·斯蒂格勒在《统计学史》( The History of Statistics )一书中所指出的那样,这一样本量比当时伯努利所居住的巴塞尔市的总人口还要多。伯努利在《猜度术》一书的结尾写道:“这已经不只是天文数字了,以人类的能力来衡量的话,我感觉这跟无限大没有区别。”史蒂芬·斯蒂格勒给出了如此评价:“看到25500这个数字的时候,伯努利肯定心如死灰,我都不知道他哪儿来的力气写下最后这段话。” ]

如果采用比较现代的方法,那我们可以用更小的样本量来实现伯努利想要的置信度。不过,就算以如今的统计标准来看,伯努利对置信度的要求也是相当高。我们稍后再谈 p 值和置信区间的概念,现在我们先来看看伯努利所追求的置信度到底有多高——每1000次有999次落在给定的范围——这样相当于假阳性率只有0.001。而在大多数的社会科学中,我们追求的假阳性率只有0.05,伯努利的要求比我们高50倍,尽管其他某些学科会采用更严格的标准,尤其是物理学。

伯努利还意识到,概率不仅存在于游戏和赌博中,人类其实每时每刻都在和概率打交道,比如判断谋杀案的凶手时需要分析概率,研究文件是否经过伪造时也要分析概率。因此,伯努利想要构造一个通用的哲学方法来分析那些经验数据。其实两千年来哲学家们一直在争论,人们到底应该用理性还是感性去认知真理。柏拉图认为,世界存在绝对的真实——他将其称为“形式”——但我们的感官是不完美的,感官永远无法感触绝对的真实。 因此柏拉图认为,认识真理的途径应当是理性分析,而不是实验本身。

作为一名物理学家、实验主义者,伯努利认为,虽然我们永远都不可能确切地知道任何事情,但是我们的确知道不同的事件有不同的概率。比如我们连续掷100次色子,发现每次的结果都是6,那么虽然我们无法判断它肯定被动了手脚,但我们可以说它极有可能被动了手脚。为了让接下来的各种话题(比如各种和概率相关的概念、贝叶斯定理——逻辑形式的一种拓展)的讨论更为顺畅,我们需要知道,伯努利认为确信程度可以用数字来衡量,1代表完全确定,0代表完全不可能 ,这意味着置信度是一个可以被量化的概念,具体数值会受到实验数据的影响。

奥布里·克莱顿认为,问题在于伯努利所讨论的仍旧是“抽样概率”,而不是“推断概率”,或者更确切地说,他根本没有将二者区分开来。伯努利已经成功证明,样本中的黑球、白球比例“很可能接近”盒子中的黑球、白球的真实比例(具体有多可能、有多接近取决于样本大小),所以他自然而然地认为,盒子中的黑球、白球的真实比例同样“很可能接近”样本中的黑球、白球的比例。可是他错了,两者的可能性完全可以天差地别。直到牧师托马斯·贝叶斯出现,人们才明白伯努利错在哪儿了。 W+ShU+vElNx0V1nlc5ZWxtw8V6keZCn/Tp5eZ/INC3mi9ZgaJyd0rC3vT6gRhwzb

点击中间区域
呼出菜单
上一章
目录
下一章
×