我想在本书中讨论的第一个谬误——大多数人都在做决定时经历过的失败——被称为 赌徒谬误 (gambler's fallacy)。请问:以下哪一个数字序列更有可能出现在彩票中奖号码中:1、2、3、4、5、6或者12、31、23、14、8、42?
许多被问到这个问题的人——如果他们缺乏统计学背景——会选择第二个序列,并且声称一组随机数字出现的概率更高,他们还会问:“你有没有听说过一张彩票的中奖号码是1、2、3、4、5、6?”答案显然是否定的。“这就正好证明了它。”他们会接着说。对这个问题的最终回答,也是最聪明的一个是:“那你呢?你是否听说过一张彩票的中奖号码是12、31、23、14、8、42?”不同点是,如果彩票的中奖号码是1、2、3、4、5、6,就会被认为是不寻常的;但如果是第二个序列被选中,那么没有人会觉得有问题。
赌徒谬误 针对这样的问题:随机性是否比有序性更普遍?一个随机序列比一个连续序列更有可能出现吗?
赌场是 赌徒谬误 现象的源头。长时间不参与游戏的赌徒会在轮盘赌桌周围徘徊。他们会跟踪记录轮盘赌的号码,等待五个连续的号码显示相同的颜色。几乎一半的轮盘赌数字是红色的,另一半的数字是黑色的。人们可以押注“红”或“黑”,他们获胜的概率接近50%(在美国约为47.4%,在欧洲为48.6%)。举个例子,站在一边的人等到连续五个数字落在红色上,然后他们会在黑色上押下一大笔钱。如图1所示。
图1 美国典型的轮盘赌桌
错误地按照 赌徒谬误 行事的人会认为,独立的事件之间存在着依赖关系,就好像幸运女神有记忆一样。赌徒谬误存在于我们生活中的不同方面,例如这样的断言:如果连续有三年没有下过雨,那么下一年可能会有很多场雨。当学生在做答考试中的单选题时,他们遇到了一堆答案都是B的问题,如果在下一个问题中,他们必须在B或D中选择一个,他们很可能会选择D。交通或小额索赔法庭的法官倾向于宣判那些有一系列前科的人无罪,而宣判那些有一系列无罪释放记录的人有罪。
接下来有两个场景:你的两个朋友中的一位这周赢得了彩票大奖,你觉得哪一位更有可能?是来自四号楼,过去十年每周都买彩票的安迪;还是住在六号楼,过去一周买了他人生中第一张彩票的本?
安娜和芭芭拉都是20岁的女性,这个月她们其中一人发现自己怀孕了,你觉得谁更有可能?是安娜吗?过去三年她一直在进行无保护措施的性行为;还是两个月前才开始进行无保护措施性行为的芭芭拉?
许多人会说更有可能是安迪中了大奖,安娜怀孕。这是奥本海默(Oppenheimer)和莫宁(Monin)在他们的文章《回顾赌徒的谬论》(The Gambler's Fallacy in Retrospect)中举出的两个例子。
事实上,无论是安迪买了十年的彩票,还是安娜进行了三年的无保护措施的性行为,这些都不重要。是最近的一张中奖彩票产生了一位中奖者,也是最近的一次性行为导致了怀孕。过去完全无关紧要。
当之前连续四次硬币都是背面朝上落地时,第五次更有可能是正面朝上吗?如果你的答案是肯定的,那么接着回答下面的问题:硬币是怎么知道它已经背面朝上落地四次了呢?它的记忆储存在哪?
相比之下,一辆行驶数百公里却不加油的汽车很快就会停下来,检查油箱的人能相对准确地说出汽车什么时候会停。有没有类似的方法来确定硬币何时背面朝上落地?答案当然是没有的。硬币没有记忆,因此在任意的结果之后,它背面朝上落地的概率——假设硬币没有不对称的重量平衡或其他作弊机制——将永远是50%。同样的道理也适用于那些以过高频率落在特定数字上的骰子:你应该检查骰子的结构是否存在问题。
一位女性生下了四个男孩后,再次怀孕了。和第一个孩子出生之前一样,她再生儿子的概率是50%吗?这里的答案略有一点复杂。如果生下四个男孩的顺序完全是巧合,就像硬币以背面朝上落地四次一样,那么她再生一个男孩的概率确实是50%。话虽如此,这里也可能有生物学上的解释:例如,这位女性的丈夫无法产生携带X染色体的精子,这种情况下,该女性生男孩的概率会更高。这个案例与抛硬币作弊的案例类似。
对于普通硬币而言,人们期望那些从平均和长远角度来看应该发生的事情能够立即发生。这意味着,如果一枚硬币连续五次背面朝上落地,人们会期望它修正自己,然后在下一次正面朝上落地!确实,在平均情况下,从长远来看,硬币在一半的情况下应该是背面朝上落地的,但这并不意味着在第六次抛硬币时它就会立即修正自己。
在交通法庭上,一个60岁的男人站在法官面前。他被指控在十字路口闯红灯。这个男人有着40年的驾龄且从未违反过一次交通规则。在他的辩词中,他声称是交通信号灯没有正常运作,绿灯只亮了两秒钟,然后迅速切换到红灯,中间没有黄灯,结果,他在路口闯了红灯——是交通信号灯的错,不是他的错。作为抗辩,传唤这位司机的警察称交通信号灯在事故发生的一周之前就已经检查过,并且运转良好。法官应该相信谁呢?这个男人是否要因为这项指控而受到惩罚?
可以假设警察没有撒谎,在检查时,交通信号灯也确实在正常工作。同时,也有可能交通信号灯出现了暂时的故障,司机也没有撒谎,而如果被指控的司机以前有过违反交通规则的经历,那么更合理的假设是他在撒谎。然而事实上,这位经验丰富的司机之前并没有违反交通规则,这表明,他是一个谨慎的司机,因此,他无意闯红灯的概率比较高。
如果是这种情况,那么可以说人们倾向于相信预期的事件在未来发生的概率会受到过去发生的事件的影响。如果行为体系有记忆,那么确实是这样。例如,一个反复违规者更有可能再次违反同样的交通规则,而一个谨慎的司机则不会。但在绝大多数情况下,行为体系是没有记忆的。轮盘赌的轮子不会记得它在前几轮中转到哪个数字,因此,之前的结果,甚至是最相近的结果,都不会对下一轮出现的特定数字或颜色的概率产生任何影响。
依靠过去的数据是估算概率的一种常见的方法,但失败是不可避免的,就像前面提到的 赌徒谬误 。在这些谬误中,一个比较著名的是篮球中的 热手谬误 (hot-hand fallacy)。这个谬误比 赌徒谬误 更难辩驳。这个领域的许多人都对 热手现象 的存在深信不疑,并且他们还会毫不犹豫地驳斥每一个和他们意见相左的统计学家,说:“他们对篮球一无所知!”
热手谬误 指的是篮球比赛中的一种现象,即球员、教练以及大多数球迷都会认为,在比赛的不同阶段,某个特定球员会出现 热手现象 (即手气好,持续性的运气好),这个时候球就应该传给他使得他能够投篮得分。当球员被问及是什么使他在某一场比赛中取得成功时,他通常会说他只是手感很好,投进了每一个球,即使是在他处于不容易得分的位置和情况下。球员的表现就好比天使加百利(Gabriel)下凡,在球场上翱翔腾空,展开隐形的翅膀轻抚球员,给他带来了好运的祝福。
如果我们暂时忽略掉天使,用数据说话,教练和球员会认为连进四球的人在接下来几分钟投进下一个球的概率比四投两进的人要更高。
对此有很显然的逻辑解释:“这名球员证明了他自己”“他有了信心”“他今天状态良好”等。
表1摘录于季洛维奇(Gilovich)、瓦隆(Vallone)和特沃斯基的一项著名的研究,展示了著名的NBA职业篮球队费城76人队在1981年主场比赛中的投篮命中率。从表1中可以看出,连进三球后投篮的命中率并不比连续三次投篮未进后的命中率高。事实上,对于所有的球员来说,连进三球后比投失三球后的命中率要低得多,平均相差了10%。
表1
(续)
达里尔·道金斯(Daryl Dawkins)的命中率在投篮未中后会明显上升。这位球员高中毕业后便直接加入了NBA;他很年轻,同时也缺乏经验,这可能导致他对自己投丢的球格外敏感。因此,道金斯在连续几次投篮不中之后便不会再投球,除非他确定自己能投中,这直接与 热手理论 相矛盾。
对 赌徒谬误 和 热手谬误 最常见的解释之一是,当人们估计概率时,他们倾向于忽略有效的数据,只使用最易懂的数据。当然,最易懂的数据就是最近的数据,而不是过去出现的全部的数据。
另一种解释是众所周知的 小数定律 (law of small numbers)。这是特沃斯基和卡尼曼创造的一个幽默术语,改写自统计学领域十分著名的 大数定律 (law of large numbers),该定律指出,一个足够大的样本的分布与整体分布相类似。 小数定律 则表达了一种心理现象,即人们基于一个小而不具代表性的样本得出错误的结论,这可能导致泛化、偏见和刻板印象。
对此,特沃斯基和卡尼曼提出了下列问题。
某城镇有两家医院。在较大的那家医院里,每天大约有45个婴儿出生;在较小的那家医院里,每天大约有15个婴儿出生。如你所知,大约50%的婴儿是男孩。然而,确切的百分比每天都在变化。有时可能高于50%,有时会低于50%。在一年的时间里,两家医院记录了出生婴儿中60%以上是男孩的日子。你认为哪家医院记录了更多这样的日子?
在被问及这个问题时,只有21%的人回答正确。其余的人则错误地回答说,大医院记录的这样的日子更多,或者两家医院记录的天数是相当的。正确的答案是,那家小医院记录了更多超过60%的出生婴儿是男性的日子,这是因为它的样本数量更小,因此偏离整体平均的概率更高。在小医院出生的每个婴儿占当天所有出生婴儿的7%,而在大医院,每个婴儿只占当天所有出生婴儿的2%。因此,每一个男婴的出生对小医院总体男婴出生百分比的影响比大医院更大。
请阅读下面的问题:
在一个瓶子中有60个红球和40个白球,而在另一个瓶中有60个白球和40个红球。一位女士将她的手放入了其中的一个瓶里,并取出了3个红球(100%)。她的同伴将手伸进了另一个瓶里并取出了10个球,其中7个是红球(70%)。在他们当中,谁更确定自己把手伸进了红色球较多的瓶里,是这位女士还是她的同伴?
特沃斯基和卡尼曼问了许多人这个问题,大多数人认为女士本人把手伸进红球更多的瓶中的可能性更大。在这里,同样地,人们因样本数量的关系犯了错。假设一个篮球运动员10投7中,另一个人3投3中。3投3中的人更有可能是走运。随着投篮次数的增加,运气就变得不那么重要了,而球员自己的投篮水平逐渐变得重要。
以色列研究人员拉玛·法尔克(Ruma Falk)以一种独创的方式测试了随机性。她构建了两个12×12的网格,如图2所示。在这两个网格中,50%的方块是黑色的。
图2 用于评判随机性的两个黑白网格
研究人员问被试:“这两个网格中的一个的排列是随机产生的,而另一个不是。在你看来,哪个网格具有随机生成的排列——是右边的网格还是左边的网格?”
如果你和这项研究中的大多数参与者一样,那么你会认为选择右边的网格作为随机产生的网格更令人放心。左边的网格看起来好像包含了序列,并且有完全相同的颜色覆盖了大片表面,因此,人们更倾向于认为它是非随机的。
实际上,左边的网格是两个网格中随机生成的那个。人们错误地认为,如果方格中的颜色各有50%的概率,那么它更有可能呈现交替的颜色,而不是显示单一的颜色序列。
人们往往犯的一个非常突出的错误是猜测,如果在不确定的条件下有两个可能的结果,其中每一个发生的概率都是50%。例如,当我问农民:“今年结霜的可能性有多大?”最常见的回答是:“要么有,要么没有。”他们相信概率是五五开的。但是,如果某一特定地区平均每10年才发生一次霜冻,那么明年发生霜冻的概率是10%,而不是50%。
如果你问股票市场的投资者:“某只股票上涨的概率是多少?”他们会回答:“要么上升,要么下降;只有两个选择,因此,概率是一半一半。”但事实是,如果股市正处在牛市,某只股票升值的可能性就更大。如果是熊市,股票价值下跌的可能性就更大。概率并不是一半一半。
关于同样的问题,还有一个非常著名的场景是一款有三扇门的游戏(见图3)。其中一扇门的后面是一辆豪华轿车,另外两扇门的后面是山羊。在一档名为《让我们做个交易》(Let ' s Make a Deal)的游戏节目中,有一次,一名参赛者选择了一扇门,主持人蒙蒂·霍尔(Monty Hall)并没有立即透露其所选的门后是什么,而是打开了另一扇门,门后站着一只山羊。因为有两扇门的门后有山羊,所以主持人总是能够给观众展示一只山羊。在主持人揭露这扇门的背后是一只山羊后,他让参赛者在剩下的两扇门中再次选择。参赛者可以选择坚持他最初的选择,或是改变他的想法去选择第三扇门。
大多数人更愿意去打开他们最开始所选择的门。其中一个原因是,如果一个人坚持自己最初的选择,即使没有赢得豪华轿车,也只会感到失望而已。但如果他改变了原来的想法,去打开了第三扇门,而没有坚持最初的选择,最后没有能赢得豪华轿车,他不仅会感到失望,而且会后悔没有坚持最初的选择——当他本来可以选择背后是车的那扇门时,他却最终选择了背后是羊的那扇。
另一个人们不喜欢改变他们原来所选择的门的原因是,他们确信豪华轿车在这两扇门其中任意一扇门后面的概率是相等的。这样,如果只剩下两扇门,而豪华轿车在其中一扇门后面,那么它在人们所选择的那扇门后面的概率等于在另一扇门后面的概率。换句话说,两扇门各占一半。
然而令人惊讶的是,这是不对的!豪华轿车在人们最初选择的门后面的概率是1/3,而不是1/2。结论是,改变最初的选择去打开另一扇门是绝对值得的!
图3摘自《纽约时报》( The New York Times )上刊登的世界最高智商(228)的玛丽莲·沃斯·莎凡特(Marilyn vos Savant)和与她一直争论的数学教授之间的长文。玛丽莲有一个专栏,用于回答读者提出的科学方面的问题。她对蒙蒂·霍尔问题的正确解答引起了来自数学家和统计学家的一片嘲讽,这些学者仍然坚持在打开一开始选择的那扇门后,赢得豪华轿车的概率是50%。
图3 蒙蒂·霍尔问题
我们向大家呈现这款游戏的目的是想说明:人们经常错误地认为两个事件的概率是相等的,而实际上,这两个事件的概率并不相等。
还有一个智力游戏:一个房间里面有60个人。其中至少有两个人的生日在同一天的概率有多大?看上去,如果房间里有60个人,一年是365天;概率是60/365,也就是约1/6。然而,这个答案是不对的。正确答案是99.4%——几乎是百分之百。图4展示了对于不同大小的样本而言,两个人在同一天过生日的概率。
图4 随着样本数量的变化,两人生日相同的概率
从图4可以看出,23人组成的样本已经使两个人在同一天过生日的概率是50%。在由40个人所组成的样本中,概率达到了89%,而在50人和70人组成的样本中,概率分别是97%和99.9%。
上述所有的例子都表明,我们计算或是估算概率的方式是凭借直觉的,是不理性的,而在大多数情况下,这种方法都不会产生统计学上正确的结果。
作为这一章的总结,我要提出一个该领域非常有名的问题,它被称为秘书问题(the secretary problem)。在一家新公司中有100个经理。每一个经理都在寻找一个新的秘书,同时他们中的每个人也希望自己的秘书是最好的。一家招聘公司招聘了100个人,即将给每人安排一位经理。每个候选人都在公司办公室外面排着长队等待录用。
公司的总裁第一个选择。他面试了第一位候选人,他可以录用他或者拒绝他再去面试下一个候选人。未被总裁录用的应聘者会继续接受副总裁的面试,而总裁不能再录用之前的应聘者。总裁可以面试尽可能多的候选人,直到找到理想的秘书。问题是,对于总裁而言,为了找到最好的秘书,哪种策略是最好的?总裁从100个候选人中选择最好的一个的概率是多大?
让我们用另一种方式来表达这个问题:你会在1000(1万或者100万)张纸上写下不同的数字,范围从负无穷到正无穷。正数,负数,小数,整数,你想写什么都行。只要你告诉我有多少张纸,并保证没有两个完全相同的数字。
我们会充分地进行打乱,并且我需要猜出哪张纸上的数字最大。接下来就是我要做的:我会打开第一张纸,看上面的数字,然后表示这不是最大的数字,接着打开第二张纸,接着第三张,以此类推。在某个特定的时候(在看完所有数字之前),我会停下来,并宣布:“这就是最大的数字!”在你看来,如果你在1000张纸上写数字,而且我并不知道数字的范围是什么,我能选出最大数字的概率是多少?
有些人天真地认为,如果我随机地停在了这1000张纸中的一张上,我选择最大数字的概率是1/1000。如果我确实是随机选择了这张纸,这就是正确的答案。但是,这不是我要做的。如果确实有1000张写有不同数字的纸,下面将会是我要做的:
在充分打乱纸张后,我会一个接一个地打开其中的368张,并称里面的每一张都并不包含最大的那个数字。
当我打开这368张纸的时候,我会记住其中最大的数字。让我们假设最大的数字是980亿。然后,我会打开剩下的632张纸。当出现第一个比980亿大的数字时,我将会宣布这是1000张纸中最大的数字。
我成功的概率有多大?答案是36.8%。当处理10张、1000张或者100万张纸时,这样高的概率是真实可靠的。
将这种方法用在30张纸上。让你的孩子或其他重要的人在纸上写下任意30个数字,并把它们混合在一起。打开前11张纸条(30×0.368≈11)。记住最大的数字,继续打开剩下的纸条。当你得到一个比前11张纸条中最大的数字还要大的数字时停下来。现在你不应该感到惊讶:在超过1/3的情况下,你能够猜对。
总结
1.那些相信命运的人可能会忽视对概率的准确评估。依赖于命运的决策,忽略了事件的统计概率。这种无视等于将概率和风险抛诸脑后。不仅仅是命运,我们的行为也会影响我们决定的结果。
2.命运没有记忆。对于统计事件,不存在纠正或报复机制。我们倾向于把随机的结果解释为命运补偿了我们过去的遭遇。而事实上,这两件事之间并没有联系。
3.对独立进程来说,一个事件和另一个事件之间没有联系,而与独立进程相反的是,有记忆系统的进程——也就是在任何节点都能测量情况的过程(比如血液中的酒精含量或油箱中的汽油)——它们的结果不取决于命运,而是取决于系统的状态和它行进的方向。一个醉汉可能不会因为命运而出车祸,但可能会因为过量饮用伏特加;一辆车突然停下来不是因为运气不好,而是因为油箱里没有汽油了。
4.人们需要注意,不要把命运看作一种趋势。通常,一个巧合的序列可以被赋予不相关的含义,比如发现某个城市有多少人患有癌症,然后推断该地区到处都是辐射或被污染的水。事实上,这种现象可能完全是巧合。从小样本中得出的任何结论都可能是错误的。
5.为了得出统计结论,有一个大的样本数量是必要的。一方面,在赌场里想输钱的人应该用少量的钱来多玩几轮轮盘赌。一个想要赢钱的人,即使他们的胜算低于50%,也应该带着一大笔钱来只玩一轮。另一方面,想在股票交易所赚钱的人应该做长线投资,而不是试图在几天内“发一笔横财”。原因在于,赌场的预期利润是负的,一个人更有可能通过赌一把来赢;而在股票交易所的预期利润是正的,一个人更有可能通过参与很长一段时间来赚钱。
6.有组织和无组织的序列的概率是相等的。骰子扔出三次6的概率等于它扔出3然后是6,然后是4的概率。
7.通常两种可能的结果不具有相同的概率。也就是说,两种结果的概率不是50%∶50%。它们可以是90%∶10%,60%∶40%,甚至是99%∶1%。