20世纪50年代至80年代是美国游戏类电视节目的鼎盛时期,其中最著名的电视游戏节目之一是《让我们做笔交易》( Let’s Make a Deal )。概率论中的“蒙提·霍尔问题”就是在这档节目的基础上发展出来的,并以主持人蒙提·霍尔(Monty Hall)的名字命名,这让蒙提·霍尔名声大噪。 在这档节目中,参赛者面前有三扇门。其中一扇门的后面是一辆时髦的汽车,另外两扇门的后面各有一只山羊。参赛者需要选定自己认为后面有汽车的那扇门,比如1号门。为了制造悬念,蒙提打开了另外两扇门中的一扇,比如3号门,并看到后面有一只山羊。为了进一步制造悬念,他给参赛者一个机会,要么继续坚持原来的选择,要么转而选择未打开的那扇门。假设你是参赛者,你该怎么做?
几乎所有人都坚持原来的选择不变。 参赛者认为,由于汽车是随机地被放在某扇门的后面,而3号门又被排除掉了,所以现在汽车在1号门或2号门后面的概率都是50%。他们认为,虽然改变选择没有什么坏处,但也没有什么好处。因此,他们出于惯性、骄傲与预期而坚持自己的第一选择。一次不幸的选择改变所带来的后悔,远超一次幸运的选择改变所带来的快乐。
1990年,美国《大观》( Parade )杂志的“玛丽莲问答”(Ask Marilyn)专栏报道了蒙提·霍尔问题,这本杂志是随美国数百家报纸的周日版一起发行的,蒙提·霍尔问题因此而被广泛知晓。 专栏作家玛丽莲·沃斯·莎凡特(Marilyn vos Savant)当时被称为“世界上最聪明的女人”,她在一次智力测试中所获得的最高分被载入了吉尼斯世界纪录。莎凡特认为,你应该改变选择:汽车在2号门后面的概率是2/3,而在1号门后面的概率是1/3。文章发表后该杂志社收到了上万封来信,其中有上千封信是数学和统计学专业的博士写的,大多数人都认为莎凡特错了。以下是一些来信内容:
你搞错了,彻底搞错了!既然你好像并没有掌握其中的基本原理,那我就给你解释一下。在主持人展示了一只山羊之后,你现在有1/2的机会猜对汽车所在的那扇门。无论你是否改变选择,概率都是一样的。美国的数学盲已经够多了,“世界上智商最高的女人”就不要再继续糟蹋数学了,真丢人!
——斯科特·史密斯博士,佛罗里达大学
关于这个话题,我估计你会收到很多高中生和大学生的来信。也许你应多保留几个地址以寻求帮助,这有助于把后面的专栏工作做好。
——罗伯特·史密斯博士,佐治亚州立大学
也许,女性与男性看待数学问题的方式不同。
——唐·爱德华兹,俄勒冈州森里弗
反对者中有来自匈牙利的著名数学家保罗·埃尔德什(Paul Erdös)。他是一位多产的数学家,以至于许多学者都在夸耀他们的埃尔德什数。埃尔德什数是他们与这位伟大的理论家在共同作者网络上的最短距离 。
但那些“迷之自信”的男数学家错了,世界上最聪明的女人却是对的。你应该改变选择,原因不言而喻。汽车在门后的摆放有3种可能,我们可以逐一考虑每扇门的情况,并计算出每种策略在3种可能性中获胜的次数(见图1-3)。假设你选了1号门,当然这只是一个标签。只要蒙提遵守“打开未被选择并且有山羊的那扇门,如果未被选择的两扇门后面都是山羊,就随便打开其中的一扇门”的规则,那么无论你事先选哪扇门,获胜概率都是一样的。
假设你的策略是“不改变选择”(见图1-3左栏)。如果汽车在1号门后面,你就赢了,蒙提打开哪扇门无关紧要,因为你并没有改变选择。如果汽车在2号门后面,你就输了。如果汽车在3号门后面,你也输了。所以“不改变选择”这一策略的胜率是1/3。
现在假设你的策略是“改变选择”(见图1-3右栏)。如果汽车在1号门后面,你就输了。如果车在2号门后面,蒙提就会打开3号门,这样你就会换到2号门,你赢了。如果车在3号门后,他就会打开2号门,所以你会因为换到3号门而获胜。“改变选择”策略获胜的概率是2/3,是“不改变选择”策略获胜概率的2倍。
图1-3 蒙提·霍尔问题的3种可能性分析
这并不是多难的事。 即使你无法穷尽这些逻辑可能性,你也可以自己用剪纸和玩具玩几轮,并计算成功概率,就像蒙提自己为说服一名持怀疑态度的记者所做的那样。 也许,直觉会告诉我们蒙提知道答案并给了我们一个提示,无所作为肯定是愚蠢的。为什么数学家、大学教授和其他大人物都搞错了呢?
当然,性别歧视、人身攻击和职业嫉妒也会影响人们的批判性思维。莎凡特是个迷人的时尚女性,她曾为八卦小报供稿,还在午夜的脱口秀上用诙谐有趣的话开玩笑。 [6] 她打破了人们对数学家的刻板印象,她的名气和她所创造的吉尼斯世界纪录,让她成为被攻击的目标。
当然,问题本身也给大家带来了困扰。就像认知反射测试和沃森选择任务中的难题一样,蒙提·霍尔问题的设计,就是故意诱导我们在系统1中犯错。而且,在系统2中我们也不容易认清这个问题。即便你把正确的解释说一遍,许多人也无法接受。像埃尔德什这样的大数学家,也只有在看到游戏被反复演示后才能被说服。 许多人目睹了游戏演示过程,许多人甚至在这个游戏上下注,但是,他们仍坚持自己的错误选择。人们的直觉与概率法则为什么如此不一致呢?
一个线索来自那些自以为无所不知的人为自己的错误提供的过度自信的辩解,这些辩解有时是从其他概率谜题中轻率地沿用下来的。许多人坚持认为,每一个未知的选择(在蒙提·霍尔问题这个例子中,是未打开的门)必定有相同的概率。对于像硬币或骰子这种对称的赌具来说,这无疑是正确的,因为硬币正反面或骰子六面出现的概率是一样的。当你对选择绝对一无所知时,这便是推理的起点,但这并不是自然的法则。
许多人想到了因果关系。汽车和山羊在游戏开始前就已放置好,打开一扇门,不能挪动已放置好的汽车和山羊。指出因果机制的独立性,是揭穿赌徒谬误等错觉的一种通常做法。所谓赌徒谬误,就是人们错误地认为,轮盘在连续出现几个红色之后的下一次转动中会出现黑色;而实际上轮盘没有记忆,它的每一次转动都是独立的。正如莎凡特的一位助手所言:“想象一场有3匹马参与的比赛,每匹马都有相同的获胜机会。如果3号马在比赛中跑50英尺 就猝死了,那么剩下这两匹马的获胜概率将不再是1/3,而是1/2。”显然,他的结论是,把赌注从1号马转向2号马是没有意义的。但这样思考是有问题的。想象一下,当你赌1号马赢时,上帝说:“3号马不会赢。” 他本来也可以说2号马不会赢,但他没有说。因此,改变一下赌注在某种程度上也是可以接受的。在《让我们做笔交易》的节目中,蒙提·霍尔就是上帝。
这位神一样的主持人让我们感受到了蒙提·霍尔问题的奇特性。它需要一个无所不知的人,这个人不像通常谈话那样,直接把听者想知道的内容分享给他们(在当前情况下,就是哪扇门后面放置了汽车),而是故意增加悬念。 如果是一个对门后事物一无所知的人,他的信息也就没什么价值了。但万能的蒙提知道真相,知道我们的选择,并据此选择他的提示,也就是打开某扇门。
人们对这一价值巨大但深奥难懂的信息的不敏感,恰恰揭示了与这个谜题相关的核心认知弱点:我们把概率和倾向混淆了。倾向是指一个物体更有可能以某种方式运动。关于倾向的直觉是我们对于这个世界的心智模式的一个主要部分。
人们感觉弯曲的树枝容易回弹,羚羊很容易疲劳,豪猪通常会留下带有两个肉垫的脚印。一种倾向不能被直接感知(要么树枝反弹了,要么它没有反弹),但它可以通过仔细观察一个物体的物理构成,并利用因果法则进行推断。干燥的树枝可能会折断;羚羊在雨季有更多的耐力;豪猪脚上有两个接近的肉垫,当地面很软时,它们会留下脚印,但在地面很硬时就不一定了。
概率则不同,它是在17世纪时被发明的概念工具。 “概率”这个词有好几种含义,其中之一对于风险决策至关重要,这就是对事物未知状态的相信程度。任何能改变我们对某一结果相信程度的证据,都将改变其发生的概率,以及对其采取行动的理性方式。概率依赖虚幻的知识,而不仅仅是物理构成,这有助于解释为什么人们在蒙提·霍尔问题上会犯错。
他们凭直觉感知,汽车在不同门后的倾向已经确定,他们知道打开一扇门不会改变这些倾向。但是,概率跟世界中的事实无关,而与我们对世界的无知有关。新信息减少了我们的无知,改变了概率。如果这听起来很神秘或不好理解的话,设想一下我刚刚抛出的硬币正面朝上的概率。对你来说是0.5,对我来说就是1,因为我偷看了。同样的事件,不同的知识,概率就不同。在蒙提·霍尔问题中,无所不知的主持人为我们提供了新的信息。
当主持人促成的“无知的减少”与物理环境的联系更加明显时,问题的答案就直观了许多。莎凡特邀请她的读者想象一下如果把游戏节目做些改变,会发生什么。比如,将3扇门换成1 000扇门。 你选了一扇门,之后蒙提展示其他998扇门后面的每一只山羊。这时,你是否会把赌注换到另外一扇关着的门上呢?这一次,蒙提的选择显然传达了能让人采取行动的信息。你可以想象,他要时时关注后面放置汽车的那扇门,并确保不打开它,而仍然关闭的那扇门是一个信号,意味着这扇门后面可能放置了汽车。