这是一个著名的二难推论命题:有个人同他的妻子和母亲一起过河,中途在对岸突然出现一只长颈鹿,他立刻举枪向它瞄准。长颈鹿说:“如果你开枪,你母亲就没命:如果你不开枪,你妻子就完蛋。”这个人该怎么办呢?
这则经典的二难推论故事源于达荷美的波波族。 类似的稀奇古怪的故事、叫人难以做出决断的问题,在非洲民间传说中非常流行,其中许多故事还被西方的作家和哲学家借用过。在波波族的民间传说中,长颈鹿是会说人话的,而且说一不二、说到做到。用较为西方的方式和更加专业的术语,你可以像下面那样重述这则二难推论:你、你的配偶和你的母亲被几个发疯的科学家绑架,关在一个房间里,捆在椅子上动弹不得。房子里有一架古怪的机器,你正好可以触及其中一个按钮。一挺机关枪正对着你的配偶和母亲。墙上挂着一只钟,滴滴答答地走着,在阴森森的空气中发出令人恐怖的声音。一个科学家宣布,如果你按动面前的按钮,那么机关枪将瞄准你的母亲并把她击毙;如果你在60分钟内不去按按钮,那么机关枪将瞄准你的配偶开火。你仔细观察过这部残酷的机器,并且相信它会完成规定的程序。你该怎么办呢?
类似这样的二难推论有时会在大学的伦理学课程中进行讨论,当然也不会有令人满意的答案。如果你坚持认为在这种情况下你只能什么也不做(不去按那个按钮,从而让机枪击毙你的配偶),理由是因为你什么也没有做,因此就没人能怪罪你。这显然是逃避责任的一种选择。你唯一可以选择的是确定你更爱你的配偶,还是更爱你的母亲,从而确定要保住哪一个人的性命。
在有些二难推论中,要让另外某个人同时也进行选择,这便使决策更加困难。在这种情况下,结果将取决于所有人做出的所有选择。在格雷戈里·斯托克(Gregory Stock)的《问题书》( The Book of Questions ,1987)中,有一则类似的但更具有挑战性的二难推论:“你和你深爱着的人分别被关在两个房间中,两人身边各有一个按钮,并且你们都知道,除非两人中有一人在规定的60分钟内按下按钮,否则两个人都要被处死;而先按按钮的人可以保住对方的性命,但自己将立刻被处死。你该怎么办呢?”
这里,有两个人要估量他们所处的困境,并独立地做出选择。不管哪个人去按动按钮都是生命攸关的。最棘手的问题在于:你应当在什么时候做出牺牲?这个二难推论强迫你在为自己还是为心爱的人提供一艘救生艇这个难题上做出抉择。
许多二难推论涉及某个人可能选择以牺牲自己为代价去保护另一个人,例如,父母可能为保护孩子而慷慨赴死,因为孩子显然有更长的生命之路。但不管应用什么准则(我们当然没有理由相信当事双方会应用同一个准则),有关救生艇的抉择都存在以下三种可能结局。
1.当事双方在谁应当牺牲、谁应当活下去这个问题上达成共识时,前者(牺牲者)应该去按按钮以挽救后者。这种结局是最容易被人接受的。
2.双方都决定保护对方:母亲决定保护女儿,因为女儿会活得更久一些;而女儿决定保护母亲,因为母亲给了她生命。在这种情况下,结局取决于谁抢先按下按钮。
3.最令人不安的情况是双方都认为自己应该活下去。这样的话,没有人去按按钮,而时钟正在滴滴答答地走下去……
让我们来想象一下第三种情景:在计时开始之后已经过去了59分钟。你希望你所爱的人会去按按钮,但她(或他)却没有按(我们假定当另一方按了按钮后,幸存者会立即得到通知)。这时,你还有时间把各种可能性都仔细考虑一遍,因为有些人也许会琢磨整整一个小时才能决定谁应该活命,或者鼓起勇气去按按钮。但整整59分钟过去了,却没有任何动静,于是你就应该开始考虑你所爱的人是否已经决定由你来做出牺牲了。
发誓决不去按按钮是毫无意义的,即使在最后一秒钟。不管你怎样以自我为中心,你都没有能力逃过一劫。总有人要死,这是这个二难推论的必然结局。如果你所爱的人不愿意做出牺牲,那么你最好成全她(或他)。记住,你是真心爱着那个人的。
在理想情况下,在最后关头你会去按按钮的,而你所爱的人可能也想这么做。这就是你拖延着直到最后关头来临的全部理由。你想把在最后关头去按按钮的机会留给对方,但她(或他)却没有这么做,在这种情况下,也仅仅在这种情况下,你才会去按按钮。当然,你所爱的人可能也是这么打算的。
有两个因素使“双方都企图拖延到最后一秒”这种情况复杂化,那就是反应时间和时钟精度。那架该死的机器是不会有一丝一毫同情心的,一到时间它就会把你们两个立刻杀死。因此,你(或者是对方)必须抢在这种结局发生之前完成上述决策过程并迅速按下按钮。此外,墙上的挂钟并不一定与机器精确同步。当然疯子科学家会这样说,但因为他是疯子,说的未必可信。为安全起见,为了确保你是在规定时限内按了按钮,实际上你必须提前一点点。在采取“等待直至最后一刻”这种策略的情况下,这是最关键的一个决定!
你与也在拖延着时间的爱人的处境相同。如果双方都只在最后时刻来临时才下定决心,其后果将难以预料。其中一个人也许正好比另一人抢先一步按下按钮,也可能双方都错过了时限而被处死。事实上,结果肯定是随机的,偶然性远大于合理性。
在古怪的房间里做出孤注一掷的决定这类问题在哲学论著中比比皆是,从而赢得了“问题盒”这样一个名称。这类二难推论问题为什么能引起人们如此的兴趣?部分是因为这种异乎寻常的困境使人感到新奇、刺激。但如果它们仅仅是一些测验智力的难题,并未与我们的个人经历产生共鸣,自然不会引起人们这么大兴趣的。
当然了,现实生活中的二难推论不是由发疯的科学家制造出来的,而是由于我们的个人利益同其他人的利益发生碰撞,或者是同社会利益发生冲突,从而以各种各样的形式建立起来的。我们天天都面临着艰难的选择;有时候,我们做出选择的方式同期望的方式很不一样。由二难推论引出的内在问题虽然简单,却令人十分困惑:在每一种情况下,是否都存在合情合理的行动方案呢?
1949年8月,苏联在西伯利亚爆炸了它的第一颗原子弹,美国对原子能的垄断地位至此结束。世界上有了两个核大国这种局面,比西方观察家曾经预期的要早得多。
苏联的原子弹激发了核武器竞赛,这种竞赛带来的某些后果是容易预见的——每个国家都想武装到这种程度,能发动一场快速压倒对手的核攻击。许多人意识到,这会导致令人无法接受的二难推论。在世界历史上第一次出现了这种可能性——某国期待通过一次闪电式的打击使敌国从地球上消失掉。在危机时期,按动核按钮的诱惑几乎是不可抗拒的。同样重要的是,每个国家都害怕自己成为别国突然袭击的牺牲品。
20世纪50年代,在美国和西欧,曾有许多人主张美国对苏联发动一次直接的、不需要理由的核打击。人们为这种核打击赋予了一个委婉的名称,叫作“先发制人战争”。有这种想法的人认为,美国应该抓住时机,通过核讹诈或突然袭击来建立权威、统治世界。你也许认为,只有极端分子会支持这样一个计划。事实上,“先发制人战争”的运动在许多十分优秀的知识分子中也获得了支持,其中包括两位当代最出色的数学家:伯特兰·罗素 和约翰·冯·诺依曼。一般说来,数学家通常不是由于他们的政见或对世界的看法而闻名于世的;而且,罗素和冯·诺依曼是两个完全不同的人,但在“世界上不应该有两个核大国共存”这一点上,他们恰恰站到了一起。
罗素是“先发制人战争”这场运动的主要推动者,他热衷于宣传“苏联具有核摧毁能力”,除非苏联对由美国主导世界这种状态放弃主权。在1947年的一次演讲中,罗素说:“我倾向于认为俄罗斯人会默认美国主导世界这种状态:否则,世界将经历由此造成的战争,并出现一个独一无二的政府,因为这是世界的需要。”
冯·诺依曼的态度更加强硬,他热衷于出其不意地使用核武器先发制人。《生活》( Life )杂志曾经引用冯·诺依曼的言论:“如果你问为什么明天不用原子弹去轰炸他们,我倒要问为什么不今天就去轰炸呢?如果你说今天5点去轰炸,那么我要问为什么不是今天1点就去轰炸呢?”
他们两个人都对苏联没有任何好感。他们相信先发制人战争是逻辑的必然,是解决核扩散这一死结的唯一合理方案。在《新联邦》杂志( New Commonwealth )1948年1月号鼓吹先发制人战争的一篇文章中,罗素写道:“(对于先发制人战争)我已经提出的理由就像数学证明一样,是如此明白无误和不可避免。”然而,逻辑本身也会出差错。“先发制人战争”这场异乎寻常的闹剧的真实含义是什么呢?恐怕说得最清楚的是当时的海军部长弗朗西斯·马修斯了:1950年,他在不经意间用奥威尔式的语言 极力鼓吹美国要成为“为和平的侵略者”!
今天,随着东西方紧张关系的解冻,“先发制人战争”看上去就像冷战思维的一种奇特变形。然而,我们今天仍然面临着大量这类问题。当一个国家的安全同整个人类的利益发生冲突时,应该怎么办呢?当一个人的利益同公共利益发生冲突时,应该怎么办呢?
没人能像约翰·冯·诺依曼(1903—1957)那样说明原子弹这个二难推论是怎样折磨人的。“诺依曼”这个名字对于大多数人来说并没有多大的意义,这位声名卓著的数学家几乎属于一个不存在的人种。知道这个名字的少数圈外人则会把他看作电子数字计算机的先驱,或者是为曼哈顿计划工作的一群杰出科学家中的一位。还有少数人则无端地把他看作斯坦利·库布里克的电影《奇爱博士》中的若干个原型之一。 当然,冯·诺依曼的确曾坐在轮椅上参加过原子能委员会的会议。
很早就为冯·诺依曼赢得天才声誉的主要著作是关于纯数学和数学物理学方面的。曾经有人希望他一生的工作都远离尘世间的事务,然而冯·诺依曼却对应用数学情有独钟。计算机和原子弹都是冯·诺依曼的业余爱好,但是这两个项目十分典型地反映了他对于数学应用的兴趣。
冯·诺依曼会玩扑克,但算不上行家里手。他那敏锐的思维使他能够捕捉到游戏中的一些要素。他对采用骗术、虚张声势、猜测对方意图,以及在规则允许的框架内游戏者互相斗法、彼此误导对方等种种手法,都特别感兴趣。凡此种种,用数学术语来说的话,都是“非平凡的”(nontrivial)。
从20世纪20年代中期到20世纪40年代,冯·诺依曼沉醉于研究扑克和其他游戏的数学结构之中。当这项工作接近完成时,他意识到这些理论可以应用到经济学、政治学、外交政策,以及其他领域中去。冯·诺依曼和普林斯顿的经济学家奥斯卡·莫根施特恩 在1944年以“博弈论和经济行为”( Theory of Games and Economic Behavior )为题公布了他们的分析报告。
若要认识冯·诺依曼的博弈论,首先要了解它并不等同于一般意义上的赌博。博弈论研究的其实是大家通常所说的“策略”(strategy)。在第二次世界大战期间同冯·诺依曼一起工作的科学家雅各布·勃洛诺夫斯基 在“人的升华”节目中回忆,有一次在伦敦的出租汽车上,他和冯·诺依曼谈起博弈论:
……因为我对下棋很着迷,因此很自然地对他说:“你的意思是,博弈论像下棋?”“不,不,”他说,“下棋不是博弈。下棋是定义得十分完善的一种计算。你也许无法给出答案,但是理论上,任何棋局必然有一个解,也就是有一个正确的过程。而真正的博弈完全不是这个样子的,现实生活也不是这个样子的,现实生活中包括虚张声势、一些骗人的小策略、互相估摸对方以便应对等。在我的理论中,博弈研究的就是这些内容。”
可见,博弈论是一门研究在有思想的、可能会骗人的对手之间的冲突的学问。这也许让博弈论听起来似乎更像是心理学的一个分支而不是数学的分支。实际上,它是数学的一个分支,因为对局双方都被认为是完全有理性的,因此博弈论认可精确的分析;更确切地说,博弈论是数理逻辑的一个分支,它研究人(并不总是理性的)之间的冲突。
当有人深入地研究一些看起来并不相关的事物,并且提取出其中一些一般要素时,科学就会取得极大的进步。博弈论也是这样起源的。冯·诺依曼认识到在客厅里玩的游戏中蕴含着基本的冲突。这些隐藏在扑克牌、棋子、骰子的华丽装饰背后的冲突深深地吸引了冯·诺依曼,他还在经济学、政治学、日常生活以及战争中发现了类似的冲突。
在冯·诺依曼的术语中,“博弈”就是一种冲突的态势,在这种态势下,一个人必须做出一种选择,并且知道对方也在做出选择,所有的选择规定的某种方式将确定冲突的结果。有些博弈是简单的,易于分析;有些博弈则包含循环推论,很难分析。冯·诺依曼想知道博弈中是否总有一种理性的方法,尤其是有许多骗术、诡计和相互猜测的那类博弈。这正是博弈论的基本问题之一。
你可能会天真地认为每一种博弈都必然会有一种理性的方法。真是这样吗?冯·诺依曼想弄清这一点。世界并不总是合乎逻辑的,在我们的日常生活中充塞着那么多的非理性。更有甚者,像扑克游戏中那样,相互猜测必然引起无尽的推理链。显然,理性的玩家对于如何进行游戏也不一定有确定的结论。
缺乏天才的数学家或许也能发现上述问题,但他们对此却无能为力,只能叹口气,重新退回去做“严肃的”工作。冯·诺依曼则不然,他抓住这个问题不放,以数学的严密性去对付它,最终获得了非凡的成就。
冯·诺依曼从数学上证明了,在两个人的博弈中,只要他们的利益是完全相悖的,就总是存在一个理性的行动过程。这一证明被称为“极小极大定理”(minimax theorem)。极小极大定理所覆盖的博弈种类包括许多娱乐性游戏,从十分简单的连城游戏(ticktacktoe)到非常复杂的棋类游戏,它适用于所有一输一赢的博弈(这是符合博弈双方的利益“完全相悖”这一要求的最简单情况)。冯·诺依曼证明,在这样的博弈中,总有一种“正确的”,或者更确切地说,“最优的”方法。
如果极小极大定理就是上面说的这些,那么它最多就是一个对娱乐数学还算不错的贡献罢了。实际上,冯·诺依曼看出了其中所蕴含的更深刻的意义。他的意图是将极小极大定理作为把所有其他类型的博弈都包括进来的博弈论的基石,包括二人以上的博弈、局中人的利益部分重叠的博弈等。经过这样扩充以后,博弈论就可以适用于所有类型的人类冲突了。
冯·诺依曼和莫根施特恩把博弈论当作经济学的数学基础介绍给大家。我们可以把经济冲突看作是一种“博弈”,受博弈论定理的支配。投标争夺一个合同的两位承包商,或者在拍卖会上竞相出价的一群买主,都纠缠在互相猜测的微妙的博弈之中,值得进行严密的分析。
几乎从一开始,博弈论就被看作是一个重要的新领域而受到欢迎。《美国数学会通报》上一篇对冯·诺依曼和莫根施特恩著作的评论中预言:“我们的子孙会把这本书当作20世纪前半叶中最重要的科学成就之一。该书的作者们已经成功地创建了一门新的真正的科学——经济科学,这个看法无疑是正确的。”在《博弈论和经济行为》出版以后,博弈论及其术语成为在经济学家、社会科学家和军事战略家中十分流行的行话。
最早接受并应用博弈论的组织之一是兰德公司。兰德是第二次世界大战结束后不久根据空军的指示建立起来的“思想库”的原型。它的最初目的是进行洲际核战争的战略研究。兰德聘用了许多战时从事国防工作的科学家,并逐渐发展成为拥有众多显赫思想家的著名咨询公司。
兰德对博弈论极为重视,聘请冯·诺依曼作为顾问并投入极大资源,不但研究博弈论的军事应用,还对博弈论本身进行基础性的研究。在20世纪40年代末和50年代初,冯·诺依曼已是位于加利福尼亚州的兰德公司总部的常客。
1950年,兰德公司的两位科学家提出了自博弈论问世以来影响最大也最有争议的一种博弈,这就是梅里尔·佛勒德和梅尔文·德莱歇 提出的看似简单、实则最能迷惑人的“囚徒的困境”,它几乎动摇了博弈论的部分理论基础。“囚徒的困境”这个名称是兰德公司的顾问阿尔伯特·塔克 起的。之所以起这样一个名称,是因为塔克为说明这种博弈讲了一个有关囚徒的故事,对此我们将在后面详细介绍,现在我们只要知道在这种博弈中,冲突的形势是最具幻想力的,并且至今仍使我们困惑不已就足够了。
对于那些研究民间传说的人来说,二难推论这类故事中会出现令人难以做出决断的情况,同时要求听故事的人回答该怎么办。囚徒的困境也是这样一类故事,它的结局是留给听故事的人或者读者一个解不开的难题。“囚徒的困境”被发现以后并没有立即公开,只是在20世纪50年代的科学界里被口头传播,但它确确实实满足了民间文学家对二难推论这类故事所下的定义。
当然,囚徒的困境不只是一个故事,它是一个精确的数学结构,也是现实生活中的一个问题。从1950年“被发现”这个时代背景来说,它并不像看上去那样神秘,因为当时大家正紧密关切着核扩散和军备竞赛。事实上,早期核时代的紧张形势正是出现囚徒的困境这种博弈的原因之所在。
对核时代而言,以牺牲公共利益为代价,能否使一方获得安全这样一个揪心的问题并不是什么新问题,自从有战争起,这样的问题就存在了。但核打击的突发性和毁灭性使这个问题变得明显起来。可以毫不夸张地说,囚徒的困境是防卫的核心问题,而某个人对此的反应既不能证明其错,也无法证明其对,保守派和开明派会做出截然相反的评价。
本书虽冠以“囚徒的困境”这样一个书名,但它不是讨论军事策略问题的。囚徒的困境是一个一般的概念。理论家们现在已经认识到,囚徒的困境会发生在生物学、心理学、社会科学、经济学、法律等领域。只要有利益冲突的地方,就会有囚徒的困境,而冲突并非只发生在有感知能力的生物之间。研究囚徒的困境对于解释动物社会和人类社会的形态极有好处。这是20世纪出现的最伟大的思想之一,不仅简单到任何人都可以掌握,而且具有重要的意义。
在冯·诺依曼生命的最后几年里,他看到战争的现实性变得越来越像虚构的二难推论,或者说像他的理论中的抽象博弈。核时代的风险常常带有“技术进步超越道德进步”的属性。这一判断令人沮丧,使人怀疑道德进步是否还存在,而原子弹越做越大,人们却照常生活。囚徒的困境已成为这个时代最基本的哲学和科学课题之一,它同人类的生存紧紧地联系在一起。
当代博弈论的实践者试图锻造一种道德进步。那么,在囚徒的困境中难道真有什么方法会促进公共利益吗?试图回答这个问题是当今最重大的智力冒险活动之一。