要谈博弈论,便不得不讲到“囚徒困境”。1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,他用两个囚犯的故事,将当时专家们正研究的一类博弈论问题,作了形象化的解释。从此以后,类似的博弈问题便有了一个专门名称——“囚徒困境”。
塔克的囚犯故事大概是这样讲的:
某一天,一位富翁在家中被杀,财物被盗。警方在侦案过程中,抓到两个犯罪嫌疑人——甲和乙,并从他们的住处搜出被害人家中丢失的财物。但是,他们都否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点东西。
警方虽怀疑他们作案,但却没有掌握确切的证据,于是便将两人进行隔离审讯,由地方检察官分别与甲和乙单独谈话。检察官分别对他们两个说:“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,根据控辩交易制度,如果你坦白并揭发同伙杀人的罪行,我将判你无罪释放,但你的同伙要被判30年。如果你拒不坦白,而被同伙检举,那么你就将被判30年,他被判无罪释放。但是,如果你们两人都坦白交代,那么,你们都要被判15年。”
那么,甲和乙该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果大家都只被判1年。但是由于两人处于隔离的情况且无法串供,所以每一个人都会从利己的目的出发,选择坦白交代的最佳策略。因为自己坦白交代,而对方抵赖的话,还可以期望得到无罪释放,即使对方也坦白交代,至多也只判15年。而如果自己选择抵赖,对方选择坦白的话,那么自己就得坐30年牢,而对方却会被无罪释放,这显然是最不划算的。出于同样的动机,彼此会考虑到对方选择抵赖的可能性是很小的,所以谁也不会去冒这个险。所以,两人合理的选择是都坦白,原本对双方都有利的策略——抵赖就不会出现。
这就是经典的“囚徒困境”。以整体利益而言,如果两个参与者都合作保持沉默,总体利益更高,结果也比两人背叛对方的情况较佳。但两人均只追求自己个人利益,均衡状况会是两个囚徒都选择背叛,结果两人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。
“囚徒困境”被看成是博弈论的代表性案例,不仅因为其简单易懂,还在于它的现象在日常生活中广泛存在。
囚徒困境结局的出现,都是源于对自己利益的考虑。现代社会中,虽然许多人都明白“背叛”并不能使自己获得最大收益,却仍然要选择“背叛”,也都是利益使然。
现实中,很容易可以找到囚徒困境的例子。两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛),或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”,例如会对经济造成损坏等。
两个行业顶尖的大公司打广告战也是一种囚徒困境的例子。若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有两种选择:互相达成协议,减少广告的开支;增加广告开支,设法提升广告的质量,压倒对方。若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就陷入了囚徒困境。在现实中,要互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。
囚徒困境理论告诉我们,囚徒欲想获得最大利益,唯有订立“攻守同盟”,相互抵赖,但其前提条件是:双方的交流不存在阻隔,并且双方的关系是反复博弈而非一次性的。
为什么会出现囚徒困境?主要还是源于人们对自己利益的考虑。囚徒困境是理性的人类社会活动最形象的比喻。它准确地抓住了人性的不信任和需要相互防范的一面。正因为彼此的不信任和防范,现实中生活中许多人都明白“背叛”并不能使自己获得最大收益,却仍然会选择“背叛”。