博弈法则：历史与生活中的逻辑最新章节_周建武著

1.博弈就在我们身边

社会生活中的许多现象，都带有博弈的特征，比如说在历史事件、日常生活、商场、股市中都存在着很多博弈，可以说博弈是无处不在的。

每个人都是理性的，都是从自己的利益出发去作出选择，但有时候很容易遇到无法通过自己的力量左右局势的情况。在这样的情境下，应想办法尽可能让自己的损失最小。趋利避害是人们处于困境时一种理性的选择。下面先举一个博弈论中最具代表性的例子：囚徒困境（Prisoner's Dilemma）。

聪明囚徒的两难抉择

“囚徒困境”说的是两个嫌疑犯被警察抓住，但警方没有足够的证据指控二人有罪。于是，警方把两个嫌疑犯分别关在独立的不能互通信息的牢房里进行审讯，警察分别和二人见面，并向双方提供以下相同的选择。

若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，则此人将即时获释，而沉默者将被判刑10年。

若二人都保持沉默（相关术语称互相“合作”），则二人同样被判刑1年。

若二人互相检举（互相“背叛”），则二人同样被判刑5年。

用下表概述如下。

囚徒到底应该选择哪一项策略，才能使自己的刑期最短？两名囚徒由于隔离监禁，并不知道对方的选择。两个囚徒该怎么办呢？是选择互相合作还是互相背叛？从两个囚徒的角度看，他们之间互相合作、保持沉默就能得到最好的结果。但人类的天性总是首先从最有利于自己的角度去想问题，为此他们不得不仔细考虑对方可能采取的态度。就个人的理性选择而言，检举（背叛）对方所判刑期，总比沉默要低。试设想困境中两个理性的囚徒会如何作出选择。

若对方沉默，背叛会让我获释，所以会选择背叛。

若对方背叛、指控我，我也要指控对方才能得到较低的刑期，所以也会选择背叛。

二人面临的情况一样，所以，二人的理性思考都会得出相同的结论：选择背叛。背叛是两种策略之中的支配性策略。结果二人同样服刑5年，总体利益较合作为低。这就是“困境”所在。

基于理性假设，也就是著名的经济人假设，两个基于“坦白从宽，抗拒从严”审讯的囚徒，从个人理性并追求个人利益最大化出发，产生的结局是，二人皆坦白，也就是背叛。这在四种策略中并不占优，那为什么不采用集体最优策略而进行合作？很简单，集体的优化，必然侵害个人利益的最大化。当然，这一切的前提是，破解这一困境的途径是打破信息孤立，而执法者的反制则是维持信息孤立或者加强威胁。

什么是博弈

博弈论是由两位杰出的学者——冯·诺伊曼和摩根斯坦在20世纪中期创立的。1944年，冯·诺伊曼与经济学家摩根斯坦合作出版了巨著《博弈论与经济行为》，标志着现代博弈理论的初步形成。由于二人此时研究、提出和建立的是一种标准型、扩展型和合作型的博弈模型，因而他们的理论又被称为合作型博弈论。

合作型博弈论指的是研究分析的对象是二人的零和博弈，也就是说，二人互相博弈，这一方赢一点，就意味着另一方输一点，双方的净获利为零。这一理论的缺陷有二：一是社会活动中常常是多人参与，并非只有二人互相博弈；二是博弈的结果并非你输了，我就必然赢，常常出现整个群体净获利大于零或小于零的非零和博弈结局。正因为有上述缺陷，加之行文比较抽象，所以，此理论提出以后，并不为世人所知，仅是少数数学家的专利。直到20世纪50年代初，当时仅二十出头的美国数学家纳什通过两篇论述非合作博弈的论文对博弈理论作了进一步的创新和完善，才使博弈理论走入了一个崭新的天地。

纳什在论文中解决了过去人们少有涉猎因而也尚未解决的多人参与、非零和博弈的理论问题，由此创立和提出了著名的“纳什均衡”。其博士论文在普林斯顿大学发表后，引起轰动。自此，纳什跻身于博弈论大师之列，并于40多年后的1994年获诺贝尔经济学奖。而非合作博弈论也成为博弈理论的新主流而为越来越多的人所熟知，在实践中得到越来越多的运用。

为了解释和理解博弈决策的相互影响，我们可以设想一下一个石匠的决策和一个拳击手的决策会有什么样的区别。当石匠考虑怎样开凿石头的时候，他的“对象”原则上是被动的和中立的，不会对他表现出策略对抗。然而，当一名拳击手打算攻击对方要害的时候，不仅他的每一次攻击都会招致抵抗，而且他还会面临对方主动的攻击，他必须设法克服这些抵抗和攻击。

在博弈过程中，你必须要意识到，你的对手都是聪明而且有主见的人，是关心自己利益的活生生的人，而不是被动和中立的。一方面，他们的目标常常与你的目标发生冲突；另一方面，你们之间又有潜在的合作因素。你在作决定的时候，必须将这些冲突考虑在内，同时注意发挥合作因素的作用。

为了自己，也为了与他人更好地合作，你需要学习一点博弈论。当然，博弈论不是万能的。我们不可能用它来解释所有事情。博弈论的基本公设之一就是，人是理性的。所谓理性的人，是指行动者具有推理能力，在选择具体策略时，目的是使自己的利益最大化。而在现实生活中，人们在作决策时往往是有限理性。因为人的精力和时间永远是有限的，人不可能具备完全理性，不可能掌握所有知识和信息。人们不可能搜寻到所需的全部信息。同时，也要意识到信息的搜寻需要成本，必须付出大量的时间、精力和财力等。意图搜寻到所有信息，企图作出收益最优的决策只是一种理想。

但毕竟人是理性的动物，博弈论至少可以帮助我们得到对现实的客观世界近似的描述，所以，博弈论仍然是我们目前所能得到的一种非常有效的分析工具。就像并不完美的力学是自然科学的哲学和数学一样，博弈论是社会科学的力学和数学。没有牛顿力学，我们连最简单的物理现象都无法理解。同样的道理，没有博弈论，我们也无法解释和分析很多现实的社会现象。

博弈的不同表现形式

在不同的状态下，博弈有不同的表现形式。

一是合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契，以选择共同的策略，此种博弈就是合作博弈；反之，就属于非合作博弈。企业之间的联合定价就属于合作博弈，而经常挑起价格战的企业采用的便是非合作博弈。在合作博弈中往往包含着非合作博弈，如石油输出国组织是合作博弈的产物，但它们之间为了各自利益的超产和争吵又属于非合作博弈。

二是零和博弈、常和博弈与变和博弈。零和博弈指的是所有博弈方的得益总和为零，赌博就属于零和博弈。例如4个人参与一场赌博，其中3个人总共输了1000元，那么另外一个必然赢了1000元。期货交易市场参与者之间的关系也属于零和博弈。人们平常所说的“损人利己”实际上也包含零和博弈的意思。

常和博弈则是指所有博弈方的得益总和等于非零的常数。例如，若干人分配一份总额既定的财产乃典型的常和博弈，即蛋糕的总量是不变的，而每人享有的份额是可变的。

变和博弈则是指随着博弈参与者选择的策略不同，各方的得益总和也不同。如在同一个股票市场，在一定的时间段内，面对同样的大盘走势，由于投资者的投资策略不同，有可能大部分人赚钱而小部分人亏钱，也有可能小部分人赚钱而大部分人亏钱。

博弈就是逻辑游戏

博弈论原本是数学的一个分支，但由于它较好地解决了对竞争等问题的可操作性分析，因而成为经济学中激动人心的一个研究领域。可以说，博弈论已经改变了经济学的传统轮廓线。

博弈论的英文是Game Theory，直译过来就是游戏论、运动论或竞赛论。比如在足球比赛中，双方都想在努力巩固防守的同时，积极进攻以置对方于“死地”。这种行为就是一种博弈。“弈”在汉语中有下棋的意思，下棋中双方的行为也如同足球比赛中双方的行为。当然，扩展开来讲，企业之间的竞争、国家之间的角力等，都是“游戏”，只是游戏的内容不同而已。

我们平时所玩的很多游戏其实是和博弈有着许多相似的本质的，都是在确定的游戏规则的约束下，游戏参与者决策、行动的过程。游戏是一种抽象。在面对复杂现象的时候，人们经常会“只见树木不见森林”，不能抓住某种现象的关键所在。而在游戏中，可以通过抽象出现实生活中的一些要点，并且把一些干扰性的因素减少到最低点，从而轻松地分析问题并找到合理可行的解决办法。

比如古老的围棋游戏，它最初的功能形态就是模拟战争。在围棋之中具有很多军事的内涵，如围而歼之。下围棋的目的就是获得最大的利益。从围棋的玩法中我们可以比较清楚地看出战争的本质和目的。

围棋游戏的规则，有两气生、一气死、贴目、打劫等，最终可以根据所占地盘的大小来确定谁胜谁负。这也是一种逻辑游戏，和战争在很多方面都是相通的。下围棋的人其实就是在棋盘上进行较量，这个过程其实也就是博弈的过程。所以说，下围棋和博弈是有着相通之处的，强调的是从全局进行控制，而不是为了蝇头小利。也就是说，所有的作战方法都必须是有效的，而且还要看其在全局中是否有用、有效。

在很多时候，博弈类逻辑游戏不但可以锻炼人的思维能力，而且还可以培养人的思维方法。一个好的思维方法能够使我们从错综复杂的现象中发现事物的本质，从纷繁的表因中找到事物变化的主要原因，从而使事物呈现出更好的条理性。由于任何思维方法都是比较抽象的，不像直接理论那么简单，因而我们只能通过自己的想象，亲自动手来操作，在经历了失败以后，才能得以形成。所以说，只有思维能力较强的人，才能在工作中发现更多的问题，才能更好地解决问题。这已经成为人们的一种共识。

许多逻辑游戏都有这样一个共同特点，就是参与者所选择的策略对于胜负有很重要的影响。当一个游戏规则制订好了之后，策略选择就会成为最关键的因素。特别是在围棋、象棋这样一些参与者的初始条件完全相同的游戏中，选择什么样的策略可能是影响游戏结果的决定性因素。

其实，不管什么样的游戏，都有专属于它的一些游戏规则。现实生活中也是这样的，有法律、道德和各种成文或不成文的规章制度和惯例等。不过，像这样的一些规则并不是固定的，可能会随着情况的改变和人们的要求而不断进行修正，但只要有规则存在，就确定了人们行为的前提和条件。所以说，博弈和游戏是有着共同特征的，那就是这些规则规定了游戏参加者能够做什么、不能够做什么，可以按照什么样的次序去做，采用什么样的方式结束游戏，参加者如果违反有关规定将会受到什么样的处罚，等等。

所以，游戏和博弈所指的都是一种策略，它们之间的理论是有相通之处的。每一个游戏参加者从游戏结果的好坏中不仅能够看出自身策略的选择，而且还能够看出其他参加者策略的选择。有时候策略的好坏会直接影响到最终的结果，但是有的时候还会出现你选的策略并不好而最终的结果却很好的情况，那是因为对方选择了对他不利的策略。因此，如何选择一个对自己更有利的策略就是博弈的重要原则。

博弈的类型

博弈的类型可通过两个维度来划分。

一个维度是从静态到动态，静态就是一次性博弈，动态就是你来我往的多次博弈。所有博弈方同时或可视为同时选择策略、采取行动的博弈是静态博弈。譬如，在投标活动中，投标人投出标书虽有先后，但因为所有投标人在开标前都不知道其他投标人的标价，因此可看作同时选择策略、采取行动。体育竞赛中，双方出场阵容的选择也属于静态博弈。动态博弈则是指博弈方的选择和行动有先后之分，后行动者可以根据先行动者的策略选择来决定自己的策略。如A企业降价后，B企业也跟着降价；足球比赛中，一方换上一名攻击性前卫后，另一方有针对性地换上一名后卫；等等。

另一个维度，是从完全信息变为不完全信息。在前一种博弈中，每一个参与者都拥有全部的相关信息，后一种博弈则只拥有部分相关信息。

两个维度、四个象限，就是博弈论模型复杂化并不断接近真实世界互动的过程（见下表）。

第一，静态完全信息博弈。

典型的是单次完全信息的博弈，就是双方同时行动，行动结束，游戏也就结束了。比如，囚徒困境就是一次博弈，简单地说，就是我知道你的最优策略是什么，你也知道我的最优策略是什么，你知道我知道你的最优策略，反之亦然。在囚徒困境这个例子里，我知道你肯定会背叛我，因为这样对你最好，那么我也只能背叛，不存在合谋，没有提前商量的空间，只能各选各的。在这样的情景下，产生的均衡就是纳什均衡。

第二，动态完全信息博弈。

若按照时间维度往前推一步，一个单次的博弈会变成一个多次的互动过程，这就是动态完全信息博弈。这种拓展有两种情况。

一种是重复的博弈，就是说一个博弈重复地进行。在重复的博弈中，囚徒困境有可能得到解决，两个人开始合作了。策略就是你合作我就跟你合作，你要是敢背叛我，我也让你完蛋，大不了一起完蛋。这种策略让合作成为可能。

另一种是不断延展的博弈。前一种单次重复博弈是两个人同时行动，但是在延展博弈中，你先来一下，我再来一下，然后你再来，跟下棋一样。每一次轮到自己行动的时候，前面已经有别人的行动，已经是事实了，自己就要相机行事，根据之前的行为，看眼下自己能做到的最好的是什么。

第三，静态不完全信息博弈。

从简单的一次完全信息博弈变为不完全信息博弈，则是另一种情况。在这种情况下，我们对对方的一些信息是不了解的，你无法预知对方在给定行为下的最好的策略，那么你只能赋予对方采取不同策略的概率，然后，根据这个概率选择自己的策略。

以射点球为例，对于门将而言，他不知道射门者的偏好，而只能对这个偏好进行估计。如果是左脚球员，门将会估计这个球员踢向门右侧的概率大一些。那么，根据这一估计，他会以更大的概率朝右侧这个方向去扑球。但是，射门的人完全有可能踢向另一个方向。

再以讨价还价为例，买方喊出一个买价的时候，是不知道卖家心目中的合适价格的，喊高了则自己吃亏。同样，若卖家喊价，也有可能喊低了。

第四，动态不完全信息博弈。

动态不完全信息博弈最接近真实世界中的大部分博弈，就是把时间上的复杂性和信息不对称都考虑在内，这是博弈论中较为复杂的情况。

在信息不对称的情况下，可通过某种方式传递信息。这就是博弈论中最为经典的“信号博弈”（Signaling Game）。博弈双方，一方对另一方的某一特性不了解，不知道它是什么类型，但是，一方可以通过另一方发出的信号去推断它的类型。

比如在择偶过程中，一个女孩选择对象，当她无法确认追求者是否真正钟情于自己时，她就需要通过追求者发出的信号来判断。发出信号是要有成本的，要证明真爱，就要发出对你足够好的信号，以凸显出你和别人不一样。在这样的博弈中，均衡是怎样的呢？有两种情况：一种是，那些强烈爱的人和那些温和爱的人竞相花费成本证明真爱，若到某一时刻，温和爱的人发现不再值得投入了，这时候强烈爱的人就胜出了，这叫作“分离均衡”；另一种是，到最后两种人也没完全区分出来，一些爱得不那么深的人也混在真爱中。女孩索性随意选一个人嫁了得了，这叫作“混同均衡”。

真实世界中，从静态到动态，除从完全信息变为不完全信息外，博弈的人数也可以从两人变为多人，有一个非常经典的博弈论模型叫作全局博弈（Global Game）。比如“银行挤兑”现象，你是否挤兑取决于你是否相信别人会挤兑，以及你相信银行有多少钱。在这个博弈中，主观的因素变得更加重要。

可见，博弈论是相当强大的思维工具和方法论。虽然理论可能很复杂，但其内涵却在日常生活中常有体现，人们可以结合自己的生活经验来体会。