购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

作为魅力学问的博弈论

(总序)

有许多理由让我向读者们推荐博弈论,也顺便推荐本套丛书。说起博弈论,在过去的10多年里,人们对于它的感受是随着时间的推移而变化的。20世纪90年代初,我开始为研究生和博士生开设博弈论课程,一些同事用怀疑的眼光看着我。随后,在中国经济学界出现了博弈论热潮,而这种博弈论热潮是我在1996年发表在当时很有名的《经济学消息报》上面的文章所准确预言了的。 随后,有一些反潮流的人撰文批评这样的博弈论热,但是,我们看到,即使包括张五常这样的大家在内的批评者都没有成功地为博弈论热降温。在今天的经济学专业杂志上,包括国际上著名的经济学刊物,甚至在超出一般意义的经济学期刊,譬如管理、法律、政治学、生物学、心理学、军事科学等学术杂志上,运用博弈论方法构造数学模型的论文可以说是汗牛充栋、随处可见了。

与许多学问不同,博弈论不仅仅因为它开始成为包括经济学在内的社会科学的一般性研究框架而显得重要,犹如19世纪的牛顿力学在自然科学中的地位,而且,博弈论还是一门充满韵味且魅力十足的学问。正是由于博弈论那深刻的策略分析与对于大千世界中无所不在的复杂现象的巧妙解读,人们不仅满足了好奇心,而且还会感到茅塞顿开,豁然开朗,甚至在读了博弈论对于从经济管理到进化生物学一系列学术难题的精妙解读之后,禁不住会大呼过瘾,爽极!

对于许多人来说,科学的价值是能够帮助人们去认识世界、改造世界。其实,这是实用主义者的感受。对于科学家,特别是一些大科学家来说,他们认为科学理论的价值是它无比的美感,譬如爱因斯坦、薛定谔。对于既不同于普罗大众,也不是爱因斯坦那样的大科学家的大多数研究者来说,玩科学的感受其实就是有趣。趣味,是使得大多数科学家埋头于学问的主要推力。这种沉迷于学问里面的无穷趣味,是普通人难以想象甚至难以企及的境界,那可不是一般的趣味,那是“神趣”!——令人神魂颠倒、忘乎所以之意境!有如窥见上帝秘密之快感和人世间任何其他满足都难以比拟的快乐。当然,并不是所有的学问都能够如此这般地给人带来快乐,但是博弈论肯定是位列其中的。

作为研究策略性互动的学问,博弈论在解释经济行为的原因、政治制度的形成与演化、进化心理学假说的模型构建、进化生物学的数学化、市场设计与供求匹配等方面大获成功,已经成为生命体行为现象微观研究的重要方法——不仅仅是人类的经济行为。

美国第一位获得诺贝尔经济学奖的大师保罗·萨缪尔森说过:如果你想成为一个有见识的人,就一定要读读博弈论。其实,读读博弈论,还不仅是让人开眼界、长见识,喜欢深刻思考的人,会发现博弈论正是你爱不释手、丢弃不了的东西。

到底博弈论有什么迷人的地方呢?随便举个信手拈来的例子,就是中国的跨地区移动通讯为什么要收取漫游费。要知道,全世界只有三个国家在收取漫游费——中国、印度和日本。为什么?在我曾经参加的听证会上,运营商说跨地区移动通讯会增加运营商的业务量,所以成本的增加使得它们通过收取漫游费来填补额外的成本。其实,收取的漫游费数量远远超出了它们购买设备处理业务的费用,这样的理由是不成立的。那么,是什么难言之隐让运营商要收取漫游费呢?博弈论让我们很容易推演出运营商难言的秘密:如果取消漫游费,那么运营商们就处于全国统一的竞争性市场中,它们之间就会打起价格战,导致大多数运营商退出,而留下极少数幸存者垄断市场。并不是所有的运营商都有这样的自信:我会是最后的幸存者。所以它们之间就达成这样的默契:通过漫游费将市场分割为各个区域性市场。漫游费是地区市场分割的壁垒,各个地区的运营商都在自己的地盘里过着垄断带来的好日子。比如,在漫游费的高墙下,你是北京的用户,想用重庆的电话,因为重庆的话费可能要便宜一些。但是,漫游费就让你用重庆的电话比用北京的电话还要贵。这样,即使重庆的电话费比北京的电话费便宜,漫游费也让你难以企及,因为加上漫游费,对你来说用重庆的电话就要比用北京的电话贵了。同样,重庆的用户也会只用重庆的电话,各个地区的用户都只用本地区的电话,全国性的统一竞争性市场就被分割成各个地区的垄断市场,而用户们也不得不支付高额的话费。在这里,博弈论所起的作用是:它预言统一市场中会出现价格战。因为如果你知道一点博弈论,就一定知道“囚徒困境”这样简单的博弈论模型,也知道两个小偷在警察面前都会相互出卖同伙的结果。竞争性市场里的企业相互杀价,进行价格战就是“囚徒困境”,而相互出卖是它们的选择。

怎么样,博弈论让你大开眼界了吧。其实,在博弈论里,这样的妙招很多,它会教你怎样识破谎言。1996年的诺贝尔经济学奖得主之一、博弈论专家维克里就教会招标人如何识破投标人的谎言,让投标人老老实实地把真实的底价告诉招标人。

举一反三,同样基于惧怕价格战的原因,沃尔玛与麦德龙连锁店在选址上就不会十分接近。读者也许会注意到,沃尔玛与麦德龙在全世界任何地方的分店,通常都有足够远的距离。这样,即使居住在沃尔玛附近的消费者知道麦德龙的商品可能较沃尔玛便宜,但是较远的空间距离也让他对于放弃沃尔玛而去麦德龙购物望而却步。同样,居住在麦德龙附近的消费者也会是麦德龙的客户。沃尔玛与麦德龙之间拉开空间距离,就能够相互维护二者之间的市场细分而避免价格战对于双方的伤害。这是一种默契,也是博弈的结果。

博弈论不仅仅是学问,也不仅仅可供人们在茶余饭后消遣。更加重要的是,博弈论在现实中被广泛运用,从英美国家的3G手机频率拍卖,到1999年台湾“大选”中陈水扁上台,都明显或者不明显地采用了博弈论的策略。1999年,台湾“总统大选”。当时,卸任“总统”李登辉暗地想把“台独”分子陈水扁扶上台。国民党有两个候选人:连战与宋楚瑜。尽管在那个时候国民党在台湾已经有一些日薄西山,但是与新起的民进党相比,仍然是“瘦死的骆驼比马大”,小小的民进党是难以撼倒国民党的。但是,李登辉是经济学家,作为台湾大学的经济学教授,他自然想到了运用博弈论策略对国民党使阴招,尽管他当时还是国民党的总裁。他通过媒体发表许多伤害宋楚瑜的言论,使宋楚瑜上当。因为一气之下的宋楚瑜为了与作为国民党总裁的李登辉划清界限,就贸然把他的支持者从国民党拉出去,另外成立了一个亲民党。这样,本来可以轻松击败民进党的国民党,就由于选票被国民党与亲民党两个党分散,让民进党最终取胜。可以说,李登辉在1999年是运用博弈论霍特林模型中的策略,成功分化了国民党的选票而使陈水扁登上台湾“总统”的宝座,而他对博弈论策略的运用也达到了炉火纯青、天衣无缝的水准。在霍特林模型中,如果是两个候选人竞争,他们会使自己的政治纲领相互靠近,但是,如果是三个候选人竞争,则其中一个候选人把自己的政治纲领适当地与其他两个候选人的政治纲领拉开距离就可以取胜。由于连战与宋楚瑜之前的选民都是国民党的选民,他们俩分开后,他们的支持者之间的政治偏好是差不多的,所以,陈水扁只要把自己的政治主张适当地与他们俩区分开来,就可以分别击败他们。李登辉是通过博弈论而瞒天过海的,不仅让宋楚瑜上当,而且使整个国民党甚至选民们也被蒙在鼓里。

博弈论不仅仅是好玩,而且十分有用。我们来看看下面这个例子。20世纪80年代,在美国有两家销售音响产品的商店——疯狂艾迪和纽马克&路易斯。疯狂艾迪为了阻止纽马克&路易斯私下进行降价竞争,陷入价格战导致双方同归于尽,便打出了这样一个广告:凡是在疯狂艾迪购买商品的顾客,如果发现在其他商店可以以更低的价格买到同样的商品,疯狂艾迪可以按照差价的双倍对顾客进行补偿。这样,如果纽马克&路易斯私下降价,任何人都不会去它那里买东西。因为所有人为了获得两倍差价的补偿都会去疯狂艾迪买商品。这意味着一旦纽马克&路易斯私下降价,则对方会自动降价更多,并且纽马克&路易斯的顾客还会流失。这种方式就迫使纽马克&路易斯不敢私下降价,价格战就这样避免了。

这个案例在全世界都被模仿。我在重庆的家乐福超市也看到过类似于疯狂艾迪那样的广告:谁要是在重庆主城区以比本店更加便宜的价格买到同样的商品,本店将按照差价的三倍补偿。

更加鲜活的例子是,在2012年,中国的电子商务巨头京东试图挑起的一场大家电价格战被苏宁电器用与当年疯狂艾迪完全相同的博弈策略秒杀了!2012年8月14日,京东商城的首席执行官刘强东在其实名认证的微博上面声明:京东商城的所有大型家电将在未来三年里保持零毛利,“保证比苏宁、国美连锁店便宜至少10%以上”。苏宁立即以微博接招,宣布所有产品价格必然低于京东,否则将给予消费者两倍差价赔付。于是,硝烟还没有升起,京东便偃旗息鼓了。苏宁简单搬用疯狂艾迪的策略便一招致命,击退了京东的挑战。

在政治领域,博弈论更是如鱼得水。现今的政治科学研究,大量采用博弈论的方法已经是世风。一些令人头疼的政治现象,用博弈论方法看就是直截了当的了。譬如,中东和平进程为什么受阻,就是因为目前的停滞状态是博弈论中的纳什均衡。巴勒斯坦要求以色列首先交还被占领土,然后才声明放弃恐怖活动;而以色列要求巴勒斯坦首先宣布放弃恐怖活动,然后它们才交还占领的巴勒斯坦领土。双方都不愿意首先改变自己的策略。因为如果巴勒斯坦宣布放弃恐怖活动,以色列也可以不交还被占领土,巴勒斯坦就惨了。同样,如果以色列交还了占领的巴勒斯坦领土,巴勒斯坦也可以不宣布放弃恐怖活动,以色列也会吃大亏的。因此,双方都不会首先改变自己目前的策略,这就是博弈论里的纳什均衡。既然是纳什均衡,就是一种难以改变的胶着状态。

混合策略博弈是指博弈的参与人通过模糊自己的策略动机迷惑对手的博弈。在人们的生活中,谈恋爱就是一种混合策略博弈。在谈恋爱的过程中,女孩子通常会对于男孩子的追求反应含糊。因为如果女孩子说她爱男孩子,男孩子就认为已经搞定,就不会继续狠追女孩子了,女孩子会因此失去被追的愉悦。如果女孩子说她不爱男孩子,男孩子就会放弃,女孩子就会失去继续考察男孩子的机会。所以,女孩子总是对于男孩子的追求若即若离,不轻易说她对他爱与不爱。这是混合策略的运用。

一旦引入信息不对称,博弈论就更加魅力十足了。许许多多曾经是扑朔迷离的社会现象、经济现象,甚至生命现象,在信息不对称假设下就会令人感到茅塞顿开。

在2013年初,包括韩国和日本在内的一些在华外资汽车公司,纷纷开始推出将新购汽车的保修期延长至5年的营销策略。外资企业采用这种策略的目标是试图将中国的国产汽车公司挤出市场。以往,中国的国产汽车与外资之间在华市场的竞争主要依靠价格优势。但是,由于劳动力成本的上升,价格优势不再,外资企业依靠的是质量优势,这是国产汽车公司难以模仿的,它们由此发出高质量的信号,从而形成不对称信息中的分离均衡。

也就是说,在过去中国还具有低劳动力成本的情况下,国产汽车公司与外资之间还存在竞争,这种竞争的均衡是外资的高质量与国产汽车公司的低价格之间的平衡。到了2013年,国产汽车的低价格优势由于原材料涨价和劳动力成本上升而逐渐式微,外资与国产汽车之间都在差不多的价格水平上进行竞争了。在这种情况下,在同样的价格水平上,消费者就更加偏好高质量的汽车。保修期越长,就可以被认为是质量越高的产品。因为只有生产高质量产品的公司,才不会因为较长的保修期而产生高昂的费用,这是由于高质量产品在即使是较长的时间里也较少出现质量问题。这样,通过较长的保修期,企业就把高质量的信号发送给了消费者,而消费者也就因此放弃购买没有发送高质量产品的企业产品,转而购买发送高质量信号的企业产品了。

生命现象是我们这个地球上最神奇、最神秘的现象。达尔文的进化论为我们说明了复杂的生命现象是如何进化而来的。正是博弈论为进化论建立起了数学模型。

生命的个体也许并不是对于许多不同的生存策略进行理性的选择,而是通过偶然的试错过程发现了最优的策略。当所有个体都完成了最优生存策略的“自然选择”之后,就达到了纳什均衡。个体因为发生突变而面对不同的生存策略,而不同的生存策略给个体带来了不同的生存适应度。只有那些带来最大适应度的策略才可以让个体生存下去,而通过遗传,那些成功地“自然”选择了最优策略的个体便把自己的基因遗传了下来,而其他物种个体便灭绝了。博弈论专家证明,这种自然选择出来的最优策略是纳什均衡策略,尽管并不假定生命个体一定是理性人——这避免了传统经济学理性人假设带来的尴尬,因为心理学家经常会批评这样的假定。

在人类出现的东非大峡谷,那些高个子的人类祖先,因为生存更加困难(高个子更容易被豺狼虎豹看见,在野兽追来时更难以躲避),心脏负荷大,需要更多的食物而处于生存劣势。因此,只有那些生存能力较强的高个子基因遗传下来了。这是一种不对称信息博弈中的信号博弈现象。高个子是发送优良基因的信号,所以人们在谈对象的时候,一般喜欢高个子,这是因为他们或许载有更加优良的基因,可以通过与他们结合把自己的基因遗传下去,因为既然高个子生存更加困难,但是当他们还生存着时,就意味着他们具有更加强大的生存基因。表面看起来,喜欢高个子是因为我们觉得高个子赏心悦目,是美的元素。其实,人类的美感是与生存能力联系起来的。这是所谓进化博弈论的发现。

博弈论中最具魅力的部分是信号博弈。在进化博弈论里,信号博弈把过去人们认为是纯粹主观性的审美解读成进化中的生存博弈形成的策略,当然是物种在进化过程中的纯粹是自然选择的策略。

信号博弈还可以解释官僚贪污现象。官员贪污腐败是忠诚的信号。读者可能会觉得奇怪:贪污腐败怎么与忠诚联系在一起?其实,政府官员贪污尽管是古今中外都普遍存在的现象,但是从历史上看,在东方要盛于西方。在东方,至少在过去,特别是东方一些完成现代化进程之前的国家,贪污甚至是人们习以为常的,或者说是老百姓看来无可奈何的现象。同时,我们注意到,在历史上,东方也普遍采取专制社会的社会治理模式,以至在文献上会出现“东方专制社会”的术语。

我们下面从博弈论的信号发送机制出发,说明这两个社会现象之间存在着密切的联系,即专制社会与官员贪污腐败之间存在着因果关系。专制会带来贪污腐败,或者说比非专制社会更加普遍的贪污腐败现象,这种因果关系并不是简单地因为专制社会缺乏对于官员的监督,而是因为在专制社会里,官员向其上司表忠诚,可以通过自己贪污腐败来发送忠诚的信号,以利于保护自己。

在专制社会,官员的全部命运基本上都掌握在他上司手里。上司可以决定他们的升迁,甚至掌控着他们的身家性命!

官员为了保护自己,让上司找不到任何可以灭掉自己的口实,或者让上司相信自己不会谋反,自己是完全忠诚于上司的,就需要发送这样的信号给上司——我是忠诚于您的!

但是,发送的信号必须要满足“可置信”的条件。上司怎么才会相信你的表白呢?

如果你非常清廉,这样就会有好的声誉。一旦你谋反成功,譬如谋朝篡位,你的好声望就会让人民接受你,而让想攻击你的潜在敌人感到要击败你是比较困难的。正是你的好声誉会助你谋反成功。

但是,如果你的声誉很糟糕,即使你谋反成功,人民也不会接受你,你的敌人也会利用这一点对你发起攻击,并且会得到人民的响应,你会落败的。

这样,当你具有好的声誉时,你谋反成功并且取而代之的动机就会比较强烈,相反,你的坏声誉会增加你谋反成功的难度,你的谋反动机也就比较小了。

如果你并不想谋反,同时也要向上司表明你的忠诚,你就可以采取自毁声誉的办法,增加你谋反成功的难度,同时也告诉你的上司,你是不会谋反的,因为你谋反成功的机会很小!这种信号是可置信的。

当你的上司相信你不会谋反时,你就成功地保护了自己。

当然,官员的贪污不仅仅是为了实施这样的策略,也有真正对于财富的贪婪。但是,人们对于财富的贪婪无论在东方还是西方社会都应该是一样的,为什么在东方社会要更加普遍?这是因为东方社会普遍存在的专制治理模式给这一信号发送提供了动力。所以,贪污作为信号是有一定解释力的。

当然,这种信号理论比较适合解释皇帝身边的权臣贪污,并不能解释下层官员的贪污。譬如,和珅生活在乾隆皇帝身边,但是其贪得无厌到了不能企及的程度,乾隆皇帝反而对他宠爱有加。

据说张良在跟随刘邦进入京城的时候,便叫家丁们到街上去打砸抢。这样的自毁声誉与贪污行为其实都是保护自己的策略,两者异曲同工。

博弈论看起来深刻奥妙,有一些玄乎。其实,博弈论就在我们身边,每时每刻,无所不在。2013年春,朝鲜三次核爆,单方面宣布《朝鲜停战协定》无效,大肆反美,令全世界都为朝鲜捏了一把汗。其实,如果从博弈策略的角度分析,朝鲜是有充分的自信的。朝鲜知道,美国其实是不会打击朝鲜的。如果美国对朝鲜进行核打击,则东北亚会出现核污染,会伤及驻日本和韩国的美军。美国政府在选民的压力下不得不从东北亚撤出。这样,美国在东北亚核战争中不仅一无所得,而且还会遭到全世界的责骂,并且灰溜溜地从长期盘踞的东北亚撤出。如果美国用高科技常规武器打击朝鲜,朝鲜会用核武器反击,美军大败,加上东北亚的核污染,导致美国同样会从东北亚撤出,朝鲜会崛起,统一半岛。所以,美国人并不会对朝鲜进行打击,无论是用核武器还是常规武器。事实上,这样的判断是存在先例的。1969年,当时因为中国与苏联在珍宝岛的冲突,苏联打算对中国进行核打击,被美国的尼克松总统干预制止了。尼克松并不是要帮中国的忙,而是怕中国与苏联的核战争污染了驻日本和韩国的美军,导致美军不得不撤出东北亚。由此,朝鲜核爆反美是它的占优策略——这是博弈论的术语,即在任何情况下都是最优的策略。

因此,朝鲜完全可以大张旗鼓地反美,不断进行核爆挑衅,并不担心美国会拿它怎么样。我们看到,在朝鲜不断升级的挑衅下,美国人基本上是无动于衷的。因为一方面是朝鲜猜透了美国人的想法——他们不敢动真格;另一方面,美国人也猜出了朝鲜的想法,知道他们知道自己的想法——这就是博弈论——你知道他知道你知道他的……这就是博弈!

既然是这样,双方都是在演戏,那么,朝鲜演这出戏是给谁看呢?答案是:演给朝鲜的老百姓看。这样,新上台的领导会树立威信——瞧瞧,咱弄得美国佬都拿咱没有办法!——还行吧!其实,在朝鲜核爆的背后存在好几个博弈呢!在这样的情况下,当朝鲜雄起的时候,美国只有处于守势,而给定美国处于守势,朝鲜当然会选择攻势——这是众所周知的胆小鬼博弈,或者叫做斗鸡博弈。而且,朝鲜玩的是边缘博弈,并且,朝鲜越是疯狂,其实是表面上看起来是疯狂,越是脱离中国或者俄罗斯的管束,边缘博弈的威慑作用就越大,不知道有多少人看出了这一点!

好了,我们看到,潜藏在博弈论精深的数学模型背后的故事是多么地精彩!每一个博弈论模型都有着一个好听的故事。本套丛书就为大家提供了更多更加好听的故事,赶快去读读吧……

蒲勇健
2013年3月20日
重庆渝中区瑞天路雍江苑 v232jSHNolREtZixnRtfum/nQbX9oHudiYRg5to4jQhh6iJbocMm6EXT2AekE85D

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开