购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

均衡策略

利用优势策略方法与劣势策略方法进行简化之后,整个博弈的复杂程度已经降到最低限度,不能继续简化,而我们也不得不面对循环推理的问题。 你的最佳策略要以对手的最佳策略为基础, 反过来从你的对手的角度分析也是一样。接下来我们将会介绍解开这个循环的技巧,最终走出这个循环。

为了说明这一点,我们首先回到《时代》与《新闻周刊》的价格战,不过这次不会假设备选价格只有2美元和3美元两种,而是一系列价格。现在,《时代》的管理层必须针对《新闻周刊》可能选择的每一个价格确定最佳策略。假设每种杂志都有一群忠实读者,也有一群可能受到价格竞争影响的流动读者。如果出于某种原因,《新闻周刊》的管理层把价格定在1美元的水平,也就是制作成本的水平,那么,《时代》的管理层一定不会跟随这个毫无盈利的价格策略,而会定出一个较高的价格,杂志仍然可以卖给忠实读者而获得一定利润。如果《新闻周刊》提价,那么《时代》也会提价,只不过幅度较小,从而为自己赢得一定的竞争优势。假定《新闻周刊》每提价1美元,《时代》的最佳策略是提价50美分,于是,我们可以用图3-11表示《时代》针对《新闻周刊》可能选择的每一个定价而确定的最佳策略。

我们假定两本杂志的成本一样,具有同等大小的忠实读者群以及同样的吸引流动读者群的能力。那么,《新闻周刊》针对《时代》可能选择的每一个定价而确定的最佳策略将与图3-11完全一致。

图3-11 击中与错过图

现在我们可以想象两种杂志的经理正各自埋头琢磨。《时代》的经理说:“如果他卖1美元,我就卖2美元。不过,他因为知道我这么想,所以不会真的卖1美元,而是执行他在我卖2美元时的最佳策略,即2.50美元。那样的话我就不能卖2美元,而是采用我在他卖2.50美元时的最佳策略,卖2.75美元。不过,他因为知道我这么想……”这样一层一层分析下去,究竟有完没完呢?

有的,结局是3美元。假如这位《时代》经理认为《新闻周刊》会卖3美元,那么他自己的最佳策略就是也卖3美元,反过来,从《新闻周刊》的角度分析也是一样。整个循环推理最后将聚成一点。

我们可以用图3—12来显示这个结果,该图同时反映了两者的策略。可以看到,两条线在两家都卖3美元的一点相交。

图3-12 击中与错过图

我们已经找到了一个策略组合,其中,各方的行动就是针对对方行动而确定的最佳策略。一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学者把这个结果称为 “均衡” 。这个概念是由普林斯顿大学数学家约翰·纳什提出的。纳什的想法成为我们指导同时行动博弈的最后一个法则的基础。这个法则如下。

法则4:寻找这个博弈的均衡,即一对策略,按照这对策略做,各个参与者的行动都是对对方行动的最佳回应。

这一定就是夏洛克·福尔摩斯和莫里亚蒂教授曾经用来看穿对方心思的秘诀。

我们还要解释一下这个法则。为什么一个博弈的参与者非得达到这么一个结局呢?我们可以说出好几个理由。没有一个理由本身就有足够的说服力,不过,只要把几个理由结合起来,就能形成一个有力的答案。

首先, 存在避免循环推理的必要, 因为循环推理帮不上忙。均衡在没完没了的“我知道他知道我知道……”的循环里是稳定不变的,这使参与者对其他人的行动的估计能保持连贯性。各方正确预计别人的行动,并且确定自己的最佳对策。

均衡策略的第二个好处出现在 零和博弈 中。在这种博弈里,参与者的利益严格相悖。你的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在做的事情会有什么样的最佳对策。

第三个理由是,均衡方法 注重实效 。要想证明一个东西是布丁,就要吃一吃。综观全书,我们将会利用均衡方法讨论许多博弈。我们希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为指导方针。我们相信,这么做会使我们提供的案例更有意思,比抽象地讨论均衡方法的优点更有意义。

最后,可能存在一个对均衡概念的误解,我们希望各位可以避免。当我们说 博弈的结果是均衡,并不自动意味着这就是对博弈的全体参与者最有利的结果,更不意味着是对整个社会作为一个整体而言最有利的结果。 有利或者不利的评价永远属于另外一个问题,答案视各个案例的具体情况而各有不同。在第4章和第9章,我们会谈到这两种例子。 gRJn+3xAkGuAowvdu5bKR36kTEQfXccfeQR+7v9l5f6wse3qoKC5W7piDIGV4f/n

点击中间区域
呼出菜单
上一章
目录
下一章
×