购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

劣势策略

不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。

一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

假如你只有两个策略可以选择,其中一个是劣势,那么另一个一定是优势策略。因此,与选择优势策略做法完全不同的 规避劣势策略做法,必须建立在至少一方拥有至少三个策略的博弈的基础之上。 现在就让我们看一个这种类型的简单例子。

设想一场橄榄球比赛的一次对抗。攻方一门心思竭尽全力向前推进,能跑几码算几码,而守方则全力以赴阻挡对方向前移动,寸步不让。举个例子:当比赛只剩下很少时间,攻方可能希望尽力推进,使自己更容易得到一个射门得分的机会。

假如攻方只有两个策略,即带球跑或者传球,而守方则有三个策略——拦截带球跑、拦截传球以及闪击四分卫(blitz the quarterback)。我们可以计算出全部六种策略组合分别能使攻方向前推进多少码。以守方选择闪击四分卫而攻方打算传球为例。假设四分卫被撞得倒退10码的概率是10%,迅速传球传出10码的概率是70%,而传球传出更远达到20码的概率是20%。那么,平均值就是

0.1×(-10)+0.7×10+0.2×20=-1+7+4=10

显而易见,这些数字本应该以两队拥有或者缺少的特殊技能为基础;我们只不过为了描述方便而选择了一些非常独特的技巧。

我们用图3-6显示所有六种策略组合将会得出怎样的计算结果。

如图3-6所示,攻方竭力要得到最大数目,守方则尽量压低这个数目,因此,我们没有必要分开列表确定他们的行动。

图3-6 攻方期望得到的码数

双方都没有一个优势策略:没有一行的数字完全高于另一行,也没有一列的数字完全低于另一列。不过,守方倒是有一个劣势策略,就是闪击四分卫。闪击四分卫的结果是无论如何都会拱手让出较大的码数,因此,这一策略对于守方而言会比它采用其他可能的策略都更糟糕。因此,守方不应该闪击四分卫,攻方也可以非常自信地认定对手不会那么做。

至此,这场推导尚未结束。闪击策略可能从守方教练的笔记本中删除了,整个比赛可以被视为双方各有两个策略。在这场经过简化的比赛中,攻方有一个优势策略,就是传球。其数字分别是9和8,都大于带球跑策略的数字,分别是3和7。传球之所以不是原来的比赛的优势策略,原因在于,带球跑的结果在守方采取闪击策略的时候会有一个比较理想的结果(因为带球跑者可能趁守方闪击四分卫而分身乏术时,顺利突入开阔地带),而现在闪击策略已经不予考虑。因此,攻方将会选择传球。反过来,守方也会想到这一点,选择自己的最佳策略,即防守传球。

这里涉及的普遍适用的概念可以归纳为一个指导相继移动的博弈的行动法则。

法则3:剔除所有劣势策略,不予考虑,如此一步一步做下去。

假如在这么做的过程当中,在较小的博弈里出现了优势策略,应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终,它也会缩小整个博弈的规模,降低博弈的复杂程度。

我们以一个虚构的波斯湾海军对峙局势具体描述逐步剔除劣势策略的做法。 图3-7所示的格栅代表战斗舰艇的方位以及可能的选择。I点的一艘伊拉克舰艇准备发射一枚导弹,企图击毁A点的一艘美国舰艇。这枚导弹的路径已经由电脑程序在发射的时候确定,可以直线前进,也可以每隔20秒大幅转动一个直角。假如这枚伊拉克导弹笔直从I点飞向A点,美国导弹防御系统可以非常轻易地进行拦截。因此,伊拉克一定会尝试带点拐弯的路径。所有能从I点通向A点的路径已经由下面的格栅显示出来。每条边的长度,比如IF的长度,等于这枚导弹20秒之内可以走过的距离。

那艘美国舰艇的雷达会监测到伊拉克舰艇发射的这枚导弹,因此电脑会马上发射一枚反导弹。反导弹的速度和伊拉克导弹相同,也可以做同样的90°拐弯。于是,这枚反导弹的路径也可以用同样的格栅表示,只不过这次是由A点出发。但是,为了填装足够撞毁一枚导弹的爆炸物,反导弹不得不少装燃料,装的燃料只够它飞行1分钟,因此,它只能走过三个节点(比如,从A点到B点,B点到C点,然后再从C点到F点,这一路径我们用ABCF表示)。

图3-7

假如在这1分钟开始之前或者结束之际,我们的反导弹将与来犯的导弹相遇,那么,反导弹就会爆炸,消除伊拉克导弹的威胁,否则伊拉克导弹就会击中我们的舰艇。问题是,应该怎样选择两枚导弹的路径?

在这个博弈里,值得关注的只有第1分钟的路径。各方必须事先想好三个20秒时间段应该怎么走。将每个时间段的可能选择加起来,双方各有8条可能的路径,共有64种组合方式。我们现在就来考察全部64种组合方式,计算哪些方式下反导弹和导弹会迎头相撞,哪些方式下不会相撞。

举个例子:假设伊拉克选择IFCB,即头两个时间段直线从I点经F点到C点,然后转90°到B点。对照美国的ABCF策略,可见,反导弹和导弹将在两个时间段(即40秒)之后在C点相遇,因此这一组合的结果是相撞。假如伊拉克还是采取IFCB策略,而美国却选择ABEF迎击,反导弹和导弹就不会相撞。表面上看来,上述弹道都经过B点和F点,但反导弹和导弹是在不同时间达到这些点;比如美国反导弹20秒后到达B点,而伊拉克导弹则要在60秒后到达。

图3-8显示了所有这样的组合。伊拉克的8个策略分别标为I1到I8,同时标出具体路径,比如I1表示IFCB。同样地,美国的策略用A1到A8表示。相撞的结果记做H,不会相撞的结果记做O。

图3-8 击中与错过图

图3-8看起来好像很复杂,但只要借助消除劣势策略的法则,就能将其大大简化。美国反导弹的目标在于得到相撞的结果,因此在美国人看来,H强于O。不难看出,对于美国人,A2策略与A4策略相比处于劣势:假如你将A4行拿起来,盖在A2行上面,你会发现,只要是A2得到H的地方,A4也会得到H,而且A4还多一个H,即对应伊拉克I5策略的地方。对全部可能性进行这样的分析,可以知道A2、A3、A6和A7策略与A4和A8策略相比处于劣势,A1不及A8,A5又不及A4(简化过程详见图3-9)。因此,伊拉克人可以确信美国人只会采取A4或者A8策略。伊拉克人 把注意力集中在这两行, 一心想避免反导弹和导弹相撞,因此在他们看来,I2、I3、I4、I6、I7和I8策略与I1或者I5策略相比处于劣势。划掉劣势策略所在的行和列之后,整个博弈就简化为图3-10。

图3-9 击中与错过图

我们的两个法则不可能将图3-10进一步简化了,因为这里已经没有任何优势策略或者劣势策略可言。不过,我们已经做得很不错了。看一看表格里剩下的策略,我们发现,伊拉克导弹应该沿着格栅外围前进,而美国反导弹则应该小步曲折前进。这样,我们很快就能看到双方应该怎样从各自拥有的两个方案中进行抉择了。

图3-10 简化的击中与错过图 jyt/melb18j/B2QtvBKjEflKlc0zUWepFB0HGyhKERgkL5iNcvAu4/YK8JRd235W

点击中间区域
呼出菜单
上一章
目录
下一章
×