博弈论：人人都在用的博弈技巧最新章节_徐文著

警察与小偷的博弈

是不是所有博弈都存在一个纯策略（指参与者在其策略空间中选取的唯一确定的策略）的纳什均衡点呢？答案是否定的。除了上面叙说多次的、大家比较熟悉的纯策略均衡点外，有的博弈并没有一个确定的、唯一的策略，而是存在一个混合策略（指参与者采取的不是确定的唯一的策略，而是在其策略空间中以概率来选择不同策略）均衡点。下面我们将以警察与小偷的博弈为例，对混合策略均衡点进行说明。

某小镇只有一名巡逻警察，他一个人要负责整个镇的治安。假定该小镇主要分为A、B两区，A区有一家建设银行，B区有一家金银首饰店。再假定这个小镇有一个小偷，要对该镇实施偷盗行为。因为没有分身术，警察一次只能在一个区巡逻；而对于小偷来说，一次也只能去一个地方行窃。

假定A区建设银行需要保护的财产为2万元，B区首饰店的财产价值1万元。若警察在A区巡逻，而小偷也恰巧选择去了该地，小偷就会被警察当场抓住，该区建设银行的2万元财产就不会损失；若警察在A区巡逻，而小偷却选择去了B区，因没有警察的保护，小偷偷盗成功，B区首饰店的1万元财产将分文不剩，全落进小偷的腰包。

在这种情况下，警察要怎样巡逻才能使效果最好呢？

如果按照先前的思路——只能选取一个确定的唯一的策略，那么明显的做法是：警察在A区巡逻，可以保护该区建设银行的2万元财产不被偷窃。而小偷去B区，偷窃一定成功，B区首饰店的1万元财产尽归小偷所有。也就是说警察的收益是2万元，而小偷的收益是1万元。

但是，这种做法是警察的最佳策略吗？存不存在一种更好的策略或者说能不能对这种策略进行改进呢？

若警察在A区或B区巡逻，而小偷也正好选择去A区或B区，则小偷无法实施偷盗，此时警察的收益为3（保住A区建设银行和B区首饰店共3万元财产），小偷的收益为0（没有收益），记作（3，0）。

若警察在A区巡逻，而小偷去B区偷盗，此时，警察的收益为2（保住A区建设银行2万元财产），小偷的收益为1（成功偷盗B区首饰店1万元财产），记作（2，1）。

若警察在B区巡逻，而小偷去A区偷盗，此时，警察的收益为1（保住B区首饰店1万元财产），小偷的收益为2（成功偷盗A区建设银行2万元财产），记作（1，2）。

警察与小偷的收益可写成如下的收益矩阵：

由上面分析，我们可以得出这个博弈没有纯策略纳什均衡点，只有混合策略均衡点。在混合策略均衡点下，双方的策略选择是其最优策略选择。

此时，警察的一个最佳选择是：用抽签的方法决定去A区巡逻还是去B区巡逻。因为A区建设银行的财产价值是B区首饰店的两倍，所以用两个签（比如1、2）代表去A区巡逻，一个签（比如3）代表去B区巡逻。如果抽到1、2号签，就去A区巡逻；如果抽到3号签，就去B区巡逻。这样警察就有2/3的概率去A区巡逻，1/3的概率去B区巡逻，其概率的大小与巡逻地的财产价值成正比。

而小偷的最优选择也是同样以抽签的办法决定去A区行窃还是去B区偷盗，只是与警察相反：小偷抽到1、2号签去B区行窃，抽到3号签去A区行窃。那么，小偷就有1/3的概率去A区偷盗，2/3的概率去B区偷盗。

上面所说的警察与小偷所采取的策略便是混合策略。

按上述混合策略，警察的总期望收益是7/3万元，与只巡逻A区得2万元的收益的策略相比，明显得到了提高。

原因如下：

当警察去A区巡逻时，小偷有1/3的概率去A区偷盗，2/3的概率去B区偷盗，此时，警察巡逻A区的期望收益为7/3（1/3×3+2/3×2=7/3）万元；当警察去B区巡逻时，小偷同样有1/3的概率去A区偷盗，2/3的概率去B区偷盗，此时，警察巡逻B区的期望收益为7/3（1/3×1+2/3×3=7/3）万元。警察的总期望收益为7/3（2/3×7/3+1/3×7/3=7/3）万元。

同理，我们也可知小偷采取混合策略的总期望收益是2/3万元，比得1万元收益的只偷盗B区的策略（前提是警察只巡逻A区）要差。

当博弈一方所得为另一方所失时，对于博弈的任何一方而言，此时只有混合策略均衡点，而不可能有纯策略的纳什均衡点。