什么叫动态博弈呢?动态博弈与静态博弈是对应的,指游戏参与人的行动有先后顺序,而且行动在后的参与人可以观察到行动在先的参与者的选择,并据此作出相应的选择。这种博弈无论如何都无法看作同时决策,所以叫作动态博弈,也称“多阶段博弈”。先说结论,由于动态博弈这个特性,斗地主博弈也就同时具备了两个特点:多阶段和顺序性。
我们生活中最常见的静态博弈大家都玩过——石头、剪子、布。还有一个常被提起的典型的静态博弈是“囚徒困境”,背景是这样的,警察将两个嫌疑人同伙关在不同的屋子里。警方给出的政策是:
①如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年。
②如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
③如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
表1-1所示是决策矩阵。后面我们也会用到类似方法。
表1-1 囚徒困境规则
研究表明,当两个人没有串通的情况下,“坦白”是对任一方来说情况不会变得更差的选择,所以在“囚徒困境”中都坦白是一个均衡状态(学术上称之为纳什均衡)。
“石头、剪子、布”和“囚徒困境”都是静态博弈,也称为一次性博弈。决策是同时做出的,我们没法根据其他人的抉择来确定自己的策略,只能揣摩。而斗地主是多阶段的动态博弈。动态博弈与静态博弈有两个重要区别:
①多阶段性,上一个阶段的最优选择有可能在下一个阶段变为最差,一系列的最优选择累加起来结果可能并不好。
②顺序性,在动态博弈中有先后顺序,有的时候先动者有优势,有的时候后动者有优势。顺序是做决策的重要考虑因素。
有人说你讲这个有啥用,有了这两个特点又能怎么样呢?有了这两个特点就会得出斗地主中比较高级的技巧——信号牌。由于斗地主具备多阶段和顺序性这两个特点,让发送“信号”和接收“信号”变得非常有意义,很多打牌高手往往深谙此道。
至此,我们已经推导出了斗地主技巧的理论框架。由于斗地主是三方参与的、非完全信息的动态博弈,这就引出了斗地主技巧体系的核心问题:
我是什么角色?(叫分、角色决定了策略)
如何让队友知道自己的牌型?(信号牌,发信号和收信号)
如何获得更多的牌的信息?(记牌和算牌,即牌张、牌型、在谁手里)
我当前的最优行牌方案是什么?
以上4个问题基本覆盖了所有斗地主技巧,这其实也正是斗地主的大体流程,叫地主、出牌循环(同时算牌),最终决出胜负。下面将结合大数据分析和真实大赛案例,通过叫分、记牌和分角色技巧,循序渐进地探讨如何提高斗地主技巧。
√斗地主的三个特点:三方参与、非完全信息、动态博弈。
√三方参与:自己的角色及行牌策略。
√非完全信息:记牌和算牌。
√动态博弈:叫分博弈、行牌方案、收发信号。