行为供应链博弈模型及其复杂性研究最新章节_李秋香著

2.2　博弈理论

2.2.1　基本理论

字面意思上博弈论可以理解为来自游戏的理论，是应用数学的一个分支。博弈论最初起源于牌、赌博等游戏，主要研究棋牌类游戏中的胜负问题。从定义上看，博弈是在特定的条件和游戏规则下，博弈中的人或者组织从允许的策略中同时或者先后进行选择并加以实施的过程。1944年，《对策论及其在经济领域中的应用》一书发表代表了博弈论真正作为理论发展起来，这本著作当时在经济、数学、社会领域引起了很大反响。后来博弈理论被广泛应用到多门学科中，作为一种有效的方法经常用于复杂网络系统和供应链系统的分析。

用博弈论研究复杂系统，主要是研究各主体或组成部分之间的相互影响。一方的条件和选择发生变化都会影响到其他主体和组成部分的选择，博弈方之间是有利益冲突的。在考虑对方选择的影响下，为了自身利益最大化参与者各自做出理智的决策。

1. 博弈的基本要素

一般博弈问题包括以下几个要素：

博弈的参与者（Players）：指在一场博弈或者竞赛中，能够独立进行决策并能独立承担博弈结果的博弈方。一次博弈至少有两个博弈方，如果有 n 个博弈方，则成为 n 人博弈。

博弈方的策略空间：每个博弈参与者可选择的策略集合。

博弈的顺序：博弈的参与者要做多次次序不同的博弈，所以博弈方要确定行动的次序。这样即使博弈的其他要素是相同的，也是不同的博弈，产生的结果往往有本质的不同。

博弈方的得失（Payoffs）：博弈结束时，每个博弈方通过收益函数或者赢利函数计算自己的得失，是博弈方所选定的策略的博弈效果。

博弈的信息（Information）：是指博弈参与者在决策时所获取的信息。

理性：理性人在博弈中会对所有的策略结果进行排序。在博弈过程中，根据其他博弈方的策略，选择能带来最高收益的策略。理性又分为完全理性和不完全理性，现实中，人不可能是完全理性的，大多处于完全理性和不完全理性之间。管理学家西蒙提出了“有限理性”的概念。他认为决策者会受到自身能力、外部环境和认知能力的影响，因而决策人表现出有限理性的机制。

均衡：表示系统中各决策方处于一种稳定状态。

目标：局中人所期望实现的结果，通常用局中人的目标函数表示，局中人通过策略选择来实现。

2. 博弈的类型

按照不同角度，博弈可以分成不同类别：根据博弈参加者是否合作，可将博弈分为合作博弈和非合作博弈；根据参加者决策是否具有先后顺序，可将博弈分为静态博弈和动态博弈。根据参加者对其他参与者的信息是否完全了解，可将博弈分为完全信息博弈和不完全信息博弈；同时还可以根据博弈次数、博弈时间等对博弈进行分类。表2-1归纳了博弈的主要类型，下面的这些分类都有其特定的意义。博弈结构差异对博弈的分析方法、分析过程和分析结果都有重要影响。

表2-1　博弈类型

任何一个完整的博弈均包括四个要素：①局中人，即博弈的参加者，在博弈过程中独立决策、独立承担后果的个人和组织。局中人可能是自然人也可能是团体，如国家、企业，甚至是若干个国家组成的集团，如欧盟，北约。一般来说，博弈方的数量越多，博弈过程就会越复杂，博弈结果就越难预测。②博弈方的策略空间，策略空间是博弈方可选择策略的集合，每个策略都对应着一个博弈结果。③博弈顺序，博弈顺序是指博弈方进行博弈行动的次序，在相同博弈方、策略空间下，同时决策行动和先后决策行动，其结果往往有本质的变化，博弈次序对于博弈结果影响巨大。④博弈方的收益，收益是博弈结束后，各博弈方的“得失”。收益一般通过收益函数计算得出，收益函数通常又称为赢利函数（或支付函数），是全体局中人所取定的一组策略的函数。

博弈按照不同角度可以分为合作博弈和非合作博弈；静态博弈和动态博弈；完全信息博弈和不完全信息博弈；完全信息静态博弈和不完全信息静态博弈；零和博弈、常和博弈和变和博弈、序贯博弈和重复博弈等类型。

（1）合作博弈、非合作博弈

按照博弈方之间是否进行合作，博弈可划分为合作博弈和非合作博弈。合作博弈是研究人们达成合作时如何分配共享收益。一般方法是参与人之间制定一个对各方具有约束力的协议，各参与人在协议范围内进行博弈，合作博弈强调的是收益分配问题。非合作博弈是研究各博弈方在利益相互影响的局势中以自己收益最大化进行决策的博弈，强调的是策略选择问题。本书中合作博弈的决策依据是各个节点企业均以风险规避型的供应链总收益最大化，非合作博弈的决策依据是各个节点企业以自己收益最大化。

（2）完全信息博弈、不完全信息博弈

按照博弈方对其他参与人的特征、策略空间、支付函数等方面的了解程度进行分类，博弈可划分为完全信息博弈和不完全信息博弈。完全信息博弈指在博弈过程中，每个参与人掌握所有其他参与人的特征、策略空间及支付函数的准确信息；反之，就是不完全信息博弈。

（3）静态博弈、动态博弈

按照博弈方的行动先后顺序进行分类，博弈可划分为静态博弈和动态博弈。静态博弈是在博弈过程中，博弈方同时选择行动，或者不同时但后行动者并不知道先行动者采取的具体行动。动态博弈指在博弈过程中，博弈方有主导者和跟随者，博弈方的行动有先后顺序。一般主导者先行动，跟随者后行为，且跟随者能够观察到主导者选择的行动，如Stackelberg博弈。

（4）零和博弈、常和博弈、变和博弈

按照收益情况划分，可划分为零和博弈、常和博弈、变和博弈。零和博弈指一方收益必然来自另一方的损失。因此，零和博弈的博弈方始终是对立关系。常和博弈指博弈各方都会有收益，但收益总和是一个固定的常数。变和博弈指各方博弈方的策略组合不同会有不同收益。

（5）序贯博弈、重复博弈

在动态博弈中，参与人前一个阶段的行动选择决定其后的博弈结构，即后一个博弈决策不同于前一个博弈决策。重复博弈是同样结构的博弈重复多次，其中，每次博弈称为阶段博弈。重复博弈的基本特征主要有三个：①前一阶段博弈不改变后一个阶段博弈的结构；②所有博弈参与方都能观测到过去博弈的历史；③参与方的总支付是所有阶段博弈支付的贴现值之和或者加权平均值。影响重复博弈均衡解的主要因素是信息的完备性和重复次数。

3. 纳什（Nash）均衡

在完全信息静态博弈中，在给定其他人策略的条件下，每个参与方选择自己的最优策略；当其他人不改变策略时，此时的策略是最好的，这种策略组合就是纳什均衡。此时如果改变策略将会导致收益降低。所以，在纳什均衡点，每一个理性的参与方都不会有单独改变策略的冲动。任何有限纯策略的二人博弈至少有一个均衡偶，即纳什均衡点。寻找均衡点的存在性相当于找到博弈模型的不动点。纳什均衡点是一种非常重要的分析手段，可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点局限于任何参与方不想单方面改变策略，而忽视了其他参与人改变策略的可能性。因此，纳什均衡点的结论在很多情况下缺乏说服力。纳什均衡是博弈论中最重要的一个概念。经济学中，博弈均衡是指使博弈的参与者都实现自身的最大利益，这意味着博弈各参与者对已有的市场平衡满意。所有参与者都不想也没有动力改变自己策略的状态。

下面给出纳什均衡的数学定义：

设 G ={ S ₁ ，…， S _n ； u ₁ ，…， u _n }表示一个对策，其中，包括 n 个局中人， S ₁ ，…， S _n 表示每个局中人可以选择的策略， u ₁ ，…， u _n 是各局中人的收益函数，如果存在一个策略组合，…，，∃ ，使，… ，，… 为最佳策略组合，称，…，为 G 的一个纳什均衡。

总之，博弈论的本质是通过数学和逻辑学的办法来分析日常生活中的竞争和矛盾。因此我们要深入研究这些规则和规律，从而使竞争最终按照预期运作。

2.2.2　经典的博弈模型

寡头垄断（Oligopoly）是现实经济运行中最常见的市场结构。其主要理论模型有古诺博弈、斯坦克尔伯格博弈和伯川德博弈。

1. 古诺模型（Cournot Model）

法国经济学家安东尼·奥古斯丁·库尔诺（又译为古诺）1938年提出了古诺模型，也称为古诺双寡头模型（Cournot Duopoly Model）。在古诺研究的基础上，很多学者对市场中存在三个或三个以上的寡头厂商竞争的情况进行了研究。

古诺模型是在一定条件下进行研究的，主要包括以下几个方面：

（1）古诺模型考虑的是市场上只有两家生产厂商，且都是为了实现自身利润最大化，生产的产品是同质的。

（2）寡头生产商以决策变量进行博弈。每家厂商的产量都是对另外一方产量预期的函数，同一时期内，两个寡头同时决策，产量决策相互之间不会影响。

（3）生产商依据竞争者的上期决策信息确定自身的产量。

（4）生产成本均为零，每个寡头都能够准确地了解市场的需求曲线。

（5）需求函数是线性形式的。

古诺模型有一定的使用范围，但现实中的供应链博弈不能用古诺博弈进行分析，如现实中供应链的企业主体不能完全掌握对方信息，竞争者提供的产品不是同质的，这些影响因素导致古诺博弈的结果与现实情况大相径庭。现实中多数企业之间通过价格进行博弈，而古诺模型是针对产量进行博弈。为了使博弈更加贴近于现实情况，很多学者对古诺模型进行了改进。

2. 斯坦克尔伯格均衡（Stackelberg Equilibrium）

1934年，德国经济学家Stackelberg提出了斯坦克尔伯格模型。模型假设市场中存在两大类参与方，一类处于主导地位，另一类处于顺从地位。处于领导地位的参与方先做出决策，处于跟随地位的参与者马上根据领导者的决策信息确定自己的策略。因此，领导参与者做决策时，也会考虑跟随参与者的决策结果。与古诺模型相比，斯坦克尔伯格模型有以下两点不同：

（1）古诺模型假设寡头厂商具有同等地位，斯坦克尔伯格模型假定厂商处于主从地位。

（2）古诺模型中寡头厂商具有同等规模，斯坦克尔伯格模型中跟随厂商的规模一般比较小。

斯坦克尔伯格模型正是针对如下市场现状提出的：跟随厂商规模比较小，他们的决策成本高。在这种情况下不具备决策优势，跟随领导厂商可以降低它的决策成本和风险。斯坦克尔伯格模型决策过程为：首先，为了实现自身利润最大化，领导者根据市场的情况和跟随者的情况制定自己的决策。其次，跟随者根据领导者的决策制定自己的决策。下面解释斯坦科尔伯格模型的博弈过程。

假设市场需求函数为：

其中， Q = q ₁ + q ₂ ，则可以得到生产商1的利润：

跟随生产商2的利润为：

可以得到：

由于生产商1预料到生产商2根据 q ₁ 来确定自身的产量，可以计算出生产商1的最优产量：

假设 c ₁ = c ₂ ，均衡使双方的利润为：

在以制造商为主导的风险规避型供应链中，零售商为跟随者。零售商根据观察到的先动制造商的信息进行决策。

3. 伯川德模型

1883年，法国经济学家约瑟夫·贝特兰德（又译伯川德）提出了伯川德模型（Bertrand）。与古诺模型不同，伯川德模型以产品价格为决策变量，而不是产品产量。因此伯川德模型是关于价格竞争的模型。分析伯川德模型时作如下假设：

（1）寡头制造商生产同质产品，生产能力无限，并同时决策进行市场竞争；

（2）寡头制造商的生产成本是相同的；

（3）寡头制造商之间没有正式或非正式的串谋行为。

下面来分析伯川德模型均衡的形成过程。假定两个制造商 A 和 B ，若 A 制定产品价格为 p _a 并能获得一个正的利润，这时 B 制定产品的价格 p _b 低于 p _a ，消费者只会选择购买 B 的产品，而厂商 A 的利润为零；同理，若 B 制定产品价格为 p _b 并能获得一个正的利润，这时 A 制定产品的价格 p _a 低于 p _b ，消费者只会选择购买 A 的产品，厂商 B 的利润为零。 A 和 B 的产品价格最终确定为边际成本，这时如果制造商提价，没有利润；降价，定价会低于生产成本，同样无法盈利。通过分析得到一个结论，对于伯川德模型，定价低的制造商将会赢得市场的全部利润；经过长期博弈，产品的定价最终等于产品的边际成本，制造商的利润为零。这显然与现实中寡头竞争的情况不一致，这就是著名的“伯川德悖论”。出现这种情况与伯川德模型的假设条件有关：

（1）模型中对制造商的生产能力是没有限制的。如果制造商生产能力有限，市场需求部分不能得到满足，产品价格就会高于边际成本。

（2）制造商的产品是完全替代的。如果制造商生产的产品有差异，制造商之间就会避免直接价格竞争。

解开“伯川德悖论”的办法之一是引入产品的差异性。在产品存在差异的情况下，均衡价格就不会等于边际成本。下面考虑一种具有特殊的差异（空间上的差异）模型—经典的Hotelling模型。

4. Hotelling模型

在经典的Hotelling中，产品是同质的，主要考虑产品在空间上的差异。决定顾客是否购买产品的主要原因是价格与运输成本。假定两个零售商 A 和 B 位于一个长度为1的线性城市的两端，即 A 位于 x =0处， B 位于 x =1处，所有的顾客都均匀地分布在［0，1］区间内。假定每个产品的边际成本和单位成本固定不变且为零，如果有零售商进入市场参与竞争，每个产品的边际成本和单位成本固定不变且为零。 c 为每个顾客购买产品的距离成本，顾客购买产品的运输成本与厂商的距离成比例。显然，处于 x 位置的消费者在 A 处购买时的运输成本为 cx ，如果该消费者在 B 处购买，则运输成本为 c （1- x ）。

假定两个销售商同时确定自己的销售价格（ p ₁ ， p ₂ ）。当处于 x 位置的消费者购买两种产品无差异时，则处在 x 左侧的消费者将在 A 处购买， x 右侧的消费者将在 B 处购买，则 x 处满足： p ₁ + cx = p ₂ + c （1- x ）。通过计算可以得到需求函数：

根据公式（2-26）可以得到两个销售商的利润函数。对利润函数求一阶导数，同时判断二阶导数满足的条件即可得到两个销售商的价格。

由于Hotelling模型广泛应用于产品差异化竞争的分析，本书将Hotelling模型应用于供应链中，研究概率销售情况下的制造商和零售商的行为特征。

5. 博弈论在供应链中的应用

供应链中各节点企业间天然的博弈关系表现在：各企业以个人理性为研究出发点，符合博弈各方经济理性的假设；供应链中各节点企业间存在相互影响和相互依赖的关系，每个节点企业的决策行为会影响其他企业的决策，说明各企业间的关系具有博弈行为；博弈论的很多结论与供应链中企业之间的合作关系和管理方式等理念极为相似，如“纵向一体化”概念。应用博弈论的思想找出供应链的主要问题和约束条件，建立供应链博弈模型已成为应用最为广泛的工具和手段。

本书中主要涉及的博弈问题是竞争的零售商之间的博弈，制造商与零售商之间的博弈。一般情况下，供应链中各节点企业间的博弈问题通过三步来进行描述：

（1）将供应链问题用博弈模型表达出来。供应链中涉及的企业比较多，与企业利益相关的因素很多且相互制约。对供应链问题进行假设或简化，找出与企业利益相关的主要问题，并用博弈模型将供应链的主要问题描述出来。

（2）找出博弈模型的博弈结果。结合实际条件，用博弈论思想或者数学工具对供应链博弈模型进行求解，得出供应链模型的均衡解（博弈结果），结合实际情况对博弈结果进行分析。

（3）将博弈结果与第一步中所描述的供应链主要问题等信息结合起来进行分析。如果博弈结果与所描述的供应链主要问题发生冲突，说明第一步中建立的模型不合适，需要重新审视第一步所建立的博弈模型并做出修改。

很多学者将经典的博弈模型进行了扩展并运用到供应链建模中。Li和Li（同一姓氏）研究了一个关于零售服务和公平关切下双渠道供应链均衡问题。Snyder等研究了连续时间动态古诺调整模型。Ahmed等研究了一个动态伯川德寡头模型，有限理性公司没有采用梯度调整机制对价格进行调整。Wu和Gorder研究了动态多主体多阶层离散主从博弈。Yu和Yu（同一姓氏）主要研究了贝叶斯博弈的动态行为。这些学者从不同角度、不同领域对博弈模型进行了扩展，丰富了博弈模型的内容。

2.2 博弈理论

2.2.1 基本理论