博弈论 [196] 又称对策论(Game Theory),是通过建立具有斗争或竞争性质现象的数学理论模型以研究博弈过程中各博弈方的预测行为及实际行为并研究其优化策略的研究理论,已成为现代数学及运筹学的重要分支学科。博弈理论已成为多学科的标准分析工具之一,在金融学、证券学、生物学、管理学等各类学科中应用广泛。在经济学类文献中,古诺(1838)、伯特兰(1883)和埃德格沃思(1925)研究的垄断定价和生产是对博弈论的最早研究。然而,他们的研究并没有改变大多数经济学家所认为存在问题的方法,因而被认为是一个特例。1944年,约翰·冯·诺依曼(John Von Neumann)与奥斯卡·莫根泰(Oskar Morgenetern)在他们的著作《博弈论与经济行为》中引入了普遍博弈论的思想,他们在书中提出,大多数经济问题都应该被看作是一种分析博弈。
在供应链的研究中,最常用的博弈理论是演化博弈理论、斯坦伯格博弈理论,还有个别学者研究对称信息与非对称信息、完全信息与非完全信息下闭环供应链的博弈。运用博弈理论,可以研究定价、组合、回收、协调、最优决策等几乎所有闭环供应链中的影响因素,研究经验丰富,研究基础稳固,博弈理论已成为供应链管理理论研究的重要研究工具。
博弈论可分为合作(Cooperative)博弈和非合作(Non-cooperative)博弈两大分支。合作博弈理论研究的为各博弈方达成合作时应如何分配合作所得收益,即收益分配问题。合作博弈通过合作剩余方式提升各妥协方收益从而提升社会效益。然而,合作剩余在博弈方之间分配受制于博弈方的力量对比关系及策略运用。
合作博弈与非合作博弈的重要区别在于是否达成信息互通以及是否有约束力的可执行契约。信息对称是博弈方为相同目标而合作的前提和基础条件。然而净收益的内部分配,则需要有可强制执行的契约来保证。在供应链研究中,马德青 [197] 利用纳什博弈理论,构建了具有纳什公平关切参考点的“嫉妒—自豪”型的零售商公平效用泛函;并利用微分博弈理论,给制造商设计了均衡批发价格和回收努力的投入策略、产品最优均衡定价策略以及制造商和零售商的最优值函数。Zhao [198] 在节能减排、可持续发展的背景下,研究供应链与合作博弈理论间的有机结合。Niyato [199] 用演化博弈理论结合收益矩阵和复制动态方程分析其合作机制,求解演化博弈的均衡策略。Zou [114] 等利用博弈论,在分散和集中决策方案下探索批发价格,零售价格和回收价格的最优决策,并通过分析协调价格竞争和风险规避提出了一种收益分享合同,实现了闭环供应链的协调。
合作博弈侧重研究合作达成时的收益分配问题,而非合作博弈侧重研究博弈各方在利益相互影响的情形下如何作出收益最大化决策,即策略选择问题。
Jamali [200] 基于博弈理论模型,分析比较了不同回收及销售渠道下的最优定价决策。Nav [201] 运用博弈理论、混沌动力学和复杂动力学理论,从定性和定量的角度分析了已建立的供应链系统的复杂性特征。Kristiansen [202] 运用博弈理论建立权力结构模型,研究产出随机性和权力结构对每个参与者决策及收益的影响。Bai [203] 等在需求不确定、零售商作为担保主体的情形下,运用替代性两产品报童模型,构建了集中和分散两种决策下再制造闭环供应链博弈模型。Liu [204] 提出了一种新的基于博弈论的证据ANP方法,以有效地解决不确定环境下的供应商管理问题。Alamdar [115] 研究了一个包括一个制造商、一个零售商和一个收集方的模糊的闭环供应链(CLSC)。文章基于模糊价格和销售努力依赖需求来分析最优决策问题,建立六种博弈论模型,运用博弈和模糊理论提取和比较最优解。
目前博弈论以非合作博弈研究为主,因为博弈各方都想成为最大受益者,所以不会考虑整体收益和社会效益。非合作博弈研究主要集中于如下两方面:
第一方面是博弈方采取行动的决策时序。此时,非合作博弈可划分为静态博弈(Static Game)和动态博弈(Dynamic Game)。静态博弈指博弈过程中,博弈方同时选择行动,或当无信息互通时各博弈方先后行动而后行者能够观察到先行者的行为决策;动态博弈指博弈过程中,博弈方错位行动且后行者能够观察到先行者的行为决策。非合作动态博弈在供应链中的应用诸多,Deng [205] 基于演化博弈理论建立了制造商和零食商的动态博弈模型,研究了有无担保机制下制造商和经销商的决策选择和影响因素。根据制造商和经销商博弈呈现出的长期性和动态性,运用复制动态方程得到两者行为的演化规律。Matter [206] 用动态博弈方法研究了制造商竞争下,电子废品制造商回收再制造的闭环供应链决策问题。Zailani [207] 用动态博弈方法分析了供应链上下游企业和供应链企业的技术创新,得出了企业利润均衡函数。王哲等 [222] 通过由政府、制造商、零售商和回收企业组成的三阶段博弈模型,分析政府规制下利益相关者的最优决策和利润,研究政府监管对双重责任和双渠道闭环供应链运作的影响。
第二方面是博弈参与方之间的信息互通情形。此时,博弈可以划分为完全信息(对称信息)博弈和不完全信息(非对称信息)博弈。对称信息指每一参与方对所有其他参与方的信息都有准确的把握,反之即非对称信息。Braz [208] 的研究表明,闭环供应链中牛鞭效应的原因与前向供应链中的相似。Sabitha [209] 运用斯坦伯格博弈理论研究再制造闭环供应链的信息共享与信息不对称问题。Liu [210] 提出了复杂信息博弈的概念及其纳什均衡,证明了人工神经网络可以解决复杂的信息博弈问题。供应商选择在供应链管理中发挥着重要作用。Wei [211] 用博弈论研究了具有对称和非对称2种信息结构的闭环供应链的最优决策问题。
在主从博弈中 [212] ,领导者凭借其主导优势在博弈中占据先机或者有利位置,跟随者在领导者之后做出博弈。在现实生活中,中央政府与地方政府之间的博弈、集团与子公司之间的博弈,CEO与各个项目团队之间的博弈等都是主从博弈的具体实例。主从博弈的概念最早是由德国经济学家Heinrich Von Stackelberg提出,1934年他出版的《Marktform und gleichgewicht》 [213] 文章中,Stackelberg给出了Stackelberg模型。后来许多学者对Stackelberg模型做了相关研究。Tao [214] 讨论了一次性博弈模型和流量控制博弈均衡解决方案,进一步研究了基于多跟随者Stackelberg博弈模型的流量和拥塞控制行为。基于此流量控制模型,他还提出了具有多个跟随者的Stackelberg博弈,证明了Stackelberg均衡的存在性,并推导得出Stackelberg平衡点上的领导者和多个跟随者的解。Zhang [215] 建立了基于效用的合作认知的无线电网络的Stackelberg博弈并以分析格式找出独特的纳什均衡点。Kang [216] 用Stackelberg博弈研究基于价格的双层femtocell网络资源分配策略。Yuan [217] 提出了一种基于Stackelberg博弈的自主车道变换模型。Tian [218] 通过对Stackelberg博弈论的分布式自动协商模型的研究,提出了一种基于代理人利用的利润分配模型,以解决协同物流运输利润公平分配相关问题。
在供应链研究中Stackelberg主从博弈应用广泛。何彬斌 [219] 从分散决策和纵向合作角度出发,基于演化博弈理论和Stackelberg模型,研究了供应链绿色营销的策略选择。Ma [220] 使用Stackelberg博弈模型开发了列车运行调度的操作方法的模型。铁路运营商被建模为博弈领导者和乘客作为博弈追随者;可以根据乘客服务质量与URT运营成本之间的权衡来确定最佳服务频率。Giovanni [221] 从制造商(M)为领导者、零售商(R)为追随者的基准(无激励)情景开始,通过利润分享合同设计了两个激励博弈,用以调整企业关闭循环的动机。Huang [222] 采用Stackelberg博弈来获得每个再制造场景的均衡决策,分析了在制造商,分销商和第三方技术许可下的闭环供应链中信息共享的好处。结果表明,无论再制造模型中有无技术许可,制造商和第三方的利润水平总会因为信息共享的存在而提高,同时经销商的利润会产生一定的损失。通过在每个再制造模型中引入技术许可,可以有效地减少分销商的这种利润损失。Hong [98] 构建了Stackelberg博弈模型,以研究本地广告,二手产品回收和定价在集中式和分散式闭环供应链中的最优决策。在考虑分散渠道时,他们建立并比较三种模式:制造商回收,零售商回收和第三方回收商回收。分析表明,本地广告强烈影响渠道成员的定价策略、二手产品回收决策和利润。同时,制造商授权零售商回收旧产品是最佳选择。此外,研究结果还发现合作广告不能协调闭环供应链,但简单的两部分关税合同可以通过产生与集中决策系统相同的性能来协调分散式闭环供应链的成员。廖毕丰 [223] 应用Stackelberg博弈理论研究闭环供应链中各节点企业的相关决策问题,研究得出了集中和分散两种决策模式下制造商的最优担保力度和零售商销售初期的最优订货量。
本书基于博弈理论,研究具有担保服务的闭环供应链系统,并将博弈方法贯穿于供应链定价决策,担保主体组合,最优担保效率等方面,具有稳定性与创新性。