商务谈判理论与实务最新章节_杨剑英著

第四节
谈判博弈理论

如果你在决策时会考虑到对方的反应，并且把对方的反应作为决策的依据之一，这说明你和对方是一种“博弈”关系。商务谈判是谈判参与方为了达到各自的目的，就利益的交易条件，通过沟通和协商以达到各方都能接受的协议的过程。它具备了博弈论的一些基本特征，因此，有一种观点认为谈判即为博弈，比拼的是智慧和勇气。

一、博弈论的起源与内涵

“博弈论”译自英文Game Theory，其中Game一词英文的基本含义是游戏。“游戏”（如下棋、打牌、竞赛等）都有一个共同特点，即策略或计谋起着举足轻重的影响作用。虽然在不少游戏中，如扑克和体育比赛，运气或身体素质的作用很大，但参与游戏各方的策略选择的好坏将成为左右游戏结果的关键因素。现实生活中许多活动都可以说是“博弈”，如合伙经营、企业重组、政治竞选、军事斗争、国际纠纷等，这些问题都与游戏一样，是在一定规划下参加各方的策略较量，参与者可以控制运用的关键因素也是策略选择，并且相关各方的策略和利益也存在相互依存和制约关系。

（一）博弈的概念

博弈(Game)是指在一定规则约束下，基于直接相互作用的环境条件，各参与者依据各自所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。

博弈论研究的是理性的博弈方，在独立决策但其决策又相互影响其各自收益的情况下该如何行动。也就是说博弈论把小到猜拳游戏、大到国家之间的战争等每一种互动的情形都视为一个博弈，把参与互动的当事者，无论是个人还是企业，都称为“参与人”，然后考察博弈的参与人如何进行决策，依次预测博弈的结局如何。正是由于能够为所有的互动情形提供一个统一的分析框架，博弈论现在已经逐渐成为社会科学研究的一种基本方法，这种方法对于我们处理各种需要与人打交道的事情尤为重要。谈判的本质特征是一种博弈现象，博弈论的思维方式为解决谈判中的问题提供了强有力的分析工具，它使谈判者的思想集中在谈判另一方的想法和可能采取的行动上，帮助谈判方考虑谈判另一方对其建议作何反应，以及其行为可能产生的意想不到的效果。

（二）博弈论的基本术语

1.参与人(Player)

博弈首先要有人参与。博弈的参与人是指理性选择的主体，也称局中人或博弈方，他在博弈中要选择一些行动以获得最大的效用或收益（支付）。博弈的参与人可以是生活中的自然人，也可以是企业、政府、或国家等。一般来说，博弈的参与人至少是两个或两个以上。在一个博弈中，只要其决策对结果有着重要影响的主体，我们都把它当做是一个参与人。另外，当一个博弈涉及随机因素时，我们往往还引入一个名为“自然”(Nature)的虚拟参与人，比如在投资决策中，一项投资决策能否获利不仅取决于投资者的选择，还取决于不受投资者控制的随机因素，即俗话所说的“谋事在人，成事在天”。“天”就是“自然”这个虚拟的参与人，但是“天”与一般参与人不同，它不是为了某一特定目的而采取行动。

2.行动(Action)

行动是参与人在博弈的某个时点的决策变量。每一个参与人在轮到他采取行动时，都有多种可能的行动可供选择，比如在讨价还价时，你有多个价格选择。所有参与人在博弈中所选择的行动的集合构成了一个行动组合，不同的行动组合导致了博弈的不同结果。所以，在博弈中，要知道博弈的结果如何，不仅需要知道自己的行动，还需要知道对手选择的行动。另外，行动的先后顺序是博弈的重要问题，如果博弈双方是同时行动，这类博弈称为静态博弈，此时参与人只能凭借自己的猜测做出判断，如石头、剪刀、布的游戏。如果行动有先后顺序，则称为动态博弈，此时后行动的参与人可以先观察对方的行动，再做出自己的行动选择，如打牌、下棋等，谈判的还价是在对方的报价之后进行。动态博弈中，有时是先动优势，有时是后发制人。因此，选择先发制人还是后发之人，对参与人来说经常是一个非常纠结的问题。

3.信息(Information)

信息是指在博弈当中每个人知道些什么。这些信息包括对自己、对方的某一些特征的了解，比如对方是一个比较容易妥协的人，还是一个比较好斗的人；对方的企业是低成本的还是高成本的。同样，信息也包括了对对方采取的一些行动的了解，即轮到自己行动时，对手在这之前都做了些什么。1948年美国数学家、信息论的创始人香农在《通讯的数学理论》中指出：“信息是用来消除随机不确定性的东西。”博弈论中信息是参与人有关博弈的知识，其中有关对手的类型与行动的知识至关重要。参与人在博弈中的行动选择总是在一定的信息条件下进行的，所谓“知己知彼、百战不殆”，充分说明了信息的重要性。人们常说的“无知者无畏”也同样说明了信息对行动的重要作用。

4.策略(Strategy)

策略是博弈论中最核心的概念之一，博弈论也因此被称为“策略思维”。策略是指参与人在行动之前所准备好的一套完整的行动方案（预案），可以理解为参与人的一个相机行动计划(Contingent Action Plan)，它规定了参与人在什么情况下该如何行动。比如，1939年9月16日，毛泽东在《和中央社、扫荡报、新民报三记者的谈话》中，对国民党顽固派制造的一系列反共摩擦事件，提出一个策略：“人不犯我，我不犯人；人若犯我，我必犯人”。这里实际上包含两个行动——“我不犯人”和“我必犯人”，并规定了这两种行动的具体条件（时机）：“人不犯我”和“人若犯我”。策略是行动的规则，它要为行动规定时机。

一般来说，策略具有完整性、多样性和不可观察性三个基本属性。策略的完整性意味着参与人对所有可能的情况都要加以充分的考虑，没有任何遗漏。策略完整性的前提是将信息进行全面分类，将可能出现的情况按照一定的规则进行完整分类，比如考试成绩的五分法（优秀、良好、中等、及格、不及格）。策略的多样性意味着参与人有多个策略可供选择。比如上述提到的“人不犯我，我不犯人；人若犯我，我必犯人”只是一个策略，还可以有另外三种策略供选择：“人不犯我，我不犯人；人若犯我，我也不犯人”、“人不犯我，我要犯人；人若犯我，我不犯人”、“人不犯我，我要犯人；人若犯我，我更要犯人”。策略的数量取决于信息的数量和行动的数量，是两者的乘积，如果你遇到N种情况，每种情况可以有 M 种行动选择，那么，你可以选择的策略数量就是 N ×M 个。策略不同于行动，行动是具体的做法，策略是对行动的预想。即你可以看到对方是怎么做的，但是不一定了解对方是怎么想的。因此，行动是可观察的，策略则是不可观测的，好的策略是建立在对于可见事实的洞察与不可见变数的预见之上。

5.支付(Payoff)

支付是每个参与人在给定策略组合下得到的报酬。对于参与人的每一组可能的行动方案，博弈都有一个结果表示各参与人在该策略下的所得或所失，不同的行动方案会得到不一样的支付，即参与人的得与失，所以支付也可以理解为参与人的损益，这是参与人最为看重的。支付在具体的博弈中可能会有不同的含义，比如谈判人员关心的可能是自己的物质报酬，也可能是社会地位、自尊心等；企业关心的可能是利润，也可能是市场份额，或者持续的市场竞争力；政府关心的可能是GDP，也可能是财政收入、社会稳定或者国家的国际地位等。在博弈分析中，重要的不是支付的量化数值的绝对大小，而是数值之间的相互关系。换句话说，你或许难以测算出学习《商务谈判》这门课的愉悦程度的大小，但是，你一定知道学习该课程之后，是比之前更开心了，还是更不开心了，或者没有变化。

6.均衡(Equilibrium)

均衡是指所有博弈参与人的最优策略组合。这个策略组合是某个结局，是博弈的一种稳定状态，在这一状态下，所有参与人都不愿意单方面改变自己的策略，或者说无法通过改变自身的策略（及其行为）选择。换句话说，给定对手的策略，每一个参与人都已经选择了最优的策略，这个稳定状态是由所有参与人的最优策略组成的。在博弈论的分析中，经常把均衡称之为纳什均衡，其含义是：给定你的策略，我的策略就是对我而言是最好的策略（之一）；给定我的策略，你的策略也是对你来说是最好的策略（之一），即双方在对方给定策略下已经没有积极性去调整自己已选的策略。这是一种“没有人愿意偏离”的状态，因为缺乏偏离的激励，因此，只要约束条件不变，均衡的状态就不会变。由此可见，均衡是一种相对稳固的状态，也因此会出现所谓的“现状的暴政”，即维持现状已成为一种常态或习惯，它的力量非常大，以至于改变现状往往很难。这就不难理解，为什么改革需要理由，不改革却不需要任何理由。如果你想推动一个组织变革，请务必先找好一个能够打动人的理由。因此，改革往往需要强有力的推动力。

需要指出的是，博弈论中的均衡概念和经济学中的“一般均衡”“局部均衡”等均衡概念有所不同。博弈论中的均衡指的是所有参与人都不再改变自己的策略，该策略处于稳定状态；经济学中的一般均衡或者局部均衡指的是一组市场出清的价格，使得市场上的供给和需求相等，市场处于稳定状态。

（三）博弈的分类

1.合作博弈和非合作博弈

按照博弈参与人是否能够达成一种具有约束力的协议来区分，博弈可以分为合作博弈(Cooperation Game)和非合作博弈(Non-cooperation Game)。合作博弈是指参与人能够达成一种具有约束力的协议，在协议范围内选择有利于双方的策略。例如，企业间的联合定价等，强调的是集体理性，协议追求的是集体利益的最大化，各方会自愿遵守形成的决策或达成的协议。非合作博弈是指参与人无法达成这样的一种协议，每一个参与人都独立做出决策，强调的是个体理性，各方追求的是个人利益最大化。这意味着，即使达成了一个能够给各方代理集体利益最大化的协议，如果这个协议不是一个纳什均衡，也不会得到执行。合作博弈和非合作博弈的区别，不是前者进行合作，后者不合作，而是做出决策的过程是基于个人理性还是集体理性。理论研究表明，非合作博弈理论是研究如何达成合作的最适当的理论。

2.静态博弈和动态博弈

按照博弈参与人做出策略或行动的有无先后顺序来区分，博弈可以分为静态博弈和动态博弈。静态博弈是指在博弈中，参与人同时选择行动，或虽然非同时选择，但后行动者并不知道先行动者采取了什么具体行动（即物理时间不同时，但是在逻辑时间上同时）。动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者的行动，也称“多阶段博弈”。通俗来说，如石头剪刀布的游戏、罚点球（一攻一守）等都是同时决策的，属于静态博弈；诸如下围棋、谈判双方的讨价还价等是有先后顺序的，属于动态博弈。

3.完全信息博弈与不完全信息博弈

按照博弈参与人对其他参与人的了解程度来区分，博弈可以分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中，每个参与人对其他参与人的类型、策略空间及损益函数有准确的信息。不完全信息博弈是指参与人对其他参与人的类型、策略空间及损益函数的信息了解得不够准确，或者不是对所有参与人的类型、策略空间即损益函数有准确的信息。通俗来说，不完全信息博弈指的是总有一些信息不是所有参与人都知道的。

4.零和博弈与非零和博弈

从博弈的结果来看，博弈可以分为零和博弈与非零和博弈。零和博弈是指博弈前的损益总和与博弈后的损益总和相等。日常生活中，猜硬币、石头剪刀布、赌博通常都是零和博弈，即一方的收益必然意味着另一方的损失，博弈各方的收益和损失相加总和永远为“零”，双方不存在合作的可能。“零和博弈”可以理解为自己的幸福建立在他人的痛苦之上，因而双方都想尽一切办法以实现“损人利己”。非零和博弈根据总和的值又可分为“正和博弈”和“负和博弈”。正和博弈是指博弈双方的利益都有所增加，或者一方的利益有所增加而另一方的利益不受损害，也可能是一方利益的增加超过了另一方利益的损失，因而整个社会利益有所增加。一般而言，市场经济中的交易行为大多数是正和博弈。负和博弈是指参与人博弈之后损益总和为负值，既可以是参与人都有不同程度的损失，也可以是一方的损失大于另一方的收益。例如，在中国股票市场中，众多的小额投资者有可能小部分人赚钱而大部分人亏损，甚至还有可能所有人都亏损。

（四）学习博弈论的好处

我们常说“当局者迷，旁观者清”，那么学习博弈论带来的益处就是“当局者请，旁观者更清”，并在此基础上帮助我们建立更好的合作关系，共享美好未来。

1.好处之一：当局者清

通过博弈论的学习，可以让你做出对自己更为有利的选择。如果你和对手玩一个游戏，游戏的规则是双方轮流从21个棋子中取走1个、2个或者3个，最后没有机会再取的就是输家，那么你愿意先取还是后取？（这个游戏一般称为尼姆游戏，棋子可以是任何数量，每次最多能取多少个棋子也可以重新设定。一定数量的棋子被称为尼姆堆。）如果你从来没有玩过这个游戏，请问你需要思考多长时间才能做出先取还是后取的正确选择？博弈论带给你的分析方法可以纠正思考问题的逻辑错误，有助于将各种错误发生的可能性降至最低。在一个瞬息万变的环境下，博弈双方往往比的是反应速度，如在战场上、在体育比赛中、在突发事件的处理上等，通过博弈论的学习，你给自己建立了一种快速反应机制，能够先于对手抢占有力位置，从而提高获胜的可能性，正所谓“凡事预则立，不预则废”。

2.好处之二：旁观者更清

通过博弈论的学习，你可以做一个更清醒的旁观者，更好地理解过去和现实，预测未来的发展。在多方博弈中，可用博弈的思维方式预测各参与方将可能采取的策略（行动）以及可能的最终结果。例如，如果你能够从中央政府、地方政府、房地产开发商、购房者四方博弈的角度去理解商品房市场的运行机制和房价变动，那么对房价在近些年的持续上涨就会有更清醒的认识。

3.好处之三：提出完善制度的建议

博弈论研究的内容是“理性人的互动行为”，人与人之间的互动必然是在一定的游戏规则下进行的，博弈论提供给每个人一种从游戏规则（制度）到策略选择再到博弈均衡的分析框架，并由这个框架告诉人们游戏规则对结局的影响作用。这种影响作用很多时候是决定性的，从而为人们如何完善现有的规则（制度）提供了理论依据和评判标准。因此，博弈论的学习有利于制定出更完善的制度，避免无谓的争斗。

二、以博弈论解释谈判

（一）囚徒困境博弈

博弈论中最为经典、也最为重要的博弈是囚徒困境，在 1950 年由艾伯特·塔克(Albert Tucker)提出，它虽然非常简单，却很好地反映了博弈问题的根本特征，而且这个博弈模型也是解释经济现象、研究经济效率问题非常有效的基本模型和范式。囚徒困境博弈的基本模型如下：

假定有两个犯罪嫌疑人共同作案，警察抓住了他们，但缺乏足够的证据。警察将他们分开拘押，并告诉他们可以选择坦白或抵赖：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。那么，这两个犯罪嫌疑人应该如何选择呢？

这个博弈有两个参与人——犯罪嫌疑人（囚徒）甲和乙，每个人有两个行动——坦白或抵抗；两个人隔离审查，谁都不能观察到对方的行动。这个博弈的支付结构如图2-3所示，支付矩阵中每一格的两个数字代表对应策略组合下两个囚徒的支付（效用），其中第一个数字是囚徒甲的支付，第二个数字是囚徒乙的支付。这种表述形式是表示博弈问题的一种常用方法，称为一个博弈的“得益矩阵”(Payoff Matrix)。

图2-3 囚徒困境博弈

现在来看参与人囚徒甲和乙会如何决策。我们假设人是理性的，不想坐牢，因此，他的目标就是能少坐就少坐；我们还假定每个人只关心自己，不关心对方（如果囚徒甲和乙是父子关系或兄弟关系，他们的行为也许会有变化）。先来分析甲的选择，他面临的问题是：如果乙坦白的话，自己坦白判8年，抵抗判10年，那么坦白比抵抗要好；如果乙选择抵抗，自己坦白会被立即释放，抵抗则判1年，坦白还是比抵抗要好。因此，对于甲来说，不管对方坦白还是抵抗，自己的最优选择都是坦白。同样，对于乙来说也是如此。所以，每一个人的最优选择都是坦白。

一般来说，博弈中每个参与人的最优选择依赖于别人的选择，但在囚徒困境博弈中，每个人的最优选择与他人的选择无关，这种独立于他人选择的最优策略称为该参与人的占优策略(Dominant Strategy)。所谓占优策略是指在博弈中参与人的某一个策略，不管对方使用什么策略，只要参与人使用这一策略，都可以给自己带来最大的支付。占优策略类似我们常说的“上策”，在博弈中如果每一个参与人都有一个占优策略，则他们显然都会选择这一策略，那么占优策略组成的策略组合就构成了博弈的占优策略均衡。显然，在囚徒困境博弈中，坦白是每个参与人的占优策略，两个人都选择了坦白也成了博弈的占优策略均衡，结果就是两个人都会坦白，各判8年。

囚徒困境的内在根源是个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现个体利益共同的最优。在囚徒困境博弈模型中，如果两个人都选择抵赖，各判刑1年，显然要比都坦白各判刑8年好。但是这个帕累托改进办不到，因为它不满足个人理性要求。人类的个人理性有时能导致集体的非理性，聪明的人会因自己的聪明而作茧自缚，或者损害集体的利益。简单地说，“囚徒困境”问题都是个体理性与集体理性的矛盾引起的。因此，囚徒困境也因此又称为“合作悖论”或“集体行动悖论”，尽管合作能够给双方带来好处，但是双方仍然是不合作。

在现实生活中有很多类似囚徒困境的事例，比如小孩子的学习负担问题就是一个囚徒困境。现在的小孩子除了正常的上课学习之外，还要在周末去学习奥数、英语、各类兴趣班等。可以设想，如果所有的学生周末都休息，考上重点中学和重点大学的一定是那些最聪明的孩子，问题是如果你周末休息，别的孩子周末补功课，那么可能别人就考上了，虽然你聪明也可能考不上，然而你的最优选择也是周末补课。结果是，所有的孩子一周七天都在学功课，最后考上重点中学和大学的仍然是那些聪明的孩子。竞争带来这种不合理的结果：每个人都忙活，但是最后的结果不一定对大家都好。

企业之间的竞争也是囚徒困境。2000年6月9日，中国的九家彩电企业在深圳开会，制定了一些彩电型号的最低限价，形成价格同盟。但是，会议过去刚刚三天，参加会议的一些企业就在南京等地率先降价，使得价格同盟名存实亡。一般来说，这种结盟很难维持，因为如果你不降价，对方先降价就可以扩大销量，占领更多的市场份额，所以最终的结局是大家都降价，搞价格战。

企业做广告也是如此。企业投放广告的成本很高，而且不一定能给企业带来利润，但为什么大多数企业都选择做广告呢？假如某行业有两家企业，如果企业都不做广告，各得到10单位的利润；如果都做广告，去掉广告成本后各得到4单位利润；如果一个企业做广告，另一个企业不做广告，做广告的企业就可以多销售而得到12单位利润，不做广告的企业只能赚到2单位利润。这个博弈的占优策略就是两个企业都做广告。因为无论别人做广告与否，你的最后策略都是做广告，最终两个企业的利润都减少了。

公共产品的供给也存在囚徒困境问题。所谓公共物品是指像国防、道路、桥梁等具有非竞争性和非排他性的物品，就是说消费起来不会排斥他人的产品和服务。正是由于公共产品消费的非排他性，使得个人没有积极性来提供公共产品，每个人都想着别人来提供，自己搭便车。这使得公共产品如果单靠私人来提供的话会严重不足，从而使得这个社会的效用下降。因此，公共产品一般由政府提供，但是又需要政府使用强制的办法让个人为公共产品提供相应的服务和资金，例如，现代社会要人们缴纳个人所得税、服兵役等。

（二）智猪博弈(Boxed Pigs Game)

设想猪圈里有两只猪一，只大一，只小。在猪圈的一头装有食槽一一，另头安装着个按钮，按一下按钮会有8个单位的食物出现。但不管大猪还是小猪，按动按钮都需要花费2个单位的食物成本如果两只猪同时按按钮再一。，起跑过去吃，大猪能吃到6个单位，小猪能吃到2个单位，扣除2个单位的成本后，大猪净得益4个单位，小猪净得益0个单位。如果大猪按按钮，小猪等着先吃，大猪再赶过去吃，则大猪吃到5个单位，去掉按按钮的2个单位成本，净得3个单位，小猪不付出任何成本也吃到3个单位。如果小猪按按钮，大猪等着先吃，则大猪吃到7个单位，小猪吃到1个单位，再减去按按钮的2单位成本，小猪是净亏损1个单位。如果大家都等待，结果是都不会有食物吃，净收益都为0（见图2-4）。

图2-4 智猪博弈

现在问题是，谁来按这个按钮？

先考虑大猪的情况，如果小猪“按”的话，大猪的最优选择是“等待”（因为7大于4）；但如果小猪等待的话，大猪的最优选择是“按”（因为3大于0）。这就和前面的囚徒困境博弈不一样了。在囚徒困境博弈中，每一个参与人都有一个占优策略，即不论对方是否坦白，你最好是坦白。但是在智猪博弈中，大猪没有占优策略，大猪的最优选择依赖于小猪的选择。所以大猪在做出选择前必须猜测小猪的选择。

对于小猪而言，如果大猪“按”，自己的最优选择是“不按”（因为3大于0）；如果大猪“不按”，自己仍然应选择“不按”（因为0大于-1）。换句话说，无论大猪是选择“按”还是“不按”，对于小猪来说“不按”都比“按”好。作为理性的参与人，大猪的最优选择只能是“按”，智猪博弈的结局就是：大猪按，小猪不按，各自得到3单位净报酬。

在这个例子中进一步提出一个占劣策略概念，所谓的占劣策略(Dominated Strategy)是指不论对手选择什么，自己都不会选择的策略。在智猪博弈中，对于参与人小猪来说，“按”就是一个占劣策略。因为，无论大猪选择“按”还是“不按”，对于小猪而言，“按”都不是它的最好选择。如果大猪也是理性的，就可以把“按”这个策略从小猪的策略集合中去掉（如图2-5）。此时，大猪只能选择“按”，因为对于大猪来说，“不按”为占劣策略，它也不会使用这一策略。这样一来，我们就得到了唯一的最优策略组合：大猪按，小猪不按。这就是智猪博弈的策略均衡。

图2-5 剔除小猪劣策略后的智猪博弈

智猪博弈的结果可谓的“多劳不多得”，或许大猪感到有点愤愤不平：“活都是我干的，小猪却吃的跟我一样多。”小猪的回答是：“你不按拉倒，我又没有叫你去按！”智猪博弈其实是一个搭便车的博弈。一方付出了相应的代价，双方共享所得到的收益。在现实生活中，也有类似智猪博弈的应用。比如，在股份公司中，股东承担监督经理的职能，但股东中有大股东和小股东之分，他们从监督中得到的收益并不一样。监督经理需要搜集信息，花费时间。在监督成本相同的情况下，大股东从监督中得到的好处显然多于小股东。这里，大股东类似“大猪”，小股东类似“小猪”。均衡结果是，大股东担当起搜集信息、监督经理的责任，小股东则搭大股东的便车。股票市场上炒股票也是如此。股市上有庄家和散户。庄家类似“大猪”，散户类似“小猪”。这时候，“跟庄”是散户的最优选择，而庄家则必须自己搜集信息，进行分析。

市场中大企业与小企业之间的关系也存在类似的问题。进行市场研究、产品开发、为新产品做广告等活动，对大企业来说是值得的，对小企业来说则可能得不偿失。所以大企业往往负责创新，而小企业把精力花在模仿上。国际范围的反恐怖主义活动也类似一个智猪博弈。在全球化时代，恐怖主义已成为一种国际现象，伤害所有的国家。但反恐的成本是很高的，小国尽管也不喜欢恐怖分子，但他们也没有反恐的积极性。所以，国际反恐中，一定是大国承担更大的责任（人力、物力），小国搭便车。即大国扮演大猪的角色，小国扮演小猪的角色。随着中国的崛起，国际社会要求中国承担更大的责任，也是这个道理。

前面讲公共产品的生产是囚徒境博弈，事实上有些公共产品的生产类似智猪博弈，因为受益者是不对称的，有人受益大，有人受益小。在这种情况下，受益大的个人可能有的生产公共产品积极性，如过去农村一些大户人家就负责本村道路的维修。这也就是说，并不是所有的公共产品都需要政府提供。

囚徒困境和智猪博弈的结局都是一个纳什均衡。纳什均衡(Nash Equilibrium)是所有参与人的最优策略组合，在这一给定的策略组合中，没有任何参与人有改变自己选择的积极性。这个策略组合对大家是相互一致的，互为最优。纳什均衡是信念和选择之间的一致性，即基于信念的选择是合理的，同时支持这个选择的信念也是正确的。纳什均衡可以自我实施，也就是说，如果这个结果会出现，这个结果就真的会出现。社会中的许多制度在设计时，肯定希望人们能自觉遵循，那么这个制度一定要是个纳什均衡。

（三）纳什谈判解

两家企业在进行谈判时，如果谈判的结局是一个纳什均衡，那么谈判双方必然会朝着这个方向努力，达成最终的一致协议，该协议可以理解为是纳什谈判解(Nash Bargaining Solution)，它建立在三个公理化条件之上：①帕累托有效；②线性转换不变性；③无关选择的独立性。

帕累托有效是讨价还价的效率标准，表明最后达成的协议应该是帕累托最优（见图2-6）。从图形上看，双方的利益分配方案应该在可分配财富的边界线上，而不能在这条线里面。如果在这条线里面，就意味着至少有一个人在不损害他人利益的情况下可以得到更多，那么此时的谈判解就不是一个帕累托最优解。

线性转换不变性是指对效用函数进行线性变换不影响讨价还价的结果，类似将摄氏温度转换成华氏温度并不改变温度本身一样，这是经济学中预期效用理论的基本假设，每一个人的期望效用水平不受度量的标量影响。有了该假设，就可以把多维谈判问题约减为一维谈判问题，就一个方面展开谈判。现实中的谈判往往是多维的，如双方除了就价格展开谈判，还会就支付方式、交易期限、物流配送、退换货条件等展开谈判，每一个维度的得失都会对当事人的效用带来一定的影响，我们把多维谈判带来的效用加总后，可以近似地看成一个维度的谈判问题，从而可以使谈判简单化。

无关选择的独立性是指如果原来可行的选择没有被选择，那么去掉这些无关的选择，不会影响讨价还价的结果。比如企业与零售商合作销售产品，企业获得1 200元、零售商获得1 800元的收益是可行的，但是双方签署的协议不包含这一选择，那么即使在双方的约束中去掉该选择，协议也不会改变。这就是无关选择独立性的含义。

纳什证明，如果所有参与者都认可上述三个公理性假设，而且知道对方也都认可这三个假设，那么双方讨价还价就等价于在满足可行分配约束x +y ≥V(x,y)的前提下的最大化福利目标函数。

这个目标函数可以理解为每个人净收益（或效用）对数的加权平衡，其中的权数是各自在剩余价值中的份额。求解该优化问题，可以得出如下关系式：

如图2-6所示，N点代表无差异曲线W ₁ 和可行分配线的切点，是合作剩余最大化的点，在这个点以内，代表合作剩余变小，在这个点以外，虽然会增加各自收益，但是超出了可分配的合作剩余总值，这种分配不会实现。P点是谈判双方的威胁点，或者说是保留价格点，表示如果双方不能达成协议，双方分别得到保留收益a和b 。点N和点P连线的斜率，是双方合作剩余的最佳分配比例。

图2-6 纳什谈判解图示

对于h和k，实际上是合作剩余在双方之间的分配比例，也可以理解为双方的谈判力，或者是双方的边际贡献率。某个参与者的边际贡献率是指他参与合作与不参与合作产生的剩余之差。双方之所以进行谈判，是相信合作之后会产生更多的收益（效用），但双方对合作产生的净收益的贡献度有所不同，净收益的分配应依据双方的边际贡献率，即他的边际贡献在总的边际贡献中所占的比例。当两个人的边际贡献（谈判能力）相等时，合作带来的剩余收入就应该平均分配，否则，就按照h和k的比例进行。

【例2-5】画家与画廊的利润分配谈判

假设一个画家创作了一幅画，他可以自己直接在市场出售，也可以交由画廊去卖。如果他自己卖的话，可以卖到1 000元，如果交给画廊卖，可以卖到3 000元。对于画廊而言，如果不接受画家的委托而卖其他作品，画廊的收入是500元。也就是说，如果画家委托画廊销售，双方合作的总收益就是3 000元，如果双方各自销售，总收益是1 500元。现在的问题是：双方合作后如何分配这3 000元？

分析： 现在把这个利润分配问题进行一般化讨论。假设现在有两个参与者：A代表画家，B代表画廊，两人分配数额为V的财富。如果他们能够达成协议的话，则按照协议分配利润；如果不能合作，则画家得到a，画廊得到b。对应上述案例，V =3 000，a=1 000，b=500。这里的a和b可以称为威胁点（也叫做“谈判砝码”），即如果双方谈判破裂每一方可以得到的最低利益。在一般情况下，(a+b)一定要小于V（即V-a-b>0，这是合作带来的剩余）。如果a和b之和大于V，就不可能存在帕累托改进，谈判也就没有意义了。

用x和y分别代表参与者A、B在谈判中得到的数额，则有x+y=V ，即两个人刚好将所有价值分配完。如果用h,k表示两人在总剩余价值中得到的份额，那么h+k=1。根据定义容易得x=a+h(V -a-b),y=b+h(V -a-b)。具体如图2-7所示。

图2-7 纳什谈判解

在图2-7中，横坐标代表A得到的数额x ，纵坐标代表B得到的数额y ，总价值V可以全部给A，也可以全部给B。所以V-V这条连线（V值不固定时，连线是曲线）是可行分配的边界线，所有分配方案均不可能超过这条线。点P代表前面提到的威胁点，其坐标为（1 000，500），表明如果谈不成的话，画家自己卖画可以得到1 000元，画廊代理其他作品得到500元。从图中可以看出，任何一种分配都不能处在P点的左侧或者下方。因为，如果达成协议的状况比原来还要糟糕，每一个理性的参与者都不会签署协议。所以，满足个人理性的可行的协议合作解一定在阴影围成的三角形区域内。

这样，两人分配利益问题可以转化为福利目标函数求最优解的问题。由于画家和画廊的边际贡献都是V -a-b ，因为缺少任何一方的合作，画家将得到1 000元，画廊将得到500元，总价值会减少1 500元，即每一方的边际贡献都为1 500元。也就是说，离开任何一方，这1 500元的增加值都不会实现。这样，双方的边际贡献总和是3 000元，所以h=k=1 500/3 000=1/2。这表明两个人的谈判力是完全对等的，或者说所处的位置完全可以互换。此时问题变成：

求解该最优问题，可以得到下面的等式：(y-500)/(x-1 000)=1

最终可以得到：x=1 750,y=1 250。即3 000元在总售价中，画家得到1 750元，画廊得到1 250元。与不合作的情况相比，每个人从合作中得到的增加值都是750元，即增加值平均分配。

可以得到一般性的结论：当两个人的边际贡献率（谈判能力）相等时，合作带来的剩余收入就应该平均分配。比如说，假定某种产品只有一个厂家生产，生产成本是60元，也只有一个买家，价值是100元，交易带来的剩余价值是40元，那么纳什谈判解的价格就是80元，双方各得到20元的剩余。

但是，如果双方的边际贡献率不一样，比如参与人A、B双方合作得到V，但A与C合作也可以得到V，这样一来，参与人A与B合作、A与C合作能够实现的总价值是一样的。对于A来说，B或者C可以完全替代。这样，B和C每个人的边际贡献就变成0了。因为，离开B、C中任何一个，A仍然可以实现合作的价值。这时，B和C就失去了讨价还价的能力，谈判力为0。回到画家卖画的案例中，假如只有一个画家，存在两家画廊，且可以相互替代，那么画廊从谈判中分配的剩余价值就是0，合作的好处都被画家拿走了，画廊只能得到500的“保留价格”（即谈判达不成协议时的收入水平）。

进一步，可以假设画廊B和画廊C给A带来的边际贡献不一样。比如画家A与画廊B合作，创造的总价值是3 000元，而A与C合作创造的总价值是6 000元。假定没有A这个画家，C只能赚到1 000元。因此，A与C的合作中，C的边际贡献是2 000(=6 000-1 000-3 000)元。这时因为，如果没有C的话，A还可以与画廊B合作卖画得到3 000元。A的边际贡献是4 000(=6 000-1 000-1 000)元。A和C的边际贡献之和是6 000元，所以A在剩余价值中应该占到三分之二的比例，C在剩余价值中占三分之一的比例。即在6 000元的总价值中，画家A得到3 667元（等于价值4 000元的三分之二加上保留价格1 000元），画廊C得到2 333元。注意，虽然C的加入使得画廊B退出了画家A的市场，但正是由于画廊B的存在，才使得画家A的谈判能力提高。如果没有画廊B的存在，画家A只能分的总价格的3 000元。

一个人的谈判能力与其可替代性成反比，可替代性越高，谈判能力越低；可替代性越低，谈判能力越高。在产品市场上，需求方的人越多，供给方的谈判能力就越大；反过来，供给方的人越多，需求方的谈判能力就越大。拍电影时，大牌明星的片酬高是因为他的边际贡献高，有了他票房收入和广告收入也就高，所以他的谈判能力就很强，而普通演员很容易被替代，谁上场对影片的价值没有什么影响，所以他们就没有太多的讨价还价的能力，因此片酬就比较低。因此，人们要提高自己的讨价还价能力，就需要考虑如何去提高自己的边际贡献。

三、博弈论在谈判中的运用

商务谈判之所以带有博弈的性质，在于其行为的高风险性和预期合作的有限性，如果是频繁的重复合作，商务谈判人员因彼此非常熟悉而容易达成默契，谈判的必要性就大幅度降低。谈判意味着愿意承担风险，如泄露信息、信任误判、合同陷阱、毁约等。谈判的这种不确定性，致使人们心目中的商务谈判好比一场获取控制力和降服对手的智力游戏，充满了对抗和投机。但是，企业的经营管理不能建立在不确定的基础上，需要制定一套有规律和有规则的谈判策略，以应对各种各样的博弈局面，并尽可能地相互信任，建立长期性合作。

（一）博弈基础上的谈判程序

在博弈论的基础上，可以将谈判分为三个步骤：一是确定双方的风险值，二是确立合作的剩余，三是达成分享剩余的协议。

1.合理确定谈判双方的风险值

所谓风险值是指双方在谈判中的最低利益要求（底线），如果合作的条件低于双方的“底线”，则合作不可能成功。确立风险值是打算合作的双方对所要进行的交易内容的评估确定，每一方都必须接受至少等于风险值的条件。假如要购买某一商品估计可能的价格是多少？最理想的价格是什么？最高能忍受的价格是多少？其他附带条件有哪些？从博弈论来分析谈判，只有双方合作，才会有剩余，谈判的合作解一定是风险值加上合作剩余的分配。例如，甲方想卖掉一套房子，最低要价30万元，乙方刚好有50万元想买一套二手房，他看了这套房子后，认为价值在40万元左右。因此交易一定是在30万元（甲的风险值）与40万元（乙的风险值）之间，如果双方合作，则产生了合作剩余10万元，如果以35万元成交，则甲乙双方各得到了5万元的剩余。在实际交易中，情况远比这些要复杂得多，许多合作项目的风险值的确定本身就是一个庞大的系统工程，收益也是长远的，短期内难以确定。

2.确定双方的合作剩余

风险值确定后，会形成双方合作的剩余。合作剩余既有显现利益，也可能有潜在的利益。对于许多谈判项目而言，产生多少的合作剩余是一个难以确定的未知数，因为合作剩余还应该包括一些附加的利益。谈判双方应善于分析和发现全部的剩余，去构建合作方案。

现代谈判理论认为，谈判不仅仅是考虑分配蛋糕，而是要想方设法把蛋糕做大，让每一方都能多分一些，即谈判要成为“正和博弈”，使博弈各方的收益都有增加。这就意味着参与谈判（博弈）各方之间存在着相互配合，只要大家共同合作，将利益扩大，就可实现皆大欢喜的结果。

3.达成分享剩余的协议

合作剩余确定后，如何进行剩余的分配是最关键的问题。关于剩余的分配，从来没有统一的标准，一般取决于双方实力的对比和谈判策略与技巧的运用。在零和博弈中，各方为了在博弈中占上风，都不想让对方了解自己的真实想法，并尽量争取从对方得到更多的利益，因此有可能使博弈合作不成功，其博弈结果是不确定的，如前述的10万元剩余，是5∶5还是6∶4分配等是不确定的。如果谈判不能坚持下去，各方就不能合作，也就无法创造新的价值，实现更大的利益。阻止谈判顺利进行和各方有效合作的最大障碍就是谈判各方难以在如何分享价值的问题上达成一致协议。因此，在谈判中应尽量争取正和博弈，达成各方都认可的协议，这是谈判各方分享合作剩余的保证，也是维系各方合作的纽带。

（二）博弈论在商务谈判过程的作用

1.博弈论可用于有效推断和辨别对手所关注的利益和可能采取的行动策略与反应

预测对手的利益顺序和行动逻辑是一切谈判的基础，通过谈判的交流也有助于摸清和证实对手真正的利益与底线。即使利益冲突严重的谈判双方，借助博弈分析工具，告知对方博弈中对抗行动升级的危害性，也能成为避免各方选择恶性对抗的有效途径。实际上，拥有大规模报复的威慑力减少了而不是增加了对抗的机会和程度，例如，大型企业通过谈判告知对手报复的可能性，通常足以阻止行业内其他企业放弃轻率地发动价格战策略。

2.运用博弈理论辨明谈判的类型以制定合理谈判策略

一般而言，博弈的次数与合作的必要性和可能性是正相联系的，如果是一次性博弈，比如在旅游景点购买纪念品，这种行为就是直接的讨价还价行动，大致了解一下市场行情后就可以运用心理因素进行大胆还价即可，买卖双方不需要顾忌未来的关系。在现实中，企业的多数商业往来是重复博弈的行为，交往的次数越多，实现合作策略的必要性就越高。根据诺贝尔经济学奖得主罗伯特·奥曼和托马斯·谢林对博弈论的研究成果，无限重复博弈是建立互信与合作策略的必要前提。经过多次非对抗性行为，博弈双方逐渐会意识到合作或者至少避免对抗符合自己的最大利益，在此基础上有可能形成稳固的合作关系。将该原理引申到商务谈判过程中，对重要的客户和对手应注意保持经常性的接触与交流，分别建立信任或维持威慑力，以谋求对方最大限度地遵守合同。就对手而言，只有其根据你所释放的明确信息，并判定你确实拥有兑现信用和使用威慑力的可能时，才会按照规则行事。

3.博弈论有助于谈判中树立先发优势

商务活动中的博弈层面十分复杂和不确定，涉及谁先行动、参与人实力对比的演变、执行合同等一系列的问题。谈判中率先行动方有利于确定一个谈判起点，使得另一方只能在被限定的范围内做出选择。对于看起来是双赢的局面，也存在谁获利多和谁先获利的问题。这方面的信息是不完整的，并且还在发生变化，需要把商务谈判的合作与非合作的可能性都加以考虑。另外，在没有法律禁止协商价格、产量、销售区域、信息披露等范围内，博弈双方在一定时间里有达成和维持合作的可能。因此，博弈双方可以通过谈判进行经常性的利益调整，以尽可能长久地维持利益。

4.博弈论分析能促进谈判合约的改进

“零和博弈”不符合谈判双方的利益要求，精明的商家们逐渐意识到，一方的所得并非以另一方的所失为代价，即双方应该尽可能创造出共赢的局面，采取合作的方式超越“零和博弈”，增加共同利益总和，这与增加各方的利益并不矛盾。此时，参与博弈的某一方单方面主张利益请求，只要不给对方造成额外的成长风险或收益减少，有可能在增进己方的利益的同时又被对方所接受。

商务谈判真正的阶段性成果是达成可执行的合同，或者说达成明智的合约，以满足各方合理的要求和利益。这样的合同能够公平地解决争端，是可持续的合约，它甚至考虑了重要的间接相关方的利益。但是，随着合作的开展，重大的合约签订后似乎总有改进的余地。成功的商务谈判不仅在于谈判的效率和履约的可靠性，还在于实现谈判中的心理平衡，维护谈判者的声誉等。所以谈判的结局有利于实现帕累托改进或实现帕累托均衡，即一方福利的改进并不损害另一方的福利。所以，有经验的谈判人员会尽量争取那些有利于己方、又不给对方增加额外负担的要价。

第四节 谈判博弈理论