无政府状态下的合作最新章节_肯尼思·奥耶著

国际政治的博弈理论

邓肯·斯奈德尔

博弈论在国际政治中的应用并不新鲜，但这一路径的普及性在近期明显增加。这种复兴除了博弈模型在军事政治战略分析中既有的标准作用之外，也与博弈模型在国际政治经济学中的新运用相关联。这样可适时矫正战略分析仅仅在军事事务中适用的局限。战略分析的根本并不在于具体对象属于军事议题还是经济议题，而是在于我们如何理解国家间政治的基本观念。作为独立的、目标导向的行为体，民族国家的概念居于战略博弈分析的中心，其应用跨越了不同的议题领域。

博弈论的最终前景在于扩展理性行为体模型的范围，将其从传统现实主义视角的有限范围扩展到一个具有更少冲突问题和更多合作问题的更复杂世界中。这种扩展为在理论上整合国际政治中军事侧面和政治经济侧面的努力提供了激励。这种理论一体化的重要方面在于发展可以包含不同议题领域的模型，而这些议题领域往往会被分别加以处理。就个体而言，本章提出了将博弈模型应用于国际政治、军事和经济的宽广范围这一目标。就集体而言，本章显示了博弈论在更广泛的理论工作上所具有的价值：在相同的理论框架下理解国际政治的不同问题。这样，正如本章阐述的，博弈论的最大效用在于根据统一的理论使用博弈模型来理解国际政治的不同方面。

博弈论复兴的第二点价值在于更大程度上关注模型的经验应用。早期的军事战略分析基于演绎论证，但除了逸闻趣事式的修饰外并没有得到检验。也许这种状况可以归因于这样一种幸运，即如果将核战争的爆发作为核心的因变量，资料就不充分。然而，关于非核威慑的相关历史证据也只是在近期被系统地考察过。 ^[1] 近期博弈论在军事和政治经济问题上的应用具有一个优点，即它关注演绎理论的经验含义和评估。在检验博弈论对国际政治的理论化是否有用的过程中，我将强调博弈论的经验侧面是必要的。

博弈论在诸如国际关系一类的实体知识中的应用提出了许多困难的经验问题。例如，谁是相关行为体？博弈的规则是什么？每一个行为体可以获得哪些选择？博弈中的报偿如何？议题最好定性为单轮博弈还是重复博弈？在分析任何特定的议题时，我们都不可能为这些问题提供确定的答案。博弈论所要求的某些信息往往难以获得。不无嘲讽的是，它并不总能够充分包括其他重要的信息——如关于互动情境的相关历史细节、对决策者个性和行为的洞察、对外交政策过程的理解。博弈论分析的这些缺点使一些分析家断言，博弈论作为一种理论工具来引导国际政治经验研究的有用性受到了严重的削弱。

本章结论表明，将博弈论看作一种描述工具而非一种分析工具，就误解了博弈论的力量之所在。博弈论的过多应用仅仅是挑选案例：古巴导弹危机到底是“胆小鬼”还是“囚徒困境”？这种用法可能有助于重构和解读特定事件，但它将博弈论的首要价值误解为重新描述世界，并因此限制了对博弈论的检验。对演绎型理论加以检验的更适当方式在于考察其分析预测的经验矫正性。这要求通过其假定（例如偏好和报偿）赋予理论的经验内容，而不是使理论（或理论的多个模型之一）去迎合某些历史或当下的事件。

将博弈论作为描述而非分析工具的一个例子可以说明上述区分。《国家间冲突》被普遍认为是国际关系中博弈论最具雄心的一项应用。在这本书中，格伦·斯奈德（Glenn Snyder）和保罗·迪辛（Paul Diesing）在16个案例中运用博弈模型来考察国际危机中的讨价还价。他们从事件的具体历史分析中重构了每一场危机的博弈结构。他们已经充分意识到这种重构的困难，而且如果（这一点在此类分析中经常发生）其他人对各场危机提供了不同的解读他们也不会感到惊奇。但是，这种挑战仅仅检验了他们根据博弈术语重构危机的技巧，而没有检验理论本身。实际上，由于斯奈德和迪辛使用危机的整体来生成描述性博弈模型，他们对博弈论的应用并没有产生在经验上可以证伪的任何预测。博弈论的演绎力量并没有得到运用。因此，他们的著作并不是博弈论的经验应用，即使它说明了博弈模型的纯描述运用。 ^[2]

无论是基于经验目标，还是理论目标，博弈论的真正力量在于它可以用来产生新的发现和理解，而非重构单个的情势。这一目标要求根据国家在相互依赖的国际体系中追求目标的行为，而将博弈论看作一种国际政治的理论。这就意味着博弈模型在预测很大程度上由非目标或非体系行为决定的结果上并无用处。如果这些因素决定了所有案例或多数案例，那么博弈论对国际政治而言，将没有什么用武之地。然而，如果坚持具有战略理性的国家采取自我利益的行动这一假定，并可以准确地将偏好、战略和报偿加以模型化，那么博弈论可以产生可检验的重要预测。

这一立场基于现在已被广泛接受的观点，即任何理论的目标不是为了再生产现实，而是通过简化现实增加我们对基本过程的理解。基于这一理由，将任何单个案例的所有细节整合进来的做法都不是我们想要的。简化和抽象引导我们免受信息泛滥之苦而聚焦更根本的问题。

博弈模型的简约性有助于清晰说明社会现象，而博弈论的演绎环节使我们得以推断关于国际政治的新理解。最知名的例子就是“囚徒困境”。根据这一矩阵的分析，为了解诸如关贸总协定和限制战略武器会谈提供了洞见，而仅仅通过档案研究不能获得这些洞见。将分析扩展到多人囚徒困境和集体行动的逻辑，可解释为什么国际合作即使符合所有国家的利益，有时仍会失败。关于不同规模国家的影响及霸权式领导的进一步考察表明，力量和利益的不同分配促进或阻碍集体最优结果的出现。 ^[3] 在动态博弈中，动机的变化解释了为什么关贸总协定中的合作比限制战略武器会谈中的合作更加成功，在后者，如果对方背弃合作，相互猜忌会强化关于潜在危险的知觉。

在这些丰富的研究方向下，博弈论可以多个方面引导国际政治的经验研究。在本章的第一部分，我阐述了作为国际政治的一种理论路径的博弈论，并将博弈的这一用途与隐喻和其他用途进行比较。这为讨论理论的经验运用前提奠定了基础。在第二部分，我讨论了博弈模型的理论建构及其应用于具体的国际问题的含义。这些建构所提出的问题扩展了我们对特定问题的理解。在第三部分，我检验了简单博弈模型的理论扩展，即通过纳入国际政治互动的关键特点来扩展经验应用的情景丰富性。这两个部分的讨论参考了博弈的技术性文献，但焦点在于博弈论路径提出的国际政治的经验议题。 ^[4] 在最后一部分，我概括了博弈论作为一种国际政治理论和一种经验研究指南所具有的适用性和局限性。

一、作为一种国际政治理论的博弈论

将博弈论作为隐喻、类比、模型或理论的不同运用体现了其用于经验现象的多种逻辑。即使这些运用有时可以相互替换，分辨它们会说明博弈路径和经验证据的关系。其间的差异对更严格的路径来说已远超出了平常称谓上的不同，即使某些用途就其本质而言比其他用途更严格。实际上，使用博弈论的不同逻辑反映了将其怎样用于经验研究的不同理解。博弈论在国际政治中的多数应用属于隐喻和类比，而作为模型和理论的应用并不让人满意。既然我们在此关注演绎的而非纯描述的模型在经验上的应用，这些区分是重要的。最后，提出这些分类的目的并不在于提供术语的确切含义，而是在于展示博弈论路径的各种逻辑对国际政治的不同含义。

1．隐喻

隐喻不仅在文学中普遍使用，在科学和政策上也如此。在社会科学中经常使用机械和生物隐喻。例如，“多米诺骨牌”的隐喻在战后美国对外政策中相当重要。隐喻的力量在于其不精确的、可以广泛解释的特点。隐喻使我们思索和产生创造性猜想。其中没有正式的演绎工具：运用对两种实体的含蓄比较，从一种实体出发推断另一种实体更多的特点或结论。 ^[5]

隐喻使观念创造性地在不同的知识领域之间转移。这就解释了它们的启发性和说明性价值——特别是在理论建构的探索阶段，可以广泛解释的特点便于创造性思维的产生。但是，隐喻也往往被误解和误用。如果没有充分注意所比较对象在特点和结论上的对应性而错误运用隐喻，那么任意解释就变成了草率和愚蠢。生物和机械隐喻在理解社会上更“庸俗”的、误导性的应用，很好地说明了这些缺点。

因此，在社会科学中使用隐喻需要保持一定的警惕；随着研究的进步，必须用更精确的规定来限制隐喻的丰富性。例如，考虑一下“霍布斯式的自然状态”作为国际政治的一个根本隐喻。虽然对说明国家间安全困境具有启发意义，但当我们将其过分解读为如下结论，即任何国际合作都要求一个和霍布斯式的主权者相类似的世界政府时，这一隐喻就具有误导性。如果从对隐喻更复杂的规定出发，即承认两种政治体系之间的显著差异（例如，国际体系中的国家在本质上比霍布斯式自然状态中的个人更加安全）使非集中化的国际合作成为可能，上述混淆就不会发生。 ^[6]

规定严格性的增强不能和不同形式的表达相混淆——具体说就是不能与数学代替纯粹的文字表述相混淆。我们不会仅仅通过将隐喻转变为一个博弈矩阵就改善了隐喻。巧辩“问题 X 是‘囚徒困境’”或者“古巴导弹危机是‘胆小鬼’博弈”有效地表达了一个隐喻，但并没有使隐喻更可行或更充分地运用博弈论的力量。这样的陈述仅仅是复述了我们已经知道的事实，也许只是通过对历史事件的特定重构修饰了事实。真正的严格性要求收紧隐喻和关切问题之间的对应性。虽然类比和模型根据各自的推导逻辑可以进一步加以区分，它们在某些程度上只不过是更多可控制的隐喻。 ^[7]

2．类比

类比的关键在于其援引特定的推理类型。基于两种实体之间密切的既有相似之处，就可以推断更多的相似之处。如果 X _i 代表实体 X 的第 i 个特点，那么，通过说明它们特点的数量（如 j ）和关系（A ₁ ↔B ₁ ，A ₂ ↔B ₂ , …，A _j ↔B _j ）之间的对应性，就可以在 A 和 B 之间建立类比。在类比的基础上，我们（暂时）推断如果已知特点 A _j+1 ，A _j+2 等属于 A ，那么 B 就会存在对应的特点 B _j+1 ，B _j+2 等。这种推理对两种实体而言仅仅是表面上的，它存在于两者之间的比较。类比的任何一方都不包含任何内在的演绎结构（例如，无论对 A 或对 B 来说，特点 j+1、j+2 并不必然能够从特点1，2，…， j 中合乎逻辑地导出）。这样，推断的逻辑具有高度归纳性，并取决于是否观察到同构现象，并最终取决于命题在经验上是否得到证实。

在经验上得到证实之前，类比推断只是尝试性的。类比推理的中心任务在于区分消极（即不正确的）类比和积极（即正确的）类比。中性类比，即还未知是否正确的类比，在得到更多的证据之前往往被看作是不可知的。因此，类比如果用来引导经验观察，可以指出不同现象特点之间的相似性，但我们不能将类比作为演绎工具来确定关于这些特点是否存在的结论。类比与隐喻的最主要区别在于，特点之间更紧密的对应性和由此导致的对结论的更精确评估。

运用类比的典型方式是将国际政治和新古典微观经济学模型联系起来。这些类比的核心是国际政治体系中的国家与寡头垄断市场中的企业之间的类比（构成市场基础的博弈论结构）。这一类比从大量假定的经验对应性出发来建构，包括 ^[8] ：

这些对应性建立了类比，并使其他从垄断理论到国际体系的推断成为可能。它们包括以下命题：既然市场的垄断性集中带来市场稳定和很少的价格战，国际体系中的权力集中会带来体系的稳定和较少的国际冲突。这一推断的地位在于，这一似乎可信的假说取决于是否同意初始的对应性。如果经验上得到了证实，那么这一积极类比进一步支持了两者之间的对应性，进而可以运用类比的力量寻求更多的含义。然而也存在消极类比，即被验证为错误的推断。例如，在市场中竞争往往导致劣者被淘汰，但在国家体系中这种情况并不多见。又如，经济结果首先根据诸如效率一类的体系特点而非个体企业的命运来评估，而国际体系基本上根据体系对单个国家的影响来评估。

虽然类比可以作为有力工具将国际政治加以概念化，但是它的局限性也是明显的。错误的类比可以被发现，但无法消除；不能分析在类比中没有对应性特点的有趣对象；最后，推断的逻辑主要是归纳性的，没有直接运用演绎逻辑。既然演绎是博弈论路径力量之所在，类比则仅仅运用了这种力量的一部分。一个更好的替代方案便是运用博弈论模型，从而更直接地纳入国际体系的大多数显著特点。 ^[9]

3．模型

模型更强烈关注在实体及其模型之间严密的对应性，因为模型是抽象的和建构的，一个模型可以为所调查的问题专门定做。模型最主要的特点在于其形式逻辑既是演绎的，也是内部的（刚好不同于类比所具有的归纳的和外部的逻辑）。运用相同的符号，使模型 A 在1，2，…， j 若干方面与 B 对应。特点 A _j+k 如果能从 A ₁ ，A ₂ , …，A _j 的某种合成中推导出来，那么 A _j+k 就是模型的结论。与之相对应的特点 B _j+k 就可以在此基础上从 B ₁ , B ₂ , …，B _j 的相应组合中合乎逻辑地得到。模型与类比的不同之处在于，模型并不需要在起初确立同构关系的归纳之外更多的归纳。模型仅仅说明了 B 的特点之间所具有的逻辑关系。这种逻辑关系在模型 A 中的对应关系中得到了更清晰的展示。

因此，模型比类比更严密。在类比中， A ₁ ↔B ₁ ，…，A _j ↔B _j 既有的对应关系并不能够保证每一个 A _j+k 有一个对应的 B _j+k 。一些类比推断可能是不正确的，即使没有显著损害类比的力量——如果已确立足够的对应性，并且其他的推断仍然正确。与之相比，模型的内部演绎论证使我们基于 A 的特点 A ₁ ，A ₂ , …，A _j 断定A _j+k ，就意味着如果我们的对应是成立的，那么结论 B _j+k 就必然也适用。如果经验评估表明 B _j+k 并不成立，那么模型自身必须被修正。结论是一种更加严密的形式：消极类比不会和积极类比共存。我们不得不修正和重构模型。

（经验上可证实的）模型具有可矫正特点，相当于在证明为误之前暂可接受的中性类比（即未检验的结论）。模型的逻辑结构显示了探究的新路径。因此，在模型中的对应性要比在类比中更加紧密。在类比中，即使一处对应性出现了错误，如果其他的对应性依然成立的话，我们并不需要修正推导的外部逻辑。在模型中，某一处对应性的错误将会破坏演绎的内部逻辑，并产生错误的结论。这样，由于对其对应性规则的更高要求和更强的演绎能力，模型可以对世界作出更有力的解释。

模型的演绎形式深化了理解和解释。由于在模型中对应性更紧密，在模型不完善时又要修正模型，我们的知识需要更加精确。在类比中，对应性（或者多少对应性）是否必要并不清楚，但在模型中对应性却在推导逻辑中发挥了明显的作用（即进入演绎推理）。这样模型就促进了简约性。模型也引导我们评估最重要的对应性是否准确，并考察对应性的变化（假定）如何导致了不同的结论。

最后，过程或事件的模型（即例如某个特定军备竞赛这样的具体经验现象）与理论模型（即诸如军备竞赛一类的一般现象）需要加以区分。前者涉及一个实体的特点的抽象分析，以一组简单的关系代表它。这种模型可以纳入一种理论，但也可能和多种理论相一致。但理论模型包含了一系列相互联系的类似规律的陈述，这些陈述可以应用于一定范围的现象。博弈论在两种模型之间生成了有益的张力：博弈模型既可以作为一种对具体现象的直接表述，也可以作为对特殊事件的更普遍解读，从而涉及了更宽泛的理论视角。 ^[10]

4．理论

既然同一表述可以成为不同理论的模型，对模型的解读就将取决于其嵌入的理论。理论包括了演绎的结构、对基本假定的解读和理论建构。解读结构越丰富（与模型中紧密的对应性相比），解释就越丰富。由于这一点，理论可以在更大范围内加以解释，其含义也可以增补，从而引导模型的修正和扩展。理论丰富性更深刻的来源在于理论中可能包含的多元模型，这些模型根据具体的参数条件而出现。通过这些模型，看上去不同的现象——也许由于情境因素的不同而变化——可以在同一个理论框架中来加以理解。

作为一种有意识行为的理论，博弈论说明了理论和模型之间的关系。理性假定使我们得以根据行为体的有意识行为来解读解决方案。当规则被更明确地引入分析时，各种政治制度环境（例如经济垄断理论的资本主义市场对均势理论中无政府的国际社会）决定了博弈规则，导致了对模型的不同解读，并最终导致了不同的模型。行为体的政策选择或偏好的各种规定可能会在对国际体系的同一种基本理论框架下导致不同的博弈（例如“胆小鬼博弈”对“囚徒困境”）。博弈论作为理论的主要优点在于它所包含的模型具有极大的多样性。

博弈论如果成为一种国际政治理论（而非战略行为的一般理论），需要作出具体的经验假定（对应性）。例如通过假定追求权力最大化的国家是主要行为体，博弈论就归入现实主义的立场。但是博弈论路径并非和现实主义一致。虽然有必要将国家看作是理性的，但是在经验上既不需要必然假定国家是主要行为体，也不需要必然假定国家寻求权力最大化。由于这些假定具有不同的规定性，博弈论和一种修正了的结构路径相一致。 ^[11] 因此，博弈论将竞争性的视角带入同一框架，并且强调了它们各自不同的经验假定。

作为国际政治的一般理论路径，博弈论假定在缺乏集中的权威的制度条件下国家追求目标的行为。因此，它说明了国际无政府状态的根本问题、国家利益不同构造的含义以及国际冲突与合作的政治环境。如果充分发挥其作用，博弈论运用简化的假定可扩展我们对国际政治的理解，并深化我们对国际政治的解读。

在社会科学研究中，隐喻、类比、模型和理论是互补的；在不同的阶段，每一种都是适当的。在它们之间转换经常是有用的。但是随着研究的深入，隐喻和类比的局限性日益增加。由于模型具有更大的严格性和演绎力，相应的理论框架在解读上具有丰富性和广泛性，模型和理论的结合将更富于建设性。 ^[12]

如果博弈论向一种国际政治理论转型，国际政治分析将更成熟。对博弈的隐喻和类比已经广泛地被用来说明和澄清国际问题。为了更直接地运用博弈论的演绎力，我们必须收紧经验情势和博弈模型之间的对应性，并将假定和预测分开。如果我们这样做的话，模型和理论将为相关的经验证据提供引导，正如证据将为评估和修正模型提供引导一样。如果以这种方式来处理，博弈论就不再仅仅是重写历史或重述观点的新语言，而成为我们扩展理解和推动研究的有力工具。为得到这种力量，我们需要做出假定以及连接演绎逻辑和经验事实的工作。在下文中，我将讨论既作为模型也作为理论的博弈论在国际政治的经验考察中如何应用。

二、运用博弈论建设国际关系理论

博弈论的概念为建构国际关系理论提供了引导。在这一部分讨论最基本的概念——战略、战略理性、偏好和报偿——及其对理解国际政治的含义。虽然我主要参考简单的2×2博弈，但是该讨论也同样适用于其他博弈模型。通过将国际问题的情景特点纳入博弈模型，这一部分将更明确地覆盖这些内容。

1．战略

战略是一种完整的行动计划，涉及包括偶然的外生事件、其他行为体的内生行为在内的所有可能性。除了最微不足道的决定以外，这个概念是极其复杂的，超出了任何人、机器或国家官僚机构的计算能力。虽然我们可以将战略看作更复杂的决策过程的简化，但如果将战略作为一般政策姿态的简化表述就可能取得更丰富的成果。例如，在贸易政策中不必关注无数的细微差别，比如关于钢铁和纺织品的差别对待或者关税还是非关税壁垒的运用等，只要在广泛的意义上说明自由的国际贸易战略还是限制性的国际贸易战略就有意义了。与其类似，减少军事开支的战略、增加国际紧张的战略或促进环境保护的战略都是有意义的，而无须关心是否有人编纂了关于在哪一种预想到的可能性下如何实行政策的准确清单。简单的2×2博弈将这一点发挥到逻辑上的极致，即仅有两种选择（标以合作和非合作）是可以获得的。虽然并非没有局限性，这样的假定是一种有用的简化，可以说明一个议题领域的根本性质。

战略的概念如此复杂，以至于能够包含广泛的现象。这种覆盖的广度是博弈论的主要优势。然而，也需要了解这种广度的局限性，以确保战略的概念被用来澄清而非混淆问题。一个例子是战略如何纳入动态的因素，即随时根据变化的环境对计划作出调整。当动态的问题被看作为行为体随着时间而展开的静态战略选择时，博弈论最有力的一些结果将会出现。然而，正如我们将在第三部分发现的，动态问题如果归于一种静态分析，有时会变得更加模糊。即使没有如此，区分包含单独的决策阶段的简单博弈和表述多个阶段持续博弈的“简单博弈的次序”依然是有用的。

第二点关切在于具有战略和理性行为的关系。在此区分一下模型和理论是有用的。我们同意阿克塞尔罗德所说的，作为一个模型，“有机体并不需要一个大脑来运用战略”。 ^[13] 阿克塞尔罗德通过在大范围的现象内运用博弈模型展示了重要的结果。在这些现象中，“战略”和寻常意义上该词汇的含义——计划或战略行为无关。例如，博弈模型和自然选择的假定相结合为细菌、微生物和其他低级生物的行为提供了具有启发意义的解释。类似的分析可以运用于经济和政治过程。这样，博弈论模型对未涉及理性行为体的理论也是有用的。但是正如阿克塞尔罗德所指出的，当战略和有意识的行为相联系时，博弈模型在理论理解的情景下会更加丰富。这种战略理性在博弈论中的明确使用抓住了国际政治的重要方面，而脱离理性假定的博弈模型则做不到这一点。 ^[14]

2．战略理性

现实主义的基石在于将国家看成理性行为体。这要求国家在运用可获得的信息来追求一定的目标时，作出合乎逻辑的正确计算。这种假定已经受到了另外一些理论，包括官僚政治、决策心理学模型、社会选择和复杂组织理论的冲击和挑战。这些批评给博弈论提出了值得注意的重要教训，这一点将在本章关于博弈报偿来源的部分来讨论。但是，即使“博弈论的用途不可替代”这种说法的确言过其实，理性假定对国际政治研究的价值在很大程度上可以迎接这些挑战。

相互依赖的视角，或者更为广义的博弈论，对非战略理性的概念提出了另一种挑战。这种非战略理性主导了现实主义过于简化（但普遍悲观）的观点。 ^[15] 在现实主义世界中的理性集中于无政府状态下权力的斗争。当国家追求的利益相互冲突时，国家会奋起保护自己。因为自助环境的冲突性质会将情势错误地看成是零和博弈，在此情况下，合作不可能发生，国家不顾其他国家的利益，只追求自己的最大利益。博弈论视角揭示，只有在人为建构的双人室内博弈中，这些环境条件才会出现。对于现实的国际问题来说，假定利益的纯粹对立并没有恰当地抓住国家利益的特点。这就直接导致了战略理性，即对自我利益的追求要得以实现，必须考虑一个国家的选择和其他国家的选择之间的互动。没有国家能够在不顾其他国家选择的情况下找到自己的最优战略，或获得自己的最优结果。其相关的含义在于，即使国家决策者寻求在冲突性互动下保护自己，也需要追求合作性互动的机会。

对博弈论分析来说，理性的两个方面特别重要。 ^[16] 第一，非战略概念和战略概念的共同点在于，为了长期考虑放弃短期优势的能力。第二，战略理性与非战略理性相区分的最显著特点在于，行为体基于偏好和其他行为体如何行动的预期来选择行动路线。因此，当国家开展一定的行动，国家所偏好的目标并不一定成为接下来的即刻结果。它可以成为达到某些其他目标的战略计划手段（下面考虑的例子是一报还一报战略的使用，以短期的成本去换取长期的合作）。这种可能性要求我们考虑每种选择与先前的和后续的选择如何相互联系，并理解国家目标如何不同于观察到的行为。

对从博弈论角度理解国际政治而言，战略理性的假定是根本的。个体行为和集体结果可根据国家对其自身利益的战略追求来理解。诸如机制这样的制度安排的发展可以解释为通过改变“博弈规则”而克服集体行动问题的努力。 ^[17] 合作增加的前景和冲突增加的危险可以通过国家面临的战略可能性来考察。从理论上说，对国家所作的理性假定越强，博弈论所提供的解读就越丰富。如果理性假定为官僚、心理或组织因素所严重限制，同样的模型就需要不同的解读。

最后，战略理性属于博弈论抽象特点中最重要的一个。通过将国家政策的理性选择放在解释的最显著位置，博弈论使我们理解国家选择的自主性，即使它通过理解整体战略互动来决定性地预测和解释这些选择。这样，博弈模型混合了目标性行为和限制行为的国际政治结构性规定。它将体系上的宏观理论和自发的决定联系起来。国家作出选择，但它们作出的选择或多或少地由国际政治中的紧急事件所决定。 ^[18]

3．报偿

理性假定国家追求其目标，但这些目标并不能加以具体说明。博弈论视角要求分析国家的动机以及它们的偏好如何在博弈模型中表示成报偿。在议题领域与其博弈模型之间建立这种对应性是博弈论在经验中能否成功应用的最紧要问题。要做到这一点，我们必须提出国家目标取决于内部价值和外部环境，从而需要将国际问题的其他经验和理论理解纳入模型。

对于报偿的归纳来源而言，发生了什么并不能解释为什么发生？“偏好显示”（revealed preference）路径的简单应用——阿马蒂亚·森（Amartya Sen）敏锐地将其称为一种“坚固的规避 ”——导致了行为体所作的选择回到其偏好的循环推理中。 ^[19] 除非为了思维的和纯描述的目标，这种对于情势的重新表述并无意义。为了避免循环性，偏好显示可以略有不同的方式来运用。当一个国家面对一种环境时，在类似的其他情势下该国所做的选择可以用来归纳推断其偏好（及其报偿）。用来决定博弈报偿结构的证据独立于结果。在档案和备忘录中，可以得到关于偏好的独立证据，包括领导人关于其目标的陈述。这些来源要求采取仔细的和系统的路径来收集证据；必须排除领导人出于个人目的的陈述，必须避免偏颇地和专门地收集逸闻趣事来支持报偿结构的确定。

由于战略理性怀疑任何对相关证据的解读，对博弈模型来说，即使最精确的归纳路径也是有问题的。既然行为体有时为了长期收益放弃短期收益，可观察到的行动可能不会直接反映偏好。而且，战略理性的本质在于国家可以放弃个体的最优行为而相互协作，以达到共同偏好的结果（例如，囚徒困境中可以观察到“合作”行为，但我们不能由此间接推断出国家最大的个体报偿与这样的“合作”行为相联系）。因此，战略行为体可观察到的行为经常不能全面地、令人满意地显示其利益。

最后，归纳程序仅仅提供了不完整的偏好图。就偏好展示而言，只有国家实际作出的选择能被观察到；它们对其他可能结果的评估证据是间接的和不完全的。根据简单的博弈，直接的证据只有在四格中的一个可以获得。信息量之少更令人震惊，因为2×2博弈是对丰富的偏好映射系列的简化表述。这样，即使有其他来源的论证，纯粹的归纳性证据对决定博弈矩阵的结构来说，总体上仍是不充分的。

国家偏好的理论阐述能够为摆脱经验上的两难提供一种路线。这种“报偿理论”必然先于博弈模型。它们使博弈论和国际政治的其他路径以建设性、互补性的方式联系起来，甚至在某些情况下和那些被看作是理性模型的替代理论联系起来。为报偿的来源发展一种理论基础的可能性，最好被视为实现这种目标的替代方式。

当某个议题领域的理论知识具有实体意义时，可以直接评估国家的偏好。这种知识为模型化一种情势并导出其报偿结构提供了一种方式。考虑一下国际贸易的新古典理论，它为包括关税征收、资本流动限制或行业补贴在内的战略选择所决定的报偿提供了一种详细阐述的框架。这种强理论可以使我们对大量重要贸易问题上的国家间战略情势加以精确地说明。在有关军事开支的文献中可以找到另一个例子，盟国和对手之间军事开支的影响的理论观点辅以国际紧张和联盟的主流知识，就可以揭示这些情势的战略结构。 ^[20]

但国家的偏好并非总是与对某个议题领域的客观理解紧密联系起来。知觉和信息过程、组织或官僚规则可以改变决策者的相关报偿。对这些因素的理论理解可以说明影响国家对外政策制定的额外因素。当然，根据决策过程自身解释行为的极端观点将与博弈模型形成竞争而非互补。但是为有意识的行为留下空间的温和观点则表明，相关的经验因素会影响战略行为。例如基欧汉将“有限理性”纳入参与国际机制的决定。而皮埃尔·艾伦（Pierre Allan）运用“外交气候”的概念承认了理性模型中对过去事件的认知因素。当理性行动为这些因素所限制，而非为这些因素所推翻时，这种理论综合才具有建设性。 ^[21]

当部分信息限制了报偿结构的逻辑可能性时，理论上的思考也是有价值的。例如，如果一种情势是对称的或者共同和冲突利益的性质是可以理解的，那么，一组可能的2×2博弈将得以化约。 ^[22] 另外，一个议题领域的实体知识有助于描述博弈结构，比如相对收益而非绝对收益（如重商主义对自由主义贸易政策）或者跨国连接的政策选择方式（如宏观经济政策在经济一体化国家之间的国际扩散）。关于国家间关系的总体政治制度背景、一个问题持续到将来的可能性或卷入国家的数量和相对规模的信息，都有助于确定战略关系的结构——所有这些将在下面分别讨论。

推断报偿结构的理论路径对纯粹归纳的路径来说具有几个优点。第一，通过强调根本动机，而非观察到的结果，偏好可以和行动区分开来，个体利益可以和战略计算区分开来。理论路径也为超出实际发生的结果提供了关于报偿的更完整信息（例如2×2博弈中的每一个格子）。这就可以分析一个完整的博弈结构。此外，我们不得不考察关于国家行为背后的动机相关的新问题，这样就使分析不再仅仅是以更正式的语言重新描述一个问题。

理论推导的第二个优点在于，它系统地提出了偏好会随着时间或国际政治的制度环境的变化而发生变化的问题。博弈论路径要求行为体在面对可比较的选择时具有稳定的偏好和协调一致的行为。如果偏好变化太快，模型将退化为一般的事后偏好显示行为，在此情况下，行动被假定为首先反映了偏好的变动。通过将这些随着时间影响偏好和报偿的因素直接纳入报偿理论，理论路径就避免了这种循环推理。这种关于偏好变化或制度演化的系统方法使我们可以恰当地处理国际议题的变化。

报偿的理论说明的更大优点在于，它释放了博弈论的演绎力。通过合成偏好和可用战略所定义的博弈结构与博弈论解决方案，我们可以得到关于单个国家的行为和整体结果的新推断。这些可证伪的预测独立于可观察的行为，这就为假定的可矫正性和博弈论分析路径的有用性提供了证据。如果一种理论经受了检验，那么这些新演绎将会扩展我们对国际行为的知识和理解，分析也将从隐喻和类比走向模型和理论。 ^[23]

报偿理论推导的最后一个含义在于，任何特定的应用都不是对博弈论路径单一的检验，而是对博弈论和嵌于博弈结构的特定理论假定相合成的检验（例如推导报偿的行为体的根本动机）。如果特定的模型是不充分的，报偿理论将在博弈论路径自身面前被推翻。只有一个更似是而非的报偿理论无法建构时，博弈论的普遍有用性才被推翻。即使这样，我们也不能确信这一失败是否真的来自我们在理解和阐释行为体动机上的缺点。但是，对报偿的理论说明使博弈模型对经验证据而言更加脆弱，并使其具有潜在的可证伪性。这种条件使其成为一种严肃的解释，并好于对世界同一反复的再描述。最后，为了适应矛盾性证据而修正理论说明的努力可能使我们在理解国际政治上有所创新。

三、国际政治的情境与博弈模型

对博弈模型的一种批评相当普遍却具误导性，即指责博弈模型过于“简单”而不能把握国际政治的复杂性。博弈模型并不能抓住国际互动的所有细节，但正如我在前文中指出的，简约实际上提升了理论把握复杂性的力量。为了发展上面的观点，我现在检视一下简单博弈模型的扩展，正是这些模型抓住了国际政治的关键情景性因素。博弈模型的理论运用使我们可以将其直接适用于国际政治的最主要方面。

1．外部的博弈环境与国际机制

说明博弈结构的目标在于把握一种国际情势中的基本特点。一些特点是假定（行为体、战略、报偿），而另一些特点是预测（结果）。博弈表述的价值取决于它是否成功把握了国际环境中的主要方面。博弈论也可以形成更广泛的解读，以至于没有明确进入模型的特点也能用于理解和解读。

对行为体、能力和偏好的说明确定了某个问题的整体博弈模型。每个国家和其他国家的战略联系作为“结构性”的限制决定了这个国家的机会。在此“结构”的概念是原子论的，即结构被看作个体单位的总和，并且强调单个议题的结构而非整个国际体系的结构。因此，博弈模型不足以检验世界结构这样的概念。 ^[24] 然而，国际体系及其既有的实践和规则模式对确定单个博弈模型和从博弈模型中推导结论都是至关重要的。当博弈规则和这些规则下的国家行为可以区分时，国际政治的结构可以通过这种方式加以模型化。（当然，通过确立新的行为模式、预期和规范，博弈规则也可以改变。从长期看，新的博弈规则就出现了。）

实际上，甚至议题、行为体和选择的确定也取决于先前存在的国际秩序。例如，将贸易问题单列出来纳入关贸总协定的框架，承认国家作为相关的决策者，并接受武力在决定贸易争端上的限制，所有这些都反映了理论上的假定，即现存贸易机制的哪些方面对国际贸易的政治分析而言是“给定”的。一种分析的假定可能成为另一种分析的考察对象。机制并非独立于全球现存的政治结构，而是立基于全球政治结构之上，并且相互“嵌套”，以至于一种机制的结构提供了另一种机制的基础。因此，既有的国际秩序规则确定了根本的博弈，即使这一博弈被用来进一步提出关于国际机制发展的问题。

与机制出现相关的经验问题和博弈论解决方案提出的理论问题相关。对单个国家来说，这些问题包括最大化自我利益的概念（例如，最大化对最小化战略选择），以及机制中的规范、惯例和期望如何影响这一概念。这就产生了效率的问题，即机制是否能使国家获得共同利益。第三个问题在于，结果是否是自我实施的（即一种稳定均衡），以至于机制可以在没有集中实施的条件下通过国家自利的行为而得以维持。最后一个关注点在于利益的分配和对公平的考虑，因为它们会影响我们对机制的评估。

当考察国际制度在促进国际合作的作用时，这些核心问题为预测和评估机制内的行为和机制自身的转型提供了标准。这种对博弈模型的更充分解读正是根据战略理性和相互依赖决策的理论假定，而两者都是博弈论的基本要素。

2．分析讨价还价与非对称性的报偿测量

关于偏好的强假设——例如定距对定序测量——包含了从博弈模型中推导出强结论的更多信息。测量的适当水平取决于我们关于该议题的知识和所考察的特定理论问题。定序测量在最低的程度上为博弈分析提供了关于博弈结构的充分清晰的定义，但这并不总是足够的。更强的测量对分析一定的核心问题是必要的。下面考虑一些关键的例子。要得到议题重复性有助于合作这一结论，就需要对两种（贴现）报偿流根据时间变化而做出定距层次上的比较。议题联系，即根据一个议题上的援助来交换另一个议题上的援助能否促进合作，取决于一个议题上所得收益与另一个议题上所致成本之间定距层次上的比重。实际上，双边讨价还价问题的解决方案在总体上取决于定距报偿。通过与初始的定序排列相一致的定距报偿来取代定序报偿，即使是简单的2×2博弈也可以被显著改变。简言之，除了偏好的简单顺序之外，只要偏好强度起作用，定距报偿就是必要的。

即使没有定距层次的报偿，关于强度的部分信息仍可能是有用的。例如已知背叛合作协议的动机在某个情势下比在另一个情势下更强，即使不能做出更准确的比较。更强的背叛动机往往使非集中化的协议更难有效实施，并减少了合作的前景。这样，定序报偿经常被关于偏好强度的部分信息所加强。 ^[25]

偏好强度的差异不仅发生在同一类行为体上，还发生在不同类的行为体之间。后一种情势产生了效用的“人际”比较这一棘手问题，即对国家的相对福利收益进行比较。这些因素在结果的规范评估中居于核心地位（例如海洋法倡议的分配性含义），并可能因此影响国家的行动（例如给予欠发达国家关税特惠）。然而，人际比较对纯粹的“实证”分析也是重要的。以较低的成本伤害（或奖励）其他国家的能力也会影响国家的行为。对一个国家比其他国家更脆弱的非对称情势而言，这一点尤其重要。脆弱性较低的国家将运用其地位上的优势来决定结果。当双方脆弱性相等时，结果最可能平等。做出这样的比较虽然是不可靠的，但是必要的，特别是当议题极端非对称时。定序博弈模型往往使议题看上去具有对称性（例如在囚徒困境中通过相同的定序偏好而将大国和小国看作平等的伙伴），即使在人际比较和定距测量上，它们是极端非对称的（例如这一问题对小国是至关重要的，而对大国却是无足轻重的）。既然国际政治的许多关键问题围绕着相互依赖和依赖的问题，这一思考就是重要的。

这样，博弈模型如果在理论上更多地注意潜在偏好，并且更有力地测量报偿，就可以抓住讨价还价（包括联系和历时性合作）和非对称性的问题。这种博弈模型也提出了实证分析中的重要规范问题。虽然这些不同的问题难以应对，它们并非博弈论分析所固有的。后者仅仅说明我们在理解国际政治时一些实体理论上的缺点。

3．重复与动态博弈：历时性的双人博弈

国际政治从本质上说是动态的，涉及国家间历时性的互动。正如上文所讨论的，战略可在一种纯粹的静态分析中包含动态的情势（即国家在当下选择未来的行动）。但是将所有可能性压缩为一种单一的选择，可能会产生关于国家决策能力的不现实假定，从而混淆了国际政治中的重要方面。为了理解国际机制的演化、预期的变化、国家的学习和调整以及国家偏好的变化等因素的影响，“历时性变化”的概念需要加以澄清。 ^[26]

“动态”一词并非像其数学含义那样精确，它有许多不同的用法。对国际政治而言，该词强调：第一，国家在不同时间作出多元决策的影响；第二，国家之间随着时间的展开相互调整。当博弈随着时间而展开时，新的均衡结果是否出现以及这种均衡是否稳定将至关重要。这些问题（而非博弈的形式）使动态分析与众不同。

定义决策阶段的问题将国际议题的动态分析复杂化了。离散时间模型（discrete time model）由于其容易使用而居于主导地位。根据重复博弈的顺序可以进行标准化处理，在此情况下将时间分成若干决策阶段，以分别对应一个单轮的静态博弈。然而，不应在一种特别的基础上援引重复博弈之间“显示”偏好或情景因素的变化，来定义不同的重复博弈或将不同的博弈模型搭配到一个议题上的不同时点。动态分析要求在理论上了解时间变化的经验模式，例如由苏联政治局或者美国选举过程的阴谋而导致的超级大国“继承危机”，可以解释两国间政治的体系性波动。通过增加相互依赖或者通过改变国家间的预期和信任，过去的互动会影响当下的行为。纳入这些效应可以使我们将静态模型的系统顺序适应动态世界的环境变化，但是这会比建构单个的静态博弈模型要求更多的国际政治理论假定（例如影响博弈结构的外生因素或预期的内生变化）。

当博弈未来回合的前景影响当下的行为时，动态分析可得到进一步的应用。一个议题的时间持续性会影响博弈每一“回合”上的国家行为，并改变（均衡）结果。近来最令人激动的成果说明了这种分析的力量：虽然在单一回合的囚徒困境中合作并不符合个体理性，但在重复囚徒困境博弈下，如果达到一定的（具体）条件，合作将是理性的。 ^[27] 其理由在于，当国家可以通过历时性合作获得长期收益时，国家就会放弃背叛的短期动机。这就使国际合作在没有集中实施的情况下成为可能，并且表明了国际政治的动态分析的重要性。这也是运用博弈论的演绎力导出新结论的重要例子。

重复性不仅改变了博弈结果，也改变了情势的基础结构。在单轮回合的囚徒困境中，背叛是占优战略，其他行为体的行动是完全无关的。而在重复博弈中，与其他国家的协调至关重要。例如，只有当其他国家（在双边情势下）或者足够数量的国家（在多边世界中）采用了协调一致的战略时，“一报还一报”战略才是有效的。这样，一旦囚徒困境博弈是重复的，单个国家所面临的基本问题将会改变。然而，其他博弈的重复回合并不总是促进合作。例如，协调博弈重复的前景为国家提供了违反现存合作协议的动机，即迫使其他国家接受自己所偏好的另一种协调点。这样，虽然囚徒困境与合作的失败并非总是国际关系的恰当隐喻，重复囚徒困境与合作的成功也同样并非总是恰当的隐喻。每个问题需要分别加以模型化，以理解重复性博弈的影响。 ^[28]

将囚徒困境“超博弈”作为一种“动态”博弈加以反思将是有趣的。既然它涉及历时性博弈下对单一战略的选择（例如“一报还一报”或“总是背叛”），它就具有静态博弈的形式特点。只有在战略被用来应付可重复的一系列静态博弈下如何对弈的问题时，它才是动态的。由此，它提供了重复博弈的顺序中战略转换的系统分析（例如，在“一报还一报”战略下从合作向非合作的转换）。这种对超博弈的解读（加上这一事实，即它可以涉及上面所讨论的静态博弈的转化）赋予其动态特点。 ^[29]

这个超博弈的更大力量要求国家可以比较当下的收益（例如当下回合不合作的收益）和未来的收益（例如保持历时合作的收益）这一强假设。这种比较需要涉及定距报偿和比定序报偿更多的关于偏好（强度和顺序）的信息。由于个体从重复中所得报偿是在不同时点下获得的，国家必须通过“贴现率”比较它们来显示它们关于当下对未来收益的时间偏好。这些贴现率取决于国内环境、国家在国际体系中的情势和重复博弈在未来是否可持续的不确定性。 ^[30]

一个重要的因素是博弈中重复的数目。一个议题预期存在时间越长，未来回合对当下选择的影响就越大。同样，国家调整其政策越快，单一博弈的时间框架就越短。进而，在任何给定时期的互动就越多。这就表明，国家可以通过在军备控制中改善核查或者将谈判分解为一系列更小的步骤来促进（囚徒困境中的）合作。将其他国家看作未来合作的可靠伙伴可以提升这些政策的有效性，而采取“最后一步”或为当下优势牺牲未来协作的动机会削弱这些政策的有效性。

除了提供合作动机的洞见外，重复博弈分析提出了国家如何调整到新的均衡结果这一问题。阿克塞尔罗德的著作探索了随着重复博弈中一定战略的自然优胜——特别是“一报还一报”——合作的进化。然而，虽然进化模型对理解合作的出现具有启发意义，进化理论在调整机制的具体化上误入歧途。这是因为国际体系既没有选择性的消亡（国家很少消亡，即使在战争中），也很少发生进化理论所要求的偶然的变化。相反，通过学习和计划，国家可以理性地调整。博弈论很好地抓住了这一点。即使行为模型是同一的（例如，说明“一报还一报”的功效），理性的调整比进化理论使我们能够更有力地和更丰富地从理论上解读国际政治与合作。 ^[31]

依据战略理性来解读动态博弈，可以使我们进一步研究便于合作的国际机制出现的动因。我们可以根据国家试图通过合作改善其福利的审慎行为来理解互动。我们可以根据最大化行为来解读机制的规则和规范的接受：只有当国家认为机制的维持符合其利益时，机制才能发挥作用并存在下去。这种理性调整的机制解释了合作行为，即使没有消亡的威胁，即使国际政治环境对进化调整来说变化得太快而不能确保成功地适应。它也解释了为什么合作在全球问题上出现。在这些问题上，所有国家都同等地受到影响，以至于根据其行为在它们之间作出进化选择是不可能的。最后，我们应当希望在一个有核世界中，为了合作的调整是理性的。

4．多边世界：多人博弈

既然许多国际议题涉及大量国家，两个以上行为体的博弈模型是重要的（例如古典欧洲均势下的五个行为体、海洋法中的多个参与者、在当代经济机制中五国、十国或七十七国“集团”等）。多人博弈模型表明，这种扩展对于一些问题有所助益，而对另一些问题效用有限。 ^[32]

多人博弈是复杂的，并且很少提供简单的答案，但是大量相互联系的假定可以简化具体情势的分析。第一个简化是当国家的数目较大时，没有任何一个国家对其他国家产生实质性影响。每一个国家都假定其行动不会被察觉，并在其他国家不会作出反应的假定下追求其利益。这就使问题变成“狭义理性”——等同于一个行为体对自然界的博弈——从而没有提出战略复杂性的问题。这并不是说这种情势没有兴趣点或没有问题：集体行动问题会导致集体次优结果。但是大数目假定对国际政治来说并非总是富有成效的，因为一个议题往往只涉及中等数量的国家，这些国家有能力对彼此行为进行监督和作出反应，特别是具有下面所讨论的区别对待的能力。

另一个相关的简化是对称性假定。这就意味着国家面对相同的机会，具有相似的利益和在一个议题领域中产生大体相当的影响。在这些情况下，每个国家和其他任何国家的关系都是大体相同的。多边关系可以理解为任何一个国家与其他所有国家之间的战略关系。谢林和拉塞尔·哈丁对“K集团”的分析以及公共物品供给的许多问题都是这样的例子。 ^[33] 这些对称性模型有时可以通过在其中纳入一定的非对称性来加以修正（例如，将利益的不同分配引入到公共物品供给的对称性问题之中）。

最后一个简化涉及国家针对其他国家的行动采取区别对待的能力。例如，国家区别对待关税清单（例如共同市场或普惠制）和运用军事力量在威胁敌国的同时保卫盟国。为了更加有效，区别对待必须和其他国家的战略联系起来，以便使区别对待取决于敌国的相应行为。就此而言，完美的区别对待和大数目情势刚好相反。当区别对待是完美的，每个国家能采取对其他任何国家都各不相同的政策时，多人博弈就可以作为一系列相互联系的双人博弈加以分析。阿克塞尔罗德对合作的进化分析就依赖这一假定，因为行为体被假定为具有与某些行为体合作而不和另外一些行为体合作的能力。通过运用区别对待的假定，阿克塞尔罗德为多个行为体之间合作的出现提供了有力的解释，虽然它在很大程度上依赖于双人博弈论。 ^[34]

区别对待并非总是合理的假定。它在技术上很难对付议题的本质或国家的能力。例如，国际公共物品的供给问题之所以产生，就是因为国家不能将其对某个国家的行动与针对其他国家的行动分隔开来（例如在国际水域限制捕鱼的规模）。即使是可行的，区别对待也可能难以实施。这样，区别对待的贸易协议有可能由于跨境运输遭受侵蚀，在军事上威胁一个国家也往往很难不使其他国家感到紧张。甚至当区别对待在技术上是可行的，诸如贸易中的非歧视规范一类的政治安排也使其不可能实施。在另外一些情况下，诸如联盟或贸易共同体一类的政治制度被设计用来便于区别对待。只要条件允许，区别对待使我们得以根据简单的模型分析多人博弈。

许多多人情势并不符合关于大数目、对称性或区别对待的相关假定。我们如何分析国际政治中这些重要的情势呢？首先，多人博弈论的总体结论可以增加我们对国际政治的理解。虽然多人博弈论往往在提供多个解决方案以替代任何特定博弈的单个解决方案上令人失望，这种多元性自身为理解战略问题提供了洞见。解决方案之间的差异说明了理解国家间政治时战略结构的重要性。例如，效率标准（帕累托最优）与国家自我利益最大化之间的冲突，说明了在集体行动问题中集体理性和个体理性之间的内在冲突。同样地，对“核心”解决方案存在的分析显示，当在大量国家中存在多个强大的和重叠的次同盟时，合作有可能产生。

其次，如果通过将具体的国际议题加以模型化，就可能更具体运用多轮博弈的结果。关于垄断的研究已经为国际政治研究提供了启发；其丰富的理论和经验知识无疑包含了深刻的洞见。然而，这种知识不应该像华尔兹那样作为类比加以纳入，而应将其作为如何建构模型和理论的例子。直接针对国际政治量身订做的模型将会比任何在企业和国家之间建立类比的伟大尝试都能更好地抓住国际政治的复杂性。例如，对均势的研究包含了大量关于不同数目国家之间战略关系的洞见，但其大部分工作仍然是初步的，仅仅根据行为的描述性规则来表述，非根据国家的目标来阐述更正式的模型。其他的一些研究工作迈出了试图将国家的目标加以模型化的重要一步，但没有成功地考虑国家间的战略关系。 ^[35] 对于建立一个更完整的理论来理解政治军事关系来说，这两种路径的整合具有巨大的潜能。

然而，多人博弈论并没有得到简单的结论，它也并非万能药。总体上看，如果我们的目标在于在我们的模型中重造具体的情势，多人博弈论将是不适合的。对于这里并未讨论的更复杂的多人动态博弈来说，更是如此。但是，如果我们的目标在于理解国际合作随着国家数目的增加而面临的普遍问题，那么博弈论简化的假定和一般的结论仍具有价值。

四、结论：博弈论与国际合作

评价博弈论的最终标准在于它是否扩展了我们对实体问题的理解，诸如本书在国际合作的案例中所分析的那些问题。博弈论是非常概括的，如果没有额外的辅助假定就不能提供具体的预测。因此，它的有用性取决于它是否提出了国际政治的有趣问题，并表明经验阐述的有效方向，而非是否提供了狭义上的正确答案。案例研究为这一理论经验阐述的解释力提供了检验。当然，检验并非是对特定条件下行为的具体预测——理论不能产生那些预测——而是为议题领域的行为提供了一般性解释。如果特定案例研究中的解释在经验上并不成立，其原因既可能在于一般理论路径的缺点，也可能在于特定的经验阐述中的问题。这样，理论的检验最终要看案例研究在整体上是否表明博弈论路径为国际政治提供了新的洞见。

作为国际政治理论的博弈论富有成效，使其能够在经验上得到如此广泛的运用。理论建构是灵活的，可以适应不同的实体问题。理论所包含的各种类型的模型使我们可以系统地合并不同议题的最重要的情景特点。在简单的2×2博弈中，这一点在不同的博弈结构（例如囚徒困境对胆小鬼）中得到反映，并且通过对报偿和国际环境的细致模型化加以区分。对多人和动态博弈的扩展则使我们提出了其他重要的维度。在一种共同的博弈框架下应对不同的国际议题并没有减少这种多样性，而是在此框架下探索了各种情景差异的含义。通过这种方式，博弈论强调了情景的重要性，而没有迷失其中。

如果我们运用不当，博弈模型的多功能性会使我们反受其害。隐喻和类比路径对描述和展示来说是有价值的，但其过于随意而不能提供可证伪的命题。以前后必然的方式应用模型也是如此。模型只有嵌于理论观点中，并在某个议题领域中根据相关的经验对应性（例如报偿或者重复的次数）量身定做，才会提供有趣的和潜在可证伪的经验命题。进而，这些模型的演绎力有助于将推导和假定相分离，即使它们产生了新的预测。

作为国家行为的理论，博弈论为理解国际关系提供了最有希望的前景。作为一种一般性理论，博弈论将彼此争论的相互依赖理论和现实主义理论放在一个共同的框架之中。博弈论可以足够灵活地整合许多关于世界政治和单个议题的各种假定，即使战略理性假定的正确性受到了限制。国家自我利益行为并不事先就必定导致冲突或合作。同样，强有力的国际制度的出现，无论是正式的制度还是非正式的制度，既非势所必然，也非天方夜谭。相反，各种可能性所需的条件得以预测将取决于不同议题的具体环境。理论促使我们以适当的经验对应性考察这些可能性。以这种方式，“国际政治的博弈理论”有助于我们阐明和更新“霍布斯式无政府状态”和“国际组织”这样广泛使用的隐喻，正是这些隐喻分隔和模糊了我们对国际政治的理解。

[1] ．关于最近的论著，参见Alan Alexandroff and Richard Rosecrance, “Deterrence in 1939,” World Politics 29（April 1977）, pp.404—424；Bruce Bueno de Mesquita, The War Trap （New Haven: Yale University Press, 1981）；Alexander George and Richard Smoke, Deterrence in American Foreign Policy （New York: Columbia University Press, 1974）；Robert Jervis, Perception and Misperception in International Politics （Princeton: Princeton University Press, 1976）；John Mearsheimer, Conventional Deterrence （Ithaca, NY: Cornell University Press, 1983）；Glenn Snyder and Paul Diesing, Conflict Among Nations （Princeton: Princeton University Press, 1977）。

[2] ．我的评论并非旨在批判这一有雄心、有眼光的研究工作。作者对博弈论的描述性运用是适当的，其终极关切在于决策与议价的不同模式，而非博弈论，后者仅仅在“刻画危机结构上发挥了有限的作用”。参见Glenn Snyder and Paul Diesing, Conflict Among Nations , p.87。然而，如果将这一著作归为任何一种分析性的博弈论路径，博弈理论家将合理地表达不同的意见。

[3] ．Duncan Snidal, “The Limits of Hegemonic Stability Theory，” International Organization 39（Autumn 1985）, pp.579—614.

[4] ．本书中的论文预设读者对博弈论路径基本熟悉。关于博弈论的优秀概论性著作参见Henry Hamburger, Games as Models of Social Phenomena （San Francisco: W.H.Freeman, 1979）；更高级的博弈论著作参见Martin Shubik, Game Theory in the Social Science: Concepts and Solutions （Cambridge: MIT Press, 1983）。两部可读的经典著作是R.Duncan Luce and Howard Raiffa, Games and Decisions （New York: Wiley, 1957）；Thomas Schelling, The Strategy of Conflict （Cambridge: Harvard University Press, 1960）。

[5] ．Martin Landau, “On the Use of Metaphor in Political Analysis,” Social Research 28（Autumn 1961）, pp.331—353.

[6] ．霍布斯式（国内）的自然状态与当代国际关系的对比参见Charles Beitz, Political Theory and International Relations （Princeton: Princeton University Press, 1979）。从战略行为体视角讨论非集中化的国际合作，参见Robert Keohane, After Hegemony （Princeton: Princeton University Press, 1984）；以更纯粹的博弈论视角探讨非集中化的国际合作参见Duncan Snidal, “Interdependence, Regimes and International Cooperation”（Ph.d．diss., Yale University, 1981）；相关的论文也可参见Stephen Krasner, ed., International Regimes （Ithaca，NY: Cornell University Press, 1983）。

[7] ．隐喻的特点在于对应性规则的松散，并不必然缺少数学形式上的复杂性。关于数学形式上复杂的隐喻，参见弹簧谐运动作为军备对抗的隐喻，Paul Smoker, “The Arms Race as an Open and Closed System,” Peace Research Society（International）Paper 7（1967）, pp.41—62。关于批判性讨论，参见Peter Busch, “Mathematical Models of Arm Races，”an appendix to Bruce Russett, What Price Vigilance? （New Haven: Yale University Press, 1970）。

[8] ．垄断的类比广泛传播。这里提出的对应性可参见Kenneth Waltz, Theory of International Politics （Reading, MA: Addison-Wesley, 1979），特别参见第七章。其他微观经济学类比的例子可参见Robert Gilpin, War and Change in World Politics （New York: Cambridge University Press）；Robert Keohane, “The Demand for International Regimes,” International Organization 36（Spring 1982）, pp.325—355。

[9] ．关于（理性的最大化行为）“经济分析路径”与作为类比的经济学之间的比较，参见Brian Barry, Sociologists, Economists, and Democracy （Chicago: University of Chicago Press, 1978）。

[10] ．理论与模型的区分并非总是清楚的。玛丽·赫西（Mary Hesse）认为：“几乎所有模型或解读都具有某种盈余含义。然而，如果一个模型在预测和解释上运用了其盈余含义，我们就可以称其为理论模型。”参见Mary Hesse, “Models and Analogy in Science,”in Paul Edwards, ed., The Encyclopedia of Philosophy （New York: Macmillan and Free Press, 1967）, pp.354—359。

[11] ．Robert Keohane, “Theory of World Politics: Structural Realism and Beyond,”in Ada Finifter, ed., Political Science: The State of the Discipline （Washington, DC: Amercian Political Science Association, 1983）.

[12] ．在此我们同意：“也许每一门科学都始于隐喻，终于代数；也许没有隐喻，就没有代数。”虽然在这一部分的论述中，“模型”一词应该代替“代数”。参见Max Black, Models and Metaphors （Ithaca, NY: Cornell University Press, 1962）, p.242。

[13] ．Robert Axelrod, The Evolution of Cooperation （New York: Basic Books, 1984）, chap.5.

[14] ．这一立场与米尔顿·弗里德曼（Milton Friedman）著名的“如果”论点在一个层面上一致，但在另一个层面上不同。弗里德曼认为，有待模型化的行为体实际上是否做“战略”计算并不重要，只要他们行动“如果”这样做了。对他来说，检验基于假定的预测是否准确更为有用。但是如果我们除了预测行为之外还要理解和解释行为，他的观点就不够充分了。为了理解国际政治中的国家行为，避免以“前后必然”的方式将行为设定为“理性的”，我们必须关注国家理性的性质和限制。参见Milton Friedman, “The Methodology of positive Economics,”in Frank Hahn and Martin Hollis, eds., Philosophy and Economic Theory （New York: Oxford University Press, 1979）；Mark Blaug, The Methodology of Economics （New York: Cambridge University Press, 1980）。

[15] ．即使在最好的现实主义者那里，以褊狭的方式解读理性的风格也是明显的。参见Kenneth Waltz, Theory of International Politics , p.70。现实主义的复杂版本整合了博弈论的概念，已运用了对战略理性的理解。关于非战略理性头脑清晰的讨论，参见 Bruce Bueno de Mesquita, The War Trap , pp.29—33。

[16] ．参见Jon Elster, Ulysses and the Sirens: Studies in Rationality and Irrationality （New York: Cambridge University Press, 1979）。

[17] ．参见Robert Keohane, After Hegemony ；Duncan Snidal, “Interdependence, Regimes and International Cooperation”。

[18] ．Pierre Allan, Crisis Bargaining and the Arms Race （Cambridge, MA:Ballinger, 1983）, pp.5—6；Frank Hahn and Martin Hollis, eds., Philosophy and Economic Theory , p.15.

[19] ．Amartya Sen, “Rational Fools: A Critique of the Behavioral Foundations of Economic Theory,”in Frank Hahn and Martin Hollis, eds., Philosophy and Economic Theory , p.92；emphasis in original.

[20] ．Mancur Olson and Richard Zeckhauser, “An Economic Theory of Alliance，” Review of Economics and Statistics 48（No.3, 1966）, pp.226—279；Duncan Snidal, “Interdependence, Regimes and International Cooperation，”chaps.5—6.

[21] ．Robert Keohane, After Hegemony ，chap.7.，Pierre Allan, Crisis Bargaining and the Arms Race , chap.4.虽然可以对理性理论加以限制，并非总能将相互争论的路径整合起来，除非以浅薄的方式来做到整合。甚至某些内在于理论的议题完全不能解析，特别是在“国家利益”确定中的偏好聚合问题。

[22] ．哈丁展示了如何为威慑问题缩小相关博弈的范围，参见Russell Hardin, “Unilateral Versus Mutual Disarmament,” Philosophy and Public Affairs 12（Summer 1983）, pp.236—254。

[23] ．这些演绎的例子包括我们上面所讨论的。这种演绎导致了理性行为体路径在政治学其他领域的成功（例如，候选人最大化选票的假定产生了关于其行为的结论。）关于上述问题的讨论（以及将效用归为“公民责任”以解释投票而浅薄地使用偏好展示所招致的批评）参见Brian Barry, Sociologists, Economists, and Democracy , chap.2。

[24] ．Richard Ashley, “The Poverty of Neo-Realism,” International Organization 38（Spring 1984）, pp.236—286.

[25] ．例如，Robert Jervis, “Cooperation under the Security Dilemma，” World Politics 30（January 1978）, p.174。然而，定序报偿可以极大地推进我们的研究，经济学家曾经（错误地）相信定序报偿对实现所有目标而言都是足够的。测量如何与所考察的问题紧密联系起来，参见Robert Cooter and Peter Rappoport, “Were the Ordinalists Wrong About Welfare Economics，” Journal of Economic Literature 22（June 1984）, pp.507—530。对这些问题更深刻的、更具技术性的讨论，参见Martin Shubik, Game Theory in the Social Science: Concepts and Solutions , chaps.4 and 5。

[26] ．在此忽视了时间偏好不一致的复杂因素。参见Jon Elster, Ulysses and the Sirens: Studies in Rationality and Irrationality , chap.2。

[27] ．合作将在预期和回应其他方合作时才有意义。关于重复囚徒困境博弈的效应的早期表述参见Martin Shubik, “Game Theory and the Paradox of the Prisoner's Dilemma,” Journal of Conflict Resolution 14（June 1970）, pp.181—193，结论的形式化工作参见Michael Taylor, Anarchy and Cooperation （New York: Wiley, 1976）；通过锦标赛方式加以拓展的成果参见Robert Axelrod, The Evolution of Cooperation 。

[28] ．双人囚徒困境超博弈的协调可以在超博弈战略矩阵中看到，参见Michael Taylor, Anarchy and Cooperation , p.39。关于重复囚徒困境与重复协调之间区别的讨论，参见Duncan Snidal, “Coordination Versus Prisoners' Dilemma: Implications for International Cooperation and Regimes,” American Political Science Review （December, 1985）。

[29] ．阿克塞尔罗德补充道，在根据战略进化而进行的动态调整过程中，在一个时期更成功的战略更有可能（由于生存、模仿或学习）在接下来的时期中采用。另参见R.Harrison Wagner, “Theory of Games and International Cooperation,” American Political Science Review 77（June 1983）, pp.330—346。在单一的2×2博弈中，通过运用序贯博弈来体现动态假定以消除“行为体欺骗的机会（通过假定他们会有条件合作）”（pp.332—333），瓦络纳提出了有价值的批评。然而，他在扩展型博弈中对有条件行为的假定上也犯了类似的错误（p.344）。重复博弈分析使决策阶段更清晰，而不必人为插入“有条件”合作，这种合作的基础在于报偿增长之前预测未来的能力和从敌手行为中恢复的能力。

[30] ．历时性合作的形式结论要求博弈无限期持续，或者终止日期具有不确定性。邓肯·卢斯（R.Duncan Luce）和霍华德·雷法（Howard Raiffa）表明，如果终止日期已知，合作将不是理性的。拉塞尔·哈丁认为即使令人难以相信，未来的回合会提供合作的动机。参见Russell Hardin, Collective Action （Baltimore: John Hopkins University Press, 1982）。

[31] ．这种情况属于同一个模型可以对应两种不同的理论（进化理论和理性理论）。阿克塞尔罗德承认根据学习和适应而对其模型作出另一种解读，特别是在他关于堑壕战合作的一章中。在此他没有提出关于政治的庸俗进化论观点。但是，其关于重复博弈的模型在理性理论和进化理论下的确具有相当不同的解读。参见Jon Elster, Ulysses and the Sirens: Studies in Rationality and Irrationality ；Robert Keohane, “Theory of World Politics: Structural Realism and Beyond”。

[32] ．一种情势应该什么时候被看作是多人博弈呢？在一些情况下答案是明确的，因为许多国家的行动在技术上不可能彼此隔离。例如，在对公共渔场的保护中，所有捕鱼的国家都是相关的。数目的问题将取决于公用品的确切属性。如果鱼种是非迁徙的，公用品可以根据领土划分而分割，那么只有领土（也许少到只有一个）国家才会涉及。但是如果鱼种是迁徙的，公用品不可分割，那么，任何捕鱼的国家都是相关行为体。如果国家在此议题上采取战略行动，并没有如实表达其利益；或者如果参与者的数目对机制而言并非外生，决定属性将是复杂的。例如，在经济机制（例如贸易集团）的建立中，成员范围将取决于机制的预期影响。关于技术博弈论的资料综述参见Anatol Rapoport, N-person Game Theory （Ann Arbor: University of Michigan Press,1970）；Martin Shubik, Game Theory in the Social Science: Concepts and Solutions （Cambridge: MIT Press, 1983）。

[33] ．Russell Hardin, Collective Action ；Thomas Schelling, Micromotives and Macrobehavior （New York: Norton, 1978）.

[34] ．在阿克塞尔罗德的分析中，每一个行为体采用相同战略（例如，一报还一报）来应对其他所有行为体。但是这意味着在任何特定的一步上不同的国家行为不同（根据它们在先前的回合中如何博弈）。但是2×2博弈的相关性是其分析的中心，因为行为体的进化生存取决于每一种战略费用与其他所有战略费用的比较。Robert Axelrod, The Evolution of Cooperation , chap.3。

[35] ．两部相关的著作参见Morton Kaplan, System and Process in International Politics （New York: Wiley, 1957）和Bruce Bueno de Mesquita, The War Trap 。