02 “爱尔法鲁酒吧”问题

归纳推理和有限理性

“爱尔法鲁酒吧”问题是个很有意思的决策问题。“很多人会去”的预期会导致几乎没人去，而“不会有人去”的预期则会导致许多人去。为什么理性预期会导致自我否定？现代心理学家认为，在复杂的或不确定的情况下，演绎推理会显得“力不从心”，这时人们主要依靠归纳推理进行决策。

1993年，当时我在圣塔菲研究所，正尝试用计算机模拟的方法来对以归纳方式进行经济决策的问题进行建模，不经意间发现了一个悖论。在圣塔菲的峡谷路，有一家名为“爱尔法鲁”的酒吧。每个星期四晚上，酒吧都有表演。人们如果预期那里人不多，他们就会去；如果预期那里人很拥挤，他们就不去。我马上意识到，这是一个很有意思的决策问题。“很多人会去酒吧”这种预期会导致几乎没人去，而“不会有什么人去酒吧”这种预期则会导致许多人去。这就是说，预期所导致的结果，恰恰否定了预期。或者更准确地说，这意味着理性预期，即一般来说正确或有效的预测，会导致自我否定。因此，这里出现了逻辑上的自我矛盾，而且与说谎者的悖论相比，逻辑结构不一样。

我据此写成了一篇文章，得到了许多物理学家的激赏。在复杂性研究的圈子中，“爱尔法鲁”变成了众所周知的名字。“爱尔法鲁”问题后来被张翼成和达米安·夏利一般化了，并进入了博弈论教科书。许多学者都对这个问题进行了研究，撰写了很多文章，为最初的问题和后来提出的少数者博弈模型及其变体给出了很多个“解”。

这篇文章最初发表于1994年的《美国经济评论会议文章》上。

*　*　*

经济学中假定的理性类型，是个完美的、合乎逻辑的、演绎的理性，这在对理论问题求解时非常有用。但是，对人类行为的这种理性假设是有很大问题的，它带来的问题远远多于它通常能够解决的。如果我们把经济主体所面临的决策问题想象成一个大海，即简单的决策问题构成表层和浅层，复杂的决策问题构成深层和底层，越靠近海平面的决策问题越容易，那么演绎理性最多只能解决位于海平面及以下1～2米的那些问题。例如，“井”字游戏问题很简单，它位于上述“决策问题之海”的表层，很容易就可以为它找到一个合乎完美理性的极小极大“解”。但是，稍稍复杂一些的国际跳棋，它位于“决策问题之海”略深一点的地方，就找不到理性的“解”了；至于国际象棋和围棋，仍然位于“决策问题之海”的中等深度的地方，当然就更加找不到了。

完美理性或演绎理性，在面对复杂情况时必定会“力不从心”，这有两个原因。第一个原因是显而易见的：当复杂性超过了一定程度时，人类的逻辑思维能力就无法应付了，这就是说，人类的理性是有限的。第二个原因是：在多个行为主体相互作用的复杂环境下，任何一个行为主体都不能假设与自己互动的其他行为主体的行为是完全理性的，因此每个行为主体都不得不猜测其他行为主体将如何行动。这就是说，他们必须依据主观信念以及关于主观信念的主观信念来做出决策。因此也就不存在客观的、明确的、共同的假设了。反过来说，这也就意味着，理性的、演绎性的推理，即在明确的前提假设下，通过完美的逻辑推理得出的结论不再适用了。总之，问题本身将变得晦暗不明。

当然，经济学家对这些情况其实是非常清楚的。问题不在于完美理性有没有效，而在于完美理性在什么地方有效。如果承认有限理性，那么在经济学中，如何对有限理性建模？关于有限理性的文献虽然不太多，但一直在不断增加，它们蕴含着很多有价值的思想，但是这些思想在很大程度上是零碎的，彼此之间没有很好地衔接起来。相比之下，在行为科学中却不是这样。现代心理学家基本上已经有了这样一个共识：在复杂的或不确定的情况下，人们会使用一些有自身特点的、可预测的推理方法，而且这些推理方法都不是演绎性的，而是归纳性的。

归纳思维

在复杂或不确定的情况下，人们是怎样进行推理的？现代心理学告诉我们，作为人类，我们只拥有适度的演绎推理逻辑能力，而且我们只能适度地运用这种能力。但是，我们却特别擅长观察、识别和匹配模式，也就是那些能够带来明显进化利益的行为。因此，我们在面对复杂问题时，我们会先搜寻模式，并利用找到的模式来简化问题，然后构造临时的内部模型或假说，或者说“ 图式 ”（schemata）。接着，我们会根据当前的假说来进行局部演绎推理，并采取行动。当我们接收到来自环境的反馈后，我们对当前加强假说的信念可能会强化，也可能会弱化；那些没有用的假说将会被丢弃，并在需要时用新的假说来替代。换句话说，当我们不能完全依靠演绎推理，或无法对问题进行完备的界定时，我们就使用简单的模型，来填补我们理解中的空白。这种行为是归纳性的。

在下国际象棋的棋手身上，我们可以观察到这种“归纳性的行为”。一般来说，在下棋时，棋手会研究整盘棋的“局面”或“大势”，并回忆自己的对手在过去比赛中的下法，以便识别不同的模式。然后，他们会利用识别出来的模式，来形成关于对方意图策略的假说或内部模型。而且，在同一时刻，他们的头脑中可能会“准备”好几个内部模型，如“他正在使用‘卡罗–坎恩’（Karo-Kann）防御”“这看起来有点像博特温尼克（Botvinnik）和维德马（Vidmar）在1936年那个对局”“他可能想走出中盘兵布局”等。棋手们在这些假说的基础上，进行局部演绎推理，分析不同的下法可能会带来的影响。随着棋局的展开，他们会坚持那些被证明有效的假说或心理模型，舍弃那些被证明无效的假说或心理模型，并且形成新的假说或心理模型。换句话说，他们在下棋时要完成一系列“工作”：识别模式、构造假说、根据当前持有的假设进行推理，并随时根据需要替换假说。

这种类型的行为在经济学中可能不为熟知，但是我们要认识它的优势其实并不困难。采取这种方法，我们就能够解决复杂问题。我们可以构建可行的且更加简单的模型，那是我们可以处理的。它还使我们能够处理不明确的问题，在界定不清楚的地方，我们的工作模型能够自动填补空白。它不是“理性”的对立面，当然更不是科学的对立面。事实恰恰相反，科学本身的工作方式和取得进步的方式就是如此。

对归纳推理建模

如果人类真的是这样推理的，那么我们应该怎样做，才能将这种推理模型化呢？如果决策问题是随着时间的推移来完成的，那么一个很自然的思路就是：设定一个由行为主体组成的集合，行为主体可以是异质的，同时也假定他们可以形成各自的心理模型、假说或主观信念。这种主观信念可以用不同形式来表示。它们可以用简单的、用来描述或预测一些变量和行动的数学方程式来表示，或者可以用经济学中常见的那种形式相当复杂的预期模型来表示，又或者可以用统计假说或“条件-预测”规则来表示，例如，“如果观察到情况 Q ，那么就预测结果或动作 D ”。所有这些通常都是主观的，也就是说，它们随行为主体不同而不同。一个行为主体在某个时刻，可以只持有一个主观信念，也可以同时持有多个主观信念。

每个行为主体，都需要将自己的各个信念模型的“历史绩效”记录下来。当需要做出选择时，他就根据当前他认为最可信的，或者说可能是最有利可图的那个信念模型来采取行动。至于其他信念模型，他先记在心里。或者，他也可以根据若干个信念模型组合来采取行动。然而，人类的一般倾向是，记住许多信念模型或假说，可以根据最合乎情理的那一个采取行动。一旦采取了行动，整个图景就会得到更新，同时行为主体也会更新所有假说的“历史记录”。

这是一个“会学习”的系统。通过“学习”，行为主体知道他们的假说当中哪些是有效的，他们会不时舍弃“表现不佳”的假说，并生成新的“想法”以便取而代之。行为主体坚持当前最可信的假说或信念模型，但是一旦它不再有效，他们就会放弃它，转而采用一个更好的。当然，这会导致一种内置的滞后。一个信念模型之所以被坚持，不是因为它是“正确的”，行为主体没有办法知道它是否正确，而是因为它在过去是有效的，因此在认定它应该被舍弃之前，必须先积累一些关于它的“失败”记录。一般而言，每个行为主体都可以说，有一个据此采取行动的“缓慢周转的假说库存”。或者，我也可以说这是一个临时得到了实现的预期系统，当然只是暂时实现，而不是完美地实现。当这些信念、模型或假说不能再实现时，它们就要让位给不同的信念、模型或假说。

有的读者可能觉得自己对这个系统不熟悉，那样的话，他或她或许可以回想一下经济学中标准的学习模型，然后把这个系统视为它的一般化。在标准的学习模型中，所有行为主体通常共享一个具有未知参数的预期模型，并根据当前最合理的参数值来决定自己的行动。与标准的学习模型相比，我们的行为主体是异质的，并且每个行为主体都运用若干个主观模型，而不是共享一个统一的模型。显然，这是一个更加丰富多彩的世界。人们可能会问，在特定的情况下，它是否会收敛到某种标准的信念均衡，或者会不会永远保持开放，总会产生新的假说和新的想法。

这也是一个进化的世界，或者更准确地说，这是一个共同进化的世界。这就像生态系统中的物种一样，为了生存和繁殖，必须通过竞争、通过适应自己和其他物种共同创造的环境来证明自己。在我们这个世界里，各种假说要想变得准确、要想成为行动的依据，就必须通过竞争、通过适应自己和其他行为主体的假说共同创造的环境来证明自己。因此，在任何一个阶段，作为行动依据的一系列想法或假说将共同进化。

然而，一个关键问题仍然悬而未决。假说或心理模型到底来自哪里？或者说，它们是怎样生成的？从行为的角度看，这是心理学中的一个深层问题，与认知、对象表征和模式识别有关。我在这里不可能深入探究这个心理学问题。不过，在构建模型时，还是有不少既简单又实用的方法。有时，我们可以赋予行为主体某些焦点模型。焦点模型指的是那些明显的、简单的和容易处理的模式或假说。例如，我们可以生成一个“焦点模型库”，然后分配给行为主体。而在其他时候，在给定一个合适的模型空间的情况下，我们可以用遗传算法或其他类似的“智能搜索设备”，生成“更有智能”的模型。或者，我们还可以允许行为主体相互“借用”心理模型。在心理学中，这被称为模型“迁移”。无论选择哪种建模方法，重要的是一定要明确，上述框架必须独立于所使用的具体假说或信念，就像消费者理论框架独立于所选择的特定产品一样。当然，要在特定问题中应用某个框架，则必须采用某个生成信念的系统。

60人！归纳推理揭开的谜底

接下来，我将构造一个问题，以它为例来说明何为归纳推理，并阐述如何对归纳推理建模。假设现有 N 个人，每个人独立决定要不要在某个晚上去酒吧消遣。为了更具体起见，我们不妨假设 N 为100。酒吧的空间是有限的，如果酒吧里不太拥挤，那么来酒吧的人就可以度过一个愉快的夜晚。具体地说，如果这100个可能去酒吧的人当中，只有不到60个人真的去了，那么去的那些人就可以度过一个愉快的夜晚。没有人能够提前知道当晚会来酒吧的确切人数。因此，如果一个人或行为主体预期，当晚去酒吧的人小于60个，那么他就会去（他认为值得一去）；如果他预期去酒吧的人会超过60人，那么他就宁愿待在家里。这些人在做出决策时，不会受自己以前有没有去过酒吧的经验的影响，同时不同行为主体之间也不存在共谋或事先的沟通。唯一可用的信息，是过去几个星期以来出现在酒吧中的人数。这个问题的灵感，来自圣塔菲研究所旁边一家名为“爱尔法鲁”的酒吧。这家酒吧每周四晚上都有爱尔兰音乐会。不过，很多类似的场所中都会出现同样的问题，比如读者可以想象一下你去吃午餐的餐厅，你也许希望它安静点，但是它可能很拥挤。事实上，任何“公地问题”或“协调问题”，只要涉及数量上的限制都是一样的。在这个问题中，我们感兴趣的是，每个星期来酒吧的人数变化的动力学机制。

不难看出，这个问题有两个有趣的特点。首先，如果有一个“显而易见”的模型，所有行为主体都能够根据这个模型，预测来到酒吧的人数并在此基础上决定去不去酒吧，那么通过演绎推理就能够求解了。但是，这里的问题显然不属于这种情况。给定最近来酒吧的人数，可以设想一大批看上去同样合理、同样有根据的模型。因此，也就无法得知其他行为主体可能选择哪个模型，这样某个“有参照意义”的行为主体，也就不能以某种确定的方式给自己选定一个模型。这里不存在演绎理性解，即没有“正确的”预期模型。从行为主体自身的角度来看，这里的问题是不明确的，因此他们被推进了一个归纳的世界。其次，在这里令人烦恼的是，任何一个共同的预期都会被打破。如果所有人都预测很少有人会去，那么所有人都会去，而这个结果将证明这种信念是无效的。同样地，如果所有人都预测大多数人会去，那么将没有人会去，这种信念同样被证伪。由此，行为主体们的预期将被迫变得有所不同。

行文至此，我想请读者暂且先停下来思考一下：随着时间的推移，来到酒吧的人的数量（为了行文方便，以下简称为“到场人数”）会如何动态地变化。它会不会收敛？如果会收敛，那么为什么收敛？或者，它会不会陷入混沌呢？我们又该怎样进行预测？

动态模型

为了回答上述问题，我将根据上面描述的框架构建一个模型。假设这100个行为主体，每个人都可以形成若干个“预测器”或假说，即有这样的函数，将过去 d 周的到场人数映射为下周的到场人数。例如，最近各周的到场人数可能构成了如下序列：

……44，78，56，15，23，67，84，34，45，76，40，56，22，35。

据此，行为主体构建的假说或“预测器”可能是这样的，预测下周的到场人数将为：

•　与上周的到场人数一样［35］，

•　与上周的到场人数以50为中心构成镜像［65］，

•　过去4周到场人数的（四舍五入）平均值［49］，

•　过去8周到场人数的趋势，上下界为0和100［29］，

•　与两周之前的到场人数相同（以两周为周期的循环）［22］，

•　与5周之前的到场人数相同（以5周为周期的循环）［77］，

……

再假设，每个行为主体拥有一个由 k 个这样的“焦点预测器”组成的集合，而且可以将这个集合的“行为”记录下来。这样一来，他就可以用这个集合中当前最准确的那个“预测器”，来决定是去酒吧还是留在家中。我把这个“预测器”称为他的“活跃预测器”。一旦做出了决定，每个行为主体就会知道新的到场人数，同时更新他那些“预测器”的准确程度。

需要注意的是，在这个“酒吧问题”中，尽管决定到场人数的是行为主体们在采取行动时所根据的当前最可信的假说的集合，即“活跃假说”的集合，但是“活跃假说”的集合又是由历史到场人数所决定的。用约翰·霍兰德给出的术语来说，我们可以认为这些“活跃假说”形成了一个“生态”。我们感兴趣的是，这个“生态”如何随着时间的推移而进化。

计算机实验

对于大多数假说的集合来说，要得出解析解都很困难，因此我在下面将通过计算机实验来求解。在计算机实验中，为了生成假说，我先创建了一个预测器的“字母汤”，方法是将十几个焦点预测器连续复制很多次。然后，我随机地将 k 个（比如说，6个、12个或23个）预测器，赋予这100个行为主体中的每一个。这样一来，每个行为主体就拥有了 k 个预测器（或假说，或他可以利用的“想法”）。我们不必担心没有用的那些预测器会使得行为主体无从选择。如果预测器是“无效”的，那么它们就不会被使用；如果它们是“有效”的，那么它们就会被放到最前面来，成为“活跃的”预测器。在这个问题中，当给定了初始条件和每个行为主体可以运用的预测器集合后，所有预测器在未来的准确度都是预先确定下来的。因此，这里的动力学是确定性的。

实验结果非常有意思（如图2-1所示）。在出现了“循环探测”预测器的情况下，这种循环很快就因为被“套利”而消失了，因此不会存在持续的循环。如果有几个人预测，因为三个星期之前有许多人去，所以下个星期也有很多人去，那么他们将会留在家里。更有趣的是，平均到场人数总是会收敛到60人。这些预测器通过“自我组织”，形成了一个均衡模式或“生态”。在这个“生态”中，平均来说，所有活跃预测器，即那些最准确的、行为主体据此采取行动的预测器当中，有40%预测到场人数高于60人，60%预测到场人数低于60人。

图2-1　爱尔法鲁酒吧前100周的到场人数

从根本上看，这种涌现出来的“生态”可以说是有机的。这是因为，活跃预测器总体上可以按60：40分成两类，每一类的成员都在不断地变化。这就像一个森林，它的轮廓不会改变，但是组成它的每一棵树却一直在改变。这些结果在所有计算机实验中都出现了，而且当预测器类型以及分配给每个行为主体的预测器数量改变时，结果仍然非常稳定。

那么，这些预测器是如何实现自组织，导致了到场人数平均为60人，预测结果则按60：40的比率来分类的呢？一个可能的原因是，在这个“酒吧问题”中，60也许是一个自然的“吸引子”。如果我们把这个问题视为一个纯粹的预测博弈，那么不难看出，以40%的概率预测到场人数多于60人，以60%的概率预测到场人数小于40人，这个混合策略正是一个纳什均衡。然而，这仍然不能解释行为主体是如何接近这样的结果的，因为他们的推理是现实的、主观的。为了更好地理解这一点，不妨先假设70%的预测器在相当长的时期内，预测到场人数都在60人以上。这样一来，实际平均到场人数却只有30人，从而“证实”了到场人数接近30人的预测，并“证实”了到场人数高于60人的预测是不成立的。这将有助于恢复预测器之间的“生态平衡”，最后会调整为40%～60%的组合，而这个组合是可以“自我维持”的。但是，要从数学上精确地证明这一点，似乎并非易事。重要的是，我们一定要认识到，在设置预测器时，根本不需要考虑40～60人的“平衡预测”。尽管有的可能倾向于预测到场人数多，有的可能倾向于预测到场人数少，但是在总体行为中，上述“平衡预测”肯定会脱颖而出。当然，如果硬性规定所有预测器都只能预测到场人数低于60人，那么这个实验就会失败。结果是，所有100个行为主体总是都会到场。预测器必须能够在一定程度上“覆盖”整个预测空间。读者不妨思考一下，如果规定所有行为主体共享同一组预测器，结果会发生什么。

可能有人会反对说，在这些计算机实验中，我所使用的固定的、笨拙的预测模型给行为主体的预测造成了妨碍。如果他们能形成更开放的、更智能化的预测，那么不同的行为模型就可能涌现出来。当然，这可以算是一个猜想，有兴趣的人可以利用某种更加复杂的方法，例如遗传编程来检验这种猜想。遗传编程方法能够不断形成新的假说、新的预测器，它们能够利用“智能化”进行调整，并且随着时间的推移会变得更加复杂。我相信，我在上面给出的结果不会有任何质的变化，但如果在性质上真的被改变了，我会觉得非常惊讶。

对于这里介绍的“酒吧问题”，可以用很多方式加以推广。我也建议读者自己动手尝试进行计算机实验。

归纳推理的多彩世界

上面描述的归纳推理系统包括了多个“元素”，即信念模型或假说，这些“元素”要适应于它们共同创建的总体环境。因此，这个系统可以说是一个自适应复杂系统。在经过一段初始的学习之后，行为主体所使用的假说或心理模型相互适应下来。因此，我们可以将一组相互一致的心理模型视为一组能够在一定条件下很好地协同发挥作用的假说。这体现了很高程度的相互适应性。有时，系统中存在着一个独一无二的这种集合，它对应于一个标准的理性预期平衡，所有信念都被它所吸引着。不过，在更通常的情况下，存在着多个这样的集合，这种可能性要高得多。在这种情况下，我们就有理由认为，经济中的归纳推理系统，无论是在股市投机、谈判、扑克游戏、寡头定价中，还是产品的市场定价中，都会陷入循环或暂时锁定在某些心理模式中。这些心理模式可能是不会重复出现和路径依赖的，而且可能会越来越复杂。总之，可能性非常多。

长期以来，对于复杂的、可能无法界定清楚的决策环境，经济学家依然假设完美的演绎理性，但是他们又会为此感到不安。人类应用完全理性的范围，最多只能称得上还可以。这种说法也许很令人惊讶。到目前为止，我们还不清楚，应该如何处理不完全理性或有限理性。然而，上文对“酒吧问题”的分析表明，人类在这类决策环境中，运用的是归纳推理：我们形成各种各样的工作假设，并根据其中最可信的那个工作假设采取行动，如果不再有效，那么就用新的工作假设取而代之。对于这种推理，可以采用多种方式进行建模。通常，这种建模会引导我们进入一个丰富多彩的心理世界。在这个世界中，每一个行为主体的“想法”或心理模型，都要与其他行为主体的“想法”或心理模型竞争，以求得生存。

这就是一个进化的、复杂的世界。

02

“爱尔法鲁酒吧”问题