利益共同体：行为经济学家对市场的辩护最新章节_罗伯特·萨格登著

1.行为福利经济学：新的共识

由于桑斯坦和塞勒在发展和倡导行为福利经济学方面极具影响力，因此我将首先分析他们给出的建议。两位学者早期发表的一篇重要论文（Sunstein and Thaler，2003a）与法学有关，另一篇篇幅较短的论文则是针对经济学家而写的（Sunstein and Thaler，2003b）。这些论文可以看作他们发布的自由意志式家长主义宣言。后来的《助推》一书则是两人对上述观点的扩展和推广（Thaler and Sunstein，2008）。

桑斯坦和塞勒的重要观点之一是，行为经济学的研究结果表明家长主义是不可避免的：反家长主义的观点是“不自洽的”，也是“行不通的”。在桑斯坦和塞勒的三项研究中，上述观点都是基于本书第2章第2节中提到的自助餐厅案例提出的。这个案例的前提假设是，顾客在不同食品之间所做的选择受到这些食品在餐厅柜台的摆放位置的影响。认识到某些食品比其他食品更健康，餐厅经理必须就如何摆放不同的食品做出选择。桑斯坦和塞勒分析了餐厅经理可能采取的两种具有显著合理性的策略：她可以“在考虑所有情况后，做出她认为能够使顾客获得最大收益的选择”，或者她可以“为消费者提供在她看来他们自己会选择的食品”。桑斯坦和塞勒认为，第二种策略是“反家长主义者会偏好的选项”，但是反家长主义者针对这个选项的论证是不自洽的。根据假设，

顾客缺乏良好偏好，即顾客坚定地持有且在餐厅经理做出如何在柜台上摆放食品的选择之前就已存在的偏好。如果不同食品的摆放位置对顾客的选择具有重大影响，那么他们真正的“偏好”就不存在。（Sunstein and Thaler，2003a，第1164页）

桑斯坦和塞勒的结论是，尽管第一种策略是家长主义策略，但对善意的餐厅经理而言，它是唯一合理的选择（Sunstein and Thaler，2003a，第1164—1165页、第1182页；另见Sunstein and Thaler，2008，第1—3页）。

为避免以后混淆，澄清桑斯坦和塞勒在上文引用段落中所说的“真正的‘偏好’”的含义十分重要。给定这一情景，“偏好”一词似乎是在传统经济学理论的意义上被使用的，也就是说，“偏好”是由个人选择真实可信地揭示出来的关于潜在选择对象的一种二元关系。在这种“正式”的意义上，餐厅顾客对食品没有明确的（“真正的”）偏好。正如我在下文中解释的，桑斯坦和塞勒的分析将顾客“偏好”归结为另一种意义上的所谓“真正的‘偏好’”。

请注意，类似第1章第3节中描述的“损失厌恶”、“注意力”和“阿莱悖论”等案例，顾客在自助餐厅所做的选择依赖于特定情景，这种选择可以得到心理学上的解释（摆放在越显眼位置的食品越容易吸引顾客的注意），但似乎与顾客的利益或目标无关。这些案例是桑斯坦和塞勒分析策略的核心。自由意志式家长主义的关键创新点在于，个人从给定（客观定义的）选项集中做出的选择会受到助推的影响，也就是说，干预只能影响决策问题的（主观感知的）框架。因此，有可能在不对个人自由地选择客观选项施加限制的情况下实现家长主义的目标。但是，助推只有在选择依赖于情景的情况下才能起作用。

另外请注意，这家餐厅中的食品选择问题是对餐厅经理提出来的。经理根据自己的权力和责任行事，但其目标是让餐厅顾客受益。桑斯坦和塞勒在2003年发表的论文中将这一角色描述为“规划师”，《助推》一书将这一角色描述为“选择设计师”。正如我在第2章中解释的那样，规范性建议是针对仁慈的计划者的，这是福利经济学的一个常见观点。这自然进一步引出了如下观点：这些建议应该是为了提高计划者打算帮助的那些人的福利。《助推》一书中的观点与上述观点截然不同：桑斯坦和塞勒说，他们的建议旨在“按照选择者自己的判断标准，让选择者过得更好”（2008，第5页）。“按照选择者自己的判断标准”这句话以略微不同的形式贯穿于《助推》一书。这似乎意味着，尽管计划者基于自己的责任行事，但他努力尊重每个人对什么能使其福利得到改进的主观判断。

桑斯坦和塞勒提出的规范经济学方法要求社会计划者能够重构每个人对自己幸福的判断，即使这些判断并不总是体现在他做出的选择中。但是，在概念层面上我们应该如何理解这些判断？社会计划者如何重构这些判断？桑斯坦和塞勒在分析决策错误的过程中系统地回答了上述问题。

在提出让选择者根据他们自己的判断生活得更好的原则之后，桑斯坦和塞勒立即指出：

在许多情况下，个人会做出非常糟糕的决定，而如果他们集中精力并拥有完整的信息、无限的认知能力和很强的自我控制能力，那么他们就不会做出这些错误决策。（Sunstein and Thaler，2008，第5页）

在较早的一篇论文中，桑斯坦和塞勒用几乎相同的方式刻画上述情形，即如果个人是完全理性的，那么他就不会做出错误决策，并将这些错误决策称为“从其自身福利角度来看的劣势策略”（Sunstein and Thaler，2003a，第1162页）。这意味着，对于桑斯坦和塞勒而言，个人幸福的标准是由个人选择所显示的偏好确定的，前提是其决策不受注意力、信息、认知能力或自我控制等限制条件的影响，我将这些限制条件称为推理缺陷（reasoning imperfection）。因此，社会计划者的任务是在个人不受推理缺陷影响的情况下，尝试通过模拟个人可能会做出的选择来重构其潜在偏好。借鉴丹尼尔·豪斯曼（Daniel Hausman，2012，第102页）的说法，我将这种重构称为偏好净化（preference purification）。

这就是桑斯坦和塞勒的想法，塞勒（Thaler，2015，第325—326页）在后来的著作中证实了这一点，他在其中强调了“对我们所著的《助推》一书的批评似乎并没有抓住这一点”。这一点指的是，桑斯坦和塞勒的“主旨并不是告诉人们该做什么。我们只是希望帮助人们实现他们的目标”。在向读者提出“由他们自己判断”这一原则时，塞勒指出：“原文是斜体，但也许我们更应该使用粗体和大字体，原因是我们屡屡因外界认为我们知道哪种选择对每个人是最好的而受到批评……我们只是想减少人们称之为错误的那些决策。”

请注意，除非潜在偏好与情景无关，否则偏好净化并不能为桑斯坦和塞勒提供分析所需的福利标准。显示性偏好的情景依赖性，以及家长主义不可避免的影响，共同为桑斯坦和塞勒提供了关于自由意志式家长主义分析的起点。但是，如果选择设计师的决策标准也被证明是依赖于情景的，那么他们的分析将被彻底推翻。潜在偏好与情景无关的假设隐含在桑斯坦和塞勒的观点中，但从未得到证明。

桑斯坦和塞勒最喜欢使用的修辞技巧之一就是，将其批评者描绘成坚信人类不会受到推理缺陷影响的人。回想一下我在第1章第3节中引用的《助推》中的一段话，其中桑斯坦和塞勒取笑传统经济学家假设人类可以“像爱因斯坦一样思考，大脑中存储着和IBM深蓝电脑一样多的内容，并运用圣雄甘地一样的意志力”，同时指出“我们了解的人类并非如此”（Sunstein and Thaler，2008，第6—8页）。在举了自助餐厅的例子之后，桑斯坦和塞勒紧接着对社会人和经济人进行了对比，读者因此会得出如下结论：普通人的选择之所以展现明显的非理性模式，就是因为推理缺陷，而行为经济学家和心理学家的研究已经证实了非理性模式，但精心设计的选择方案能够将非理性模式转化为普通人的收益。如果该推断是正确的，那么它将支持下述结论，即在没有推理缺陷的情况下，个人的选择将揭示与情景无关的偏好。但这一推断是否正确呢？

稍后我会分析这一问题，但为了给后面的分析打下基础，请读者思考如下问题。想象一个人，让我们称他为超级推理者，他拥有爱因斯坦的智慧、深蓝电脑的存储空间和甘地的自我控制能力。再想象一下（因为这也是桑斯坦和塞勒描述的完美推理的一部分）超级推理者的超大存储空间可以容纳从一切现有出版物或数据库中提取的所有信息。如果不是这样的话，超级推理者就如同一个普通人，我将称他为乔。如果乔在桑斯坦和塞勒提到的自助餐厅里就餐，那么他对食物的选择将受到这些食物摆放位置的影响。现在想象一下将超级推理者带入餐厅，餐厅提供了奶油蛋糕和新鲜水果，他选择蛋糕的可能性会与蛋糕在柜台的摆放位置无关吗？

现在先搁置对这一问题的回答，首先回顾一下其他行为福利经济学学者的研究工作。在桑斯坦和塞勒提出自由意志式家长主义这一原则的同一年，科林·凯莫勒等人（Colin Camerer、Samuel Issacharoff、George Loewenstein、Ted O’Donaghue and Matthew Rabin，2003）主张将不对称家长主义作为对行为经济学研究成果的一种规范性回应。这两种建议之间非常相似。首先，两者均由著名的行为经济学家和法律学者组成的研究团队提出。其次，两者都声称行为经济学的研究成果为家长主义政策提供了合理解释，并且这些解释不受传统的反家长主义观点的影响（凯莫勒等人的论文标题是《保守派的监管》）。凯莫勒等人提出的家长主义政策建议是不对称的，因为这些建议可以帮助避免“导致人们不以自己的最佳利益行事”的“决策错误”，从而使有限理性的个人受益，与此同时对完全理性的个人来说只需要付出最小的代价（Camerer et al.，2003，第1211—1212页）。在如何定义个人利益或如何识别个人利益方面，凯莫勒等人提供的引导甚至比桑斯坦和塞勒还要少。然而，此处的一个明显含义是，如果一个人没有犯错误，那么此时他做出的选择会显示他自身的偏好，因此，凯莫勒等人提出的规范标准等同于潜在偏好得到满足的标准。而这又回到了偏好净化的情形。

道格拉斯·伯恩海姆和安东尼奥·兰热尔（Douglas Bernheim and Antonio Rangel，2007，2009）提出了一种类似于偏好净化的行为福利经济学方法。此后伯恩海姆（2016）进一步改进了这种方法。假定福利经济学的建议对象是社会计划者，而这一点是不言而喻的，伯恩海姆和兰热尔将传统方法描述为社会计划者要尊重个人为自己做出的选择。他们的目标是将这种形式的福利经济学扩展到情景依赖型选择。在伯恩海姆和兰热尔的理论框架中，关键概念是给定个体的“广义选择情景”（generalised choice situation，GCS），这一情景由一组“对象”和一组“辅助条件”构成，个人必须在这组“对象”中选择一个。辅助条件指的是可能影响个人行为，但社会计划者认为在规范意义上无关的选择情景。将这一概念应用到自助餐厅的例子中，食物就是对象，而展示食物的不同方法则是辅助条件。个人的选择行为由对应关系表示：在每个广义选择情景下，对应关系确定了个人愿意选择的对象子集。伯恩海姆和兰热尔的第一种方法提出了一个标准：如果偏好不受辅助条件变化的影响，则尊重个人的显示性偏好，并引导社会计划者“接受任何仍然存在的歧义”（Bernheim and Rangel，2009，第53页）。在这种情况下，伯恩海姆和兰热尔认为，剔除从“有问题的”（suspect）广义选择情景中获得的数据，可能会进一步影响这个基本无用的标准。“有问题的”广义选择情景指的是，如果其辅助条件导致个人关注信息、处理信息或实施行动的能力下降，那么这一广义选择情景就是“有问题的”。实际上，通过剔除个人存在推理缺陷时所做的选择，这种方法净化了选择数据。这一方法仅使用净化过的数据，然后将基于情景无关的显示性偏好的满足度作为规范标准。尽管伯恩海姆和兰热尔并未假设始终存在情景无关型潜在偏好，但他们的方法仅能对具有如下特征的选择对象进行福利排名：净化后的显示性偏好与情景无关。

净化概念的另一种使用方式是，首先假设存在与情景无关的潜在偏好，并提出一个反映这些潜在偏好和实际选择之间的心理过程的特定模型。给定这样一个模型，人们可以研究在多大程度上以及在何种假设下可以基于实际选择重构潜在偏好。基于一个与伯恩海姆和兰热尔类似的一般理论框架，尤瓦尔·萨伦特和阿里尔·鲁宾斯坦（Yuval Salant and Ariel Rubinstein，2008）利用这种方法进行了分析。他们将个人的扩展选择问题（extended choice problem）定义为一个配对（pair）（ A ， f ），其中 A 是一组包含了全部且互斥的可供选择的对象集合， f 是一个“框架”。个人的选择是由独立于框架的潜在偏好与启发式决策之间的相互作用决定的，启发式决策由框架激活并以框架为条件（Salant and Rubinstein，2008，第1288页）。萨伦特和鲁宾斯坦提出的社会计划者将上述潜在偏好作为个人选择应该面对哪种框架的规范标准（Salant and Rubinstein，2008，第1294页）。

保拉·曼齐尼和马尔科·马里奥蒂（Paola Manzini and Marco Mariotti，2012）基于另一种相关方法讨论了有限理性选择模型的福利含义。在这个“先分类后选择”的模型中，每个人对所有相关选择对象都有着与情景无关的偏好。然而，这些偏好并不一定会在个人的选择中显示出来。当面对大量选项时，个人首先将对选项进行分类，然后剔除不太理想或不太突出的类别，最后在未被剔除的选项中选择最中意的。因此，正如萨伦特和鲁宾斯坦的模型一样，个人的选择是由全部的潜在偏好与情景依赖型启发式决策之间的相互作用决定的。（在曼齐尼和马里奥蒂的模型中，相关的情景特征就是选项菜单的构成情况。）理解这一决策过程的福利经济学家或许能够通过观察个人选择来重构个人的潜在偏好。曼齐尼和马里奥蒂（2014）认为，这种“基于模型”的偏好净化形式比伯恩海姆和兰热尔在“有问题的”决策环境中剔除某些选择的方法更为可靠。

在更强调应用的基础上，汉·布莱希罗特等人（Han Bleichrodt、Jose-Luis Pinto-Prades and Peter Wakker，2001）进一步改进了偏好净化方法。他们重点分析了专家为实现客户的最大利益需要做出决策的案例。例如，考虑一位医生，他必须为失去知觉的患者在多种治疗方案中做出选择。医生可以获取来自陈述性偏好（stated preference）调查的数据，在该调查中，患者对不同健康状态的概率分布做出假设性选择。然而，考虑“不确定性条件下做出决策的恰当的规范模型”（Bleichrodt et al.，2001，第1498—1499页）就是预期效用理论的背景假设（该假设由布莱希罗特等人提出），这些调查结果彼此并不完全一致。根据布莱希罗特等人的说法，陈述性偏好数据中存在的这种不一致性“表明我们的度量方法存在缺陷，即便是目前最好的度量方法，也不能完美地体现客户的价值观”（Bleichrodt et al.，2001，第1500页）。如果在面对面访谈中要求客户重新考虑不一致的选择，则可以减轻由陈述性偏好不一致导致的问题（Bleichrodt et al.，2001，第1499页、第1510页）。注意其中的一个隐含假设是，客户具有（或可以被引导形成）彼此一致的偏好，并且这些偏好与预期效用理论一致；面对面访谈被认为是一种通过消除错误来净化偏好的方法。

但是，如果医生不得不设法处理患者在调查中的不一致反应，那又该如何呢？布莱希罗特等人提出的方法的真正创新之处在于，他们采用了一种用于纠正偏差（correcting biases）的计量经济学方法（Bleichrodt et al.，2001，第1499页）。他们使用特沃斯基和卡尼曼（1992）提出的累积前景理论（cumulative prospect theory）作为选择的描述模型（descriptive model），同时将预期效用理论作为规范模型。上述两个模型之间的区别体现在两个方面：一方面，累积前景理论使用概率加权函数将客观概率转化为主观概率，这种转化可以解释为在处理概率信息时考虑到心理偏差；另一方面，累积前景理论包括一个损失厌恶参数，该参数可以被解释为由决策问题的框架效应导致的一种偏差。鉴于这些解释，可以采用基于经验估计的前景理论模型来构建偏好的预期效用模型，具体方法是，用预期效用理论隐含的“无偏值”来替换估计的概率权重和损失厌恶参数。布莱希罗特等人建议，应该使用患者的陈述性偏好来估计前景理论模型，并且应该使用校正后的预期效用模型来代表患者做出选择。

博通德·科塞吉和拉宾（Botond KÕszegi and Rabin，2007，2008）提出了一种类似的方法，这是一种从个人选择中推断个人偏好的方法，同时承认引导个人做出选择的推理可能包含着错误。他们重点分析的案例是个人在不确定条件下的选择。他们采用的方法是，假设个人偏好更多的金钱而不是更少（任何给定状态下），偏好以更高概率而不是以更低概率出现好的结果，在此基础上让个人参与包含货币支付的赌博，并从其选择中推断出个人的主观信念。如果以这种方式推断的主观信念不符合客观相对频率，则被认为出现了“显示性信念错误”。通过分析个人如果按照正确的信念行事他会选择什么，我们可以净化个人偏好。

科塞吉、拉宾和布莱希罗特等人的分析表明，可以将描述行为经济学的常见建模方法进行修改，进而得出规范性结论。这种建模方法将传统的理性选择理论作为模板，并将个人模型转化为追求行为效用函数最大化的主体，该效用函数保留了新古典经济学和博弈论中的效用函数的许多特征。通过在效用函数中引入新的参数，该模型引入了传统理论忽略的心理因素。一般地，通过为新参数赋予默认值，标准效用函数将转化为行为函数的一个特例。例如，累积前景理论以预期效用理论为模板，在此基础上引入了损失厌恶参数和非线性概率加权参数。当这些参数取默认值时，累积前景理论便会简化为预期效用理论。如果我们承认（如同许多行为经济学家那样）传统经济理论做出的预测通常是对事实的一阶良好近似，那么，正如豪斯曼（Hausman，2012，第114—115页）和拉宾（Rabin，2013）指出的，这种建模方法就具有显著的实际价值。但是，这一模型的另外一个特征使它还可以被用于规范分析。这一建模方法可以为个人构建两个并行的效用函数：一个是描述个人实际行动的行为效用函数，另一个是假设的效用函数，其中行为效用函数的“行为参数”被赋予默认值。如果我们假设行为参数的非默认值反映了推理错误（这是一个大胆的猜想），那么就可以将假设的效用函数视为个人潜在偏好的代表。此外，根据构建效用函数的方法，上述潜在偏好能够满足传统理性选择理论中的一致性特征。

约翰·贝希尔斯等人（John Bershears、James Choi、David Laibson and Brigitte Madrian，2008）的论文提到了另一个支持行为福利经济学的例子。贝希尔斯等人区分了显示性偏好和规范性偏好。显示性偏好指的是“将经济行为人被观察到的行为合理化的偏好”。规范性偏好“代表了经济行为人的真正利益”，并被视为与“实用政策分析”密切相关。行为经济学的研究结果被解读为证明了人们的选择往往“并没有揭示真正的偏好，而是反映了真实偏好和决策错误的综合影响”（Bershears et al.，2008，第1787页）。通过从选择数据中过滤掉决策错误的影响，贝希尔斯等人提出了多种识别规范性偏好的方法。例如，类似布莱希罗特等人（2001）以及科塞吉和拉宾（2007，2008）提出的方法，贝希尔斯等人提出了“结构估计”方法。

关于行为福利经济学的最后一个例子来自朱利安·勒·格兰德和比尔·纽的著作《政府家长主义：保姆国家还是有益朋友？》（Julian Le Grand and Bill New，2015），该书从社会政策的角度展开分析（勒·格兰德是一位来自社会政策经济学领域的理论家，曾经担任英国首相的顾问）。勒·格兰德和纽捍卫的是一种政府“帮助其公民实现他们自己的目标，从而提高他们自身以及整个社会福利的政府家长主义”（Le Grand and New，2015，第182页）。他们推荐的是家长主义政策，即政府与每个公民进行互动的意图是解决个人“推理失败”的问题，以此提高个人的福利。然而，家长主义与手段有关：政府尊重每个人选择的目标，并只是帮助个人实现这些目标（Le Grand and New，2015，第2—3页）。勒·格兰德和纽关于“推理失败”的性质及其存在证据的分析均与桑斯坦和塞勒相似。与桑斯坦和塞勒一样，勒·格兰德和纽指出，个人显示偏好中的许多可预测模式与新古典理性选择理论不一致，并解释了其背后的心理机制，但对于如何重构无错误的潜在偏好，或者证明假设这种偏好的存在是合理的，勒·格兰德和纽几乎没有任何论述（Le Grand and New，2015，第79—110页）。

本节回顾的各种建议都可以被理解为一个协调规范经济学与行为经济学研究成果的通行方案。该方案将规范经济学的目标作为衡量经济政策对个人福利影响的方法，从社会计划者或受托专业人士（如医生、营养师或“选择设计师”）的角度进行评估，这些行为人表现出尊重个人对自身福利判断的意愿。该方案将个人选择依赖于“不相关”的框架这一特征视为错误，“错误”是相对于个人在不受推理缺陷影响时会显示出的潜在偏好而定义的。潜在偏好的满足被视为规范标准。

根据我的理解，上述方案隐含的思想是：潜在偏好是一个主观概念。我所说的潜在偏好是指在个人头脑中形成的判断或感知，并不直接对应于外部世界的客观属性。因此，该方案的意图是，每个人的利益或福祉都应该根据个人对他自己想要什么，或什么对他是重要的判断进行评估。从这个意义上说，行为福利经济学仍然与经济学的自由主义传统保持了一致，正如我在第1章中指出的那样。当从新古典经济学转向行为福利经济学时，实际偏好（选择揭示的）被潜在偏好取代，并作为个人幸福的评价标准。行为福利经济学家承认，这是朝着家长主义方向迈出的一步。然而，行为福利经济学家认为，通过声称潜在偏好是一个主观概念，可以避免更强形式的家长主义，在这种形式的家长主义下，社会计划者将自己关于人们幸福与否的判断强加于其计划的对象。我认为，这正是桑斯坦和塞勒反复强调的一点，即他们的目标是让人们按照自己的判断标准过得更好，同时与伯恩海姆和兰热尔对其方法的描述也是一致的，即尊重个人为自身做出的选择。

如果这种方法适用于任何特定情况，则相关的潜在偏好必须是完整的（参见第1章第2节中有关“完整”的定义）。也就是说，潜在偏好必须满足理性一致性这一传统原则，尤其是与情景无关。“任何特定情况”这一条件具有重要意义：行为福利经济学的逻辑并不要求每个人对所有可能的事态都具有完整的潜在偏好。行为福利经济学家有权声称，其方法仅适用于如下情形：潜在偏好具有恰当的属性，并能够在个人决策中得到重构。但是，如果真的将上述条件付诸实施，那么行为福利经济学得到应用的领域可能会变得非常小。

如果潜在偏好是主观的判断或感知，那么行为福利经济学认为它具有的“完整”属性就不能通过如下假设来解释，即潜在偏好反映了具有“完整”属性的某种客观概念。因此，当应用于任何特定的个人时，偏好净化方法必须预先假设个人有可能具有某种潜在推理模式，从而产生能够满足理性一致性这一传统原则的主观偏好。然而，行为福利经济学的倡导者通常既不会解释这种推理模式，也不会解释它如何推导出完整偏好。他们只是告诉人们，在这种推理模式下不会出现行为经济学家和认知心理学家在实际的人类推理中发现的“缺陷”。即使对那些基于决策过程模型的行为福利经济学模型来说，如萨伦特和鲁宾斯坦以及曼齐尼和马里奥蒂提出的模型，也是如此。回想一下，这些模型假设福利经济学家要引出的潜在偏好是存在的，模型中的启发式决策能够引出并处理这些偏好，尽管并不完美。

无疑，标准的理性选择理论中也存在偏好净化方法的这种局限性。理性选择理论以偏好之间以及偏好与选择之间的一致性公理为基础，这一理论并未解释个人构建偏好的理由。理性选择理论隐含地假设，存在一种推理模式可以推导出满足一致性公理的偏好，但将这种推理模式视为一个黑箱。不过，“同罪辩护”在这里并不适用。行为经济学质疑理性选择理论在心理学上的合理性，并在此基础上发展起来，有些人也可能说，行为经济学利用了这种怀疑（回想桑斯坦和塞勒对智人和经济人的区分）。其实证研究结果也支持了这种怀疑。对规范经济学和行为经济学的调和不应依赖于对潜在理性的黑箱假设。