汪丁丁北大经济学讲义（全5册）最新章节_汪丁丁著

二

行为经济学的基本模型

我应首先介绍西蒙关于有限理性选择的行为学模型，不仅因为西蒙是公认的战前行为经济学和战后行为经济学之间承前启后的人物——在第二次世界大战期间培养的经济学家当中，他最早也最持久坚持了有限理性假设，而且因为西蒙的这一模型确实构成了行为经济学的逻辑开端。事实上，西蒙的另一篇文章“经济学与行为科学中的决策理论”，于1959年发表，与他1955年发表的这篇文章应同时研读。从不同角度，这两篇文章互补地阐述了西蒙的有限理性假设。西蒙是计算机科学家、认知心理学家、管理学家和政治学家，虽然，他于1978年获得的是诺贝尔经济学奖。

在1955年的文章里，西蒙描述了一种寻优算法。我从我的《行为经济学讲义》第五讲转贴两页到这里，即图2.1和图2.2，提供了详细的解释。为了确定地讨论有限理性假设，我们可以想象一台计算机在一个预先设定的实数区间（通常就是[0,1]闭区间）寻找某一函数F（X）在这一区间上的最大值。如果计算机不能预先认知全局的最优，那么，它只能从特定的初始点X 0 逐渐寻找局部的最优。根据“淬火算法”，计算机管理者可以迫使计算机离开某一局部最优，试着寻找更优的局部最优，直到它在这一闭区间上找到全局的最优。不过，如果函数F非常复杂，那么，最聪明的计算机管理者（例如一位长期研究函数F的数学家）也未必知道它在哪里取得全局的最优。毕竟，哪怕数学家可以占有全体人类生命的时间之总和，他们（“可数无穷”的努力）也不可能检查一个足够复杂的函数在任一实数区间可能取得的全部数值（“不可数无穷”的可能取值）。

所以，西蒙只需要假设寻优的是一台电脑，而不必假设人为的干预，并且，他提出了基于行为心理学的“令人满意的”，而不是基于新古典经济学的“全局最优的”优化过程的判据。后来，在1978年美国经济学会的演说“作为思考之产物和作为过程的理性”和发表于1986年的一篇文章“心理学与经济学中的理性”，西蒙将这样的寻优过程称为“过程理性”，而将新古典经济学的理性称为“实质理性”。在很大程度上，西蒙的过程理性概念对应于哈耶克的“演化理性”概念，也对应于晚近实验经济学家史密斯提出的“生态理性”概念。

根据以上两图的解释，西蒙算法有四项参量：（1）初始点X 0 ；（2）a，渴望或期待达到的某一状态；（3）德尔塔，允许的误差范围，只要电脑寻优进入这一范围，寻优就自动停止；（4）k，寻优算法的步长。

图2.1　西蒙的有限理性假设及其寻优算法

上列四项参量，各自都有社会科学含义。首先，很容易想象改革之为社会的寻优过程。其次，改革有两种方式，其一是渐进的，对应着足够小的k；其二，如果k很大，寻优过程就更可能是激进的。最后，改革或寻优的行为主体预先设定某些渴望达到的期待状态a，只要社会状态进入a的足够小的邻域（称为“德尔塔邻域”），改革就应告一段落。关于a，我们根据中国经验可说的就很多。假如改革的目标a太容易实现，行为主体通常要感到失望。为避免失望，行为主体通常要调高目标。另一方面，假如政治领袖们承诺的目标a太高，以致改革旷日持久而无法取得令人满意的效果，那么，他们应当调低目标。如果民众是行为主体，那么，调低目标其实是十分艰难的社会心理调整过程。相比之下，激发民众对未来美好生活的高度预期是更容易的事情。由于存在着这样的不对称性，政治心理学的研究表明，保守的政治领袖可能竞争不过激进的政治领袖。因为后者的心理结构使他们很容易向民众提出美好生活的承诺，尽管他们知道那些承诺是很难兑现的。那些保守的政治领袖，由于很难承受无法兑现自己承诺的心理压力，通常不愿意向民众提出这些承诺。注意，这样的社会心理学和政治心理学，也适用于中国以及其他并非民主政体的国家。

图2.2　期待水平（aspiration）作为西蒙算法的重要参量

西蒙算法的基本步骤，如图2.3，可概括为六步（注意：这里出现的字母a不是西蒙算法里的渴望实现的期待状态）。首先，行为主体想象自己的可选方案集合的结构——西蒙认为想象的A是真实的A的子集。

其次，请回忆艾智仁1950年文章开篇所述的情形，在现实世界里，决策环境总是充满着不确定性。所以，每一可选方案可能导致许多后果，于是有行为主体想象的可选方案集的任一可选方案a的全部可能后果的集合S（a）。

第三步，行为主体对他想象中的可选方案集合里全部可选方案的全部可能后果作出评估，并确定每一可能后果的概率。注意，任一可能后果可能通过不同的可选方案加以实现。于是，第四步，行为主体从导致这一后果的各种可选方案可估算这一后果发生的概率。

西蒙在1959年文章里详细讨论了有限理性假设在真实世界中的依据，其中最重要的依据是“信息的代价”——实质理性假设要求决策者不考虑收集信息和处理信息的成本，可是这一成本显然太高，以致厂商和个人几乎从不等待信息完备之后才决策。认知心理学的研究表明，人类演化形成的情感定势，与人类在漫长经验中形成的许多“拇指规则”（旨在快速决策的简单方法）有相似的功能，它们倾向于增加行为主体适应环境的概率。

图2.3　西蒙算法的基本步骤

在西蒙1955年的文章中，他讨论了几种寻优算法。其中，第五种，编号为E，故称为“西蒙的E算法”，基于西蒙提出的有限理性假设并且具有最普遍的形式。西蒙的E算法构成第五步和第六步的内容。

第五步，行为主体从全部可能后果的集合里，根据他渴望实现的期待状态或目标，选择“令人满意”的子集。然后，第六步，行为主体从想象的可选方案集A里面找到能够实现这一令人满意的子集（欲求实现的后果）的那些可选方案。

行为主体当然可以调整参量，然后重复以上六步。

西蒙算法的重要寓意之一是，他指出，与新古典经济学的实质理性概念相比，过程理性只要求寻找到某一局部最优，而实质理性则要求达到全局最优。也因此，如果一个社会只有过程理性或哈耶克的演化理性，那么，如经济史学家诺斯（Douglass C. North）多次提醒的那样，社会可能死锁在某些演化路径里。因为，局部最优意味着可能远不如全局最优，同时，社会一旦进入局部最优，就失去了继续寻优的动力，这就是诺斯讨论的“锁入效应”。如何防止锁入在局部最优状态里呢？请回忆“淬火算法”，它要求在社会演化过程中有一些高瞻远瞩而不是只追求近期利益的政治领袖。也因此，我始终坚持并鼓吹一种被我称为“复杂自由主义”的自由主义态度。在我看来，单纯相信市场竞争的自由主义失之于太简单。简单自由主义更容易导致短视的政治领袖，于是更难实施淬火算法。当然，我仍是自由主义者，所以，我不同意中央计划体制，哪怕决策者们完全是高瞻远瞩的和出以公心的。

行为经济学的第二个基本模型是海纳模型，它的丰富涵义受制于它不清晰的表达，从而至今没有引起学术界的普遍关注。我仍从我的《行为经济学讲义》第五讲将详细解释转贴在这里，见图2.4和图2.5。

海纳的基本思想是用“不确定性”来刻画“有限理性”，因为在完备理性的视角下，不可能存在不确定性。然后，海纳引入“C-D gap”来刻画不确定性，这是心理学术语“competence-difficulty gap”的简称。我认为，提出这一思路，是海纳1983年文章最重要的理论贡献。注意，海纳关于理性假设的讨论适用于人类和人类以外的全部生物。他1983年的文章，长达36页，是《美国经济评论》发表过的难得一见的长文。这篇文章最初的两节，几乎完全是方法论的辨析。在这一辨析中，海纳指出，如果决策环境充满不确定性，那么，当行为主体的理性能力趋于无限时，他可以利用每一次不确定性冲击来优化自己的行为，于是，他的行为与不确定性冲击完全同步，从而是完全无法预测的。在另一极端，当行为主体的理性能力趋于零时，他无法利用任何不确定性冲击来优化自己的行为，换句话说，他只能遵循以往让他能够生存下来的那些行为规范，于是，他的行为是完全可预测的。

这样，对心理学家而言可以测度的“能力—困难”差距（C-D gap），被海纳用来界定不确定性的程度U——即“uncertainty”的第一个字母，于是U成为一个原则上可以量化的指标。海纳认为U是两组参量的函数，其一由向量“e”表示——它刻画环境的不确定性和复杂性，即行为主体要解决的问题的困难程度；其二由向量“p”表示——它刻画行为主体的认知能力，即行为主体解决问题的能力。这样，外因和内因两方面联合作用，“能力—困难”差距决定了行为主体决策的不确定性程度，由函数U（p,e）表达。显然，U是p的减函数并且是e的增函数。极端而言，对于特定问题有完备理性的行为主体，“能力—困难”差距等于零。在另一极端，完全没有理性能力的行为主体，“能力—困难”差距趋于无穷大。

图2.4　海纳模型的推演

图2.5　海纳模型的几何表达

海纳1983年发表于《美国经济评论》的文章虽然很长，却因叙述不清而引发批评。他于1985年在同一期刊发表补充文章，只有6页，叙述更加清晰，但论证却超出了经济学方法，故海纳的思路至今不入主流。

根据海纳1985年文章，假设行为主体的可选方案集合A，就A内任一给定的可选方案a和这一行为主体的“能力—困难”差距U（p,e）而言，假设集合R a 是全部使a成为“正确的选择”的情境的集合，注意，此处短语“正确的选择”，涵义是：在这些情境中，A-{a}内不存在比a更优（例如增加了生物存活的概率）的可选方案，由此而来的是净收益g a ——意思是方案a带来的超过了A-{a}内最佳可选方案收益的部分。类似地，可以假设集合W a 是全部使a成为“错误的选择”的情境的集合，如果在这些情境中，A-{a}内存在比a更优的可选方案，由此而来的是净损失l a ——意思是方案a的低于A-{a}内最佳可选方案收益的部分。显然，R a 与W a 涵盖了全部可能的情境。

现在请注意，由于行为主体的有限认知水平，哪怕出现了R a 内的情境，行为主体也未必选择正确的方案a。于是这里出现了条件概率r a =p（a|R a ），即当R a 内的情境出现时，行为主体正确地选择方案a的概率。类似地可以假设条件概率w a =p（a|W a ），即当W a 内的情境出现时，行为主体错误地选择方案a的概率。海纳在1983年文章的“脚注17”提供了这两个条件概率的统计学直观解释：如果t 1 是第I型误差的概率（即拒真的可能性），如果t 2 是第II型误差的概率（即采伪的可能性），那么，r a =1-t 1 ，w a =t 2 。

据此，可选方案a被选择之后是正确的概率与它被选择之后是错误的概率之比就是“r a /w a ”。并且，可选方案a的可能净收益是“p（R a ）r a g a ”，它的可能净损失是“p（W a ）w a l a ”。显然，在自然选择的力量作用下，行为主体的决策必须满足的生存条件是：a的可能净收益不低于它的可能净损失。在这一关系的两端同时除以可能的净损失，就得到图2.4所示（海纳1985年文章）不等式（1）。当不等式（1）的等号成立时，就称为临界公式。海纳假设这一不等式的右端只依赖于环境参量e，以T（e）代表。另一方面，这一不等式的左端r a /w a 只依赖于行为主体的认知能力p，假设与环境不确定性无关。

现在考虑平面直角坐标系，横轴增加的方向代表p（R a ），纵轴是T的数值，于是可画出算子T在临界公式成立时的曲线，就是图2.5所示（海纳1983年文章的图1）的那条曲线。图2.4公式（1）意味着，当环境不确定性增加时，p（R a ）趋于零，故T的取值趋于无穷大。

注意，图2.5所示的曲线，即T的临界曲线，将这一直角坐标系的第I象限划分为两大区域。仅当行为主体的认知能力使得r a /w a 大于T的临界值，可选方案a可改善行为主体的生存状况。否则，a将降低行为主体的生存概率。图2.5的临界曲线上方区域，是给定环境不确定性（横轴数值）时，可选方案a改善行为主体生存概率的区域。临界曲线下方区域，是给定环境不确定性（横轴数值）时，可选方案a降低行为主体生存概率的区域。

给定环境不确定性在横轴上的数值，显然，具有完备理性能力的行为主体，r a /w a 大于T，故位于T的上方区域。而理性能力足够小的行为主体，r a /w a 必定小于T，故位于T的下方区域。另一方面，给定理性能力，只要环境不确定性足够大，p（R a ）趋于零，那些选择了a的行为主体总会被淘汰。

特别地，海纳在1983年文章里假设，与A-{a}包含的可选方案相比，a是创新性更强的可选方案。此时，上述分析意味着，理性能力足够强的行为主体倾向于选择创新，而理性能力很弱的行为主体倾向于选择守旧。这一命题也可以用演化论的语言表述为：在由理性能力很弱的个体组成的种群里，那些选择了创新的个体将被自然选择的力量淘汰，那些幸存的个体都是没有选择创新方案从而是守旧的。我们对比人类和蚂蚁的行为模式，显然，蚂蚁的行为远比人类的更可预期。针对这一现象，海纳模型提供的解释是：蚂蚁的认知能力远低于人类，故与人类相比，自然选择的力量更倾向于淘汰那些尝试创新的蚂蚁。演化的结果是，与人类的行为相比，蚂蚁的行为更少改变，成为更可预期的“行为模式”。

如果环境永恒不变，那么，行为主体就只需要适应而不需要创新。如果环境变幻莫测，也就是说，环境不确定性极高，那么，行为主体必须创新。因为守旧意味着无法适应新的环境。不确定性在现代的宏观经济学教材里往往被表达为外界对经济系统的随机冲击。在一般均衡分析框架内，经济系统对随机冲击可以有两类响应：（1）短期的波动之后复归稳态，这相当于“守旧”；（2）永久偏离最初的稳态，系统进入一个新的稳态，这相当于“创新”。经过思考，我认为海纳模型提供了远比目前宏观经济分析更丰富的洞见。不过，为了应用于宏观经济分析，我们需要界定经济系统（市场或计划）的“认知能力”。

如果上帝的行为是可观测的，那么，根据海纳模型，我们不难相信，全知全能的上帝为应付充满不确定性的环境而选择的最优行为，在我们人类看来变幻莫测，故而是完全不可预期的。有鉴于此，海纳对新古典经济学的批评是：完备理性假设下的最优行为，在有限理性的世界里，看起来与上帝的行为一样变幻莫测，从而是完全不可预期的。那么，为何经济学家还要跟着弗里德曼（Milton Friedman）相信，新古典经济学的预测比其他学派的预测更准确呢？海纳的考察表明，长期以来，新古典经济学其实并未提供更准确的预测，它之所以保持着经济学主流的地位，另有原因。

海纳模型的寓意之一，是他对艾智仁“好像理性”假设的批评。虽然，艾智仁在1950年文章里并未明确赞成“好像理性”假设，不仅如此，他甚至略带嘲讽地讨论这一假设。真正喜爱艾智仁的“好像理性”假设的是弗里德曼，他在稍后发表的远比艾智仁1950年文章更闻名于世的文章里大肆宣传这一假设。例如，假设消费者们随机购买任何商品，那么，在自然选择作用之下，幸存的消费者将有什么样的消费行为？弗里德曼和贝克尔的回答是：那些只在预算线与无差异曲线的切点（理性选择）购物的消费者有更高的生存概率。不论如何，海纳的批评是，只要环境不确定性足够高，幸存的更可能是遵循规则（守旧）的而不是寻求新奇的消费者。这样的预测，与新古典经济学的完备理性选择模型的预测，恰是南辕北辙。或许，我认为，海纳的批评错过了更关键的环节，他首先必须解释环境不确定性极高是否意味着市场价格波动极大。根据常识，例如金融市场的常识，在新古典经济学理性选择模型的决策环境中，如果不确定性极高，那就意味着价格波动极大。如果价格波动极大，消费者们面对的预算线的斜率就变幻莫测。因此，具有完备理性能力的消费者的最优选择，将随着变幻莫测的预算线与无差异曲线的切点而显得变幻莫测，即表现为随机消费而不是“好像理性”。于是，弗里德曼和贝克尔为新古典经济学提出的“好像理性”辩护就失灵了。但是，海纳模型显然与我重新表述的需求定律的更具普遍性的假说一致：任何人选择任一可选方案的欲望与这一可选方案的代价成反比。

海纳模型的寓意之二，值得强调，是他1983年文章第“IV”节的“B”部分，标题是“制度演化是因为有不确定性”。这也很显然，制度是相对于自由而言的，只要有制度，就有对自由的限制。最表层的制度是一套行为规则，更深层的制度则与文化传统乃至无意识世界的规则（如果有规则的话）密切相关。所谓“规则”，就是防止人们的行为偏离这些规则。哈耶克认为，今天我们知识的绝大部分保存在我们的传统里，以致我们只能是我们传统的选择，而不是我们选择我们的传统。不难想象，人类在远古的生活远比今天更不确定，于是，根据海纳模型，生存下来的人类成员更可能是遵循规则的。由此而来的是各族群的文化传统。如果远古的不确定性很低，那么，根据海纳模型，我们就很难想象为什么现代人继承了并因此而反抗如此深厚悠久的传统及其对现代人的束缚。

海纳模型的寓意之三，是解释“成见”（固有的认知偏差）的起源。如果生存环境极不确定，那么，不仅我们的行为倾向于是守旧的，而且我们的认知也倾向于遵循某些既定规则——意味着漠视许多新的信息。这样的认知规则，也称为“偏见”或“成见”——本质还是守旧或拒绝被更新。相比而言，新古典经济学家更愿意借助于“信息成本”和“注意力稀缺”来解释“成见”的起源。

海纳模型的寓意之四，是解释行为模式逐渐多样化的趋势。假设环境不确定性保持在给定的水平上，那么，假以时日，任何具有学习能力的行为主体将逐渐改善自己的认知能力，从而在同一环境内，允许自己选择更多的创新方案——意味着行为模式的多样化。例如，当自然选择的压力足够小的时候，我们开始接受“时装”或其他时尚元素。对时尚而言，若不创新就被淘汰。类似地，我知道一些会唱歌的鸟类，那些成功求偶的鸟儿每年发情期都要唱不同于往年的歌曲。显然，它们的配偶有极强的声音认知能力。

海纳模型的寓意之五，为生物本能提供了解释。守旧到极致，那些在多少世代里被遵守的规则就成为“本能”。海纳模型的寓意之六，解释心理学家所说的“印记唤醒”——行为主体受到微弱暗示即可对某些事情产生警觉。从特定的暗示到特定的警觉，其实就是认知规则或成见。

海纳模型的寓意之七，他认为可以解释库恩（Thomas S. Kuhn）所说的“科学研究范式”。科学家群体不会轻易放弃既有的研究范式，哪怕已出现大量令人信服的反例。这是因为，科学研究的环境确实充满着不确定性，从而，幸存的研究方法不应被轻易放弃。不过，同样根据海纳模型可以推断，只要反例积累到足够的程度以致既有的认知偏见能够被逾越，科学家们将突然同时转换他们的研究范式。这样的突然同时发生的态度转变，引出海纳模型的寓意之八——不确定性引发的社会判断之共识。显然，共识也是一种认知的成见，当它成为社会判断时，就是许多社会成员共有的认知成见。

典型的社会判断的共识，就是正义感。看图2.6，因确立“前景理论”在行为经济学中的核心地位而分享2001年诺贝尔经济学奖的心理学家卡尼曼（Daniel Kahneman）与另外两名重要作者联名发表文章，援引诸多实验报告，建议将正义问题引入经济学研究。后来，桑塔菲研究院于1990年代至2000年代在全球范围主持的15个小型人类社会的“最后通牒”实验，最终确立了正义问题在行为经济学研究中的地位。海纳模型的其他寓意，由他自己写在1983年文章的其余4节里，此处不赘。

图2.6　卡尼曼等人的实验表明正义感显著影响经济行为