汪丁丁北大经济学讲义（全5册）最新章节_汪丁丁著

第五讲

第一部分
2010年10月23日/下午1 : 00—3 : 00/二教105

现在上课。通常，我的经验是，每年秋季的行为经济学课程，由于各种各样的理由，我只能讲八个完整星期的课。这样看来，这星期是第五星期，我们的课程已经讲了50%，应当有一个总结性的报告。我找了这张图（图5.1），当作是一个总结，取自《科学》杂志2009年5月29日这一期的回顾性文章“社会行为的计算”，回顾了社会脑科学这一领域的进展。这三位作者，前两位在牛津大学核磁共振功能呈像脑研究中心，第三位在实验心理学系。他们在摘要里指出，脑科学家开始推进基于脑机制的社会行为解释。呈现给我们的，是两套不同的脑区网络。第一套是关于损益权衡的学习机制，第二套是关于他人意图的探测机制。这两套网络之间的关系，尚待澄清。

作者们受了复杂社会交往的脑数学模型的启发，在图5.2（见彩图）勾勒出未来可能的社会行为计算框架。图5.2A，列出了社会认知的主要脑区，我用钢笔将脑区的英文缩写与照片里的脑区位置连接起来，更容易理解第二行的模型。

这些脑区，我们都介绍过。在模型中，它们被看做执行各自的特定功能的模块。现在讨论“社会行为”计算框架，图5.2B。这一模型的核心部分是基于经验的学习过程。所谓经验，就是以往接收到的全部刺激信号，可以表示为来自外界的输入信号时间序列和发自行为主体的输出信号时间序列。以及行为主体对自己行为导致的后果的评价，这些评价也被表示为时间序列，记作V（t）。这一思路，写在模型的中央：“经验”信号向下输入到脑内的各专业化模块，导致了各模块的学习过程。经验信号向上输入到一个称为“强化学习程序”的价值预测模型，这一模型对下一时刻的评价预测等于上一时刻的评价值及其修正值之和。评价的修正值被表示为两个模型参量的乘积——学习速率（iearning rate）与预测误差（Prediction error）的乘积。如果学习速率很高，那么很小的误差也可导致很大的修正值，也就是说，模型变得非常敏感。但是过于敏感的模型未必可以适应社会交往情境，因为例如在囚徒困境多次重复博弈中，为了维护合作策略，有时需要容忍对方的“失误”。当然，学习速率也不可太低，否则就会使预测误差长期维持在较高水平上，导致行为主体损失严重，相当于降低了适存度。因此，适应现实社会行为的模型应能调整学习速率。

图5.1

图5.2A

图5.2B

现在请看图5.2B的整体，它的左端第一列有若干个时间序列信号，这是由上述的强化学习程序提供的预测值，左端第二列是脑内各专业模块的神经元网络输出的对应于预测信号序列的真实信号序列，这两列之间有一个约等号，表示有预测误差。于是这些误差被输入到上述的强化学习模型，导致对预测的修正值。在图5.2B的右端第一列也有若干个时间序列信号，这是模型对主体的行为预测，然后由一个约等号过渡到右端第二列——记录到的真实行为的时间序列。这两列之间的误差，被输入到强化学习模型，产生修正值。

这篇文章主要介绍各专业化脑区在社会交往中的功能，如摘要所述，这些功能被分为两类：（1）基于RTPJ（他心理论）的意图探测功能，（2）基于纹状体（损益权衡）的强化学习功能。

我在图5.2里补充写了许多文字，作为前半学期的总结，你们一定要牢记这里列出的社会行为各功能脑区的位置和名称。这样你们阅读社会认知研究的当代文献时，就不会有太大的困难。左端第一列，我用中文写了标题“微观”，因为这些信号序列是关于神经元（细胞膜两侧的电位差）和神经元网络（许多细胞膜电位差的集结）层次的，故而是微观的，相对于右侧的“行为”而言。每一行为都是许多微观信号集结的结果，在这一视角下，任何行为，都是宏观的。所以我为右端第一列写的标题是“宏观”。另一要点，我写在图5.2的底部：不是关于“最大化”行为的计量，而是关于“满意”行为的计量。所以，模型是动态的，永远有新的误差和信号输入，永远更新它的预测值，因为社会是动态的，永远有新的社会行为类型发生，需要模型去学习和适应。

这样，我们借助图5.2，完成了前半个学期的内容总结。目前，加州理工大学的教授凯莫罗，在神经经济学方面获得诺贝尔奖的呼声最高。你们读他的文章，有这篇2009年文章做基础，不会有什么困难。

另外，作为这个学期课程的概述，我制作了一张心智地图，并且将它转换为PDF格式，然后在心智地图的各路径上插入相关的阅读文献，于是有了一本电子版的教科书，图5.3，你们到助教那里可以复制这张心智地图。在图5.3显示的三条路径上，各有一些大头钉标记。你在PDF专业版，例如9.0版里面，鼠标右键双击这些大头钉，就可以打开文献阅读了。

我在每年的教学中，很注意使用心智地图这类软件。根据我多年的教学经验，PPT软件远不如心智地图，或者，它们最好是当作互补的教学工具来使用。PPT只能线性表达教学内容，一张幻灯片接着一张幻灯片放映，这学期我没办法改变这一方式，因为这是ipad的局限性，它没有很好用的心智地图软件。线性表达方式，最大的弱点是缺乏整体感。黑格尔早有同感，他在《逻辑学》引论里写过，一切科学的通病在于，它们都要从一些自明的公理出发，形式逻辑地推演出一系列命题和定理。可是，问题在于，这些自明的公理，从来不是自明的，它们对不同的人有不同的含义。于是，黑格尔试图建立一个真正科学的体系，不需要任何自明的公理，这套体系必须有能力自我证明，也就是循环地证明它自身的科学性。然后他说了一句话，非常经典，我在数学系读黑格尔的著作时，立刻就记住了这句话：核心概念的展开过程就是理论本身。心智地图的最大优点就在于，它是围绕一个核心概念展开自身的。这样展开了的心智地图，就是理论本身。这里是2002年我在北京大学新制度经济学课堂上使用的许多心智地图的一张，那一年我列出并让学生分组研究十类制度，这张图是以“仪礼”为核心概念的心智地图。（图5.4）显然，由此展开的，是一整套社会理论。

图5.3

图5.4

图5.5

图5.5，也是2002年我的新制度经济学课堂上使用的，围绕“企业”这一核心概念展开，它的优点是可以将许多核心概念联系在一起。

图5.6，也是2002年的，围绕“语言”概念展开的心智地图：

目前流行的心智地图软件，我知道有三家，我最喜欢用的是Buzan's imindmap 4.0。博赞心智地图，可能是心智地图最早的发明者博赞编写的。另外两家公司或许涉嫌抄袭博赞的知识产权，不论如何，你们也可以下载和使用微软公司的Concept Draw，或Mindjet公司出品的Mindmanager 8.0，它们都是很好用的，我记得丁建峰使用的是Mindmanager，不过我更喜欢博赞心智地图，有更丰富的色彩表达，还有随意绘制路径形状的功能。

图5.6

现在我们来讲解图5.3，从杨格2004年这本书，做一条垂直线将这张图分为两半。至今天为止，上半学期我们已经大致结束了杨格2004这条线左边的部分，或多或少提到了左边出现的大部分文献，虽然还需要深入讲解例如Simon 1955和Heiner 1983。我已要求你们到助教那里获取扫描版的《第二天性》和Watts 2004，以及杨格2004，自己阅读。今天的课程，我们将讲解海纳模型，然后讲解西蒙模型。

这里的三条思想路径，最上面的路径，标题是“理性问题”，最下面的是“合作问题”。我介绍过最新发表的一篇文章，关于行为经济学的“两个灵魂”。这两个灵魂，理性问题的路径不容易走通。因为，假如我们想像在横轴上越右端理性程度越高，那么在无穷远的右端，我们得到“完备理性”假设。现实世界的任何行为，肯定都不是完备理性的，于是都可以成为对完备理性假设的否证性的检验数据。这就是为什么完备理性假设是富于成果的，它导致了许多可以否证这一假设的经验研究。虽然，新古典经济学的方法已经偏离了波普的证伪主义（否证主义的另一名称）路线，新古典经济学经验研究更接近证实主义的而不是证伪主义的。那么，当我们放弃无穷远点的理性假设，我们等于有了一个连续的谱系，每一点都符合“有限理性”假设，每一点的有限理性假设都具有了学术合法性。所以，任何行为，由于它是有限理性的，它必定可以为自己提供解释。换句话说，你若要解释有限理性的行为，任何行为，你只要指出：因为这一行为已经假设了有限理性，所以它就是有限理性的行为。这就是张五常嘲讽的“套套逻辑”，因为它不解释任何现象，它只假设任一现象就是那一现象的解释，这就不是科学的解释了。

理性问题的研究路径，因为有限理性假设不是一项可以产生丰富成果的假设，这条路径于是不容易走通。目前在这一路径上发表的文献，我关注的，是关于幸福感的研究报告，不很科学，因为是基于问卷调查的海量数据。在决定我们幸福感的三个维度上，精神生活这一维度最难通过问卷调查获取数据，我们甚至不清楚什么是“精神”生活。所以，目前发表的文献，局限于另外两个维度：源于物质生活的幸福感调查和源于社会生活的幸福感调查。这类数据毕竟可以揭示一些重要问题，例如伊斯特林悖论（参见第三讲第二部分），意味着物质生活的幸福感在达到某一水平之后不再随着人均收入增长而增长。事实上，市场发达地区的普通人更需要从社会生活获得他们的幸福感。可惜，发达市场经济往往使社会生活变得更冷漠——都市陌生感。

在“理性问题”研究路径上，最有希望得到科学发展的，我认为是以色列学派的两位作者，Giiboa and Schmeidier（助教应当给你们介绍过他们1995年那篇文章了），他们的幸福感的认知模型。因为这样的模型，旨在量化幸福感这一观念，从而可能收集问卷调查之外的数据，科学地研究幸福感。理性，我们经济学家说的理性，是指行为与行为的后果是否表现出某些合理性。我们最常使用的合理性判据，是“个体理性”判据，特指一个人的行为是否增加了他的幸福感。沿着这一模型的思路，我们要介绍麦克法顿的诺贝尔奖获奖演说，就是图5.3靠近右端的McFadden 2000。这位诺贝尔经济学家，专业是计量经济学，并因此而得奖。不过，他的研究领域是心理学和经济学的决策研究。如果在获奖十年之后，也就是在今年，我们重新命名这一领域的话，应当称为“微观行为计量学”。他的演讲，我会尽快介绍，尤其是那篇文章的第一张图。

因为理性问题的研究路径有上述困难，所以行为经济学家在最近的20年，转向了他们的第二个灵魂——“合作问题”。事实表明，这是一条富于成果的研究路径。我们介绍过桑塔费学派的15个小型人类社会的田野调查，我们介绍过苏黎世学派费尔和辛格的脑科学研究报告，我们还要介绍哈佛大学诺瓦克小组的社会仿真研究。这些研究，都是为了解释“合作”问题。于是，在这一路径上，形成了行为经济学的基本问题——合作何以可能。

我讲过，这两个灵魂是同一件事的两个侧面。只不过合作问题更富于成果，所以成为今天行为经济学的主流。在这一路径上，发展出来三条派生路径。第一条是脑科学的，“脑的结构演化与合作基础”，第二条是社会学的，“情感结构演化：道德与正义”，第三条是网络社会科学的，“信誉与信任感在社会网络中的传播”，这是我们将要进入的一个重点议题。

结合上述的两条路径，图5.3中间的路径是最核心的，因为它可以代表上面和下面的两条路径，理性和合作，都是演化的结果，而且都还在演化。我们说，一个行为的合理性，今天看来，最令人信服的是演化合理性，在演化中显得合理。人类社会的制度和文化传统尤其如此，例如，图腾与禁忌，我们的理性能力无法赋予这些现象任何符合当前我们知识状况的令人信服的合理性。但是图腾与禁忌存在了数千年，不理性吗？完全不理性的，怎么存在了数千年呢？它们的理性，是在演化过程中逐渐显现给我们的，如果我们能够理解的话。这是哈耶克的思想，今天不谈。

现在我来讲解海纳模型。他的模型，我在许多年的教学中使用，所以他的1983年AER文章我读了许多遍，这学期又读了一遍。这篇文章很长，37页，在AER这样的期刊上很少见，那里通常发表的，都是15页以下的论文。即便如此，你发表一篇，在中国已可评教授。我认识一些朋友，AER每一期都读，而且告诉我说，必须读篇幅只有3页的短文。我几乎很少读短文，在AER每一期，结尾部分，会发表一些“短文”，3—5页的篇幅，通常是“批评与回应”这类文章。为什么短文必须读呢？因为你是年轻教师，为了评职称，你不能奢望在AER上发表一篇15页的论文，你一开始只能希望发表一篇短文，就是对别人的文章加以评论。

图5.7

海纳这篇文章的标题很宏大“可预期行为的起源”，事实上，他也ciaim too much（宣布了太多的学术贡献）。所以，这篇文章引起很多批评。这是经济学家的直觉，我说过，只要一项命题与我们的常识相去太远，这可以是一篇文章声称贡献很大，大到远离我们关于学术文章的常识，于是我们就保持警惕，因为以很高的概率，这命题是错的。海纳模型，也确实有错误，所以，海纳在1985年又写了一篇文章，仍在AER发表，标题是“可预期行为的起源：进一步的模型及应用”，图5.14显示了1983年和1985年他这两篇文章的标题和索引。

如果你也被海纳1985年这篇修正文章说服了，那么，我告诉你，海纳模型几乎可以改写你相信过的全部社会科学。因为海纳1983年论文有八节，第二节给出模型之后，第八节是结论，从第三节至第七节都是应用，非常广泛的应用，从科学到文化，可谓“无所不包”。这样就是“宣布了太多的贡献”，引发批评（参见第一讲第一部分）。

海纳的这篇文章，图1最重要（见图5.14左侧）。我读论文，最重视插图。理由特别充分，今天不能细说。图5.8取自2003年《自然》杂志“脑科学回顾”的一篇论文，标题是“前额叶和颞中回在长期记忆中的相互作用”。第一作者Simons是伦敦大学学院认知与神经科学研究所的教授。

图5.8

他们的研究报告，如图5.9，左边是三列两行直方图，三列分别代表的认知实验是，从左向右，第一列“已知单词”，第二列“可名的图形”，第三列“陌生面孔”，两行的每张图里呈现左脑和右脑的激活程度，第一行显示前额叶激活情况，第二行显示颞中回激活情况。右边是两张脑图，显示被试在三项任务中前额叶和颞中回的激活情况，由三条曲线表示，最上面的曲线表示“已知（例如熟悉的单词）时的激活情况，最下面的曲线表示“未知”（例如陌生面孔）时的激活情况。位于它们之间的曲线表示“似曾相识”（feeiing of hnowing，缩写为“FOK”）。我希望告诉你们的是这些直方图揭示的现象，你们知道，人类脑的左半球有语言和逻辑的中枢，所以，已知单词，这项任务会使被试的左脑充分激活，而右脑不活跃，如左第一列的两行直方图显示的那样。你们还知道，人类脑的右半球分工识别面部表情和社会认知，所以，看到陌生面孔时，被试的右脑会充分激活而左脑不活跃，如左第三列的两行直方图显示的那样。关键是“可名的图形”例如左第二列的那只青蛙图形，同时激活了左脑和右脑，这一状态清楚地显示在第二列的两行直方图里。这就表明，开发我们的脑，最好是“读图”，而不是单纯读文字或看图画。读图，一方面可以使你脑内存储的抽象知识从左边传递到右边从而建立与社会生活（社会情感和认知）的联系，另一方面可以使你脑内存储的社会图景从右边传递到左边从而建立与抽象模型的联系。如此长期坚持，特别有助于经济分析，因为这正是我们经济学训练的主旨：一方面熟悉数学模型，一方面熟悉这些模型与现实生活的联系。

图5.9

图5.10

以上就是我的充分理由，希望你们在平时的学习中注意“读图”。现在我们来读图，海纳1983论文的图1，这张图，我画在图5.7的右上角。海纳的模型，核心要素是“不确定性”。为了熟悉不确定性对决策行为的影响，我请你们在下面（图5.10）这张股指走势图上作一个预测，例如，你预测下一个时段市场是向上呢，还是向下，还是维持不变？如果我不让你看到右端的三个箭头前面的数据，你可能无法提出任何确定的预测，因为这三个箭头所指的股市变动方向有相等的可能性。

可是现在你看到了历史数据，有两个序列，这很常见，例如，其中一个是平均值的序列。根据这两个时间序列已经呈现出来的模式，你的预测很可能是“上升”而不是“下降”或“持平”。如果你的预测确实如此，那么你是一名“动能玩家”（momentai Piayer），你根据市场的动能预测未来方向。在市场突然逆转的时候，动能玩家最可能剧烈亏损，被套牢在例如中国股市的最高点（6000点以上）。我有一些朋友，因为是散户，所以缺乏训练，不能及时退出市场，就这样被套牢，至今仍亏损数十万至上百万。基金经理就比散户少亏损许多，上一次中国股市从6000点下跌至1500点的时候，散户平均亏损70%，可是基金平均只亏损30%，他们的表现远比散户卓越，为什么？因为训练有素，基金经理绝不会舍不得卖股票，散户在亏损了20%的时候，往往受我们行为金融学研究的“处置效应”（endowment effect）的影响，舍不得卖，希望有回本的可能，但不可能，这是熊市，怎么回本？大多数散户非要坚持亏损到80%，然后说：我不卖了，压在箱子底下。基金经理没有这样的处置效应和私人感情，他们严格根据金融学教科书办理业务。这样，亏损比率就低得多。教科书写了什么？技术分析的教科书，随便你翻开哪一本，都会有大量的模式识别案例。散户其实也读教科书，但他们不能严格遵守教科书规则。所以，我常说，股市考验的不是你的学问而是你的性格。处置效应是一种私人情感，怎么可以让私人情感影响你的投资决策呢？

上面的这个作业，最关键的不是股指走势，而是，请你们注意我写在图5.10右边的文字：凡是可预期的行为，必定遵循某些行为模式。如果完全没有模式可循，你们就会像刚才那样无所适从，没有任何明确的预测。为什么有一些行为是可预期的？回答：因为这些行为表现出了“模式”（Pattern）。我们说，现代数学的定义是“Pattern recognition”。注意，数学不再是关于数字的学问，那是古代的定义。数学也不是关于微积分的学问，它也不是关于抽象代数或拓扑或你指出的任何数学分支的学问。数学是模式识别的学问，所以数学主要是一种直觉。数学训练的主旨是培养或开发你的数学直觉，这是我读数学系本科生的时候，我们校长梅向明发表的见解。他是微分几何权威，那时我们“七七级”数学系没有多少学生，十年“文化大革命”结束后第一次恢复高考，我们都特别勤奋地学习，校长亲自指导我们。梅向明说，数学家不同于非专业的数学爱好者，关键就在于数学家习惯于几何直观。一切数学定理，我们都要求有几何直观或几何想像。如同经济学家对一切定理要求找到与常识世界的联系一样。否则，我们就有警惕，不很相信。

这是我重视读图的第二个理由，私人的，所以我不常讲。现在，你们可以很容易地掌握海纳模型的结论了。可预期行为的起源在哪里？根据海纳的论证：凡是可预期的行为，必定有模式。或者是这一命题的等价命题：完全无模式的行为，不可预期。所以，问题转化为：什么样的行为完全无模式？这是海纳模型的新意或令人有些惊讶的结论：完备理性的行为，完全无模式，故而完全不可预期。或者是这一命题的等价命题：有限理性的行为是可预期的。而且，理性程度越低，行为越可预期。

请你们记录图5.7左边我写的那些文字。经济学家其实是以成本来测度行为的理性程度，实施同一行为，成本越高，就越不理性，因为有成本较低的可选方案。理性是无法测量的，而成本是可以测量的，通过将理性问题转化为成本问题，我们经济学家使问题成为可以科学研究的问题。

经济学家用行为的成本来衡量行为的理性程度，并不适用于创新行为。因为只要是真正的创新，那么你通常找不到它的替代方案，这时，惟一的备选方案就是“不创新”。注意，这是海纳模型的出发点。海纳模型求解的问题是：如果有一项创新行为，记作a，此外，全部以往的行为也就是全部有模式可循的行为的集合，记作A，在1983年的海纳文章里，A不包含a，在1985年修正的模型里，A包含a。海纳的问题是：在什么情况下，有限理性假设下的最优选择是a，并且在什么情况下，有限理性假设下的最优选择是A（即A的任何元素）。

在一组符合常识的假设下，海纳模型的结论，用图5.7右上角的那条临界曲线来刻画，如果环境不确定性保持不变，那么理性程度越高，行为主体的最优选择就越可能落在临界曲线的右上方，从而创新行为a就是最佳选择。否则，理性程度很低，就很可能落在临界曲线的左下方从而最佳的选择是A里的任何元素但不是a。

以上的最佳选择，是有限理性行为主体的最佳选择。为什么理性能力有限？海纳首先要回答这一问题。假如决策环境是完全确定性的，那么，只要在这一环境里生活足够长的时间，日复一日，总可以知道完备理性假设所要求的全部知识。因此，完全确定性，意味着完备理性假设。也因此，不完备理性，或有限理性假设，意味着环境不确定性。海纳用两组参数，即两个参数向量，来表示这一见解，第一个参数向量是“P”，代表决策者的想像（Perceptuai variabies），第二个参数向量是“e”，代表决策环境因素（environmentai variabies）。对行为主体而言，不确定性的程度U是P和e联合作用的结果，所以表示为函数U（P, e），它是P的单调减函数，是e的单调增函数。借用心理学家的术语，U称为“C-D”gap，即行动能力（Potency）与困难程度（difficuity）之间的差距。不确定性源于C-D gap，而且这两类参数在U的表达式中，可分离，这是海纳的基本假设。由于P和e可分离，所以，给定P，只要e取值足够高，决策者就会感觉理性能力不足。图5.11提供了海纳模型的那条临界曲线的直观解释，此处A包含a，你可以不理睬海纳1985年模型的这一修正，继续认为A不含a，只要你将这里的A理解为A-｛a｝即可，图5.13取自海纳1985。

为了应对环境的不确定性，我们可以对变动不居的环境分类，称为“情境”或“场合”。借助于Giiboa and Schmeidier 1995文章，基于情境之间的相似性，决策者可以对环境加以分类，将足够相似的情境归入同类。假设全部可能情境的集合是｛R｝，那么对于事前给定的行为a，存在一个客观概率π使某一个让a成为正确决策的情境R出现。不过，因为理性能力有限，决策者此时未必知道a是正确的选择，所以存在一个条件概率P（a∣R）=r使a被决策者选择。类似地，存在一个客观概率1-π使某一个让a成为错误决策的情境W出现。并且，条件概率P（a∣W）=w使a在情境W内被选择。这些关系式，见图5.13，取自海纳1985。

图5.11

如图5.11所示，R出现的概率π=P（R），与条件概率r=P（a∣R）的乘积，是a成为正确决策的概率，这一概率与正确决策带来的收益G的乘积，就是a的预期收益。类似地，W出现的概率（1-π）与条件概率w的乘积，是a成为错误决策的概率，这一概率与错误决策带来的损失L的乘积，就是a的预期损失。对有限理性的决策者而言，a的预期收入不应低于它的预期损失。这一关系的数学表达，是图5.7右上角的那张图，它的推导，见图5.12，那里的各参量都表示为a的函数，这是因为海纳接受了批评，修正了表达方式。新的表达方式强调它的临界曲线依赖于a，也就是说，任一a给定之后，才有图5.11和图5.12显示的决策过程。

图5.12

图5.12公式（1）是不等式。我们将两边的分母乘到对面的分子上，就得到刚才的关系：预期收益不能低于预期损失。临界的情况：预期收益等于预期损失。这时，公式（1）成为等式，惟一地决定了一个算子T的数值，这就是海纳的临界曲线，它将一个平面分为右上角和左下角，分别代表创新比守旧更合算与守旧比创新更合算这两类情况。注意图5.12公式（1）的表达，不等式右边的两个分数只依赖于客观因素，不等式左边的分数只依赖于主观因素。两类因素可分离。不等式左边分数的含义，是“正确/错误”概率之比，简称“正误比”。不等式右边两分数乘积的含义，是“客观损失的均值”与“客观收益的均值”之比。关于这一解释的另一表述，参见图5.13，取自海纳1985。

图5.13

现在讨论算子T在平面直角坐标系内的形状，横轴表示惟一的自变量e的数值，在[0，1]闭区间。环境的不确定性e很小或接近0的时候，直观而言，π就会足够大或接近1，故T接近0。环境不确定性极高时，π接近0，于是T接近无穷大。还可证明T是凸向原点的。这样，我们同意，T曲线的形状，如图5.7右上角或如图5.14所示。

图5.14

海纳的模型，隐含着这样的推论：A的任一元素，例如b，它与a有何不同呢？b不是创新行为，所以决策者很熟悉使b成为正确决策的那些情境，这就是有模式可循的意思，你们已经学习过Giiboa and Schmeidier 1995。决策者很熟悉b就意味着决策的“正误比”足够高，例如可以接近无穷大。你可以绘制关于b的临界曲线T，不论它是怎样的形状，由于正误比接近无穷大，决策行为几乎永远会落在T的右上方。

上述推论表明，有模式可循的时候，正误比趋于无穷大，相当于假设了完备的理性能力，故而海纳决策过程蜕化为新古典经济学“完备理性”假设下的决策过程。基于这一见解，海纳声称新古典经济学是他的模型的特例，见图16，取自海纳1985，和图17直观解释。

图5.15

现在我们介绍海纳模型的广泛应用，图5.15至图5.18。在图5.15，海纳列出四项推论。第一项推论解释“惯例”的形成：由于某一类情境反复出现，从而有模式可循，决策者选择某些如b这样的行为方案的正误比逐渐趋于无穷大。这就是基于b的惯例。

第二项推论涉及新古典经济学家的“好像理性”辩解，需要更详细解释。新古典经济学家，艾智仁（参见第二讲第二部分）最早提出“as if”的理性假说，贝克尔立即继承发挥。艾智仁的“好像理性”假说，发表于1950年他的一篇文章里，标题是“不确定性，演化与经济学”。以往我在行为经济学课程里，总是要先讲这篇文章。今年没有这样讲，你们可以自己阅读。从芝加哥开车到洛杉矶，需要穿过大半个美国，这样远的距离，如果中途没有加油站，汽车必定抛锚，永远无法抵达洛杉矶。艾智仁的假说是：经济学家等候在洛杉矶，收集从芝加哥抵达洛杉矶的汽车司机的行为样本。如果在许多可能的路线上，只有一条路线是有加油站的，那么，可以想像，只有那些偶然途径这条有加油站的司机，才可能抵达洛杉矶。于是，在经济学家收集的样本里，全体司机，似乎都有完备理性，因为他们都选择了那条有加油站的路线。其实，艾智仁指出，这是自然选择的结果，与司机自己的理性能力无关。如果上帝突然改变美国地图，让另一条路线上有了加油站，那么经济学家观察到的样本里，就是另一批司机，同样具有完备理性，但在上一批样本里却完全消失。

艾智仁认为，不确定性和演化论的视角于是要求我们修正经济学理论。我们应当研究各种情境出现的概率以及与这些情境相适应的行为模式，从而新古典经济学可以发展为一种关于经济行为的演化理论。当然，艾智仁的呼吁至今没有得到主流经济学家的响应。或许贝克尔和拉尤2007年JPE的文章，是半世纪之后对艾智仁呼吁的最重要响应吧。

海纳不同意艾智仁的辩解。因为，幸存的汽车司机们，“好像”具有完备理性的行为，这并不是演化的惟一结果。如果生存竞争不很激烈，那么，会出现许多很不理性的行为模式，它们都可能生存下来。事实上，生物学的演化理论支持海纳的这一见解。以我们人类为例，我们身体的一些结构，很可能永远没有用处却仍幸存下来。我们观察到许多特异的人格类型，如果物竞天择特别激烈，这些人格类型几乎肯定早已消失。地球上还有许多原始形态的社会，如果物竞天择非常激烈，它们必定早已被更发达的社会消灭了。海纳的这一见解，表述在他的第三项推论中。

基于第三项推论的理由，海纳的第二项推论是：大自然的选择力量，与其说是如艾智仁论证的那样导致了好像是最优的行为，不如说是导致了更多的必须遵守的惯例与习俗。甚至可以认为，最初发生的利他合作，作为一种非理性的行为，如果没有成为由社会力量维护着的惯例与习俗，那么根据艾智仁的“好像完备”理性假说，必定早已消失。这就导出海纳的第四项推论：越是不确定的环境，越导致规则的刚性。例如蚁群，C-D gap极高，故而蚂蚁被遗传决定了遵守规则。

图5.16显示，根据海纳的第三推论，可能存在许多行为模式，由于缺少理性故而不能被新古典经济学模型解释，但可以被海纳模型解释。

图5.16

图5.17显示，海纳引用了卡尼曼的长期合作者特沃斯基关于拇指规则的研究报告（Daniei Kahneman and Amos Tvershty，前者因前景理论的研究而获得2002年诺贝尔经济学奖，后者是斯坦福大学的长期校董，非常有利他主义精神，可惜稍早辞世，否则他必会分享这一奖项。辞世的时候，斯坦福大学校长写了一篇感人的文章纪念他。关于前景理论，参见第三讲第二部分）。图5.17还显示，海纳引用谢林（参见第三讲第一部分）关于“焦点均衡”的概念，作为最容易形成的“惯例”。谢林提出焦点均衡（focai Point equiiibria），因为在冷战时期，他观察美苏核谈判过程，核裁军保留下来的核弹头通常会指向对方的首都。所以，如果你请美国和苏联的谈判代表在餐巾纸上默写他们心里首先想到的两座城市的名称，那么，以足够高的概率，你将看到美国和苏联的代表们都在餐巾纸上写了华盛顿和莫斯科。谢林认为，由于共享的知识背景——在此处就是核裁军谈判的背景，博弈双方很容易在许多可能的均衡中，选择从双方共享的知识背景里涌现出来的均衡，称之为“焦点”——这是双方注意力的焦点。罗素在1940年代讨论语言问题时，提到过同样的焦点：母亲在确认孩子的注意力集中于一只苹果时，指着那只苹果说“appie”，以这样的方式，人类儿童学会了第一批单词。然后，其余的单词，可以用第一批单词定义。罗素将全部语词划分为两类，其一是通过指称得到定义的，其二是通过其他语词定义的。海纳认为，焦点均衡未必是最有效率的均衡。惯例未必有效率，但自然选择形成惯例。

图5.17

图5.18

图5.18显示，海纳模型可以解释财产权利的形成和演化。新古典经济学家，张五常是这一领域的代表人物，借助交易费用概念来解释产权的形成和演化。海纳持不同见解，他认为产权是惯例，未必有最低的交易费用。因为惯例的功能仅仅是确保“正误比”高于容忍限度T。这样的产权解释，我认为更好用。例如，图5.18下半部分，当一种产权形式被照搬到中国社会的时候，为什么很容易失效？按照张五常的交易费用思路，就应当是：这一产权形式在中国社会交易费用太高。这就很有些套套逻辑的味道，而海纳的解释更令人信服。根据海纳模型，上述的产权形式早已与西方社会反复出现的某一情境相适应，故而决策者有极小的“C-D gap ”，或等价地，决策有极高的正误比。而照搬到中国社会之后，因为并不反复出现使这一产权成为“惯例”的情境，于是，这一产权形式属于“创新”，它导致很高的C-D gap ，在适用惯例的情境中，基于有限理性的决策者不愿意接受这样的创新。典型的情况，就是法律问题，在东方社会，人们很少诉诸法律。因为这些新的法律能够解决的问题往往可由熟人社会早已形成的惯例来解决，相比而言，人们在“法院”这一情境内反而表现出更高的C-D gap ，于是他们更愿意遵循熟人社会的惯例。

图5.19

图5.20

图5.21

图5.19显示海纳1985论文关于新古典经济学是他的经济学的一个特例的论证过程。这一论证，我认为参照图5.20更容易理解。设A是全部可能的可选方案的集合，γ是从A到全部可能后果的集合的映射，它将决策者i在A里面的任何一个选择a映射为后果集合的一个子集。决策者i的偏好决定了一个最优选择算子Ci，它从γ的映象集合里选择了一个在给定偏好下最优后果的子集，这一子集通过γ的逆映射决定了A的一个子集B，新古典经济学模型其实一开始就假设决策者是从B里面选择而不是在A里面选择，好像决策者有完备理性一样。海纳指出，这样的决策，只适合于反复出现的情境，不适合于新出现的情境。因为完全新的情境，往往意味着有限理性（C-D gap ），于是决策者可能遵循某些惯例，而惯例未必带来最优后果，因此基于惯例的选择，可能在A的子集B之外。换句话说，新古典经济学理性选择模型是海纳模型的一个特例，而海纳模型可以应用于创新的情境。由于创新对演化社会理论至关重要，所以，我在历年的行为经济学课程里，特别重视讲解海纳模型。图5.21，为了将海纳模型连接到下面要讲解的西蒙模型和接着西蒙模型的前景理论，我依照海纳1985文章使用的符号及论证（图5.22，图5.23A，图5.23B），将选择算子C替换为价值函数V。新古典经济学的理性选择模型，要求满足图5.21的不等式。而海纳模型不要求满足这一不等式，它只要求正误比不低于容忍限度T，于是，海纳模型是西蒙模型的一个特例。西蒙模型不要求图5.21的不等式，它只要求“满意”，而海纳模型里满意的判据，就是那条临界曲线。西蒙模型可以引入任何一种满意判据，海纳的容忍限度，虽然，图5.23A和图5.23B，他提供了论证，仍只是许多可能的满意判据之一。

图5.22

图5.23A

图5.23B

休息十分钟。

课间讨论

程琛：海纳模型的T算子依赖于每一次选择，那么，他应当给出全部可能选择的算子的形式。

丁丁：完全正确，这就是他1983年文章遇到的批评。所以在1985年的修正文章里，他特别地要只给出依赖于创新选择的T。至于其他的选择和相应的T，他认为读者可以自己推演出来，不影响他的主要结论。海纳目前的研究，在布坎南的公共选择研究中心，仍在这一方向上。你可以问薛兆丰，他从乔治·梅森大学毕业的，刚毕业不久。他的导师是奥地利学派的法经济学家，女性，应当有一些名气。

一位同学：老师可否解释刚才使用的那些概率R和条件概率r的意思？是否意味着演化？

丁丁：英文很简单，就是“do the right thing in the right situation”。所以，你必须有两个概率的乘积，第一个是正确情境出现的概率，第二个是你在正确情境里做正确事情的概率。当然，这就意味着演化。因为你必须不断修正这些概率。

同一位同学：我正准备考研，我发现数学习题，常常要求解逆运算。在海纳模型里，是否有逆运算的可能？例如积分是微分的逆运算。

丁丁：是的，海纳模型可以用你的这一视角重新理解。不过，根据我们数学系的训练，你在更弱的假设下，得到更强的结论，你的理论就更好。不必有逆运算这样重新解释。

许彬彬：老师，创造性的行为，是演化的，怎么能用一个静态模型来刻画呢？

丁丁：对，不过，为了科学地研究创造性的行为，我们只能静态化地处理它，也就是指定一个a，然后求解静态的命题，再想像a的演化。

上课。刚才有数学系同学来讨论问题，涉及演化与海纳模型的关系。这学期的这些帮助你们直观理解海纳模型的图示，以往这门课程没有，所以，我在教学中已经很富于创新了。海纳模型当然是静态的视角，因为演化视角必须引入时间，而且是不可逆的时间。凡科学研究，都要求静态视角。当你理解了海纳模型之后，你可以把它置于你的演化视角下，重新阐释它的含义，这也是演化社会理论家通常采取的办法。

例如，你可以问：全部可能的创新行为的集合由许多诸如a这样的方案组成。那么，每一个这样的a都有一条临界曲线。可否比较全部这样的临界曲线呢？我认为这就是刚才程琛提出的问题的问题意识。我认为可行，你们应当自己完成这样的作业。这里的关键环节是，这些临界曲线之间或许不可比，如果，例如，那些使a成为正确选择的情境的集合，与那些使另一个创新行为b成为正确选择的情境的集合，没有非空的交集。这时，你怎样比较这两个选择的临界曲线呢？它们可能出现在同一条演化路径上，但必须先后发生，不能同时发生。一个应用，是中国的改革。三十年前人们普遍认同的市场化改革政策，现在遇到广泛批评。为什么呢？情境改变了，可是人们错误地认为三十年前的政策与现在的可选政策是同时可选的。不对，三十年前的那些情境，与现在的情境，很可能没有非空交集。所以，这些政策之间是不可比的。演化论的视角，很少被大众接受，因为它要求许多不同于日常生活的认知。

现在，设想有一个决策者，主观因素使他的智能极高，接近上帝那样的全知全能。那么，这个人在股市里的行为，对于我们这些普通人而言，有没有模式呢？你们回答吧。……海纳模型的结论，有些令人惊讶，就是：这样一位决策者的行为，是不可预期的，因为完全没有模式可循。换句话说，他的最优选择总是最适合股市随机波动的，于是，在我们看来，他的行为是完全随机的，哪里有模式呢？海纳模型的演化论含义就是：越不聪明的决策者，行为越可预期。因为大部分决策者都不足够聪明，所以他们的行为都可以预期，只要我们辨识他们的行为模式。这些行为模式总是以“惯例”形式出现的，为了要适应使它们成为正确行为的情境，于是我们需要辨识这些情境的类型及其概率。这就是艾智仁的呼吁，至今，很遗憾，没有多少经济学家响应。

为什么海纳发表了这篇文章之后，被布坎南调到他的那家大学了呢？因为布坎南和哈耶克一样，程度不同而已，他们都很重视文化“传统”，也就是海纳在1983年和1985年文章里反复强调的“惯例”。改革，在例如中国社会里，不能脱离传统。否则，改革将以很高的概率失败。这是哈耶克的思想，布坎南曾批评哈耶克盲目崇拜传统。但布坎南自己也非常重视传统。他专为重塑美国文化传统，长期与一位韩国学者合作，研究东亚文化传统。如果传统无关紧要，为什么布坎南要长期研究它呢？

艾智仁的“好像理性”假说是1950年发表的，贝克尔1951年立即发表文章同意艾智仁的辩解。他以无理性消费者为例，一群消费者，完全可以不理性，例如，你可以胡乱选择，不必非要在预算线与无差异曲线的切点上，你甚至可以停留在原点，如果你能生存下去的话（笑声）。然后，贝克尔说，经过一段足够长的时间，你观察这些消费者的情况，那些完全不理性的决策者，都消失了，因为钱不够花，所以都消失了。剩下的，我们经济学家观察到的样本，都是“好像理性”的决策者。

艾智仁的这一辩解，同样可以应用到企业理论。例如，一群企业，完全可以不按照边际成本原则定价（即边际成本等于价格），例如，有些企业可以定价到亏损的程度，有些企业可以定价特别高，哪怕完全卖不出去它们的产品。经过足够长的一段时间之后，你观察这些企业，能够生存下来的，进入你的观察样本的，都是那些遵循着边际定价原则的企业。这一定价原则，是新古典经济学价格理论的核心。它有两方面的含义。首先，如上述，它是对“好像理性”的企业行为的静态刻画。其次，如果市场不是完全竞争的，或竞争不充分激烈，那么，你观察到的企业，就会有一些不遵循边际定价原则的，例如它们或许遵循了平均定价原则（平均成本等于价格），但仍可生存。这时，你会推测，市场不是充分竞争的，它可能有问题，例如，被垄断了，或者，有严重的政府干预。

我们说，新古典经济学和行为经济学，可以视为互补的两种经济学。这是我近年来讲课时喜欢表达的见解。这两种经济学，从两个不同视角对公共政策提出评价。所以它们是互补的，不必视为互相竞争的。

在中国的市场化改革过程中，我们知道始终有两派意见。第一派是例如厉以宁教授代表的，另一派由吴敬琏教授代表。第一派的观点是，樊纲也很赞成：“骗出一个市场经济”。吴敬琏的看法是：“整体改革”。你们看到，分歧在于是要摸着石头过河呢？还是要事先设计一套改革方案。政府官员的行为模式是寻求较小风险的改革——不是不改革，而是风险较小的改革。所以，几十年以来，厉以宁的观点始终占上风。为什么呢？因为风险较小。虽然，吴敬琏常常提醒政府和大众，缺乏整体观点的改革过程，是将风险一步一步地积累成为巨大的风险，最终可能完全颠覆改革成果。这一警告，今天看起来像是真实的了。如果我们将这两派观点视为两种创新行为，就需要比较它们的临界曲线。你们的家庭作业，完成之后，让我知道结果吧。

海纳模型的方法论要点，我希望你们不要错过。我仅仅提及而未能展开，现在我展开解释。先请你们讨论一个问题：不确定性，这是一个观念，你怎样将它转换为概念，再转换为可操作的概念？奈特曾试图区分这一观念，使它完全不同于风险。后者，奈特说，是有概率分布的，也就是重复多次从而有模式可循的。而不确定性，是从不重复的从而无模式可循的事件。几十年之后，大约2004年，主流经济学家才开始承认他们的老师的老师，奈特，还真说对了。因为我们脑内确实有区分这两类不确定性的机制。现在，你们怎样将奈特的不确定性变成可操作的概念？海纳的办法是，首先，他相信一切或主要的不确定性，之所以被认为不能确定，是因为决策者自己的理性能力有限。如果你是上帝，在上帝视角下，哪里会有不确定性呢？一切都不是偶然的，都是“necessity”——必然性。只是在我们人类看来，有许多事情是偶然发生的。所以，海纳的办法是，为奈特定义的不确定性赋予一套结构，即C-D gap。若这一缺口是无穷大，则表明决策者智能太低下，对于面临的问题的困难程度而言。若这一缺口是0，则表明决策者对于面临的问题难度而言的智能，几乎就等于是神。于是不确定性成为一个概念，它有了结构。在这一结构里，有客观因素和主观因素这两个方面。客观因素与主观因素联合作用，决定了不确定性的程度，而且同一客观环境，我和你有不同的主观因素，我们想像的不确定性就可有很大差异。为了可操作性，海纳将这两方面的因素分离，假设它们可以分离，这就是他引入的参数向量P和e。以这一办法，不确定性，奈特定义的那种，成为可操作的了。由于核心概念的可操作化，海纳得以导出许多重要的命题，有些令人惊讶的命题。所以，我希望你们注意学习海纳模型的方法论要点，举一反三，将来你们可以科学地分析一个观念——任何一个观念。例如，“幸福”，你们可以试着将这一观念转换为概念并且是可操作的概念。当然还有更困难的观念，例如“爱情”和“信仰”。

现在我终于可以讲解西蒙模型了，图5.24，我在右上角列出西蒙模型的两个关键概念：（1）aspiration ievei，（2）toie-rance range。第一个概念没有合适的中译，例如，我译作“渴望水平”，但仍不满意。这个单词源自拉丁文“aspiratio”，是一种积极追求的欲望。法文意思是“憧憬”、“向往”、“渴望”，我的翻译，借自法文。你们知道有一家服装品牌，Esprit，从欧洲品牌转为香港品牌，这个词，你们查不到，字典里没有。商标通常是改造了的语词，不能在词典里找到的。我考证，这个品牌的意思源自法文的aspiration，它的意思不仅是渴望，而且还要有身体性——体育精神，所以是一种努力向上的精神，但是它也适用于动物行为——因为是身体性的渴望。西蒙教授使用“渴望水平”来取代效用函数的最大值，他认为，人们的行为通常只要达到了渴望水平，就会感到满意。第二个概念是“容忍范围”，因为可能有很多不同的选择，它们带来的满意程度可在渴望水平的附近波动，只要不超过容忍范围，这些选择就都是令人满意的。

图5.24

要更好地理解上述两个关键概念，我们需要借助图5.29提供的直观解释。在那里，有一个价值函数V用来测度行为的各种后果的满意程度。许多可选方案都可以使V的数值落在a代表的渴望水平的附近，于是，决策者根据容忍范围来筛选这些令人满意的选择。凡是使V落在容忍范围之内的x，就入选。可是，在全部令人满意的选择的集合里，我们还必须防止发生这样的情况，就是某一个选择的某些后果是令人满意的，但它的另一些后果产生的满意程度落在容忍范围之外。这些选择必须从上述集合被剔除，剩下的那些选择，就可确保是完全令人满意的。这一思路，导致西蒙算法，即图5.33的E算法。

西蒙模型之后，我会讲解前景理论。所以，图5.25，我用了不同的符号来表示西蒙模型，为了能够连接到以后的前景理论。西蒙模型，半世纪以来，仍是最好的。例如，2008年AER的一篇文章，主要思想是西蒙1955年这篇文章的。

图5.25

渴望，aspiration包含了主动追求的意思，这就很不同于新古典经济学理性选择模型。我认为渴望，比译作“预期”更好。渴望这一概念，在行为经济学三元视角下，有“情—境—理”三方面的因素。情境，已经在渴望的词义里反映出来，理，就是你的渴望不应太远离客观世界的现实，你非要登月消费，不现实，不符合“理”。

西蒙模型提出这两个关键概念，以后的半个世纪，行为经济学家主要是试图将这两个概念转为可操作的，在经验世界里寻找渴望水平和容忍范围的决定要素。

图5.26

这是西蒙1955年文章的索引，你们可以在JSTOR下载。这篇文章的标题是“理性选择的一个行为学模型”，今天是我们行为经济学的经典文献。下面给出西蒙原文里的模型要点：

图5.27

以及西蒙的著名的E算法：

图5.28

我听到外面很嘈杂，是否下课了？那么，明天我们继续讲。（全场掌声）

第二部分
2010年10月24日/下午1 : 00—3 : 00/二教105

今天继续介绍西蒙模型，这是半世纪以来最好的模型，因为在这里，我们看到行为经济学最初的努力，试图整合心理学的决策研究和经济学的决策研究。在图5.25的左上角，我写了新古典经济学选择模型，是最大化一个目标函数，它依赖于自变量x向量和参数向量“阿尔法”。约束条件是关于自变量的值域的，这一值域是另一参数向量“贝塔”的函数。这样的表达，可以说是最广义的新古典经济学理性选择模型，它比大多数教科书里写的理性选择模型更宽泛，因为这两组参量的不同情况，可以产生例如一个千疮百孔挖了许多窟窿的可选方案的集合。并且，目标函数也可以是千奇百怪的，可能根本不连续，因为我们只要找到它的最大值就可以，我们不必提供二阶条件（最大值存在的充分条件）。

但是，如此宽泛的一个模型，它仍意味着完备理性。因为它要找到一个最大值，不是一个极大值。也就是说，它的优化，必须是全局最优而不能仅仅是局部最优。我们从演化理论知道，这样的优化模型，要求完备理性假设。

西蒙教授改写的新古典模型，我写在图5.25右上方，非常简单，可以说是最简单的复杂化。他用绝对值符号来取代新古典模型的最大化符号，绝对值里面是行为后果的评价函数与渴望水平之差，绝对值外面有一个容忍范围“德尔塔”的限制。自变量的约束条件，与新古典模型一样，仍依赖于参数向量“贝塔”。只不过，西蒙在这里写了一句话：渴望水平依赖于选择的历史。并且，请注意符号的改变，我写在图5.25的右上角了。

在这样改写之后，新古典选择模型就完全是行为经济学的选择模型了。因为，寻找一些可选方案，这些方案的全部后果落在渴望水平的容忍范围之内，这是一种局部寻优，它不再是全局最优。并且，寻优本身，我会在图5.29里面详细解释，寻优过程本身是一个演化过程。

图5.29

我写在图5.29右上角的文字，意图是将西蒙模型的核心参数与前景理论的核心参数联系起来。在图5.29里，寻优的目标函数已经改为价值函数V了，这里不再用新古典的效用函数。容忍区间，由“德尔塔”决定，在纵轴上标出来，应在a的两端确定一个允许的区间。现在，关键是讨论寻优的初值，就是图5.29里横轴上随意指定的一个x0。

我模仿西蒙教授画的那条曲线，也画了一条曲线，计算机算法寻优就是找到横轴上对应着这条曲线上的某一个局部峰值或全局峰值的x值。这里，我需要解释寻优技术和寻优算法的步长。

对于计算机软件专业的同学，这些都是常识。其他专业的同学必须仔细听我解释。从初值出发，计算机算法的寻优，每一步走多远？这是一个问题。因为如果你第一步跨得太远，例如向右跨很远，你就可能错过了初值右侧的第一个峰值。有些决策者很固执，他们可能很少改变寻优的方向，例如，在横轴上只有两个方向，如果向左迈出一步，得到的是一个比初值还差的值，这时，许多人会改变方向掉头向右寻优。特别固执的人，他们的算法不会改变方向，一直向左，当然，在图5.29的情况下，他们不可能坚持这样走下去，因为没有粮食，他们迟早会消亡的。现在只考虑向右寻优，步子的跨度不能太大，但也不能太小，日本国会议员的术语是“挪寸步”，投票的时候，如果反对派不能不表决，他们就动员自己的议员挪寸步投票，很大的议会，从座位到票箱，寸步，要很长时间，这是反对投票的一种形式，让对方支付时间成本。如果跨度太小，寻优速度就可能太慢，以致来不及找到峰值，物种就消亡了。物种的演化过程，完全对应于上述的寻优算法，首先就是不断改变寻优的步长，争取尽快找到适存度的峰值。

其次，甚至比寻优算法的步长更重要的，是寻优技术。你使用的是什么算法？已经有了很多算法，例如梯度法和神经元网络算法。算法很关键，一个物种的寻优算法，取决于这一物种的遗传机制和变异机制，还取决于这一物种的知识结构。你们还应记得费孝通命题，一个物种有什么样的社会结构，就有什么样的知识结构。于是，社会结构可以使一个物种过早地消亡。与寻优技术密切相关的，是选择的历史，就是西蒙指出的，渴望水平依赖于选择的历史。如果你刚开始找工作就遇到特别理想的工作机会，你因为寻优的历史太短，很可能会渴望更好的工作机会于是就放弃第一个机会。结果，你到市场上转悠了几年，越来越找不到像样的工作，这时后悔为什么要放弃第一个机会。这就是渴望水平依赖于历史的含义，由于你的寻优历史格外顺利，于是你的渴望水平被激发得太高，以后永远无法获得满意。西蒙说，如果渴望水平长期不能被满足，理性的选择者通常会调整渴望水平，让它变得更低。动物行为学家观察到动物行为的类似现象。一只大猩猩，本来心不在焉，结果实验成绩非常理想，得到实验员的格外嘉奖，通常就是多给几杯橘子水，对猩猩来说是美食。这样的激励，可以使猩猩格外地提高渴望水平，就是说，专注于成绩时，渴望得到更多的橘子水。结果，它以后的成绩很难令人满意，橘子水的数量并不增加。猩猩的非理性行为是，用手捶胸，发泄情绪。然后，很可能调低渴望水平，为了让自己满意。

继续讨论图5.29寻优算法，从初值开始向右寻优，步长合适的时候，算法就可能遇到第一个峰值，即。物种的演化寻优，西蒙认为基本就是这样了。物种不会对自己说，这个峰值不是整体最优，继续找，继续向右走，就会有一个更低的满意值，物种寻优是“近视的”，就是说，它无法远视，无法看到很远的那个全局最优。这样，物种就满足于局部最优，停止在这里了。此时，除非环境发生剧烈改变，否则，物种将满足于永远停止在局部最优的生存状况中。

有一位著名的无政府主义者，你们知道克鲁泡特金吗？巴金的名字，“金”就是从他那里来的（笑声）。这是真的，巴金是笔名，“巴”是巴枯宁，“金”就是克鲁泡特金。当时巴金相信无政府主义，当时共产党和国民党的许多领袖人物都受到无政府主义思潮的影响。你们可以读一本书，《无政府主义与中国革命》。

克鲁泡特金（Peter Kropothin，1843—1921，无政府主义的思想领袖，名著《互助论》），俄国贵族，那时候，俄罗斯贵族几乎都特别有正义感，特别高尚，关心穷人，帮助穷人，反对沙皇的政策。克鲁泡特金就是这样一位贵族，他父亲有许多孩子，都接受过欧洲最优良的教育，也因此，熏陶了高尚的情操。典型地，你们知道“十二月党人”吧？都是贵族，他们其实是为穷人争取正义，被沙皇流放到西伯利亚。克鲁泡特金被流放到西伯利亚，他的专业是地理学。所以，他就继续考察那里的地理状况。结果写了《互助论》，成为无政府主义思想的理论基础，而他本人的一生被王尔德这样的作家誉为“完美的人生”，他们称他为“无政府主义王子”。他在《互助论》里阐述的是这样的见解：当自然环境特别严酷的时候，例如西伯利亚，零下60度的漫长冬天，野兽完全找不到食物，并且不得不互相依偎着取暖。结果，他观察到，各种野兽，不再互相厮杀，它们开始互助，例如，帮助对方抚养孩子，或轮流分享食物。你们能想像吗？友好的气氛，如同迪斯尼拍摄的“狮子王”，老虎、大象、狐狸、兔子和老鹰，大家都是朋友，互相帮助。

图5.30

克鲁泡特金指出，自然界的普遍原理，不是达尔文的物竞天择，而是互助。所以，他的互助论在思想史上是对达尔文进化论的重要补充或修正。

当环境变得特别严酷时，互助成为生存下去的惟一方式。这样，演化寻优就可能突破原来的局部最优，迫使物种继续向右寻优，直到它们找到了全局最优，x * 。你们知道，囚徒困境博弈的纳什均衡，不是全局最优，因为合作策略其实比纳什均衡更好。最严酷的环境，可能迫使物种遵循合作惯例。

根据图5.29，我们可以讲解西蒙的寻优算法。这一算法的要点，……你们学过勒贝格积分吗？……没有。道理一样，都是从纵轴开始工作。我们看渴望水平a，它在图5.29是一条水平的直线。容忍范围“德尔塔”决定了纵轴上以a为中点的一个区间，价值函数V在纵轴上的取值，落在这一区间之外，就是不令人满意的。现在你们从纵轴的a+德尔塔和a-德尔塔这两个点，各做一条水平直线，平行于a这条直线，无限向右延伸，构成一条以a为中心的水平带子，可称为“容忍带”。然后我们看图5.29的那条曲线，它代表了价值函数V在一切可能后果的集合上取得的值，这条曲线上凡是落在容忍带之外的值，就是不令人满意的，我们将一切落在容忍带以内的值，构成一个集合，称为“令人满意”的集合，用西蒙的符号，记作S’。

现在我们必须了解图5.30和图5.31显示的西蒙模型的六项要素，西蒙指出，行为学理性选择模型或多或少要包括这些要素的全部或大部分：（1）行为选择集A，不必满足任何诸如连续性这样的性质。A是客观允许的选择集，行为主体未必知道A的全部元素，所以，西蒙假设（2）行为主体想像的可选方案集合是“Å”（参见第一部分结尾提供的西蒙原文），它是A的子集。然后是模型的第三要素，（3）这些可想像的行为导致的全部可能后果的集合S，（4）在这一集合上定义了行为主体的一个评价函数V，西蒙认为V很可能是阶梯函数（参见第三讲第二部分介绍的贝克尔和拉尤2007年JPE文章）。（5）任一可选方案a导致的全部可能后果，记作Sa，它是S的子集。注意理解，要点（6）“Å”内任一可选方案a导致的后果集Sa可以有许多元素，每一元素何时发生，依赖于不确定的情境，西蒙假设在Sa上有一个概率分布Pa，于是可以有关于a的全部可能后果的预期评价，它是Sa内每一元素与该元素出现的概率的乘积然后求和所得的数值，即V关于a的全部可能后果的预期满意值，参见第一部分结尾提供的西蒙原文。

图5.31

图5.32

图5.33

西蒙的E算法，见图5.33，就是寻找一个想像中的可选方案a，使得a的全部可能后果的集合Sa满足：它的任一元素s的V值必须落在容忍带之内，即是S'的子集。只要找到了这样的Sa，寻优就结束了。这时，a称为令人满意的可选方案。

图5.32和图5.34很重要，它们分别显示偏好的连续形式的表达和离散形式的表达。通过这样的表达，经济学家将“偏好”这样观念，变成可操作的概念，从而可以定义“完备理性”和“不完备理性”。

连续性的偏好，典型的，就是新古典经济学消费者的偏好，在无限可分的N维商品空间上。这类偏好的最简单可表示的情况，是N=1的情况。这时，可选方案集A是一个线段，在横轴上。我们在纵轴上也截取一个等于A的线段，于是A×A即A与A的笛卡尔乘积，是平面里的一个正方形面积，如图5.32所示。这一面积里的任何一个子集，记作R，就表示A上的一个偏好。因为R里的任一点，有两个坐标，x和y，记作（x, y），这是有方向的二元点对，它表示x不比y差，记作xRy。所以，A上的全体偏好的集合与A×A的全部子集的集合之间，有这种对应关系。不过，这样定义的偏好，未必满足理性的最弱要求。理性的最弱要求是“非循环性”，我写在图5.31上方。循环的偏好是这样的，有一个笑话，飞机起飞后，乘务员问你要什么饮品，你说“咖啡”，乘务员问你要什么样的咖啡（加糖和奶的和不加糖和奶的），你说还是“果汁”更好，乘务员问你要什么样的果汁（橙汁、苹果汁、番石榴汁），你说还是“葡萄酒”更好，乘务员问你要什么样的葡萄酒（干白还是干红），你说还是要“咖啡”更好。这里出现的，就是偏好的循环性。理性的最弱要求是不能出现循环——非循环性。当偏好涉及公共政策时，往往不连续，例如，你同意修一座高速公路或不修这座高速公路，你不能回答说你同意修0.12座高速公路。所以，经济学家常常需要刻画离散的可选方案集合上的偏好，这就是图5.34显示的内容。

图5.34

不论连续的还是离散的偏好，都可以表示为二元关系。满足最弱理性要求的二元关系即非循环的，比非循环性稍强一些的性质是“传递性”，它的意思是，当你认为x不比y差并且y不比z差的时候，你应当认为x不比z差。传递性可以避免循环，但非循环性未必可传递。通常我们要求偏好满足传递性假设，而不要求偏好满足非循环性假设。更强的假设，意味着理论比较弱，但传递性假设更好用，考虑到分析方法的便利性，经济学家往往愿意牺牲更强的理论，关键是能否解决问题。阿罗的博士论文旨在解决“社会选择”问题，为了结论的鲜明性，他需要更强的理性假设，他假设偏好不仅满足可传递性，而且满足完备性假设。后者的意思是，可选方案集的任两元素x和y，决策者永远知道哪一个更不差。换句话说，他要求决策者必须有所选择而不是不知道怎样选择。布尔丹驴子的故事，经院哲学里面的，一头驴子，面对两堆等距远的稻草，不知道先吃哪一堆，于是饿死了。这种情况，阿罗假设它不存在。事实上，我们每一个人在日常生活中的选择，充满了违背完备性假设的情况。例如，你在杭州生活，一盒龙井茶和一件Esprit的衬衫，价格都是500元，你当时只计划开支500元，你买那一种商品？许多消费者不知道选择哪一种，因为这两种商品之间的关系比较遥远。你或许很容易比较同样价格的两件衬衫，或同样价格的两种茶叶。所以，完备性假设是很强的假设。

离散情况，完备的偏好，可以表示为图5.34最右端的那条链子。这条“链”上排列着全体可选方案，因为决策者知道任何两个方案之间孰优孰劣。

不完备的理性，可以表示为一堆“半链”。这是因为，我们熟悉的日常选择，往往可以划分为若干类别，每一类之内，我们永远知道怎样选择，但跨类别的选择，我们就感到很困难。所以我们在每一类之内的选择，相当于局限在这一类可选方案上的偏好满足完备性假设，故而表示为一条链子。但是跨类选择，不完备，我们不知道如何选择，这种情况被表示为一些间断的链接，如图5.34所示。典型地，对你们而言，图5.34最左端的两个可选方案是纽约大学研究生院和伯克利大学研究生院，你打算申请出国读博士学位的时候，比较容易在这两家大学之间作出选择。左侧第二条链子上的两个可选方案，是你主修专业之外可选的辅修专业，例如，经济学和政治学。这时，你也会比较容易作出选择。然后是左侧第三条链子上的三个可选方案，你可以选修的三门课程，其中第一门课程，你知道，与其选择这门课，不如选择左侧第二个链子的最好的辅修专业。关键是其余两门课顺序排列在第一门课程下面，现在让你在辅修专业中比较差的那个专业和其余两门课程的任何一门课之间作出选择，你会感到非常困难。请你们注意，在这一故事里面，你通常无法比较最左侧的链子与左侧第二和第三个链子。继续讲故事，左侧第四和第五个链子，可以是校园里你今天可以选择的餐馆和你可以相约的朋友，其中第二个可相约的朋友不比第一家可吃的餐馆好。诸如此类，你们可以讲出更多的故事。

西蒙使用的评价函数V，也可以用上述办法来表示，我们可以要求V满足理性的最弱要求，即非循环性。仔细想想，非循环性假设在西蒙寻优过程中，未必永远满足。因为如果过程是不可逆的话，就可能有“后悔”。例如，你放弃了第一个工作机会，几年之后，你后悔，希望得到那一工作机会，但已经不可能了。后悔意味着表现出来的评价体系的某种循环性。

因此，西蒙的理性选择模型，他自己称为“过程理性”。作为对比和批判的对象，他称新古典经济学理性选择模型为“实质理性”。逻辑而言，过程理性未必满足实质理性的最弱要求，因为“过程”未必可以纳入任何符合“逻辑”的理解框架。这是柏格森和怀特海的哲学，我在新政治经济学研究班多次介绍过。

那么，是否有更弱的理性假设？是的，有。黑格尔早就探讨过这一问题，在《逻辑学》里面。理性的最弱要求，你们想想，就是当我说“现在我在说话”的时候，你们不会理解为“现在我不在说话”。这一要求，哲学家称为逻辑的“同一律”，记作“A=A”。如果不满足同一律，那么我的任何表达就很难甚至不可能被理解了。其次，逻辑的第二定律“A不是A非”，称为“矛盾律”。我们在数学证明时，常用反证法证明一个定理。反证法的说服力在于，它假设如果定理不成立，就可推导出一个矛盾。由于我们的理性必须满足逻辑第二定律，所以我们的头脑可以被反证法说服。姑且只用这两大定律吧，因为“排中律”有争议。我们说，理性最弱的要求，是A不能不是A，以及A不能等于A非。否则，任何表达都很难被理解。不能理解的，我们就很难相信是理性的，金岳霖先生的术语“不可思议”，既然不可思议，就不能是可理解的。我常引用怀特海“三段论”（参见第一讲第一部分）。在任何理解之前先有表达，在任何表达之前先有重要性感受。关于理性，我们讲到此处。

这样的理性要求，逻辑第一和第二定律，我认为西蒙的寻优过程也应当满足。因为，至少V可以满足这两项要求——你不能认为你满意这些后果并且你认为你不满意这些后果。过程理性满足同一律和矛盾律。所以，它是理性的一种。演化效率，你可以说，它是理性的。虽然，特别低等的动物，你不相信它有理性。可是，自然选择让它好像有理性——只不过是最弱的“过程理性”。

跨学科教育的主旨是什么？直白地说，就是要让你们获得一种能力从任何一个专业学科的教室里，返回常识。你们会问，然后呢？常识，那不就返回到刚刚考入北京大学的水平了吗？不是。因为你已经熟悉了专业课和许多抽象概念，当代教育普遍存在的问题是，你不知道怎样将这些专业概念与常识联系起来，于是你毕业之后不懂得怎样发现和求解现实世界里的重要问题。当你返回“常识”这一原点的时候，你获得的是从常识出发，向无穷多的可能专业的任何一个专业领域，重新建构你认为可操作的概念，从而找到一条适合你的现实生活和研究工作的更富于成果的思想路线。如果你不返回原点，你充其量只是沿着专业课老师的思想路线，试图继续走下去。所以，请你们记住：常识，观念，概念，可操作的概念，返回常识，……

最基本的常识，是你关于这个世界的认识，这是一个整体。然后你有一个激发你兴趣的问题，根据问题的性质，你建构相应的概念并将概念转化为可操作的概念。于是你有了一个可以科学研究的问题。这是跨学科教育的前景，以往的应试教育，完全不能提供这一前景。

史密斯（在诺贝尔演讲中）认为，过程理性和建构理性（即西蒙批判的实质理性）是互补的两种理性。卡尼曼接着西蒙的思想路线向前走，他提出“框架”效应（framing effect）作为对西蒙的上述见解的一种可操作的概念化。西蒙的见解是：决策者将决策过程呈现给他自己的时候可能产生的误差（图5.35）。卡尼曼的操作是：让我们将决策者呈现自己决策过程的过程看作一个“框架”。对新古典经济学家来说，框架，例如一只相框，它不会影响决策者对相片本身的评价。但是心理学实验找到了大量反例，我们根据一个框架呈现给我们的信息（相片）所作的决策，通常受这一框架的影响。一个最著名的实验是“亚洲疾病”，我记忆里，这方面最早的实验是社会心理学家阿什（Soiomon Asch，美国最重要的格式塔心理学和社会心理学家，1907—1996）关于社会压力影响个人选择的实验。类似的实验，2009年发表的一篇实验报告，更精彩。在这一实验里，被试扮演独裁者。你们知道“最后通牒”博弈吧？就是甲和乙瓜分一份财富，例如，100元钱，甲扮演瓜分方案的提出者，例如，甲提出一个方案，90%的财富归甲，剩下的归乙。而乙的选择只有两个，要么接受甲的方案（实验员将据此分配甲和乙的所得），要么拒绝。当甲的方案被乙拒绝时，实验员剥夺这笔财富，甲和乙各自都得到0。这是最后通牒实验，因为很像是最后通牒，没有商量的余地。这一实验的变版是独裁者实验。甲扮演独裁者，提出分配方案。乙则只有一个选择，就是接受甲的方案。所以，乙其实没有选择，处于被独裁的境况。在实验室经济学研究中，我们发现独裁者实验还不够严格，于是有了“双盲”独裁者实验。双盲的意思是：被试和实验员都不知道独裁者的分配方案。这样，独裁者独处一室，决定分配方案，并且他知道，其余参与者也都知道，他的分配方案，不论多么自私，不会有任何第二人知道。去年发表的那篇文章，报告了双盲独裁者实验的数据，惟一不同之处是，实验者在独裁者填写分配方案的信纸上，印了三个黑点在信纸的背景上，其中，两个点在上方，一个点在下方，于是像是一张人脸，暗示有人看着你。作为对比数据，实验者还印了一种信纸，背景仍有三个黑点，但一个在上方，两个在下方，于是像是三角形，而不是人脸。就是这样的微小差异，作为“框架”差异，导致了独裁者的分配方案的系统性的差异。有人脸形状的信纸，分配方案显著地比三角形黑点信纸的分配方案更公平。

图5.35

下课了吧？休息十分钟。

课间讨论

一位同学：刚才介绍的西蒙E算法，为什么要有绝对值呢？如果得到的结果比渴望水平高，不是越高越好吗？

丁丁：这是一个好问题。不过，你要知道西蒙算法是一种计算机程序，它必须遵循事前规定的原则。如果容忍区间不用绝对值符号，那么上限就没有一个事前规定的原则了。程序何时停止搜索呢？假如结果越来越好，那么，程序就永远也不收敛了。在股市行为研究中，我们强调遵守规则，否则通常要亏损。赚了30%，至多赚到50%，你要坚决卖掉。如果你没有这样的规则，越赚得多越好，那么当市场逆转时，你很可能来不及卖出你的股票，于是产生重大亏损。在明星基金经理当中，只有极少数，有过“home run”的经历，就是赚到最大程度。张五常说过，股市行为，最艰难的决策不是何时进入而是何时退出。人生也是这样，一定要知道何时退出。知道何时进入并不难，跟着社会主流走就可以了。

詹帅：你讲的那个“Å”，我还没有想清楚。

丁丁：上帝给你一个A，你未必想像出A的全部，很可能你的有限理性只能让你想像到A的一个极小部分。演化寻优，西蒙似乎说过，你可能逐渐地想像出A的不同部分，这是想像的可选方案集的演化。

继续上课。西蒙模型与卡尼曼的前景理论密切相关的变量，首先是图5.29寻优的初始值，x0，因为这一点就对应着卡尼曼前景理论的直角坐标系原点。仍以找工作为例，你的第一个工作机会，每月工资1万元，很不错。但因为上述的理由，你的渴望水平被突然提高了，你认为照这样的前景，你可以找到月工资2万元的工作。于是你放弃了第一个机会，继续搜索。这里，你的渴望水平有一个参照点，就是第一个机会给你的每月1万元的工资。这是卡尼曼前景理论的第一要素（参见第二讲第一部分图2.17及其解释）——参照点，相对于参照点的满意程度。然后是第二要素，即我们对相对收益和相对损失有显著不同的敏感性，对损失的敏感性是对收益的三倍。

图5.36

图5.37

那么，决策者怎样呈现自己的决策过程？请看图5.36，这里出现了许多符号，它们的含义与以前不同了，我解释一下。决策者首先要确定S，它是决策者能够注意到的那些决策情境（situations）的集合。然后，决策者根据以往的全部经验（experience）——记作集合E，和他积累的全部知识（hnowiedge）——记作集合K，他当前的全部欲求（desires）——记作集合D，以及他目前持有的价值观和评价标准（vaiue system）——记作集合V，基于这些因素，他才可能比较清楚地想像S包含的那些情境，记作集合P。所以，P是决策者进行决策的“框架”，他并不在S内决策，而是在P内决策。这样的描写，我认为可以接近满足行为经济学“情—境—理”三元体的分析标准了。决策框架是演化的，因为如图5.36，P依赖于上述五个集合（S，K，E，V，D），而这五个集合都随时间而改变着。例如寻优的经验，也就是从哪一个初值开始寻优，这往往是找到满意结果的关键。知识集合K也在不断变化，寻优技术的更新，决定性地影响寻优结果。诸如此类，都是不断演化的，西蒙在1955年论文的结尾写了一句话，“a major extrension of empiricai foundations”，我们需要根本性地拓展经济研究的经验基础。这就引出图5.37的议题。

行为经济学家应当做的，首先是观察现实行为，而不是逻辑地从一些数学模型推演出这些行为。行为经济学的观察数据，至今为止，来自下列领域：实验室（Vernon Smith and Ernst Fehr），田野（Boyd and Henrich），仿真（Gintis, Young, Nowah），社会生物学（Edward Wiison, Sigmund and Nowah），脑科学（Fehr, Singer, Giimcher, Vernon Smith）。

美国经济学会通常将每年AER的5月份这期用作发表年会论文。2008年这篇文章，图5.41，发表在5月号，所以不是正式论文，但也很优秀，因为入选年会论文了，文章标题是“神经经济学数据的经济学洞见”。我将这篇文章摘要写在图5.41左下角的中文注释里，你们应注意我写在那里的最后一句话：寻优模型基于西蒙1955，这是这两位作者明确写在文章里的。他们的实验，测量的是多巴胺系统的激活状况。我们知道，效用函数，在脑科学里，往往被认为是快乐的水平，而快乐感，或快感，与多巴胺系统的激活水平密切相关。作者报告的实验，是彩票实验。在实验经济学文献里，有两类彩票，其一是中奖概率很低但中奖金额很大的，称为“the＄-bet”。另一类是中奖概率很高但中奖金额很小的，称为“the P-bet”（P是概率的缩写）。彩票的类型，影响多巴胺水平。所以，这项实验是脑科学和经济学的交叉研究，你们可以自己阅读这篇文章。

2007年，图5.38，哈佛的明星教授，Daniei Giibert，在《科学》杂志发表了一篇文章，标题是“前景：体验未来”。你们看到标题已应推测他的实验报告是什么内容，因为未来还没有发生，所以没有成为上述的经验集合E的元素，而标题写了“体验未来”，当然就是想像未来体验，在被试的想像中体验未来。注意我写在图5.38右侧的那些文字，我在这里重新定义了“理性选择”：决策者寻找的，是他想像中后悔概率最低的可选方案。由于上节课我们关于理性的讨论，现在可以将“后悔”视为决策不很理性的一项特征，尤其是过程理性，未必满足传递性假设，我们只希望它服从同一律和矛盾律。这时候的决策，寻优选择，如果事后不后悔，那么就是很满意了，这是西蒙思想。

吉尔伯特在哈佛的课程，因受公众欢迎，被CMBC录像作为面向公众的课程。你们谷歌搜索可以很容易找到他的许多资料和他关于幸福的研究报告。他讲课的时候，讲台上只有一个大约一米半高的柱子，笔记本电脑就放在这个柱子上，讲台被色彩灯光映照成一个大舞台，吉尔伯特在舞台上一边演讲一边走动，如一位明星演员。

图5.38

在2007年他这篇文章里，沿着西蒙的思路，报告了什么样的实验呢？注意“Prefeeiing”这个词，提前想像将要发生的体验。被试的想像，吉尔伯特认为，首先受被试当前所处“情境”的影响，图5.38的符号是“ē”（environment），这里包括此刻的情绪和体验。影响被试想像的第二要素是未来“事件”，图5.38的符号是“e”（event），这里包括以往的全部相关经验。想像中未来事件的体验，记作H 1 ，未来真实事件的体验，记作H 2 ，1和2分别代表现在时刻和未来时刻。所以，ē和e分别也都有1和2，现在时刻的情境和未来事件想像，未来时刻的情境和未来事件想像。吉尔伯特研究了H 1 和H 2 之间的误差及这一误差的决定因素。他的结论是，图5.39，预先感受和真实感受之间的误差，主要产生于被试脱离未来情境而想像未来的快乐，这种想像，英文是“decontextuaiized Perception”。其实，幸福必须是情境依赖的（situation-specific）。吉尔伯特指出：人是逻辑动物，想像未来幸福时，倾向于忽略具体情境对幸福感的影响。注意，我在这里标出的“情—境—理”三元关系。

图5.39

但是我们应了解，与未来事件相比，未来情境其实很难想像。因为我们想像一个未来事件时，通常可以与现在的同一事件相比。可是情境，例如一个场景，细节太多，很难想像未来某一时刻的场景。我在图5.39下半部分写的中文注释，有助于理解这一观点。我们脑的演化导致我们更多地依靠概念想像未来事件。根据语义记忆和场景记忆的区分，通常，概念不能涵盖场景。

作为中国读者，我注意到，普林斯顿大学的卡尼曼的前景理论，完全没有被这篇文章引用。哈佛大学和普林斯顿大学历来竞争激烈，尤其在争夺教授方面，有过不少新闻。可是，吉尔伯特专研“前景”误差，却不引用卡尼曼的前景理论。这是令人困惑的，虽然我可以理解。不论如何，2007年吉尔伯特这篇文章，是幸福研究的一篇重要作品。他提出的是“复合幸福”概念——“syntheticai happiness”，相对于大学生们常有的“简单幸福”概念——“simpiistic happiness”。简单幸福的想像，由于不考虑情境对感受的影响，所以常有后悔发生。复合或复杂的幸福感想像，显著地较少后悔发生。

后悔，这一观念，哲学家探讨过，很深刻，但不可操作。博弈理论家近年来也讨论后悔，而且可操作，但不能令人信服，太肤浅。我们需要一种社会科学的后悔概念，兼有哲学的深刻性和博弈理论的可操作性。凯恩斯和哈耶克联合指导过一位博士生，沙克尔（G. L. S. Schahie，1903—1992，他的激烈主观主义的预期理论受到布坎南的高度赞扬），大约在1940年代，当然不是联合指导，而是先后指导。但这两位大师是好朋友，同时还是论敌——不影响他们相互欣赏。沙克尔的思想，最近十几年引起逻辑学家的关注，例如，斯坦福大学网络百科的“沙克尔”词条，由中山大学逻辑与认知研究所的所长撰稿，因为他在斯坦福大学访问时偶然读了沙克尔的经济学文章，深受启发，追踪不已。我今天不能介绍沙克尔的思想，总之，与“后悔”密切相关。请你们仔细读我写在图5.38右方关于后悔的文字并作笔记。后悔，就是你想像的未来事件感受因为你忽略了想像未来事件的情境因而与未来真实感受相差太多，以致后悔。用演化生物学的方法测度，就是，为了维持未来令人满意的适存度，你的未来想像导致的决策带给你的适存度偏离令人满意的水平足够大以致产生的情绪波动。这样的后悔概念，是可操作的。

图5.40

图5.41

简单幸福后悔概率很高。吉尔伯特招聘的被试都是哈佛大学的学生，每学期选修一门摄影课。这项实验被嵌入在摄影课里，在学期将近结束时，老师说，为了感谢你们选修了摄影课，我允许你们从下列名作仿制品中任选一件，拿回家去。然后学生们开始挑选照片，都是拍卖行榜上有名的作品，当然是复制品。一组学生被允许自由选择的权利，就是在四天之后，如果你后悔了，你可以拿回来换另一张。另一组学生没有这样的自由选择权，也就是不论你是否后悔，你都不能调换照片。

简单幸福是年轻人最常有的幸福感，在日常生活中表现出来，就是，例如一个孩子，非要家长给他买自行车。家长怎么劝解都不行，于是妈妈询问了：你为什么非要买呢？孩子的回答：I just want it。（笑声）你们听懂了吧，你要什么就必须得到什么，吉尔伯特说，这就是简单幸福观。这样的幸福，后悔概率很高。为什么呢，因为简单幸福不真实。只有综合或复杂的幸福，才是真实的。吉尔伯特采访了三位公众眼中最不幸福的“样本”。其中一位是国会议员，卷入一桩弊案，关在监狱里十年，很不幸吧？结果采访的时候，他说很幸福，特别幸福，因为以前没有机会反省自己的人生。第二位是残疾人，事故之后，几年了，接受吉尔伯特的采访，他说，从来没有像现在这样幸福过。你们认为这是什么原因呢？第三位是，我记得是一位罪犯，采访的时候，也说他非常幸福。基于这些采访，吉尔伯特提出了复杂幸福这一观念。2007年的这篇文章，吉尔伯特并没有提供复杂幸福的结构，当然也就没有可操作的概念可言了。我等待他将来的工作。

实验结果是这样的，有自由选择权的学生，与没有自由选择权的学生相比，显著地“后悔”概率更高。不后悔的这一组学生在实验之后接受采访时表示他们一开始就很满意自己的选择。怎么可能如此凑巧呢？第一组学生一开始就不满意自己的选择，纷纷后悔？更可信的原因，是这些学生的简单幸福观导致了在没有自由选择的机会时，简单幸福感不被激活，故而后悔的概率很低。在有了自由选择的机会时，简单幸福感被激活了，故而后悔的概率很高。

图5.42

现在总结一下，请看图5.42，回到哈耶克的“三重传统”假说。从生物学开始，最底层的是“细胞”尤其是细胞膜两侧电位差和LTP（iong term Potentiai）——我会解释这一术语。从最底层的记忆，涌现到神经元网络的层次以及这一层次的记忆。再从神经元网络的层次涌现到各脑区和意识的层次，形成这一层次的记忆。

Vernon Smith继承哈耶克思想，在获得诺贝尔奖之后鼓吹哈耶克“人类合作的扩展秩序”思想。他认为，人脑内部的神经元网络，是脑内的合作秩序。第二层次是“家庭”内部的合作秩序，第三层次是“市场”合作秩序。

研究“记忆”之后，我们可以研究“情感”。记忆的研究，首先它必须变成可操作的概念。见图5.43，我引述埃克尔斯著作第176页。

解释“LTP”：生命的基本单位是细胞，由细胞膜将细胞体的内部与环境区分开来。细胞膜两侧的电位不一样，有电位差，称为“膜电位”。当电位差超过一定水平时，例如100微伏，就引起放电反应，因为它必须释放太高的电位差，否则，细胞可能就死了或爆炸了。这称为“firing”我不知道这个词怎么翻译，开火？总之，是放电的意思。细胞放电的时候，电流通过轴突传递出去。细胞有许多树突，有一个或若干个轴突。平均而言，我们脑内的每一个细胞大约与另外的1500个细胞有纽带联系，这些纽带多数都是树突——接收输入信号的，少数是轴突——输出信号的。

图5.43

现在介绍神经元之间的社会交往形式。根据杨雄里主译《神经生物学：从神经元到脑》（科学出版社，2003年），神经细胞与其靶位（在神经元与其他神经元或与自身的信号交换中，接收输出信号的神经元称为“靶位”）之间的接触点，称为“突触”。有化学突触和电突触，前者可靠且速度快，后者速度慢且易被压抑。在电突触，电流从突触前神经终末流入突触后细胞，改变后者的膜电位。电传递突触，在无脊椎动物中普遍存在。在化学突触，动作电位到达突触前神经终末，引起神经递质分子的释放。在直接性化学突触，递质与突触后细胞膜上的离子型受体结合，受体本身即为离子通道。结果是，受体的构型发生改变，通道开放，离子流过，膜电位发生变化。而间接性化学突触，则涉及到代谢型受体和细胞内第二信使。图5.44是这部著作第九章的图1，显示电突触和化学突触是两种不同的交往形式。

图5.44

又据这部著作第10章“突触传递的间接机制”，中枢及自主神经系统中的许多突触只能以间接方式传递信号。图5.45截取自该著中译本第178页，是关于间接传递机制的一个概要说明，也便于理解图5.51。

图5.45

图5.46

图5.46至图5.52，取自我2004年在浙江大学的行为经济学课程讲义，这些知识现在似乎仍是正确的，参阅杨雄里主译《神经生物学：从神经元到脑》科学出版社2003年版，第12章“突触可塑性”。图5.46显示的是一个典型的神经元细胞：dendrite，树突；Axon，轴突。图5.47显示突触间隙的细节：synapse，突触；Synaptic gap，突触间隙；membrane，细胞膜；vesicie，含有神经化学递质的突触囊泡。图5.48左图显示电脉冲沿轴突传递并在突触间隙诱致含有神经化学递质的突触囊泡向突触间隙释放，图5.48右图显示接收神经化学递质的细胞膜上的受体阀门允许神经化学递质通过细胞膜。图5.49显示电脉冲沿轴突感应跳跃的过程。图5.50很重要，它的左图显示正常细胞的开火速率，它的右图显示建立了长期记忆的细胞的开火速率。后者比前者密集很多，因为NMDA被激活了。图5.51显示细胞内部导致了NMDA激活的复杂生化过程。长期记忆之所以“长期”有效，归根结底是因为图5.51所示的染色体复制蛋白体的过程被激活，这相当于由遗传机制决定了细胞的更密集的开火速率。图5.52显示一个典型的神经元细胞可能有的各种突触结构。

图5.47

图5.48

图5.49

图5.50

图5.51

图5.52

图5.53

回到埃克尔斯解释的LTP现象，图5.43，持续15秒，每秒刺激15次，然后，刺激消失，但细胞已经记住了刺激，电位维持了10小时。这是在海马回进行的实验，埃克尔斯收集的数据表明，在大脑皮质也存在这样的长期记忆能力，并且不亚于海马回。

在图5.53我们看到恒河猴脑区的学习过程，注意左半图：在25天的训练中，神经元反应速率从140毫秒迅速下降到20毫秒（第五天），然后缓慢上升至大约60毫秒。与此同时，神经元之间的连接密度随着学习过程逐渐下降。

图5.54显示，建立了长期习惯的神经元连接，粗大但数目极少，这就意味着神经元之间的纽带数目从平均1500个，经过长期记忆的学习过程，减少到500—700个，同时，纽带变得更具鲁棒性——对外界干扰不敏感。学习之前，神经元纽带特别多，因为要适应许多可能出现的情境。学习之后，神经元纽带大大减少，符合效率原则。如果这些神经元的纽带已经专业化成为只适应少数几种情境的长期记忆神经元，那就没有必要养活太多的纽带，因为浪费资源。

图5.54

图5.55显示恒河猴学习过程中，主要脑区之间的关系。一旦有了长期记忆能力，动物很容易就建立与情境相适应的渴望水平。例如，你每天喂一只鸽子，喂两次，每次给它50粒玉米，持续20天，然后你试图每天只喂一次，不行了，鸽子已经建立了渴望水平，你突然将少一次喂食，它会很失望。如果不是鸽子，而是某一哺乳动物，你这样做将引致情绪化的反抗。

图5.55

图5.56说明长期记忆的内容，主要是场景记忆和与长期目标相关的知识。这些知识称为“致命的”（vitai hnowiedge），因为，天下没有免费午餐，神经元是很宝贵的，专用于记忆某些知识，就肯定不能用来记忆其他许多知识。所以，这些被记忆的知识，必须对生存至关重要，例如猫扑鼠的动作和技巧，就是“致命知识”。在长期记忆中，更晚近建立的记忆更倾向于满足行为主体在当前情境内作出“反应“（correspondence）的需要。但是，更长期的记忆则倾向于满足行为主体“自洽整合”（coherence）的需要。这里出现的，是“人格—记忆—自我意识”三者之间的冲突。

图5.56

图5.57

长期记忆当中，用于社会交往行为的比例越大，说明物种的社会性越强。图5.57显示七种猴子在各种日常活动上的时间分配情况。这是动物社会学家测度物种的社会性的具体指标之一。例如，B是单纯消耗能力的行为，与社会交往无关。A是典型的社会交往行为，称为“互相理毛”。C是自我护理行为。E和D，我认为有些不确定，D可以是社会行为，因为这只猴子必须花费时间探测其他猴子的意图。

图5.58

根据这些时间配置数据，图5.58显示了这七种猴子的社会性递减的序列。将最多时间用于社会交往的，是残尾猴。社会性最低的，是环尾狐猴。社会结构依赖于族群发育惯性和自然选择的压力，这是我写在图5.58左侧的注释。

现在再回顾图5.59，它以前出现过一次。我增加了解释文字，主要根据埃克尔斯的著作（《脑的进化》），诸如“直立人已有语言能力”，“语言脑在出生前已经发育”，以及“颞顶沟……”。

图5.59

注意图5.60最下面文字，取自埃克尔斯的著作。这一案例可能意味着，如果左脑的语言中枢不能在3岁以前正常激活，那么它将被其他功能占用，于是，这名13岁才学习人类语言的女子的语言中枢就在右脑。可是，语言中枢在右脑的哪一位置上呢？如果是RTPJ，我们要问，她的社会认知能力是否严重下降？

埃克尔斯更进一步引述人类学家托比亚斯（Phiiiip V. Tobias，南非约翰内斯堡大学最重要的人类学家）的见解，图5.61，与那些没有发展出语言文化的动物相比，人类这样的语言动物显著地借助于语言而获得了跨代传承知识的能力。基于语言，而有文化。基于文化，而有信仰和知识跨代传承的可能性。于是，如哈耶克所论，我们每一个人头脑里存储的知识，充其量不超过社会系统里存储的知识总量的亿万分之一。

图5.60

图5.61

最后，关于记忆，有一个重要问题还需要解答。为什么我们相信自己的记忆？有反例，有时候我们确实怀疑自己的记忆，尤其是对于许多人共同经历过的事件，如果某一个人的回忆与所有其他人的回忆严重冲突，那么，这个人会怀疑自己的记忆出了错误。况且，我们知道，外显的长期记忆确实可被改写，从而是可错的。那么，我们为什么相信自己的记忆？图5.62，这组作者（他们都是脑科的医生）2006年在《脑呈像》发表了这篇关于“metamemory”的研究报告。他们转借的是苏格拉底转述的德尔菲神庙女祭司的一个古老神谕“知道你自己”——将这篇文章的主旨表述为“hnowing you hnow”。

图5.62

“Meta-”，这个希腊词根的意思是“在……之外，在……之上”，所以“形而上学”是metaphysics——在物理学之外或在物理学之上。现在与记忆联用，意思是记忆之上的，可直译为“元记忆”，可能更好是直译为“记忆之上”。这篇文章的副标题是“认知过程的神经元网络以及记忆认知的主观置信度”。一共20名被试，年龄在22—33岁之间，右利手，生理和心理健康状况良好。实验过程有三个阶段，依此称为“编码阶段”、“再认知阶段”、“记忆的主观置信评估阶段”。第一阶段，被试在4秒之内目睹一张陌生面孔的幻灯片同时记住相应的名字，连续记住四张这样的面孔和名字。然后，大约5分钟之后，第二阶段，被试目睹刚才出现过的面孔，但每一张面孔有三个不同的名字，被试必须指出记忆中正确的名字。最后，相隔1—5秒的可变时段之后，进入第三阶段，被试目睹第二阶段点击了名字的每一张面孔的幻灯片，这时，幻灯片的左上角出现英文单词（记忆的主观置信度）“高”，右上角出现英文单词“低”，被试根据对自己第二阶段记忆正确程度的评估，选择并点击左上角或右上角。第三阶段的核磁共振功能呈像可以显示被试主观置信度的功能脑区。并且，在第二阶段，被试的记忆误差已被客观地记录下来。

尽管关于记忆的主观置信脑区我们知道得极少，根据这组作者的报告（图5.63），在评价自己记忆的主观置信度时，被试的顶叶侧回和中回有相对而言更活跃的反应，而在执行认知任务时，这两个脑区不激活。这一结论的后半部分大致符合以往我们关于脑区分工的知识，顶叶似乎不承担认知功能。这一结论的前半部分是新的知识，可以从演化论的视角给予解释：顶叶最早发育的沟回是“感觉—运动”中枢，然后是“顶—枕”交汇区——与“眼手协调”以及视觉和身体运动的协调有关的部分，再次是“颞—顶”交汇区——与语言和社会认知有关的部分。记忆的功能，在最低级的“条件反射”水平上，是有机体对外界刺激的分类，从而有机体可以对不同类型的刺激作出相应的反应。这也是哈耶克在《感觉的秩序》里，关于脑的基本功能，阐述过的见解。在对外界刺激作出正确反应之前，我们需要确认自己记忆的准确性。感觉和运动是顶叶的基本功能，所以，由顶叶承担对记忆准确性的评估工作，从演化论角度看，是合理的。我记得曾向你们解释过这一假设：脑区的紧邻关系意味着功能的紧邻关系。

图5.63

图5.64

图5.65是我介绍过的慕尼黑大学脑科学家波佩尔1985年著作的中译本标题和译者姓名。左上角是波佩尔引用的1868年实验数据绘图。并且，在左下方的正文里，有1868年实验的主持者的姓名——Kari Vierordt。图5.66和图5.67，我曾在两篇专栏文章里引用过波佩尔这本小册子。第一篇标题是“必要的疯狂”，第二篇标题是“抑郁与创造”。

图5.65

图5.66

图5.67

注意图5.67我的专栏文章的引文：波佩尔在《意识的限度》第17章指出，凡是不能表达的，都不能被意识到。然后，我加以发挥，引用罗素的见解：知识随时光而变得越来越富于公共性从而越来越缺乏私人性。我的意思是，私人感受的表达，越来越困难，从而，根据波佩尔，这些感受越来越不能被我们意识到。

图5.67，我自己的文章：写了“必要的疯狂”，就不能不继续写“抑郁与创造”。不过，对于你们而言，最好是读图5.67右侧我增加的中文注释，关于创造性思维的三个条件。

现在可以下课了。（全场掌声）

第五讲

第一部分 2010年10月23日/下午1 : 00—3 : 00/二教105

课间讨论

第二部分 2010年10月24日/下午1 : 00—3 : 00/二教105

课间讨论

第一部分
2010年10月23日/下午1 : 00—3 : 00/二教105

第二部分
2010年10月24日/下午1 : 00—3 : 00/二教105