并不是所有的事情都同时发生,所以目标之间的冲突往往涉及在不同时间实现的目标。这些冲突又常常让人感觉像是不同自我之间的冲突:一个现在的自我和一个未来的自我。
在1972年进行的一个著名实验中,心理学家沃尔特·米歇尔(Walter Mischel) 让4岁的孩子在以下选项中做出痛苦的选择:现在吃一块棉花糖,还是15分钟后吃两块棉花糖。正是在这一实验中,他捕捉到了在不同时间实现的目标之间的冲突。 生活是一场永无休止的棉花糖实验,迫使我们在早一点的小奖赏和晚一点的大奖赏之间做出选择。这样的例子比比皆是:现在看一场电影还是稍后通过一门课程考试;现在买个小玩意儿还是稍后支付房租;现在享受5分钟的快乐还是将来在个人史书上留下清白的记录。
棉花糖困境有好几个名字,包括自我控制、延迟满足、时间偏好和贴现未来(discounting the future)。 对理性做任何分析都不得不考虑棉花糖困境,因为它有助于解释一种错误认识:太多的理性会导致沉闷的生活。经济学家研究了自我控制的规范基础,我们应该现在放纵还是为将来而延迟满足?这是利率的基础,而利率就是对人们放弃现在的钱以换取将来的钱所做的补偿。他们提醒我们,理性的选择往往是现在就放纵自己,当然这完全取决于等待多久以及将来能收获多少。事实上,这一结论已经成为民间智慧的一部分,格言和笑话中经常出现它们的身影。
比如,一鸟在手胜过双鸟在林。你怎么知道当你在耐心等待的时候,实验者会遵守他的承诺,用两块棉花糖来奖励你呢?你怎么知道你退休时养老金还能正常发放,以及你为退休而存的钱在你需要的时候还能为你所用呢?不只是受托人缺乏诚信可能对延迟满足不利,专家不完善的知识也对延迟满足不利。我们可能会开玩笑说:“他们说的一切对你不好的东西都是对你有益的。”今天更完善的营养科学告诉我们,过去几十年里,人们毫无理由地放弃了很多吃鸡蛋、虾和坚果带来的乐趣。
又比如,从长远来看我们都会死掉。你可能明天就被闪电击中,那样的话,所有你延迟到下周、明年或未来10年的快乐就都告吹了。汽车保险杠上的贴纸说得好:“生命短暂,先吃甜点。”
再比如,你只能年轻一次。相对于攒钱到80多岁再买房子,你30多岁时申请抵押贷款可能要花更多的钱,但是有了抵押贷款,这些年你都有房子住。且不说能享受的时间更多,你的生活品质也是完全不同的。正如我的医生在一次听力测试后对我说的那样:“人生最大的悲剧是,当你年纪大到可以买得起真正好的音响设备时,你却听不出不同音质的差别了。”下面这幅漫画也表达了同样的意思(见图2-1):
图2-1 延长寿命的弊端
资料来源: The New Yorker © Condé Nast。
有个故事把这些论证很好地结合在了一起。一名男子因冒犯首领而被判处绞刑,他向法庭申请:给他一年时间,他将教会首领的马唱歌,以此来获得自由。当他回到被告席时,一个狱友问他:“你疯了吗?你只是在延迟不可避免的事情。再过一年,你会有大麻烦。”那人回答说:“我想,一年时间里会发生很多事情。也许现在这个首领会死,而新的首领会宽恕我;也许我会死,如果是那样的话,我也没损失什么;也许马会死,那我也就不用教马唱歌了。谁知道呢?也许我能教会马唱歌!”
这是否意味着现在吃棉花糖是理性的呢?不完全是,这取决于你要等多久,以及等待之后你能得到多少棉花糖。为了简单起见,让我们把衰老和其他变化放在一边,假设每一刻都是一样的,假设每年你被闪电击中的概率是1%,这意味着你有99%的概率活过一年。你两年后活下来的概率有多大呢?如果要在第二年活下来,你就得在第二年也躲过闪电,总的概率是99%×99%,也就是99% 2 或98%(我们将在第4章详细讨论这些数学问题)。活过三年的概率是99%×99%×99%,也就是99% 3 (97%);活过10年的概率是99% 10 (90%);活过20年的概率是99% 20 (82%),依此类推,呈指数级下降。所以,考虑到你永远也享受不到它的可能性,一颗在手的棉花糖的价值是10年后的一颗棉花糖价值的10/9。
另外一种风险是失信的实验者改变棉花糖的数量,但不改变游戏逻辑,这也会让你失去吃到更多棉花糖的可能性。以指数方式贴现未来是理性的,这就是为什么实验者必须承诺:你等待的时间越长,奖励给你的棉花糖就越多,这就相当于支付利息。利息以指数级复合增长,以补偿对你而言的未来价值在以指数级贬值。
这也意味着在两种情况下,我们注重当下可能是不理性的。第一种不理性地欺骗未来自我的方式是,我们可能对未来的回报贴现得太高——在考虑到我们有多大可能活到那个时候,以及它会给我们带来多少快乐的情况下,我们对未来回报的定价可能太低。这种耐心缺乏可以被量化。我们在上一章介绍过的认知反射测试的发明人沙恩·弗雷德里克以现金作为奖励开展了成年人的棉花糖实验。他发现,多数人(特别是对脑筋急转弯问题的诱人错误答案信以为真的那些人)选择现在的3 400美元而不是一个月后的3 800美元,这相当于放弃了一个年回报率约140%的投资机会。 在现实生活中,大约一半的美国人在临近退休年龄时仍没有为退休存一分钱;从他们为自己规划的生活来看,就好像他们退休时就会死去一样(事实上,我们的大多数祖先是不为将来谋划的)。 就像霍默·辛普森在玛姬(Marge) 警告他会为自己的行为后悔时对她说的那样:“这是未来霍默的问题。我也不关心那家伙。”
贴现未来的最佳比率不仅是个人面临的问题,也是整个社会面临的问题,因为我们要决定花费多少公共财富来造福老年人和后代。贴现未来是必须的,但是,如果一颗小行星像灭绝恐龙一样灭绝了人类,那么我们现在所做的牺牲将是徒劳的。还有一个问题是,我们不知道未来会带给我们什么,比如如果技术进步将呈指数级增长,那么未来会远远偏离我们的预定计划(谁知道呢?也许我们可以教会马唱歌)。我们的祖先在一个世纪前就为我们的利益而节衣缩食的意义并不大,比如说把建设学校和公路的钱用来制造大量的“铁肺”以应对流行性脊髓灰质炎 。我们现在比他们富裕了6倍,已经解决了他们的一些问题,同时在面临他们连做梦都不敢想的新问题。与此同时,我们也会抱怨自己前辈的一些目光短浅的选择,因为我们正在咽下这些选择的苦果,比如被破坏的环境、灭绝的物种,以及以汽车为中心的城市规划带来的污染与事故。
我们今天面临的公共选择,比如应该为减少气候变化支付多高的碳税,取决于我们对未来的贴现率,这有时也被称为社会贴现率。 如果社会贴现率是0.1%,那么它只反映了人类灭绝的概率,这意味着我们对后代的重视几乎与对我们自己的重视一样,因此我们需要把当前收入的相当大一部分用于促进子孙后代的福祉。如果社会贴现率是3%,这意味着知识和繁荣程度处于增长状态,这就要求把大部分牺牲推迟到更有承受能力的之后几代人身上。不存在“正确”的贴现率,因为它还取决于道德选择:如何权衡现在的人和未出生的人的福利。 但是,我们知道政客们只关注选举周期而不会长远地看问题,我们还有对如飓风和流行病等可预见的灾难没有做好准备的悲惨经历,这表明我们的社会贴现率高得很不理性。 我们把问题留给了未来的霍默,也不关心那个家伙。
第二种不理性地欺骗未来自我的方式,叫短视贴现(myopic discounting)。 通常来说我们完全有能力延迟未来自我的满足感,将其延迟到更未来的自我。当会议组织者提前发布主题晚宴的菜单时,人们往往选择蒸蔬菜和水果,而不是千层面和芝士蛋糕。如果问你:你要100天后一顿丰盛晚餐带来的小快乐,还是要101天后苗条身材带来的大快乐?你当然会选择大快乐。但是,如果服务员当场就用同样的选择诱惑我们,是要15分钟后丰盛晚餐带来的小快乐,还是要明天苗条身材带来的大快乐,我们往往就会改变自己的偏好,向千层面屈服。
这种偏好反转被称为短视,因为在时间上靠近我们的诱惑看起来非常清晰,而时间上距我们较远的选择在情感上是模糊的,所以我们会更客观地判断它们。指数贴现的理性过程,即使贴现率的陡峭程度超出合理范围,也不能解释偏好反转,因为如果即将到来的小奖励比之后的大奖励更诱人,那么当两种奖励都被推到未来时,小奖励仍然会更诱人。如果现在千层面比蔬菜更诱人,那么几个月后吃千层面的前景应该比几个月后吃蔬菜的前景更诱人。社会科学家认为,偏好反转表明,贴现的函数是双曲线,它比指数下降更像L形:先是陡峭地下降,然后趋于平缓。两条不同高度的指数曲线永远不会相交,如果一个奖励现在更诱人,那它以后也会更诱人;两条不同高度的双曲线可以相交。图2-2与图2-3显示了二者之间的差异。注意,图中画的是跟用时钟或日历表示的一样的绝对时间,而不是相对于现在的时间,所以现在正在经历这一切的自我是沿着横轴滑动,而贴现显示在从右到左的曲线上。
图2-2 指数贴现中不同奖励的主观价值随时间变动的趋势
图2-3 双曲贴现中不同奖励的主观价值随时间变动的趋势
应该说,用双曲贴现来解释奖赏越来越近时的意志薄弱情况,就像用催眠效力来解释安眠药效一样。双曲线所呈现出的形状告诉我们,这可能真的是两条曲线的复合体。一条曲线画的是不可抗拒的美事,如面包房的香味、迷人的眼神以及展厅的闪光,你无法不去想它;另一条曲线画的是对假想未来中的成本和效益的冷静评估。通过成人版的棉花糖实验诱惑志愿者,并对他们的大脑进行扫描,研究结果证实,即将到来的食物和远在将来的食物会激活不同的大脑模式。
虽然双曲贴现并不像经过校准的指数贴现那样理性(因为它没有捕捉到未来无限复合的不确定性),但它确实提供了一个理性自我战胜冲动自我的开端。我们可以在双曲线的最左边看到这个开端,此时两种奖赏都在遥远的未来,从主观价值来看大奖赏比小奖赏更具吸引力。我们冷静的自我清楚地知道随着时间的流逝会发生什么,它可以去掉图2-3的右半部分,永远不允许反转出现。喀耳刻(Circe) 向奥德修斯(Odysseus) 道出了这个技巧:
你首先将会见到塞壬们,她们迷惑
所有来到她们那里的过往行人。
要是有人冒昧地靠近她们,聆听
塞壬们的优美歌声,他便永远不可能
返回家园,欣悦妻子和年幼的孩子们;
塞壬们会用嘹亮的歌声把他迷惑,
她们坐在绿茵间,周围是腐烂的尸体的
大堆骨骸,还有风干萎缩的人皮。
你可以从那里航过,但需把蜂蜡揉软,
塞住同伴们的耳朵,不让他们任何人
听见歌声;你自己如果想听歌唱,
可叫同伴们让你站立,把手脚绑在
快船桅杆的支架上,用绳索牢牢绑紧,
这样你便可聆听欣赏塞壬们的歌声。
这种方法被称为奥德修斯式的自我控制,它比费力运用意志力更有效,因为意志力很容易在瞬间被诱惑压倒。 在塞壬歌声响起前的珍贵插曲中,我们的理性能力先发制人,用绳子将我们紧紧绑在桅杆上,剥夺了我们屈服的选择,从而避免了欲望将我们引向厄运的任何可能性。吃饱之后去购物,可以从薯片和蛋糕边上淡然走过,而在饥饿的时候,这些美食是无法抗拒的。我们委托雇主从我们的工资中扣下一部分供退休后使用,这样月底就没有多余的钱供你度假。
事实上,奥德修斯式的自我控制可以进一步升级,剥夺自己选择的可能性,或至少使选择更难行使。假设领取全额工资的想法非常诱人,以至于我们无法授权雇主每月扣款。面对这种诱惑之前,我们可以让雇主为我们做这个选择(以及从长远来看其他有利于我们的选择),采取的方式是让我们默认参加“强制储蓄”计划:我们只能“选择退出”该计划而不能“选择加入”该计划。这是治理哲学的基础,行为经济学家理查德·塞勒(Richard Thaler)和法律学者卡斯·桑斯坦(Cass R. Sunstein) 在他们的著作《助推》( Nudge )中称之为“自由意志家长制”(libertarian paternalism)。他们认为,让政府和企业把我们绑在桅杆上是理性的,尽管是用松的而不是紧的绳索。通过对人类判断机制进行研究,专家们将设计我们所在环境中的“选择架构”,使我们难以因受到诱惑而做出不好的事情,比如消费、浪费和偷窃等。我们所在的机构会像家长一样行事,好像他们知道什么对我们来说是最好的,而当我们愿意付出努力时,他们也会允许我们自由地解开绳索(事实上很少有人这么做)。自由意志家长制,连同来自认知科学的其他“行为洞见”,越来越受政策分析人士的欢迎,因为自由意志家长制只需很小的成本,并且在不违反民主原则的情况下,就能产生更有效的结果。这可能是迄今为止认知偏差和认知谬误研究成果最重要的实际应用(尽管这种方法受到了其他认知科学家的批评,他们认为人类比研究表明的更加理性)。