合理性的本质最新章节_罗伯特·诺奇克著

克服诱惑

我想集中讨论原则的主要内省功能，亦即使我们克服诱惑、障碍、注意力不集中和分心等。心理学家安斯利（George Ainslie）提出了这样的理论，解释为什么我们会去做明知违背长期利益的那些冲动行为，我们可用什么手段来对付这种诱惑。 ^[11] 在我们转向安斯利的工作之前，先了解一些背景情况是有益的。

经济学和心理学数据显示，相对于在日后报偿最终得以实现的时刻而言，我们在当下对于一项未来报偿总是不那么在意：我们会对未来进行“打折”。未来收到的一项报偿对于我们的现时效用（current utility）小于这一报偿在日后实现之时的效用；收到回报日期越遥远，其现时效用就越小。这种情况本身是一种有趣的现象，我们可以对它的合理性进行质疑。在我们的行动计划及项目规划中，任何时候我们不都应当如同报偿实现时那样来评估它吗？诚然，我们也要考虑不确定性，即我们是否会活到报偿实现之时和报酬是否能够实现——每个事件可能都不是完全确定的。那么，在我们目前的计算中，我们想用的期望值是用概率对未来报偿打过折的。但是，实际得到该项报偿的效用不是应当无论何时都保持不变吗？

时间偏好（time preference）——一些经济学家用来表示未来效用折扣的术语——也许是一种进化方式，由此对那些不能做出这种预期概率计算的生物灌入一种有大致效果的机制。天生的时间偏好可能是一种粗略的经验规则，它近似于先前的计算会产生的那种行为或决策，至少就报偿（及惩罚）会影响到全面适合度（inclusive fitness）而言；可能一直就存在着对这种时间偏好的选择。 ^[12] 那么，若一种存在物具有认知工具来明确地考虑未来报偿的不确定性，还能对未来实行明确的概率折扣，则这里就出现了一个问题。如果我们已经被植入了一种天生的时间偏好——替我们的祖先计算这种概率折扣的进化意图——并且不仅如此，如果在我们的概率计算中所明确打折的乃是未来报偿（已经通过时间偏好打折过了）的当下价值，那么，这里所发生的就是一个双重打折。无疑这折得太多了。看来对那些足够老到而认识到这一切并且做出期望值计算的存在物而言，他们应该使用未来报偿在其实现之时的效用作为当下的估计（然后，这个效用会经由概率而被明显地打折），而不是使用未来报偿因受时间偏好影响而被折扣过后的当下价值。要不然，他们就应该跳过预期价值的估算，直接坚持以进化方式植入的时间偏好。 ^[13] 然而，若纯粹的时间偏好本身即是一种合理的现象，而不仅仅是对概率折扣的一种进化替代物，如果这种进化的塑造作用确实发生了，那么情况就更为复杂了。

描述对未来报偿的时间偏好折扣的曲线，不一定要用直线或者指数曲线；它们可以是双曲线的形状。 ^[14] 安斯利注意到这样的两条呈高度弓形的曲线（就像双曲线一样）能够相交，并且他探索了这一事实的含义。（在图1中， y 轴衡量报偿的效用；此一报偿在给定的时刻对于某人的效用，则由那时所对应的曲线的高度来衡量。曲线向左侧下倾，这是因为一项未来的报偿在越早的时间点上其价值就越小。）假设有两套行动项目或计划，二者会导致不同的报偿。如果你取得其中可较早得到的那份报偿，也就是接受二者之中报偿较小的那一份，那么，这将排斥或者阻止你获得可更晚得到但更大的那份报偿。随着时间的推移，个人总是要实施所处时间点上效用最高的那个计划。在时段 A 中，更远的报偿具有更大的效用；然而在时段 B 中，更近的报偿具有更大的效用。既然实际上更多的报偿只有到时段 C 的终点处才能得到，因此若要得到那份更多的报偿，这个人就必须度过中间的时段 B 而不在 B 时段内转而去追求较小的报偿。而这就引出了一个问题：在中间时段 B 内，立刻就会收到较少报偿的前景比随后会收到更大报偿的前景有更大的效用。

图1

我们为什么认为这个人应该尽力克服那一中间时段呢？为什么她不应该选择更小但是更快的报偿呢？是什么使得 A、C 时段（那里较大的报偿突然变为有最大的效用了）成为决定何种选择为最优的适当时段呢？在这两个时段中，行为人会倾向于取得那份较大的报偿，而在 B 时段内，她却倾向于获得那份较小的报偿——也就是说，她此时获得的报偿小于在另一种选择中她会得到的报偿。而当我们说避免这种诱惑是更好的选择时，我们所处何处？为什么那个立场要比时段 B 内的立场更恰当呢？

这里有一个建议。时段 B 之所以不是决定那个人应当做什么的合适的基准点，是因为时段 B 并不是她对于这个问题看法的代表性样本。（因为）时段 A 和 C 相加的总时段比 B 更长。另外，若我们补上她在报偿被实现的时刻之后的判断，并用图标明那时对她而言何种报偿最大，我们就会发现，她在消费掉那一较小的报偿之后，很快就宁愿自己不曾这样做过；但是在消费掉那一份较大的报偿（在时间段 C 的终点处）之后，她会继续偏好所选的较大报偿。我的意见是，克服诱惑和得到更大报偿通常是更可取的选项，原因在于这是个人在大多数时间内的偏好：这是她（相当）稳定的偏好；而另一个选项只是她在一个非代表性时刻内的偏好。 ^[15] （不考虑任何事后偏好，如果时段 B 持续的时间比时段 A 和 C 要长，在那种情形下应该抵制该诱惑还是显而易见的吗？）诱惑并不总是应该被抵制的，只有当对于更大报偿的向往（包括事后的偏好）乃是个人在大多数时间内的偏好时，情况才是如此。这一准则肯定是可以被挫败的，而不是结论性的。但是，相对于下面两种说法而言，上面的那个准则确实具有更贴近人的偏好这一优点（尽管它并不是嵌入在某个特定的局域偏好中），即这仅仅是人出于利益的考量而去追求后期更大的报偿（因为这种实际的报偿），并因此去抵制这种诱惑，或者相关的准则——并且抵制诱惑服务于——最大化个人一生的效用。 ^[16]

安斯利描述了各种各样能让人摆脱那个充满诱惑的中间时段的方法，其中包括：在时段 A 中采取一项行动，使自己无法在时段 B 中追求那一较小的报偿【例如，奥德赛（Odysseus）把自己绑在桅杆上】；在时段 A 中采取一项行动（也许是和另一个人打个赌），这会在你获取那一较小报偿时给你加上一种惩罚，由此改变它在时段 B 中的效用；在时段 A 中采取一些措施以避免自己在时段 B 关注或者念念不忘那一较小报偿的诸般好处； ^[17] 还有就是——我们本章的主题——构建出个人的一般行为原则。

行为的一般性原则会给行为分类；它能把某一具体行为与其他行为归为一类。例如：“不要在正餐之间加餐”；“不要再吸一根烟”。【有人可能认为原则比规则（rules）更为深刻，也没有那么机械——这是在法哲学文献中常见的区分——但是就当前的目的而言，我对二者不作任何区分。】我们可以试着在效用理论与决策理论中把对行为的原则性分类效果描述如下。原则会把一些行为全部划归为类型 T ，并类似地对待它们，由此把这些 T 类行为的效用（或说是这些行为结果的效用）连接起来。但是因为这一原则的存在，所以一切 T 类行为一定会产生相同的效用，这种说法就太强了。一个特定的 T 类行为可能同时也属于其他的类型或原则，其他的 T 类行为则不，因此，它们的效用就可能是不同的。原则所建立的是受此原则所统摄的各种行为的效用之间的那种关联（correlation）。这一点在偏好的层次上表述就是：若 T 类行为与其他行为在偏好序列中排序，则 T 类行为的排序序列之间具有一种关联性。然而，若这种关联性就是采纳或者接受某些原则而对行为效用产生的唯一影响，那么，原则对于我们克服诱惑这一目的来说就毫无帮助。

一项原则（“不要在正餐之间加餐”；“禁止再吸一支烟”）的标志在于：是否把去做一件即时的具体行为的决策（吃这顿快餐，吸这支烟）与原则使得该行为所属的整类行为连接在一起了。现在，这一行为就代表了整类行为。通过采纳某些原则，你似乎就使得这点为真了：如果你做了这类行为之中的一个行为，那么你会去做整类行为。如此一来，筹码就提高了。这一次加餐行为具有的效用，就与未来所有那些加餐行为所具有的负效用或说害处捆绑在一起了，而这就有可能帮你度过那一个诱人的 B 时段；这次特定的加餐，现在对你的效用也就改变了。这次的加餐变成了能代表所有加餐的行为，并且在这一初始时刻，保持日后的苗条身材和身体健康对于当下的效用，远远大于那些未来加餐的快感之于当下的效用；臃肿的身材或者差的身体对于当下具有的负效用，成为当下考量的这一具体加餐行为的一项特征。

但我们为什么认为，这个人会在时段 A 而不是时段 B 构建出一项原则呢？这个人为什么不在这次决定加餐，且构建出一项始终都加餐的原则呢？或者更一般地说，为什么他不构建出一项总是屈服于即刻诱惑的原则呢？但是构建并接受这样一项原则（与现在加餐这个行为一起）本身并不会带来直接的报偿或者使不同时期的报偿最大化。它一般只是减少报偿的延迟。但是在 B 时段，即面对一项具体的诱惑时，我对任一个报偿都总是想“减少延迟”吗？不是的。因为尽管就一个特定的报偿而言，我是处于 B 时段，但是就众多其他（成对）的报偿而言，我是处在 A 时段（或 C 时段）。就其他这些更为遥远的成对的大报偿与小报偿而言，我现在并不总是想去获得那些更为直接的报偿，即使由于我处在它所在的 B 时段而确实希望得到一份更直接的特定报偿。正是因为诱惑是历时性地分散的，所以在任何一个时刻，我们都有比 B 时段要多的 A （或 C ）时段。因此我们不会接受一项总是臣服于诱惑的原则。 ^[18]

我们采纳一项原则会使一个行为代表许多其他的行为，也借此改变了这个特定行为的效用或负效用。此种效用的改变乃是运用我们的能力和力量，从而使得一个行为代表或象征其他行为所导致的。这一次侵犯了原则并不必然使得我们总是侵犯它：这一次加餐并不必然使得我们将成为连续加餐者。在我们采纳这个原则之前，这一次做了某一行为并不涉及到总会如此作为。采纳这个原则制造了（forge）那种关联，因此，对这一次侵犯原则的惩罚便具有了今后总是侵犯这一原则的那种负效用。我们是如何确切地做到这一点的，对此的探究将是富有教益的。

我们有这样一种能力，这一事实有着重要的后果。我们能够如此改变效用（接受一项原则使一个行为代表其他的行为），但我们不能太过频繁地这样做，也不能过于僵化。如果我们侵犯了一项已采纳的具体原则，我们没有理由认为下一次的情形会有所不同。若每次的情形都一样，我们在这一次这样做了，那我们在此类场合下不是总会这样做吗？除非我们能够区分开这个场合和随后的场合，有理由相信这个区分在今后有足够的分量，使得我们不会通过构建出另一种区分（而这是我们在随后的情形中也同样不会坚持的）而再次纵容自己；否则的话，此次所为将致使我们预期会一直重复这样做。（要构建出一个区分能够允许这一行为而排除以后的重复，实际是要构建出另外一个原则了；我们必须有更多的理由去相信，我们更会遵循那个新原则而不是这个原则，否则，这一重构也不会给我们未来的节制带来任何可信性。）在这种情境下，这一次的作为意味着我们将来会继续这样做。这难道还不够我们把所有那些未来重复之负效用附属于这一特定行为，从而改变这一次行为的效用吗？

我们预计：如果这次这样做了，则未来也会反复这样做。但是我们这一次的行为真的会影响将来吗；它会使得我们重复这一行为的可能性更大吗？还是这一行为影响到的只是我们对于重复行为有多大可能性的估计？我们需要考虑两种情境。如果我们过去没有接受过排斥此次行为的任何原则，那么依据心理学家所谓的“效应法则”（law of effect）【一个行为的正强化（positive reinforcement）会增加它在未来发生的概率】来看，这种行为对重复概率的影响不大。如果过去已经发生过许多类似行为的话，那么这对于重复概率的估计值会提高一点。但是如果过去已采纳了一项原则，那么无论是对于旁观者还是行为人自己而言，违反这一原则的行为都会提高对她重复这个特定行动的可能性的估计值。这一次违反也增加了她再去这样做的可能性。原则已经破坏了；行为的一个障碍物已被拆除了。不仅如此，认识到这一点还会使行为人气馁，她尽力在将来避免这一行动的可能性也就更小了。（请注意，如果一个行为影响到她自己对于未来相似行为之概率估计的话，这个行动会使她气馁，并因而影响到实际的重复概率。）因此，构建出一项原则对其排斥的行为筑起了一道额外的屏障，这是把全部行为的影响系于任何一个（过去的）行为。个人对一项原则投入得越多，即曾经为遵从它所付出的努力越多，那么现在违反它的代价也就越大。（因为你付出了如此多的努力尚且不能成功坚守这项原则，那么你又有多大可能性来坚守另外一项原则呢？）不仅如此，这次遵守了原则也是一种服从于“效应法则”的行为：即正强化增加了在未来也遵守原则这一事件的可能性。

然而，违反一项原则的后果也许要更为普遍，因为它可能对你在任何一个领域内（当面对的诱惑与你这次所臣服的诱惑同样强烈时）是否能成功地遵守任何一个原则的概率或可靠性都会产生影响。的确，你可以试图堪定并尽量把损害限制在这一个领域之内，但是，这与试图将损害限于这一个领域之内的这一次违反行为会面临同样的问题，只是上升了一个层次而已。当违背义务论原则直接威胁到了未来的任何一个原则性行为时，这些义务论原则就具有最大的分量：如果我（在这种环境下）连这个原则都侵犯了，那我怎么可能相信自己还能成功地信守任何一个（可欲的）原则呢？以一种过度的康德式热情，人们也许试图通过构建出一种“绝不侵犯任何一项原则”的（元-）原则，来增加灾难扩散（spreading disaster）的潜在效果。然而，即便“使任何一个违背行为代表所有行为”能降低任何一个既定违背行为的概率，最轻微的违反行为的实际后果也将会被危险地放大。这并不是说，侵犯原则的一个行为，因其代表着所有行为，则它的发生也就意味着消解掉了该原则，因而其后人们就可以随心所欲地去违反它而不受任何责罚。一个行为附带有全部行为的负效用，即便第一个行为已经做了，但其后的每一个行为也还是具有那种负效用。这种负效用不能通过违反原则而避免，只能经由抛弃原则而得以避免；但若抛弃原则，个人就面临着这个原则旨在避免的那种负效用。

采纳一项原则本身是一种行为，会影响到其他行为之间的概率关联，故而在选择采纳何种原则时慎重一点才是恰当的。个人必须考虑的不仅仅是坚持原则所可能带来的好处，还要考虑违反原则的概率和这种违反的未来效果。也许采纳一个（当遵守时）不那么好的但较为容易维持的原则是更好的，特别是当你没有坚守住更严格的原则，并非总有其他的原则可以作为可靠的退路时。（此外，你也想要一个足够明确的原则，从而使是否违反原则一目了然，这样一来，个人的未来自我就无法在原则是否得到遵守这个问题上轻易地蒙混过关。）无疑，参酌以上这些考虑，我们可以构建原则的一种最优选择理论。 ^[19]

原则一般谈论的都是一类行动的全体，并且它还使每一个当下的行动都代表着全部行动。为了发挥原则使个人摆脱诸如在 B 时段中的诱惑这一功能，谈及的必须是所有的某类行动。我们没有这样的原则，它说绝大多数 P 应该是 Q 或“15%的 P 必须是 Q ”。（或者，如果我们确有这样的原则，那它们也不是用来对付这相同的诱惑的。）尽管有时候我们需要做的不过是在部分或绝大部分时间做一个行为而已（比方说，在绝大多数晚上不吃饭后甜点；每月清偿我们绝大部分账单）。尽管如此，我们经由原则来实现这点的方法还是构建出一个谈及“所有”或“每一个”的陈述，与我们所想要的那种混合是可以共外延的。例如，每个月，清偿你的绝大多数账单；每个星期，在绝大多数晚上不吃甜点；每一年，参加全体教职工大会。一个教师——不是我自己——他的原则是在每个班都不会给出太多的 A 等成绩。由此，这每个星期、每个月或每个班就变成了代表全体。因此，我们能够解释：为什么旨在克服诱惑的那种原则关注的是一个类别之中的全体而不仅仅是一部分（一项规范本身可以关注 n %，这里 n 介于0 与100之间，但一项原则则不能）。一项原则具有某些功能，而要实现这些功能，一个情形就必须代表或者象征全体。因此，观察到的原则的这种“全体”特性会支持上面的观点，即所说的原则具有那些功能和以那种方式实现这些功能。

原则看上去可能是实现我们目标的粗糙工具；它们的普遍涵盖性（要实现任务就要放弃所有的甜点和分心）对于达到我们的目标来说也许并非是必要的。“全体”涵盖（饭后甜点，星期）的东西具有松动的余地，多少缓和了这一点，减低了原则的过分苛刻性，但还是留下了一些缺陷。如果对一个行为的 n 次重复有一个清晰的门槛，迈过这点继续重复行动将使得目标受挫，但在此之前，目标还是能达到的，那么，一个理性的人不会恰好重复 n 次行为后停下来吗？（如果每次重复都会增加实现目标的难度的话，则需要一个更为复杂的陈述。）既然第 n +1次行为本身将产生打破平衡的后果，那么便不需要任何原则来排除它了。这可能（近似地）是一种个人何时决定停止吸烟（或增加体重，等等），并因此决定何时设置一项原则的理论。然而，既然有诱惑，它就是在那时需要设置的一个原则。