倾听并吸收。
反馈回路在系统中无处不在,因此是一个重要的思维模型。
可以把“反馈”看作为了回应某一行动所传达的信息。我们每天都在有意无意地给予和接收不同形式的反馈。有时反馈比较正式,比如绩效考核;有时则不那么正式,比如肢体语言就是在交流时给予对方的反馈,而你对孩子说话时的语气也是对他们行为的反馈。
反馈回路非常重要。在法纳姆街,我们常说与你最亲近的5个人对你的成就和幸福影响最大,原因之一是他们提供给你的反馈是高质量的。与你相处时间最长的人对你的行为给予的反馈也最多,因此对你做出的选择和改变产生的影响也就最大。
只要细心寻找,你就会发现反馈回路无处不在,由此明白为何人类和系统会做出特定的反应。例如,人类的许多行为都是由激励因素驱动的。我们希望所采取的行动能让自己在不同时间范围内趋利避害。我们为自己和他人制定的激励机制就是一种反馈形式,会产生强化或抑制某些行为的回路。如果在工作中,每次有人对你提出建设性的批评意见,你都会把负面情绪显露在脸上,那你就是在鼓励同事只表扬不批评,从而错失改进提高的机会。
使用这一思维模型的挑战在于无处不在的反馈回路可能会让人不知所措。如何知道哪些反馈值得关注?哪些反馈又需要我们做出相应的调整以改善结果?
我们会不断就自己的感受、偏好和价值观提供反馈。他人也在传递反馈信息,但我们不一定能接收到,也未必能正确解读。关键是要学会筛选反馈。并非所有反馈都有价值。越快学会识别有效反馈并接受和吸收,你就越能在实现目标方面取得进步。
学会以他人易于接受的方式传达反馈意见是一项宝贵的技能。
广义而言,这个模型也可以推广至外部世界。世界给了我们反馈,我们是选择倾听并吸收,还是一味寄希望于世界改变其运转方式?
反馈回路的专业定义来自系统理论——反馈回路是指系统的输出(信息)会影响其自身的行为。由于系统的复杂程度不同,有时只有一个反馈源,有时也可能有多个反馈源,甚至是多个互相关联的反馈源。虽然从简单系统中的反馈入手会更容易,本书接下来的内容正是如此,但也要明白我们都隶属于许多复杂的大型系统,其中囊括了不少互相关联的反馈回路。
反馈回路是一个重要的模型,因为无论你是否意识到,它们都是你生活的一部分。了解反馈回路如何运转有助于你更灵活地接受和吸收各种反馈,并为他人提供更好的反馈。
反馈回路有两种基本类型:平衡反馈回路(即负反馈回路)和强化反馈回路(即正反馈回路)。平衡反馈回路趋向于达到某种平衡,强化反馈回路则会放大某一特定过程。恒温器和供暖系统就属于平衡反馈回路。有关室内温度的信息会传递给恒温器,随后恒温器就会调节暖炉的燃烧情况以将温度控制在理想范围内。而强化反馈回路不会像恒温器那样适时回调,相反,它会让变化一直持续下去,就像流行趋势的更迭或者贫穷的恶性循环一样。要打破强化反馈回路,通常需要外部干预或者状态发生新的变化,否则就只能等到所有资源消耗殆尽,反馈回路才会终止。
在复杂的系统中,反馈很少是即时的。状态的变化可能需要很长时间才能对系统的运行方式产生显著的影响,这一延迟会使因果关系的确定复杂化。在生活中,对行为的反馈一旦被延迟或者不够直接,就会引发问题,而现实又往往如此。
要想改善决策制定的过程,我们所面临的一个挑战是获得针对以往的决策的准确反馈。一方面,后果可能要很长时间才能显现出来,或者很难直接归因于某个特定的决策;另一方面,当我们所做的事情得到了积极的短期反馈,却产生了消极的长期后果时,我们可能会陷入不良的行为习惯。因此,重要的是要记住即时反馈并非唯一的反馈。在吃垃圾食品时,随着身体对脂肪和糖分做出反应,你会体会到即时的快乐。但一段时间过后,你的身体会收到其他反馈,体现出垃圾食品的负面影响。长期来看,2型糖尿病和高血压等疾病就是身体针对饮食习惯提供的反馈。
获得准确反馈的速度越快,迭代改进的速度也就越快。但是系统过载,反馈的速度过快、强度过大也会造成问题,就像初学开车时,油门或刹车踩得太重一样。平衡反馈回路在不引起剧烈震荡的情况下通常更有价值。
你可能知道亚当·斯密是有史以来最具影响力的经济学家之一,他因提出市场“看不见的手”这一概念而闻名于世,但他出版的第一本书《道德情操论》实际上是一部哲学著作。 在这本书中,他描述了指引我们的另一种无形力量——他人的肯定和否定,以及无论这种态度是真实的还是存在于我们的想象之中,它会如何影响我们的行为。
人类天性自私,把自己看得比其他人更重要。为印证这一观点,亚当·斯密表示,假如一方面你听说自己的小指要被截肢,另一方面你听到了新闻播报中严重的海外伤亡事故,相比陌生人死亡的消息,很可能前者更令你感到不安。然而,尽管自私是人类的天性,大多数人在大多数时候还是会选择相互合作、善待他人。亚当·斯密认为,与他人的交流互动是我们建立良好互惠关系的原因。他认为,他人对我们行为的反应是指引我们未来如何行动的反馈。自私自利通常招致否定,无私奉献则往往收获赞许。
他人对我们行为的反应构成了一个反馈回路,而这就是文明的基石。拉斯·罗伯茨在《亚当·斯密如何改变你的生活》一书中写道:“亚当·斯密认为,文明就是我们针对周围人的行为所表现出的认同或反对态度的总和。这些态度形成了反馈回路,以此劝善戒恶。” [1]
此类反馈不仅是根据当地法律正式进行的惩罚和颁布的禁令,也涵盖了人们对社会规范的反应。如果一个朋友在街上跟你打招呼,而你却无动于衷,你当然没有违法,但对方很可能做出消极的回应。由此你便学会了遵守规范。亚当·斯密写道:
在大自然为社会创造人类之时,她赋予了人类取悦同类的天然欲望和对冒犯同类的根本厌恶。大自然教导人类在得到赞许时感到愉悦,在遭到否定时倍加痛苦。这种教导使得他人的称赞本身能让人深感荣幸,他人的否定则成了奇耻大辱,令人颜面扫地。
亚当·斯密让读者想象一个在成年前从未与他人打过交道的人。他断定这样一个人无法认清自身性格,头脑中也不会有是非曲直的概念。 [2] 我们渴望被爱、被接受,这促使我们做出符合社会标准的道德行为。反过来,我们也会对他人同样的行为表示认可。
不过亚当·斯密也承认,道德准则并非一成不变,它会随着时间的推移而改变。如今看来匪夷所思的理念放在过去或许就是合乎道德的,或者至少是中性的。但后来,随着人们的反应方式日渐消极,反馈回路就会发生变化。亚当·斯密举的例子是杀婴,这在当今的大多数国家都是不可想象的,但在便捷的避孕措施出现之前,杀婴在不少国家不过是生活中习以为常的一部分。古希腊人会毫不犹豫地将体弱多病或因其他原因被嫌弃的婴儿扔在野外,任其自生自灭,以免他们成为家庭的负担。时至今日,在避孕或堕胎手段缺位的群体中,这种现象依然存在。 亚当·斯密写道:“我们总听人说‘这是常有的事’,显然他们认为再不公正、不合理的行为,只要普遍存在,便有了充分的借口。”
反馈回路是一个很有用的思维模型,因为所有系统都包含反馈回路,而我们被系统包围。
我们可以通过调整反馈回路来应对日常生活中的诸多挑战。弄清如何改变(我们和他人的)行为、处理不准确的信息,以及建立信任都是我们持续面临的挑战。如何让客户选择购买你的产品而非竞品,如何梳理信息以找到与决策相关的内容,如何与他人有效开展合作……这些都是我们经常要面对的情形。
所有这些因素也会在更宏观的社会层面发挥作用。社会如何激浊扬清、彰善瘅恶?如何让人们足够彼此信任,以维持社会的正常运转?
任何系统如果存在不受控制的强化反馈回路最终都将不可持续,甚至具有破坏性。平衡反馈回路在系统中更为常见,因为它们具有可持续性。自古以来,在许多社会中法律制度一方面能预防强化反馈回路破坏社会基础设施,另一方面又能促进有利于社会发展的平衡反馈回路。个中原理也为我们在日常生活中应对类似的反馈回路问题提供了经验。
让我们从反馈回路的角度探讨一下社会体系的四个方面:
1创造正确的未来激励机制;
2用边际思维影响行为;
3应对信息瀑布 ;
4建立信任。
我们希望尽可能避免出现“今天做出的选择在未来导致负面的强化反馈回路”的结果。因此,考虑一项决策在未来产生的激励作用至关重要。
“饮鸩止渴”的一个典型例子就是给绑匪交赎金。眼下的问题是有人被绑架,支付赎金后绑匪才会放人。如果你的家境殷实,完全有能力满足绑匪的要求,你可能会想付钱了事,能救人一命,问题也相应地得到了解决。
然而,你的反应却向绑匪释放了一个信号——你一定会满足他们的要求,这样就给了他们再次绑架的动机,也容易诱发模仿犯罪。支付赎金的举动会造成一个强大的强化反馈回路,给未来埋下更多隐患。
在许多法律体系中,法院作出的每项判决和裁定都是一条信息,通过反馈回路进入法律选项库,影响着法律体系如何应对未来的案件,以及法官在未来将怎样作出判决。在《高手:解决法律难题的31种思维技巧》一书中,沃德·法恩斯沃思表示,法院在作出判决时要考虑“案件结束后会对人们形成怎样的激励机制”。 [3] 法院必须谨慎行事,因为一旦出现错漏,就可能助长不良的社会风气。
法院经常碰到的一类问题就是责任问题。万一我遇到了不好的事情,我能否从他人那里获得补偿?有时答案是肯定的,但也不能一概而论。再回到绑架案。假设我是政府公务员,如果我选择不支付赎金,我是否有责任赔偿受害者家属的生命损失?大多数法院的回答都是否定的。一旦被追究责任,那就会激励我在将来遇到类似情况时选择支付赎金,那就又回到了强化反馈回路之中,如此周而复始。在考虑特定的责任情况时,法恩斯沃思表示:“(法院)可以展望未来,判断怎样的裁决能降低以后出现同类案情的可能性,而非关注过去,决定谁应该承受痛苦。”
在其他情况下,选择眼前利益会产生强化反馈回路,牺牲未来长远的利益。因此,在其他领域也有旨在促进平衡反馈回路的法律,如律师-当事人保密特权,以及版权法和专利法。虽然或许有人会认为强迫辩护律师就其当事人披露的信息做证能带来立竿见影的好处,但由此产生的反馈回路会激励不良行为。正如法恩斯沃思在谈到版权保护时所述:“每当新书和音乐上市,都有大量盗版涌现。但盗版猖獗,书籍和音乐很可能会从此消失。”
环顾四周,人们总能看到自以为不公平的现象,但他们并没有意识到这种不公平也自有其意义。特定情形中的不公平造就了整体上的公平,原因如下:个体或许经常会遭受不公,事实可能的确如此,但这些针对个体的不公平可能为集体创造更大的公平。比如某个人遭到“过度”的惩罚,对他本人来说或许并不公平,但如果能成功起到震慑作用,那就未必是件坏事。
并非每个人都能以同样的力度和速度改变自己的行为,以应对社会或经济变化等压力。有些人需要更具说服力的理由才会改变,有些人则需要更多的时间。
优秀的客户维系策略不会把所有客户都简单地归为一类。比如,针对6个月的新客户和10年的老客户可能有不同的维系策略。再比如,策略也不会将重点放在让客户完成眼下这笔交易,而是会考虑他们在一生中可能购买的数量。以上都是边际思维的例子。法恩斯沃思认为:“边际思维最重要的一个特征是不以一种非黑即白的整体视角看待问题,而是从‘增量’的角度入手,将行为视为一系列选择,即何时在某个维度上做减法,在另一个维度上做加法。”
不妨看看含糖饮料的消费情况。用边际思维影响行为意味着不把问题简单看作消费或不消费的二元对立,而是悉心钻研如何在不同领域影响人们的行为。也许你希望大众少喝饮料,也许你想让消费者转而选择更健康的无糖饮料。如果要考虑通过制定规则来减少含糖饮料的消费,那就可以对其征税,或者限制其消费或销售地点,又或者限制购买者的年龄。法恩斯沃思写到,“个体的活动存在边际……而群体也存在边际成员”,法律法规的制定往往伴随着一种“希望(不管这希望现实与否)——法律会从边际降低某种做法出现的概率”。
以反馈回路为视角,我们可以将“用边际思维影响行为”理解为制定一系列激励措施以建立反馈回路。随着时间的推移,这种反馈会改变系统,最终产生预期的结果。我们可以根据行为的细微差别调整反馈,再推广至更广泛的人群,就能对系统产生重大的积极影响。
关注边际的另一个原因是边际往往是强化反馈回路的起点。涨价后最先失去的不太可能是忠于品牌20年的忠实客户,而更可能是最新获得的客户。然而,当他们离开后转向竞争对手,甚至只是单纯减少购买数量,都有可能引发一连串负面反应,最终导致销量暴跌。最好在边际设置一系列平衡反馈回路,比如鼓励客户留存的忠诚度计划,以避免此类问题出现。
刑法必须在震慑潜在犯罪方面发挥作用。例如,如果一名罪犯“因为已经犯下的罪行而被判处死刑,那他就不会再因犯谋杀罪而付出额外的代价”。因此,我们不希望小偷被判死刑,否则他们在行窃的过程中就没有理由不杀人了。法恩斯沃思解释道:“刑罚的设计者必须关注如何保持边际威慑力,确保罪刑相适应,使人们对多做一点儿坏事永远抱有更深的恐惧。”其本质就是创造一个平衡反馈回路,根据所犯罪行的严重程度决定刑罚的轻重。
随着系统的规模与日俱增,其中一个问题在于行为调整的边际空间也会越来越大。“强行调整可能会引发其他不当行为。”为了平衡而调整反馈回路可能会在其他地方产生不良的强化反馈回路。比方说,如果限制在公共场所饮用含糖饮料,那是否会迫使人们转而在私人空间饮用?如此一来,由于在私人空间缺少外部监督,饮用时更加肆无忌惮,饮用量可能不降反升。在这样的家庭氛围下成长起来的孩子可能会对含糖饮料习以为常,由此孕育出新一代含糖饮料的忠实消费者。
基于反馈这一概念,系统可以自发产生行为的想法应运而生。 [4]
——德内拉·梅多斯
信息瀑布属于强化反馈回路,既可能是积极的,也可能是消极的,具体取决于它们所传达的信息内容。信息瀑布之所以会出现,是因为我们很难掌握堪称完备的信息,在很多情况下,我们会通过观察他人来决定自己该做什么。法恩斯沃思针对信息瀑布给出了一个绝佳且常见的例子:
街头艺人会先吸引一小群人。随着好奇心强烈的人前来围观,人群会逐渐扩大。接着,当好奇心一般的人注意到人行道上聚集了大量行人,也忍不住想一探究竟时,人群便会迅速扩大。
在《厨室机密》一书中,安东尼·伯尔顿 根据自己在餐饮业多年的从业经验为食客提供了很多建议,比如尝试当地美食,以及牛排不要选全熟。他还建议,在选餐厅时尽量选落座率高的,用餐的人多很可能意味着食物相当不错。 [5] 餐厅老板都知道此类信号的强大影响力。
餐厅老板知道,店内入座的顾客越多,就会有越多的人进店就餐。因此餐厅一般都将晚上的第一批客人安排在靠窗的位置,也不介意店外排着等位的长队。因为他们深知,越多的人表现出对餐厅感兴趣,就越能形成起正面宣传作用的强化反馈回路。法恩斯沃思表示:“人们会观察别人在做的事情,并有样学样;跟风的人越多,意味着对下一波人的吸引力就越大。”此前还持观望态度的人也会因此纷纷加入,而随着队伍越来越长,原本兴趣寥寥的群众可能也会跃跃欲试。
还有其他的信息瀑布,有些如果任由其发展可能会造成破坏。许多法律体系都有相关规定,旨在中断不法活动的强化反馈回路。大多数人都自以为是守法好公民,但违法的次数其实远超想象。比如超速行驶,你上一次全程低于限速行驶是什么时候?一旦涉及超速行驶、看盗版电影、内幕交易,以及为了逃税向员工支付现金等行为,我们通常会参考周围人的行为来界定“可接受”的标准。然而,法律体系无法起诉每一个超速的人,那么它是如何中断反馈回路的呢?
法恩斯沃思写道:“无知和不确定性是孕育信息瀑布的沃土。在自身不具备充足的知识储备时,人们容易依赖他人的想法,而共识的脆弱性使其很容易受到冲击。”因此,针对负面信息瀑布存在以下两种常见的法律层面的解决方案:一是通过立法要求公开披露信息;二是对社会关注度极高的案件提起公诉,以儆效尤。
有时,提高信息的透明度和准确性可以中断信息瀑布,比如上市公司的财务信息披露。此外,对公众关注度高的案件提起公诉不仅能起威慑作用,相关宣传内容往往也能向公众普及法律知识。美国黑帮成员阿尔·卡彭因逃税被起诉一案,可能对帮助公众了解自己的基本纳税责任起了很大的教育作用。
归根结底,法院采取的此类行动“意在发出信号,比人们通过互相观察得到的信号更为强烈”。正是这些信号中断了信息瀑布的强化反馈回路。
复杂的社会需要成员之间有相当程度的信任才能运转。一个例子是我们每次开车上路时对道路上其他司机的信任——我们相信他们在遇到红灯时会停在自己的车道上。我们会对偶尔的错误保持警觉,但总体而言,我们默认其他司机也会遵守同样的交通规则,并在他们违反规则时迅速察觉。信任无处不在。我们信任孩子所在学校的教职工,也信任食品和安全系统的工作人员。对于这些缺乏直接互动的关系,我们所经历的流程,以及对这些流程的监管和执法极大地促进了这种信任。法恩斯沃思认为:“在情况过于复杂或分散而无法产生信任时,法律往往就成了信任的替代品。”
“囚徒困境”是一个被广泛使用和引用的思想实验,探讨了如何在社会交往中建立信任。为了更好地理解与信任有关的反馈回路,不妨先了解一下囚徒困境博弈及其中的一种策略——以牙还牙。
这个思想实验内容如下:两名被指控共谋犯罪的嫌疑人被关在不同的牢房里,无法沟通。警方虽然缺乏足够的证据给两人定罪,但仍有较大的把握,希望确保两名嫌疑人都在监狱里待上一段时间,于是,他们向二人提出了一项交易,即他们可以按照以下条件揭发对方的罪行:
1若互相揭发,则各判两年;
2若一人揭发,而另一人沉默,则揭发者立即获释,沉默者入狱五年;
3若同守沉默,则各判一年。
在博弈论中,利他行为(保持沉默)被称为“合作”,揭发对方则被称为“背叛”。
这两名嫌疑人应该如何选择?如果他们能够沟通并且彼此信任,那么理性的选择就是保持沉默,各判一年是对二者来说最好的结果。但他们要如何知道对方不会揭发自己呢?毕竟,人们的行事往往是出于自身利益。保持沉默的代价太高了。
博弈实现的均衡结果就是双方都选择揭发对方,最终两人均获刑两年。在囚徒困境中,你的最优选择永远是背叛,即不信任对方。最终的结果一般不会太好,但至少可以避免最糟糕的情况。
在各种囚徒困境的真实实验中,参与者会使用不同的策略争相赢得最高的分数。研究结果表明,谋求各自利益的行为主体经过反复互动后终将寻求合作。
不过可以想见,在重复博弈中背叛并不总是最好的选择。如果你需要反复面对同样的情形,想方设法建立信任总归是值得的。
反馈回路作为一个关键的机制可以为我们提供信息,帮助我们以此做出基于信任的决策。你可以利用此前与某人的交往经验纠正自己的行为。
信息回路是以牙还牙(囚徒困境的经典策略)的基础。罗伯特·阿克塞尔罗德 的实验表明,在重复囚徒困境博弈中最佳的解决方案是在首轮选择合作,在之后的轮次模仿对手在上一轮的策略。也就是说,玩家的最佳方案是以选择信任对方开局,更重要的是,玩家创造出了一个反馈回路,表明自己愿意且有能力信任对方。
法律中存在几种有助于鼓励基本信任的机制。首先,法律体系通常会强制执行合同。我如果知道违反协议会受到惩罚,那么很大概率不会在第一次合作时就选择背叛。即便我们今后再也不会合作,背叛的成本依旧很高。除了在一次性合作中保护个体,执行合同还有助于建立反馈回路,以此促进和激励相互信任。法恩斯沃思表示:“契约让每个人都能轻易战胜囚徒困境,并享受合作带来的裨益。”重点是我们可以相信系统的反馈回路会执行微互动,以便我们彼此之间建立信任。可以想见,在几次互动之后,合作带来的收益会促成一个反馈回路,鼓励人们在类似的情形中优先考虑合作。
在无法签订契约的情况下,法律也可以对不配合的行为施加规定和相关惩罚。纳税就是一种与同胞签订的“契约”,大多数国家都对偷税漏税行为的惩罚有着明确的法律规定。在共同或公共财产的使用管理方面也有相关规定,激励人们为共同利益携手合作。
捕鱼配额的设置初衷就是如此。为防止渔民从自身利益出发,耗尽渔业资源,导致其枯竭到超出可持续发展的水平,法律规定了每个人的捕捞上限。实行配额就是一种强制合作以维护共同利益的手段。
不难想象,在许多情况下,无人合作很快就会成为一个产生负面结果的强化反馈回路。合作越少,未来合作的动力就越小。为了从源头上制止这一反馈回路,可以通过法律规定来阻止最初的背叛行为。
反馈回路是许多系统共同的组成部分,承载着系统会予以积极响应的信息。复杂的系统往往包含许多反馈回路,因此很难厘清调整系统中某一部分的反馈会对其他部分造成怎样的影响。将反馈回路作为一种思维模型,首先要关注你每天给予和收到的反馈。该模型还能让你深入了解迭代的价值,它能帮助你根据反馈进行调整。通过这一模型,你可以根据反馈明确系统调整的方向,以及需要以怎样的速度来监测调整带来的影响。
人在不断尝试中成长。我们对任何事情的首次尝试很少是令人满意的,但我们能从试错的经历中获得反馈。只要足够重视,这些反馈就能帮助我们在下一次尝试中取得进步。经过反复尝试,通过关注和吸收反馈,能力最终会得到提高。在讲述成功故事时,我们常常会忽略学习的过程,包括不可避免的失败和失望。特别是在艺术创作方面,我们通常只能看到一幅画或一首乐曲作为成品时的模样,却看不到之前所有的试错过程。
在《创造》一书中,凯文·阿什顿讲述了瓦西里·康定斯基如何创作出代表作《带白边的画》的故事。这幅作品并不是灵感闪现、一气呵成的产物,而是康定斯基在长达数月的过程中,根据细微改动的反馈不断打磨,最终创作完成的。
康定斯基首先创作了第一版草图。接着,根据不断观察作品得到的反馈,他继续进行修改、迭代。正如阿什顿所述:“修改出的第二版草图几乎毫无变化,略有不同的只是线条更分散,落笔痕迹不再那么明显……随后他又画了更多版本,一共20张草图,每张都与上一版本相差不过一两步。整个过程历时5个月。” [6] 最后的成品是这幅作品的第21版。
阿什顿形容康定斯基是试图在绘画中解决某些问题(这也可以理解为艺术目标)。康定斯基的每一次迭代都会向他提供反馈,让他知道自己是否距离解决问题更近了一步。最终,他从多次迭代的反馈中获得了足够的信息,创作出了自己想要的画作。
[1] Russell D. Roberts, How Adam Smith Can Change Your Life: An Unexpected Guide to Human Nature and Happiness (New York: Portfolio/Penguin,2015).
[2] Adam Smith, The Theory of Moral Sentiments by Adam Smith (London: Printed for A. Millar, A. Kincaid, and J. Bell in Edinburgh, 1761).
[3] Ward Farnsworth, The Legal Analyst (Chicago: University of Chicago Press, 2007).
[4] Donella H. Meadows, Thinking in Systems (Vermont: Chelsea Green Publishing, 2008).
[5] Anthony Bourdain, Kitchen Confidential (New York: Bloomsbury Publishing, 2000).
[6] Kevin Ashton, How to Fly a Horse (New York: Anchor Books, 2015).