别用“常识”理解复杂世界

万维钢
科学作家
“得到”App“精英日课”专栏作者

如果一位物理学家谈论物理，哪怕他只是用大家都能听懂的语言做科普，外行一般也不太敢提出质疑。众所周知，物理学是一门非常专业的尖端科学，没经过多年训练的人对其胡乱发表见解只能闹笑话；但当一位社会学家谈论社会问题时，哪怕他旁征博引了好多东西方先贤的经典理论，别人还是可以毫无压力地批评他。无论专家怎么说，每一位出租车司机都认为自己知道汽油涨价是怎么一回事；每一位网友都认为反腐败的出路是明摆着的；每一位球迷都认为，如果从未从事过足球行业的韦迪都能当中国足球协会的主席，那么他们也能当。

这也许怪不得大众。实践表明，在像政治学这样的“软”科学领域，其“专家”的实用程度很可能并不显著高于普通人。1984年，伯克利大学心理学家菲利普·泰特洛克（Philip Tetlock）做了一个影响深远的研究。他调查了284个专门以预测政治、经济趋势为职业的政治学家、智囊团和外交官，向他们提出各种预测问题，比如戈尔巴乔夫有没有可能因政变而下台。泰特洛克要求专家对其中的大多数问题，比如某个国家的未来政治自由状况，提供出现三种可能性（保持现状、加强或者减弱）的概率。这个研究做了20年，一直等到当年预测的事情全部水落石出。到2003年，泰特洛克总结了这些专家给出的答案，但结果发现他们的总成绩还不如索性把每个问题的三种可能性都均等地设为33%。也就是说，专家的预测水平还比不上直接掷骰子的方法。更具讽刺意味的是，这些专家对自己专业领域的预测得分居然比专业外的领域更差。

《纽约客》在评论泰特洛克根据这项研究写的《专家的政治判断》（ Expert Political Judgement ）一书时，对专家的看法相当悲观，最后得出的结论居然是：我们还是自己思考算了。尽管泰特洛克的研究显示，专家的得分其实还是比普通人略高一点儿。

社会科学并非无路可走，它可能正处于大发展的前夜。邓肯·J.瓦茨的这本新书《反常识》提出，社会科学的发展方向应该是像“硬”科学一样，依靠实验和数据。传统专家的预测之所以不行，是因为他们依赖的很多直观“常识”其实是一厢情愿的想当然。事实上，哪怕一个最简陋的统计模型，也能比专家预测得好。瓦茨这个说法并不新颖，因为已经有越来越多的人呼吁把数理方法作为社会科学研究的主要方法来运用，而且这个方法正在成为主流。现在大概很少有人在论文里拿100年前的所谓经典说事了。此书的最大新意在于，因为瓦茨同时在雅虎研究院研究社交网络，所以他在书中描述了几个亲自参与的有趣研究。

谈起社交网络，很多人会立即想到马尔科姆·格拉德威尔（Malcolm Gladwell）的《引爆点》（ The Tipping Point ）。这本书提出，要想一件东西在人群中流行开来，需要某些特别有影响力的关键人物在其中“推波助澜”。这些关键人物是社交网络中的节点，是普罗大众中的意见领袖。正是因为他们的存在，我们才可能实现把地球上任意两个人用不多于6个人相互联系起来，也就是所谓的“六度分隔”理论。根据这个理论，扩大产品知名度的最好办法是找名人做广告。名人在社交网站上说一句话，应该比普通人的“口碑”重要得多。有传闻说，在中国，有百万粉丝的名人发一条营销广告，可以获得1 000元，其实这个数字还算是少的。美国女星金·卡戴珊（Kim Kardashian）一条广告的价格是10 000美元。

“关键人物”理论完美符合人们的思维常识。我们总是强调伟人对历史的推动，强调“一小撮”坏分子对社会秩序的破坏，强调明星对时尚潮流的引领，然而问题是，这个理论并没有获得大规模统计实验的支持。

在现实生活中，统计影响力非常困难，因为我们很难测量一个人是被谁影响的。现在各种社交网站的出现给这种测量提供了可能。比如Twitter的一个特别有利于研究的特点是，如果用户分享一个网址，这个网址的URL（统一资源定位符）会被缩短，自动形成一个唯一的代码。通过跟踪这些短代码，瓦茨与合作者就可以分析信息如何在Twitter上扩散和传播。具体说来就是，如果有人发布了一条代码，而他的一个“粉丝”如果转发这条代码，那么这次转发就可以被视为一次可观测的影响。广告商的愿望是，希望信息能够这样一层接一层地转发和传播开来，形成所谓的“Twitter瀑布”。然而，通过分析2009年两个月之内160万用户的7 400万条信息链，研究人员发现，98%的信息根本就没有被推广传播。在这几千万条信息中，只有几十条被转发超过千次，而转发次数达到万次以上的只有一两条！我们平时看到的那些被反复转发的消息其实是特例中的特例。由此可见，想要通过社交网站成名，就好像买彩票中头奖一样困难。

那么，名人的影响力到底怎么样呢？瓦茨等人使用了一个巧妙的方法。他们使用统计模型，根据第一个月的数据把那些粉丝众多，并且成功引发了“Twitter瀑布”的关键人物挑出来，然后观察他们在第二个月中的表现。结果相当出人意料：这些人在第二个月再次引发“瀑布”的可能性相当随机。平均而言，名人的确比一般人更容易让一条消息被广泛传播，但这个能力的实际效果起伏极大，一点都不可靠。也许最好的营销方式不是拿大价钱请少数名人，而是批量雇用有一般影响力的人。

如果一个东西突然流行开来，我们的常识思维总是以为这个东西一定有特别出类拔萃之处，或者就是其幕后一定有推手；但Twitter上的一项研究表明，所谓幕后推手其实并没有那么厉害。那么，为什么某些书能够畅销，某些电影能够卖座，某些音乐能够上榜呢？完全是因为它们出类拔萃吗？瓦茨参与的另一项研究表明，成功很可能主要是因为运气。

这是一个相当有名的实验。实验者创办了一个叫作“音乐实验室”的网站，在几周之内招募到14 000名受试者来给48首歌曲评分，如果他们愿意，也可以下载其中的歌曲。有些受试者的评分是完全独立的，他们只能看到歌曲的名字；其余受试者则被分为8个组，他们可以看到每首歌曲被自己所在组的其他受试者下载的次数——他们可能会设想被下载次数越多的歌曲越好听，这样一来他们的打分就会受到社会影响的左右。

实验结果表明，那些“优秀”歌曲，也就是在独立组获得高分的歌曲，在社会影响组也是“流行”歌曲，且其流行程度比在独立组更高，而“低劣”歌曲在社会影响组的表现也更差；所以当听众能够被彼此的选择影响时，流行的东西就会变得更加流行，出现胜者通吃的局面。这个实验最重要的结果是，具体哪首歌曲能够登顶榜首，则是非常偶然的事件。有些歌曲可能会在实验初期纯粹偶然地获得更多下载次数，后来的受试者受这个影响，就会以为这首歌曲好听，以至于给予它更多的关注，形成正反馈。最初的运气很大程度上决定了最后哪首歌曲能脱颖而出。在独立组排名第26位的一首歌曲，在一个社会影响组居然排名第1位，而在另一个社会影响组则排名第40位。尽管特别低劣的歌曲肯定流行不起来，但好歌想要流行还是需要很大的运气。总体来说，独立组排在前5位的歌曲只有50%的可能性在社会影响组也进前5名。

对能够互相影响的一群人，不能以常理度之。撒切尔夫人曾经说：“根本就没有社会这种东西。只有作为个人的男人和女人，以及他们的家庭。”可是你不能用研究一个人的方法来研究一群人。就算你能理解这群人中的每个人，你也未必能知道把这群人放在一起会发生什么。他们之间的社交网络结构会导致一些非常偶然的事情发生，这些事情无法用任何常识去预测。一般人的历史观总是有意无意地把一个集团想象成一个有思想、有行动的个人。这样的理论无法解释，为什么很多历史事件经历数次失败后，居然在一个完全意想不到的时机下成功了。

我们生活在一个彼此互相影响的社会。我们想起来去听一首歌，也许只不过是因为朋友的推荐。我们想起来去看某部电影，也许只不过是因为我们恰好在社交网站上看到某人提到了它。歌手旭日阳刚的歌可能真的很好听，但换作某个平行宇宙，他们将登不上春晚舞台。如果历史重演一遍，芙蓉姐姐、周迅甚至李谷一都未必能成名，而《哈利·波特》第一集也未必能获得出版。我们总是习惯于把事情的成败归结为人的素质，归结为领袖人物，甚至归结为阴谋论，好像什么事情都是注定的一样，而事实却是，很多事情只不过是偶然而已。

常识只是特别善于在事后“解释”事件，这种解释根本谈不上真正的理解。“十月革命”爆发了，我们就解释说俄国当时的局势必然会爆发革命。在革命之前有谁能这么肯定呢？中国女篮以三分优势击败韩国取得奥运参赛权，赛后总结全都是成功的经验，但如果中国女篮最后几个球偶然没投进，媒体上出现的必然又全是失败的反思。我们在看这些事后的经验总结或者反思时，总觉得它们说的都挺有道理，简直是常识。专家也正是根据这些道理去预测未来。可是事先你怎么会知道这些完全相反的道理哪个会起作用呢？

如果有人说，来自农村的士兵会比城市的士兵更适合军队生活，读者很可能会认为这是显而易见的事情，因为农村本来条件就比较艰苦，需要更多的体力劳动，农村士兵肯定更能适应军队生活；然而据社会学家保罗·拉扎斯菲尔德（Paul Lazarsfeld）对第二次世界大战期间和战后美军的调查，发现事实恰恰相反。结果是城市士兵更适应军队生活，因为他们更习惯于拥挤、合作、命令，以及严格的衣着规定和社会礼仪。这两方面的常识看上去都有道理，在没有统计的情况下，我们根本不知道哪个更重要。这就是为什么不做调查研究就没有发言权的原因。

要想从复杂的随机事件中看到真正的规律，最好的办法是，像研究自然科学一样进行大规模的重复实验。如果中国女篮跟韩国女篮在同样的条件下，打100次能赢95次，我们就可以确信中国女篮强于韩国女篮。如果一首歌能在每一个社会影响组都进前五名，我们自然就可以确信这首歌的品质的确出众。然而历史不能重复，我们不知道最后发生的结局是不是一个小概率事件，却总能用“常识”给这样的结局一个解释！用这样的解释预测未来，甚至制订计划，怎么可能不失败呢？一个更实用的历史观是，放弃“一切都是注定的”这个思想，把历史事件当成众多可能性中的一种，把未来当成一个概率分布，然后尽可能地使用统计方法，通过历史数据去计算未来事件的概率。与其追求用各种想当然的常识指导未来，不如把历史当作一个数据库，从中发掘统计规律。

从事自然科学研究的科学家通常认为社会科学更简单。如果你看那些关于社会科学的论文就会发现，其中的逻辑通俗易懂，结论往往也是显而易见的。物理学经常能得出一些违反直觉而又绝对正确的结论，然而社会科学中的常识却总能大行其道。现在这种局面正在改观，自然科学的研究方法正在被引进到社会科学中去，但这个过程并不容易。亨廷顿·凯恩斯（Huntington Cairns）曾经在某项研究中颇有科学精神地写道：“62个国家的社会挫折和不稳定之间的相关系数是0.5。”然后有一位数学教授跳出来说：“这纯属胡扯，亨廷顿是怎么测量社会挫折的？难道他有一个社会挫折表吗？”其实像这样的批评也许只不过说明，社会科学研究比自然科学研究更难做。

在没有互联网的年代，我们想要找几万人做歌曲评分实验，或者分析成百上千万的社交网络和信息传播，是根本不可能的事情。现在有了互联网，社会科学终于可以带给我们一些“不显然”的研究结果了，所以，社会学家已经在使用新方法做社会科学研究。令人遗憾的是，实用专家仍然停留在过去的理论上。其中一个原因也许是，统计方法还没有来得及做出更多有实用价值的判断。无论如何，正如瓦茨所说，如今，社会科学已经有了自己的“天文望远镜”，就等“开普勒”出来总结“行星运动的三大定律”了。