鸟儿翱翔于天,像广角镜头一样将全景一览无余。
蠕虫匍匐在地,像变焦镜头一样将细节尽收眼底。
——穆罕默德·尤努斯 [1]
当熟悉了《或多或少》那档节目后,我觉得那就是我梦想的舞台。揭穿新闻中的数字逻辑错误太有意思了,不仅如此,数据统计仿佛给了我一架望远镜,让我看到数据背后隐匿的新世界。然而,我还是有种怪怪的感觉,因为每次去BBC录制节目时,总觉得自己的个人经验似乎在告诉我那些看似可信的统计数据好像哪里不对。
事情是这样的,上班族都知道,早晨上班挤车苦不堪言。为了从东伦敦的哈克尼到达西伦敦的怀特城,我先要匆匆穿过一条车水马龙的大街,到马路对面去,在繁忙的公交车流中跳上一辆双层巴士,坐到很远的贝纳尔格林站,到那儿之后我还要再换乘地铁。如果公交车拥挤,地铁只会更拥挤。拥挤到什么程度?这么说吧,沙丁鱼罐头都比地铁松快。一般情况下,等我到地铁站时,地铁站台上已经站了一群望眼欲穿的乘客,祈祷着来的这一趟中心线地铁还有空间能让他们挤上去。但这要看你运气好不好,我常常要等两三趟地铁,才能在那些上车更早、已经被挤得不太高兴的乘客之间见缝插针地挤进去,找个位子坐下是想都不用想的事情。
正是这个挤车经历触动了我,让我萌生出用数字拼出世界本来面目的想法。因为当时我看到的伦敦公共交通的统计数据和我的亲身经历截然相反。那种挤的程度已经是在考验人的忍耐力了,尤其天热的时候,车厢里汗臭难闻,让人窒息。但官方统计数据显示,伦敦公交车的平均乘客约为12人,以我每天早上乘坐的双层巴士的62个座位为例,车上应该是很空的。 [2] 这完全不对呀,有些时候,车上人多得让我觉得自己身边就挤着不止12个人,更不用说整个公交车了。
地铁的乘客量就更离谱了。据伦敦交通局统计,伦敦地铁线路中最忙的一条线路的乘客运载峰值是1000多人。 [3] 但平均乘客量是多少?不到130人,开玩笑呢吧? [4] 中心线路地铁上随便一个站台上就有130人挤不上车,或者随便一列地铁的一个车厢里就能挤下130人,这才是平均乘客量好吗?所以我怎么相信这些统计数据——一辆公交车上有12人,一趟地铁上有130人,这些数字反映了事实吗?当然不是,每次我去上班,不要说能不能挤上地铁,有时我连站台都挤不上去。也就是说,地铁实际乘客人数比统计数据要多得多。
在节目演播室里,我对数字性思维推崇备至,但上下班途中,每天这么两次狼狈不堪的经历让我意识到这些统计数据一定有问题。
个人所见和官方统计存在差异,这并非虚构。在上一章中,我们讨论了不要被情感左右是很重要的。由于我自称“数据侦探”,你可能想着我也会同样要求你们对自己的感受持否定态度。因为,有时你也会自我怀疑:官方统计出来的数据更权威吧?会不会是自己看走了眼?
是,也不是。我们的个人感受不能混同为个人情感,至少不能不假思索一概不予考虑。有时统计数据给我们提供了一个了解世界的更好方法,但有时也会误导我们。所以当统计数据与日常经验不符时,我们要足够清醒地判断应该相信哪个,是数据,还是自己的感受。
那么当统计数据和我们的感受不一致时,我们该怎么办?这就是本章要讨论的内容。
大家应该很好奇统计数据是怎么得来的吧?我们就从这个问题开始吧。就我上下班的城市公共交通而言,这些数字是由负责伦敦道路和公共交通的伦敦交通局公布的。那么交通局的人觉得他们统计出来的公交车或地铁上的人数准确吗?问得好,答案是:他们也不确定。他们就是做了一个差不多的估计。而且,这一估计也是好几年前通过纸样调查做的,就是调查员站在公交车站或地铁站,拿着夹纸板,数人头,记下来,或向乘客分发问卷再统计的结果。这个办法够笨的,但也不至于错到让我的感受和官方数据差得这么离谱的地步。
现在是非接触式支付时代了,统计乘客人数要容易得多。绝大多数人坐车只要刷公交卡或智能手机就可以了。交通局的数据专家可以在电脑上看到这些公交卡的使用情况,甚至可以根据数据猜出你可能住在哪个地区,这不算太难。比如,他们可能会看到你的卡始终会回到某个地区,或者依据你的乘车刷卡记录推断你的行动轨迹。以我为例,我是在贝纳尔格林刷卡上地铁的,而在此前一分钟我乘坐的公交刚到贝纳尔格林,交通局就可以很有把握地判断出我刚才是坐公交到的贝纳尔格林,然后在贝纳尔格林上了地铁。
在伦敦地铁上,人们从某个地方入地铁,再从另一个地方出地铁,伦敦交通局无从知道通勤者在整个地铁网里乘坐的是哪条线,或有没有换乘,因为去一个地点可以有不同的乘坐路线。因此,交通局仍然不知道某条线路的地铁有多忙。但是,根据数据,配合偶尔的数人头方法,交通局的统计数据应该是八九不离十的。
地铁数据统计会越来越准确。2019年7月8日,伦敦交通局启用了一个系统,使用Wi-Fi测量伦敦地铁不同区域的拥挤程度。只要有更多手机连接入网,就意味着有更多的人流涌入某个地铁站。这个系统能让交通局发现实时拥挤或其他问题(这个系统启动的第二天,我就与交通局的数据小组交流了一下,他们对这个系统的效果很满意)。 [5]
这样看来,这些统计数据是可信的,不能简单地认为它们是错误的。
所以下一步就是找出我们的个人感受与官方数据天差地别的原因。在我的通勤中,有一个很好解释的原因:我的出行时间与交通高峰时段重叠,此外,我搭乘的也是地铁线路人流量最大的一条,所以我乘坐的地铁不挤才怪。
还有其他的解释或原因,比如这一种:大多数地铁并不拥挤,但有几条特别挤,因为大多数人搭乘的都是这几条。举个夸张的例子,假设一条地铁线上每天运行10趟列车。在高峰时段,一趟列车上可能挤了1000个乘客,而其他非高峰时段的9趟列车上根本没有乘客,那这些列车的平均客流量是多少呢?100人,这和伦敦地铁交通局报的数字差不多。但对于每个在高峰车厢里挤得动弹不得的乘客而言,他们的感受和100这个数字完全不是一回事。
当然,伦敦地铁的真实情况并没有那么夸张,没那么多全空的列车,但确实有时列车上乘客很少,特别在与通勤者上班方向相反的列车上。所以,无论怎样,总会有在那些空荡荡的列车上的乘客来证明地铁有很空的时候。因此,这些统计数据说的是事实,但不是全部事实。
所以,对于拥挤这个问题,可以有别的角度来切入。我们不一定以列车的平均人流量来看拥挤与否,我们可以从个人的角度衡量拥挤情况,比如,调查100位乘客,有多少位搭乘的是拥挤的线路。这就是以乘客体验为核心的调查方法。交通局现在正在重新收集数据和报告,这些数据和报告反映的将不再是列车的客流量,而是乘客的乘车情况。
然而,目前还没有某个客观指标可以用来衡量公交系统的繁忙程度。作为乘客的我,感觉自己所乘坐的所有公交车都是满负荷的,需要增加几趟。交通局的统计数据也显示,的确有很多公交车是在空跑。但是,公交车都是有固定线路的,不可能随意、临时改线路,奇迹般地出现在某个最繁忙的地区去支援拥挤的公交车。交通局对公交车很低的平均客流量也很头疼,因为买这些公交车要花钱,公交车会占用道路空间、会排放污染物,所以必须有合适的客流量才能体现出公共交通的经济效益和社会效益。
简而言之,我的眼睛让我看到伦敦交通体系中重要、真实的一面,但官方统计数据揭示了我无法知道的另一面,这一面也同样重要、真实。有时,针对一件事情,个人感受和统计数据完全不一样,但却是一体两面,都是对的。
但是,这也不一定。举个例子,我们在前文说过,大量吸烟会使患肺癌的风险增加16倍,但许多人却因为自己的某个经历对这一发现产生怀疑。譬如你会说你奶奶一辈子吸烟,都活到90岁了还身体倍儿棒,而你隔壁的叔叔,一辈子不抽烟,最后却是死于肺癌。
乍一看,这似乎与我上班通勤体验与官方数据相矛盾是一样的。但仔细想来,这种情况反而要求我们摒弃个人经验,而去相信统计结果。虽然肺癌发病率风险增加16倍不是个小数字,但肺癌病例本身很少,所以我们把自身经历的特殊性当成普遍性了。世界上很多真相类型不同,有些事例太微小或太罕见,以个人经验下结论都是管中窥豹,只有依靠统计数据,我们才能见微知著,而有些却是一目了然、无须数据就知道的事实。
生病看医生就是明显的例子。
当我们感觉身体不舒服时,不管是头痛还是抑郁,不管是膝盖酸痛还是脸上长疮,都会去看病。比如,我太太最近发现她每次举起手臂时,肩膀会痛得厉害,甚至痛得连穿衣和拿高处的东西都成问题。过了几天不见好,她忍不住去找了一位理疗师,理疗师给她看了一下,然后让她回家锻炼,坚持每天做一些很难做的动作。我太太每天完成得都很认真。过了几周,她跟我说:“我觉得我的肩膀快好了。”
“哇,看来理疗很有用啊!”我说。
“也许吧。”我太太说。她一下子就听出来我准备用数据反驳她的怪腔调,所以她又说:“保不准是肩膀自己好起来的。”
是呀,站在我太太的角度,无论哪个原因,只要肩膀好就行了,而她现在的确觉得肩膀轻松了,但是不是锻炼治好了肩膀,她也不清楚。但对以后的肩痛患者来说,他们会急切地想知道锻炼是否真的有效果,或者是否还有别的更好的治疗办法。
其他病的治疗也是如此,无论是关于饮食方面的疾病、心理治疗、锻炼,还是抗生素或止痛药。如果我们病好了,其他人就想知道这是因为我们的治疗方案奏效了,还是因为我们觉得医生也看了,钱也花了,药也吃了,罪也遭了,一系列流程走下来,病就该好了的心理作用。这就是为什么人们设计了双盲实验,实验将最好的治疗方法和一种叫作安慰剂的假治疗方法进行了对比,判断到底是药奏效还是心理作用起效。从这个例子中,我们得知这并不是说个人经历没用处,而是个人经历没有我们所需要的普遍意义。
当个人经历和统计数据不符时,还有一些例子可以说明,在一些场景下,个人经验不靠谱。有人说接种麻疹、腮腺炎和风疹(MMR)疫苗会增加儿童患自闭症的风险。其实没这回事,但还是有一半以上的人相信这个谣言。 [6]
正是因为有数据的支持,我们可以十分肯定地说接种疫苗和儿童患自闭症没有任何关联。由于自闭症并不常见,我们需要比较数以万计的接种和未接种疫苗的儿童。丹麦的一项主要研究正是这样做的,它调查跟踪了65万名儿童,绝大多数儿童在15个月大时接种了MMR疫苗,但其中也有大约3万人没有接种。这项研究对这些儿童进行了为期4年的随访,结果是,无论是否接种疫苗,儿童都有大约1%的自闭症发病率。这说明未接种疫苗的儿童感染这些危险疾病的风险更高,因为他们的分母小。 [7]
那么,为什么许多人仍然持怀疑态度?部分原因是过去有关疫苗和自闭症儿童悲剧事件有过大肆报道,让人们现在仍心有余悸。那次报道说有儿童在接种MMR疫苗后不久就被诊断出患有自闭症,他们的父母认为MMR疫苗是导致自闭症的罪魁祸首。假设一下,如果你带着孩子接种了疫苗,不久之后孩子就被诊断为自闭症。你能不把两者联系起来吗?你能不怀疑吗?
其实,这样的“巧合”不难解释。自闭症往往在两个年龄段容易确诊:在儿童大约15个月大时,儿科护士会注意到一些早期症状;等孩子到了上学年龄,症状越发明显。两次MMR疫苗注射时间也正好在这两个时段,这就引起了人们的误解。 [8] 所以当一个理由能充分解释为什么我们的个人经历与统计观点不一致时,我们应该放下疑虑,相信数字。
再找一个没那么沉重的例子吧,比如我们与电视媒体的关系。电视上的很多人比你我都有钱,能上电视,当然也比你我有名,大概率他们比你我长得好看,至少比我好看。(我上广播节目而不是电视也是因为相貌拿不出手。)但每当说起普通人时,我们脑海里会不由自主地代入这些我们在电视上看到的人,但这些人基本都是相貌姣好且富有的人,怎么能代表普通百姓的相貌、收入和名气呢?但即使我们反应过来这些电视明星并不能代表你我他,也改不掉这种印象。
人们容易把从自己的视角看到的东西理解成事情的全貌,心理学家把这叫作“天真的现实主义”,即认为自己看到的是没有任何偏差的实情。 [9] 这种一叶障目的天真的现实主义会严重误导我们。所以当选举结果出乎我们意料时,我们感到惊讶:“我们身边认识的人不是都投他了吗?怎么他没胜出呢?”民意测验并不总是准确的,但我可以向你保证,机构预测的选举结果的准确率比你靠朋友圈感受的准确率要高。
天真的现实主义会让人对很多事物产生错误理解。比如莫里民意调查机构就一系列社会问题对38个国家的近3万人做了调查。结果发现这些人——可以代表我们中的大多数人——对事情的了解与可靠的统计数据严重不符,以下就是列子。 [10]
1.我们对谋杀犯罪率的理解是错的。我们以为自2000年以来杀人案一直在上升,但在大多数接受调查的国家,这一比例一直在下降。
2.我们以为在过去15年里死于恐怖主义的人数比15年前的要高,其实人数下降了。
3.我们认为28%的囚犯是移民。莫里调查估算,所有受访国家的真实比例应为15%。
4.我们以为每年会有20%的少女生育。这个数字其实从生物学的角度没有多少可信度。从具有生育能力的12岁开始算,一个18岁的女孩已有6次20%的生育概率,那么大多数18岁少女应该至少有一个孩子了。我们看看身边的情况,这是真的吗?莫里调查统计得出,正确的数字是每年只有2%的少女生育。 [11]
5.我们以为34%的人患有糖尿病,而真正的数字是8%。
6.我们以为75%的人用脸书。2017年调查时,这个数字是46%。
为什么我们以为的与真实情况相差这么大?原因有很多,但有一种说法是电视和新闻报纸影响了我们对世界的认识。这并不是说那些严肃的报纸或电视报道误导了我们(虽然有时也是),问题是新闻中那些中彩票的事,那些有情人终成眷属的故事,那些恐怖分子的暴行或陌生人无缘无故被袭事件,当然还有最新的流行趋势报道,往往不具普遍意义,都不是生活常态。这些新闻之所以成为新闻,能在电视或报纸上看到,就是因为它们少见,是小概率事件,但我们对世界的理解却受它们的影响。
正如著名的心理学家丹尼尔·卡尼曼在《思考,快与慢》一书中说的那样,当面对一个复杂问题时,我们总是仓促下结论,而不想想是不是还有别的解释。譬如,对于上面第二个问题提到的过去几年恐怖主义造成的死亡人数,我们不是扪心自问:“我被恐怖分子杀害的概率大吗?”而是在回想:“咦,真巧,我最近不是就看到一篇关于恐怖主义的报道吗?”对于少女怀孕的话题,我们不是反思在自己认识的少女中有多少是母亲了,而是忙着认同“好像是哦,我最近就看到过一条少女怀孕的新闻”。
新闻报道的事件,在某种程度上也是数据,它们虽然不是代表性的数据,却实实在在地影响了我们对世界的看法。用卡尼曼的话说,它们就是“快数字”——让人一下子就能得出结论的数字。考虑周全、不带偏见收集来的“慢数字”不是这样的。大家都知道,所谓慢工出细活,更耐心地对数字进行分析能解读出更客观的真相。
至此,我们已经列举了不同类型的事例,有些事例告诉我们官方的严谨数据比直觉感受可信度更高,有些事例告诉我们自我感受和官方数据可以提供看世界的不同视角,那么现在就有了一个问题:有没有哪种情况是我们的个人感受比数据更可信的呢?
当然有。有些东西是我们无法从电子表格中学到的。
比如杰瑞·穆勒的《指标陷阱》。这本书重421克,有220页,平均每章10.18页、17.76个尾注。有四位名人为其背书。这些数字有没有我们想知道的内容呢?我是说书的内容。难道对书的这些描绘就足以让我们无条件地相信书里说的一切吗?要了解这本书,你需要自己读一读,或者听听读过的人的评论。
杰瑞·穆勒的书抨击的就是这种细致的量化管理,量化管理本是管理和绩效评估的有效手段,但现在常常为专业知识储备不全或不了解基层情况的企业管理者或政治家所用。例如,一群医生经常会拿着临床得出的数据结果,花时间钻研,力求攻克疑难杂症。但是如果医院院长决定把奖金或评职称与医院考核数据好看挂钩,结果可想而知。例如,现在已经有证据表明心脏外科医生不愿意给危重病人做手术,因为这有可能降低他们的手术成功率。 [12]
在我的《混乱》一书中,专门有一个章节讨论这样的例子。曾经有一段时间,英国政府统计了人们看病挂号排队的天数,发现时间有点长。出于好意,政府给医生设定了一个天数,希望减少人们等待的时间。但是,医生的对策是干脆不再接受提前挂号了,这样就没有所谓的排队病人了。最后病人只好每天早上打电话,看当天自己的运气够不够好、能不能挂上号,因为政府的规定是病人排队等待的时间不能超过一天。
《美国新闻与世界报道》杂志对美国大学进行排名,结果还是名校雄霸排行榜,然后呢?本来已经挤破头的名校更是虹吸效应般地吸引着更多的学生报考,最后录取率就越发低了。
还有一个可悲的“数尸体”的例子。这是越战期间时任美国国防部长罗伯特·麦克纳马拉发明的一个变态的激励机制。麦克纳马拉认为,你多杀敌一个,就多向胜利迈了一步。这个想法本来就不靠谱,但尸体数量很快成了私下都在用的升官晋级标准,甚至被用过了头。由于数尸体比杀敌要容易得多,所以数尸体反而成了一个军事目标。数尸体有风险,也毫无用处,但它是对麦克纳马拉设定的机制的回应。
这个事情说明有些数字没有收集的必要,但你也要理解为什么麦克纳马拉想要这些数字,他没有在一线作战的经验,但想了解和掌控远方战况,这是憋出来的招数。几年前,我采访了一位反思越战的专家,他告诉我,军队过去甚至认为“战况可以通过电脑显示出来”。
你以为电脑是神吗?有些东西你必须在一线才能掌握,尤其是瞬息万变、云诡波谲的战场局势。诺贝尔经济学奖获得者弗里德里希·哈耶克对这样难以用数字表达的感觉说了一个词:审时度势。
不同领域的科学家也诟病指标量化。社会学家早就明白,当统计成为指标时,它们不是用来解读世界,而是用来控制世界的,这时统计就成了危害极大的数字。经济学家也经常引用同行查尔斯·古德哈特在1975年的一篇文章中写的一段话:“一旦为了达到某个目的而形成压力,就会牺牲掉一贯遵循的统计原则。” [13] (或者,简单来说就是:“当指标成为目标时,它就不再是一个好的衡量指标了。”)同一时期,以唐纳德·坎贝尔为代表的心理学家也反对目标量化:“社会决策中量化指标越多,就越容易滋生腐败,使本要监管的东西走样。” [14]
古德哈特和坎贝尔都说到了问题的本质:对于真正重要的事情,统计可以是一个相当不错的指征反映,但它仅仅是个指征,不是真实的情况。一旦你开始将这个指征作为一个需要改进的目标,或者一个要远程控制他人的指标,它就会被扭曲、伪造或玩儿坏。这样统计就失去了意义。
2018年,我和家人访问了中国。这次旅行告诉我,对于快数字和慢数字,我们不必厚此薄彼,将它们融合在一起才能对事物有最深刻的理解。
慢数字讲述了一个我们熟悉的故事,至少是像我这样的数字爬虫所熟悉的故事。自1990年以来,中国人均实际收入增长了10倍。自20世纪80年代初以来,极端贫困人口数量已经减少7.5亿多,远远超过中国总人口的一半。中国在近三年的水泥用量比美国整个20世纪的水泥用量还要多。从理论上讲,这是人类历史上经济活动的一场大爆发。
但是,我亲眼所见的还是震撼了我。我去中国南方省份广东旅行了一次,那种直观的感受是数字没法给的。广东一直是中国经济增长走在最前沿的地区之一。我们从高楼林立的香港出发,很快到达其紧邻的内陆城市深圳。高耸入云的平安大厦让帝国大厦相形见绌,我们在它附近登上了一列省内动车。
伦敦的摩天大楼通常是一座或两三座一组的,而深圳是十几幢差不多的高楼云集成一个中心区,大厦鳞次栉比,旁边挤着住宅楼。不远处拔地而起又是这样一簇摩天大楼,就是外形稍有不同。然后一簇接一簇,连绵不绝地延展到雾蒙蒙的远方。无论哪里,都是曼哈顿风格的摩天大楼。在我45分钟的动车旅途中,高楼似乎也在不停前进,一路铺到广州,一路都是望不到头的摩天大楼天际线。
那一天,我们在风景如画的阳朔结束了行程。尽管周围是田园美景,我却失眠了。我脑海中反复出现那绵延无尽的楼群画面,不禁开始焦虑,胡思乱想:这么多人,这么多楼,我6岁的儿子会不会在广东走丢?在这个陌生的世界,我怎样保护我的家人?这样的高速发展,地球还能撑多久?那一晚上,我辗转反侧。
当然,我在中国的所见所闻与报道的经济数据是一致的,是看中国经济增长的两种互补角度,但它们给人的感受很不一样。慢数字会让我推敲和思忖,努力解读这些数字与现代中国发展背后的逻辑。火车旅行提供的是快数字。它是那种生动的、扑面而来的,让人自动形成直观印象的数字。我不停地将广州与我所知的英国国内城市进行对比,思考高速发展会将世界带往何方。 [15]
快数字和慢数字这两种理解世界的方式都各自有优缺点。经济学家、小额信贷先驱、诺贝尔和平奖获得者穆罕默德·尤努斯将个人经历用“蠕虫视角”与统计数据提供的“鸟瞰视角”进行了对比。蠕虫和鸟类对世界的看法截然不同,但尤努斯教授强调近距离观察世界的好处,他的话没错。
当然,鸟瞰也能看到很多东西。尤努斯教授的关注对象是他身边的孟加拉国贫困妇女。他通过给贫困妇女提供低息贷款,让很多妇女成为小本经营者,从而给她们提供了一个改善生活的机会。但是,这种直观的成功个案需要用统计学上严谨的交叉检验来验证这个方法的有效性,所以尤努斯大力推广的小额信贷计划接受了较为全面的评估。评估采用了随机测试,一组人同时申请小额贷款,有人被批准,有人被拒绝。(这就像一个临床试验,其中一些病人服用新药,而另一些病人服用安慰剂。)这些试验发现,小额贷款的益处有限,且不能持久。其他方法也接受了同样严格的评估,例如,给微型企业家小额现金的同时提供专家指导,你会发现现金配给和专家指导相结合比只提供贷款能更好地增加这些小微企业的收入,即授人以鱼不如授人以渔。 [16]
鸟瞰的数据难免枯燥乏味,它不像我们的个人经历更能触动我们。然而我们的个人经历是有限的,必定挂一漏万,例如,我的中国之行还包括旅游景点、机场和高速铁路,所以如果你认为我没有遗珠,看到了所有重要的东西,那你就错了。
鸟瞰视角提供的数字枯燥严谨,但全面深刻,蠕虫视角看到的数据鲜活,但较为片面,要平衡两个视角不是容易的事。我们要经常提醒自己,在了解这些东西的同时也可能忽视了另一些东西。统计学和其他学科一样,严谨的逻辑和个人经历要相辅相成,相互纠偏,只有将两者有机地结合起来才是最理想的方法。
一个由安娜·罗斯林·朗兰德领导的名为“差距”的瑞典基金会在做这方面的努力。该基金会的宗旨是消除人们对全球化发展的误解。她通过一个构思精巧的网站“美元街”将数据直观化,也就是弥合了蠕虫视角和鸟瞰视角之间的差距。
在“美元街”,你可以比较来自布隆迪马坎巴的布托伊一家和来自中国云南的老毕一家的生活。伊梅尔达·布托伊是个农民,她和她的四个孩子每月只有27美元的生活费。来自中国的毕华和岳恒都是企业家,他们家每月有1万美元的收入。月薪27美元的生活与月薪1万美元的生活当然天差地别。但是,仅仅数字上的差异让我们难以想象贫富差距能大到什么程度,或者与我们自己的生活差距又是怎样的。
“美元街”试图通过电脑这一可视化媒介解决这个问题,它用短片和数千张照片尽可能翔实地展现不同收入家庭的生活起居——炉子、照明、玩具、放盐的地方、电话、床。它给每个家庭拍了大约150张照片,这些家庭有什么拍什么,方方面面都拍,原封不动地拍,原汁原味地拍。这些影像让贫富差距直观起来。
伊梅尔达·布托伊家里的那些照片还原了她每月27美元的生活。家是泥墙,草泥屋顶,干泥地面,没有灯,在房子里点一个火堆照明,外面地上挖个洞,上面盖个板子就是厕所。孩子们哪有什么玩具,只有几本小人书而已。
相比之下,中国的老毕家就阔绰得多。房子有淋浴、抽水马桶、高档音响和平板电视,门前还停着私家车。老毕家的一切都暴露在镜头前,包括狭窄的厨房、有两个灶头的电磁炉。
朗兰德说:“我们可以把照片当成数据。” [17] 这些不是一时兴起所拍或有误导之嫌的照片,而是可以当成有用的数据,因为它们是可排序的、可比较的,并且与数字相关。这个网站允许你筛选,这样你就可以只看低收入、中等收入或高收入家庭的照片,或者只是某个国家的照片,或者仅仅是某个特定物品的照片,比如牙膏或者玩具等。
例如,我们可以看到所有赤贫家庭做饭时的照片,发现世界上穷人做饭都差不多,一个简陋铁锅架在火堆上就行。富裕人家做饭基本上都是用煤气灶或电磁炉。不管你是哪个国家的人,你如果穷,就只能和家人一起睡在地上;你如果很有钱,就会有自己的卧室和舒服的床。很多我们以为的文化差异其实都是收入差异的表现。
尽管汉斯·罗斯林是世界上最著名的统计大师之一,但他仍写道:“数字永远无法将地球上的生活百态全部展现出来。”(安娜·罗斯林·朗兰德嫁给了汉斯的儿子。)汉斯说得没错,数字永远无法展现全部。这就是作为一名医生和学者,他游历如此广泛的原因,也是他能娴熟地将故事穿插在统计证据中的原因。这些故事和数字确实阐明了问题。
我喜欢“美元街”的原因在于它成功地将各类统计数据结合了起来——快数据和慢数据、蠕虫视角和鸟瞰视角。图片直击人心,图片让我们与全世界的人共情。图片成为数据的解说词:每月27美元,或每月500美元,或每月1万美元的生活水平是什么样子的,每种生活水平对应多少人。这让数字不再冰冷。
如果我们不知道统计数据,我们对世界现状的认知很可能大错特错。人们很容易被自己的双眼蒙蔽,以为看到的都是真相,事实并非如此。有些现象,即使得到了真实数据,我们也搞不懂其原因,但如果没有真实数据,恐怕连知道真相的机会都没有。
然而,如果只看数据,我们就只能看到世界的一角。所以在看完数据表格之余,我们也可以抬起头来,带着好奇心去看、去听、去摸,去感受真实的世界。
那么,我的第二条建议是,试着从两个角度看问题:蠕虫视角和鸟瞰视角。两个视角会给你展示一些不同的东西,这可能也成为你的难题:这两种景象孰真孰假?这样的疑问会让你踏上探究之旅。我们在后面会发现有时统计数据会误导我们。有时,我们自己的眼睛欺骗了我们;有时,一旦我们明白了事情的缘由,数字和眼睛所见的不符也就可以理解了。要做到这一点,通常需要我们问一些聪明的问题,这就是我在下一章中要讲的内容。
[1] Muhammad Yunus interviewed by Steven Covey, http://socialbusinesspedia.com/wiki/details/248
[2] Transport for London, Travel In London: Report 11 , http://content.tf l.gov.uk/ travel-in london-report-11.pdf, f igure 10.8, p.202.
[3] These numbers were revealed in a freedom of information request – https:// www.whatdotheyknow.com/request/journey_demand_and_service_suppl – and they are nicely summarised here: https://www.ianvisits.co.uk/blog/2016/08/05/london-tube train-capacities/
[4] Transport for London, Travel In London: Report 4 , http://content.tf l.gov.uk/travel-in london-report-4.pdf, p.5.
[5] Author interview with Lauren Sager Weinstein and Dale Campbell of TfL, 9 July 2019.
[6] Ipsos MORI, Perils of Perception 2017 , https://www.ipsos.com/ipsos-mori/ en-uk/perils-perception-2017
[7] ‘“No link between MMR and autism”, major study finds’, NHS News , Tuesday, 5 March 2019, https://www.nhs.uk/news/medication/no-link-between-mmr-and-autism major-study-f inds/
[8] ‘When do children usually show symptoms of autism?’, National Institute of Child Health and Clinical Development , https://www.nichd.nih.gov/health/topics/autism/conditioninfo/symptoms-appear
[9] David McRaney, ‘You Are Not So Smart Episode 62: Naïve Realism’, https:// youaren otsosmart.com/2015/11/09/yanss-062-why-you-often-believe-people-who-see-the world-diferently-are-wrong/; and Tom Gilovich and Lee Ross, The Wisest One in the Room , New York: Free Press, 2016.
[10] Ipsos MORI, Perils of Perception 2017 , https://www.ipsos.com/ipsos-mori/ en-uk/perils-perception-2017
[11] 这提醒我们停下来思考多么重要。这里不需要高深的数学知识,20%这个数字根本不符合我们日常看到的景象。在一些国家,甚至有些人认为每年有50%的少女会生孩子,这意味着年轻女性在18岁成年时都有三个孩子了。
[12] David Dranove, Daniel Kessler, Mark McClellan and Mark Satterthwaite, ‘Is More Information Better? The Effects of“Report Cards”on Health Care Providers’,National Bureau of Economic Research Working Paper 8697 (2002), http://www.nber.org/papers/w8697
[13] Charles Goodhart, ‘Problems of Monetary Management: The U.K. Experience’, in Anthony S. Courakis (ed.), Inf lation, Depression, and Economic Policy in the West ,London: Mansell, 1981, pp.111–46. The original paper was presented at a conference in 1975.
[14] Donald T. Campbell, ‘Assessing the impact of planned social change’, Evaluation and Program Planning , 2(1), 1979 – an earlier version was published in 1976 and a conference paper existed in 1974.
[15] 喜欢丹尼尔·卡尼曼的《思考,快与慢》一书的读者可能在这里会意识到他书中所说的“系统1”和“系统2”的含义。
[16] Abhijit Vinayak Banerjee, Dean S. Karlan and Jonathan Zinman, ‘Six randomized evaluations of microcredit: Introduction and further steps’, 2015; and Rachel Meager,‘Understanding the average efect of microcredit’, https://voxdev.org/topic/methods measurement/ understanding-average-efect-microcredit
[17] Anna Rosling Rönnlund, ‘See how the rest of the world lives, organized by income’,TED 2017, anna_rosling_ronnlund_see_how_the_rest_of_the_ world_lives_organiz ed_by_income