购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

隐藏在噪声中的模式

在数据泛滥的现代世界,科学家需要更加小心,不能把随机的巧合误解为意义重大的联系。在回答科学问题时,我们常常感兴趣的是确定一个量是否随另一个量而变化。例如,我们可能想要了解某一特定环境因素的存在或缺失是否会增加或减少我们的健康受某种特定影响的机会。

1992年2月,朱莉·拉姆的大儿子凯文被诊断出患有急性淋巴细胞白血病。这位来自内布拉斯加州奥马哈的5个孩子的母亲回忆说:“我当时就想知道是什么导致了癌症,因为我担心我的其他孩子。”朱莉和她的团队组织了一群儿童癌症患者的父母,成立了“奥马哈预防癌症”小组,开始调查凯文的可能病因。他们把最近出现的所有已知儿童癌症病例绘制到奥马哈地图上,发现了一些比较独特的区域,似乎病例在这些区域比较集中。他们把代表供电电缆的网格覆盖到地图上,发现一些癌症病例聚集的地区密集分布着纵横交错的电力线。他们还发现,在奥马哈一个变电站1英里半径范围内,至少有11名儿童在过去7年内被诊断出患有癌症。

在整个20世纪80年代和90年代初,人们都特别关心生活在电力线附近是否会增加罹患癌症的风险。1992年,参与争论的几位著名物理学家指出,电力线发出的电磁场强度只有地球磁场的几百分之一,因此不太可能造成伤害。

“电力线致癌论”的支持者提出了一个富有想象力的想法,认为振荡的电磁场会让人体细胞发生相同频率的振动。但物理学家再次计算出,电力线可能对人体细胞产生的所有力只有人体自身热量产生的波动强度的几千分之一。除此之外,生物学家也发现很难解释这些微小的力是如何诱发癌症的。简而言之,没有合理的物理或生物机制能将电力线与癌症联系起来。

然而,只要没有明确的实验结果从实证上排除这种联系,奥马哈预防癌症小组就会继续认为电缆是导致癌症病例聚集的原因。而我们将看到,这些病例聚集最有可能是纯粹的概率使然。

*

为了理解为什么家长小组最终偏离了目标,我们需要了解人类是如何处理随机性的(如果他们没有像前一章那样,把随机性视为一张供他们在上面撰写通灵信息的白纸的话)。不幸的是,事实证明,在理解随机现象这个问题时,我们的直觉经常让我们失望。

先不要看说明文字,看看你能否从图2–1中找出以真正均匀的随机数作为点的坐标(也就是说,图中每个点都独立于其他点,点的横坐标落在横轴上任何位置的可能性都相等,纵坐标落在纵轴上任何位置的可能性也都相等)生成的数据集。

如果你不确定,并决定选择中间那幅图,那么你很可能有“中庸偏倚”的问题——倾向于排除极端的选项,而选择更靠近中心的选项。行为科学家证实,当在两种定价方案之间做出选择时,大多数人倾向于选择低价,而不是高价,但是如果还有第三个超高价的方案,那么居于“中间”的高价方案就会最受欢迎。 [11] 当你购买保险以对冲未来风险时,有个问题值得你好好想一想:“白金方案”是真的能带来切实的好处,还是只是为了让“黄金方案”更受欢迎?

教育心理学家同样发现,如果学生真的不知道选择题答案,那么他们在猜答案时往往会选择4个选项的中间两个,或者5个选项中的第三个。 [12] 很多活动都会受到这种影响,例如玩《战舰》游戏时(玩家在试图击沉对手的战舰时,他们更可能会猜远离两边的坐标),在架子上选择物品或选择电脑下拉菜单选项时 [13] ,甚至是上厕所时(选择中间隔间的可能性比选择两侧隔间的可能性高50%) [14]

图2-1 三个数据集,每个数据集有132个点。一个数据集表示巴塔哥尼亚海鸟巢穴的位置,一个表示蚁群巢穴的位置,还有一个表示随机生成的坐标。哪个对应哪个呢?

事实上,图2–1中真正随机分布的是最左边的那幅图。中间的那幅图表示的是蚁巢的位置,蚁巢的分布尽管有一定的随机性,但也表现出了避免靠得太近以至于挤占资源的倾向性。最右边那幅图表现的是巴塔哥尼亚海鸟筑巢地,呈现出分布更加规则和均匀的特点,这是因为它们在养育幼鸟时不喜欢离邻居太近。最左边的图是计算机生成的真正均匀且随机分布的点,这些点不会避免彼此靠近。

如果你选错了,也无须懊恼,因为你绝对不是唯一一个选错的。除了可能受中庸偏倚的影响外,我们大多数人倾向于认为随机性就是“间隔均匀”。真正随机分布的点出现的密集聚集现象和大量巨大间隙似乎与我们关于随机性的固有概念相矛盾。

正是由于这种长期形成的认知偏见,我最近的一些研究专注于找到能够完全不借助人类感知来判断空间模式是否随机的标准。 [15] 团队的研究人员使用这些工具来确定正在发育的胚胎中的细胞是否比我们预期的更分散,也用来描述并更好地理解斑马鱼条纹呈现的美丽模式。 [16]

*

随机模式不等于间隔均匀,理解这一点有助于理解奥马哈的所谓癌症病例聚集问题。由于癌症病例不是均匀分布在一个国家,而是随机分布的,因此,即使不存在致癌因素,随机分布的癌症病例仅仅因为偶然,也会发生聚集现象。奥马哈预防癌症小组在检测癌症病例随机模式时取得的偶然发现,可能是随机性导致逻辑错误的一个例子,这被称为得克萨斯神枪手谬误。

这个谬误得名于一个故事,讲的是一个得克萨斯牛仔喜欢在喝了几杯酒后去谷仓练习射击的故事。人在醉醺醺时不可避免地在谷仓的墙上留下了随机分布的弹孔,其中一些弹孔仅仅是因为偶然才集中在一起。一天早上,这位精明的“神枪手”拿出油漆罐,围绕这堆弹孔画出了一个靶心,目的是让没有看到这些弹孔形成过程的人觉得他枪法很准,同时把人们的注意力从其他更分散的弹孔上转移开。

神枪手谬误是指仅收集与给定假设相符的数据而得出结论,而忽略不支持结论的数据。错误地认定事件的关联性以及事后“画靶心”并不总是有意识的行为。在某种意义上,这个谬误可以被认为是前一章中重点介绍的证真偏倚和后见之明偏倚的产物——产生嘈杂的数据后只关注我们期望看到的东西。电视真人秀的制作就是一个经典的例子,我们从中可以看到目标明确的“神枪手”。只要拍摄的片子足够长、人物足够多,甚至是最平凡的对话片段都可以被编辑成令人信服且针对性很强的叙述。

奥马哈的家长可能在无意中犯了神枪手谬误,他们在那些集中出现在电力线区域的癌症病例周围画了一个“靶心”。虽然理解这个谬误并不一定排除了电力线和癌症之间存在联系的可能性,但它确实表明,奥马哈地区的癌症病例集中出现在电力线附近,密集程度或高或低,背后可能并没有固定的原因。

*

随机性会让我们的大脑无法做出合乎情理的推断,不幸的是,它或多或少成了我们日常生活的一部分。在很多事情上(例如下一班公交车的到达时间、音乐播放器随机播放的下一首歌曲),我们都要面对这个问题。

举个例子。记者史蒂文·列维注意到他的iPod(苹果音乐播放器)在随机播放时,史提利·丹乐队的歌被播放的次数总是特别多,于是他直接问乔布斯,“随机播放”模式是否真的是随机的。乔布斯向他保证确实如此,甚至还找了一位工程师进行了电话确认。列维随后在《新闻周刊》上发表了一篇文章,大量有类似经历的读者纷纷回应,并提出质疑,例如,在随机播放模式下,鲍勃·迪伦的两首歌曾被连续播放(他们收藏的歌曲有数千首),怎么可能真的是随机播放呢?

我们往往过于随便地将随机产生的聚集赋予某种意义,并因此推断在这种模式背后有某种动力促使其生成。这是我们与生俱来的倾向。进化论观点认为,数万年前,如果在森林里打猎或采集时听到灌木丛中有沙沙声,明智的做法是选择安全行事,尽快逃跑。也许一只猛兽正在寻找午餐,逃跑会让你保住性命。也许这只是风在树叶间随意地低语,因此你看起来有点儿傻——傻,但还活着,能够把你偏执于识别模式的基因传给下一代。

如今,在没有捕食危险的情况下,人类将这种长期磨炼的听觉技能主要用于“倒带掩码”(backmasking)——将信息藏在录音中,只有倒放能识别出来。尽管倒放的录音听起来毫无意义,但是人们声称,将齐柏林飞艇乐队的《通往天堂的阶梯》倒放,就能听到:“致我的甜蜜的撒旦,他的小路会让我伤心,他的力量是撒旦。他会给和他一起的人666。在那个小小的工棚里,他让我们受苦,悲伤的撒旦。”

尽管乐队否认他们故意将秘密信息编码到歌曲中,但1982年加利福尼亚州议会消费者保护委员会在一次会议上播放了《通往天堂的阶梯》的倒放片段,并要求对一项法案进行投票,内容是强制给含有“危险性”倒放掩码的音乐贴上警告标签(该法案最终没有通过)。自称是“神经科学家”的威廉·亚罗尔在向委员会作证时说,青少年只需要听三遍倒放掩码的歌曲,这些隐藏信息就会“作为真理保存到脑子里”,使他们成为反基督教的门徒。尽管齐柏林飞艇乐队被认为是主犯,但亚罗尔声称,他在其他乐队(包括皇后乐队和披头士乐队)的倒放音乐中也发现了一些信息。

披头士乐队1968年的歌曲《革命9》中重复出现的单词“number nine”(九号)倒放时听起来有点儿像“让我兴奋起来,死人”。约翰·列侬同一张专辑中的歌曲《我很累》结尾时的喃喃自语倒放时听起来就像“保罗死了,伙计。想他,想他,想他”。这些“发现”为保罗·麦卡特尼已于1966年11月去世、被一个替身秘密取代的阴谋论提供了证据。如果你仔细听一听这些倒放片段,无论哪一段,你都会发现你听到的声音和人们声称能听到的词语之间没什么对应关系,听歌的人很可能是没有规律却硬找规律。

这种听觉上的一厢情愿在心理学中叫作空想性错视(pareidolia)。这个概念是指观察者将模糊的听觉或视觉刺激解释为他们熟悉的东西。这就是我在引言中说的“规律识别倾向”现象,它让我的孩子们看出云的形状,也让人们看到月亮上的人。空想性错视属于更普遍的幻想性错觉(apophenia)中的一种。所谓幻想性错觉,意思是人们错误地认为不相关事件或物体之间存在联系并赋予其意义。这些错误联系会导致我们去验证不正确的假设并得出不合逻辑的结论。因此,这种现象是许多阴谋论的根源,例如,许多外星探索者认为天空中任何明亮的光都是UFO(不明飞行物)。

幻想性错觉让我们去寻找结果背后的原因,而实际上可能根本没有原因。当我们连续听到同一位歌手的两首歌时,我们以为发现了一种规律,于是迫不及待地指出有问题,而事实上,这种聚集是随机性的固有特征。

最终,由于人们对iPod真正的随机播放所固有的聚集现象不满,史蒂夫·乔布斯在iPod上实现了新的“智能随机播放”功能,这意味着下一首播放的歌曲将不会与前一首特别相似,这与我们对随机性的错误看法更一致。正如乔布斯自己说的那样,“我们减少了随机性,但人们感受到了更多的随机性”。

*

朱莉·拉姆坚信自己发现了癌症病例的规律,于是她和奥马哈的其他家长一起赶到内布拉斯加州卫生部门。但到了那里后,官员们解释说他们的证据其实就是聚集效应,是幻想性错觉的一个教科书式案例。就在他们即将失去信心,认为自己的看法无法取得政府部门的信任的时候,瑞典发表的一项大型研究 [17] 似乎为他们的假设提供了支持。

瑞典的这项研究声称,高度暴露在电力线产生的电磁场中的儿童患白血病的可能性几乎是未暴露的儿童的4倍。4倍的风险比(暴露在电力线形成的电磁场中的儿童的癌症发病率除以对照组的发病率)表明电力线影响极大,似乎很难把这个结果解释为小群体中噪声引起的意外,因为样本量很大。这项研究的研究人员非常勤奋,他们让1960年至1985年间在220千伏或400千伏电力线附近300米范围内居住了至少一年的瑞典人都参与了实验,还花了大量时间和精力来计算癌症患者在确诊时和确诊之前接收到的电磁场强度。毫无疑问,这项规模庞大、看似无懈可击的研究取得的关于电磁场强度的发现为电力线致癌提供了无可争议的证据,即使是那些对电力线致癌机制持怀疑态度的物理学家和生物学家也不得不接受。

然而,事实证明,这项研究存在一个问题,而且是一个非常普遍的问题,以至于它成了公共卫生流行病学专业的学生要学习的重要内容之一。那就是,在开始调查之前,研究人员并没有明确他们要研究什么,而是进行了大量的测量和比较。他们精心收集和高度分层的数据集十分广泛,表面上看令人赞叹,其实恰恰是问题所在。这些数据使得他们不仅可以直接比较住在电力线附近的人和其他人的癌症发病率,还可以做很多其他比较。他们可以对大量人群进行类似的分析:确诊前在电力线附近居住了2年、5年和10年的人;暴露在0.1、0.2和0.3微特斯拉场强下的人;一辈子都居住在电力线附近的人和一生中只有部分时间居住在电力线附近的人;住独立公寓的人和住多户型公寓楼的人;成人和儿童……还可以继续列举下去。研究核查了每一个亚群体多种疾病发病率增加的情况,最终计算出了800多个风险比。虽然从表面上看似乎非常周密,但实际上,这是科学研究中的一个基础性错误,被称为多重比较谬误,亦称“查看别处效应”。

当我们收集有关环境因素变化的数据并将其与各种原因导致的健康问题的发生率进行比较时,我们通常能找到数据中的变化。幸运的是,即使数据中包含很多噪声,也有许多统计检验方法可以用来评估不同因素之间存在特定关系的置信度。这些测试通常会得出所谓的 p 值,其中 p 代表概率。粗略地说, p 值是环境因素和健康问题之间确实没有关系时得到你所观察到的极端结果的概率。这个 p 值越低,置信度就越高,我们就越认为两个因素之间的相关性是它们之间关系的真实反映,而不仅仅是偶然的结果。例如, p 值为0.05则表明,平均而言,如果两个因素之间并不存在相关关系,两个因素之间的这种数据统计结果在每20次重复实验中只能偶然观察到1次(概率0.05就是每20次发生1次)。这一发现并不能确定地证明任何事情。但是,如果发现在变量之间确实没有关系时这些数据的出现概率很低,就会提高我们对存在这种关系的信心。

通常,在收集任何证据之前,应该指定一个可接受的 p 值,即研究的显著性水平。如果发现的 p 值小于显著性水平,就可以说被测试的关系具有统计显著性。不同的科学领域对结果有不同程度的置信度要求。你越想对你的发现有信心,你指定的显著性水平的值就应该越低。例如,将显著性水平定为0.01则意味着,即使没有真正的影响,平均而言,每做100次独立重复的实验,就有1次统计测试表明影响是存在的。在显著性水平保持不变的情况下,随着测试数量的增加,找到看似具有统计显著性的结果的概率就会增加。一种简单的校正方法(被称作邦弗朗尼校正)是将显著性水平除以测试次数。如果确实没有关系,那么做的测试越多,结果就越难被认为具有显著性。故意对数据集进行多种比较并且只报告具有显著性的比较,这种行为就叫作数据捕捞、数据钓鱼或 p 值操纵。

进行大型研究时,如果拟定的测试未能显示出显著的结果,那么,通过对数据进行分层,测试在不同数据子集中引起的一系列潜在影响(具体而言,瑞典电力线研究对不同亚群中电力线与一系列疾病之间关系的测试就属于此类)就有可能起到“查看别处”的效果。该研究的作者在总结研究结果时写道:“对于脑肿瘤或所有儿童癌症来说,几乎没有证据支持两者之间的联系。”但作者接着进行了800多次比较,因此,他们最终能发现一个看似显著,甚至是高显著性水平(低 p 值)的结果的可能性极大。他们最终发现,住在单户住宅、暴露在0.3微特斯拉以上的电磁场中的儿童患骨髓性白血病的风险更高。可以看到,这句话中包含多个条件,对具体的疾病和研究参与者的子群体进行了限制,在这种情况下,结果才具有显著性。

实际上,由于进行了大量的比较,因此我们不能确信这种小众性的关联是不是纯属偶然。但研究人员认为他们的结论具有显著性。他们提出一些令人难以置信的原因,试图解释为什么只有这一小部分人以这种方式受到了影响。为了解释为什么只有单户住宅家庭的研究结果具有显著性,他们甚至怀疑他们在评估多户型公寓电磁场时使用的技术可能无效。在面对随机巧合时,一些科学家似乎和我们其他人一样容易做出因果推论。

尽管有时因果关系似乎是显而易见的,但为了避免查看别处效应,科学家在开始研究之前,应该谨慎地对研究要回答什么问题加以限制。如果设计得好,最终的研究应该足以回答他们最初提出的问题,还有可能发现其他有趣的关系,引导他们提出新的问题并开展研究。因为每个数据集都会包含一些纯属偶然的模式,所以直接围绕这些模式画一个“靶心”,然后得出存在某种关系的结论,是无法令人信服的。如果我们想要找到这些数据集真正反映的问题,就必须收集更多的数据,列出要研究的问题并将这些新问题包括其中,然后开始研究。

瑞典的这项研究针对其数据集提出了太多的问题,因此最终的结果是所有答案都不可信。让朱莉·拉姆和奥马哈预防癌症小组的家长们非常失望的是,我们至今尚未发现电力线电磁场与癌症之间存在任何联系,也没有发现电力线任何其他有害健康的影响。虽然瑞典科学家本该清楚不能同时探索太多不同的方向,但掉进这个陷阱的大有人在。 J41fFgEjzZFCuugknlsrJtFR4gGd/kLgG5Ftm4PxS9ZSKSKev/TnOPE9NJhKvOPI

点击中间区域
呼出菜单
上一章
目录
下一章
×