对于不吃早餐的人反而肥胖这个悖论,还有另一种解释:他们的生活可能很混乱。芬兰的一项研究调查了5,500名16岁的男孩和女孩及其父母,结果发现,不吃早餐的人往往来自问题家庭,会有以下这些表现:
吸烟
缺乏锻炼
忽视教育
摄入较多高糖、高碳水化合物、高脂肪零食
饮酒过量
体重超标
美国罗得岛州对近万名青少年进行的一项研究,与芬兰的发现相符,同样表明以下表现确实存在相关性:
不吃早餐
吃快餐
体重增加
虽然存在相关性,但并不意味着存在因果关系。因此我们会提出疑问,这些青少年体重增加,是不吃早餐或吃快餐造成的吗?对此,明尼苏达大学的马克·佩雷拉(Mark Pereira)博士给出了答案。佩雷拉博士对3,000名年轻人进行了长达15年的跟踪调查,结果显示,那些每周在快餐店就餐两次以上的人,比那些每周在快餐店就餐次数少于一次的人,体重增加了4.5千克,胰岛素抵抗的上升幅度也增加了两倍。佩雷拉博士因此认定,快餐不健康,正是因为它的热量太高,“在快餐店吃一顿饭摄入的热量,通常足以满足一个人一整天的热量需求”。
什么样的人爱吃快餐呢?生活状态混乱的人。佩雷拉博士将研究对象分为白人组和黑人组,由于可耻的历史原因,美国黑人生活条件相对较差,佩雷拉博士也据此证明了社会阶层和快餐之间的关联。经过15年的研究,佩雷拉博士发现:
黑人组每周光顾快餐店2.15次,白人组是1.6次
黑人组的受教育时间比白人组少将近两年
黑人组的运动量是白人组的四分之三
黑人组看电视的时间几乎是白人组的两倍
黑人组每天比白人组多吃大约400卡路里的食物
黑人组比白人组多喝50%的软饮
黑人组比白人组多吃50%的肉
黑人组纤维摄入量显著低于白人组
罗得岛州对近万名青少年的研究,揭示了不吃早餐、吃快餐和体重增加之间存在很强的相关性,但根据佩雷拉博士的研究,我们得知导致体重增加的不是不吃早餐,而是吃快餐。而吃快餐和不吃早餐有一个共同的根源,那就是混乱的生活方式,因此我们开始了解,不吃早餐和超重之间不存在因果关系,而是反映了另一个问题,就是家庭混乱导致人们选择了不健康的生活方式。
由此可见,不吃早餐与体重增加之间可能存在关联性,但是不吃早餐并不是体重增加的原因。不吃早餐的行为本身,有助于体重减轻,但是如果将它与一系列增加体重的行为串联起来,就会与体重增加联系到一起,从而导致不明真相的流行病学家以为,吃早餐会导致体重减轻。
我们可以拿青少年吸烟和怀孕的问题做类比。吸烟的少女更有可能怀孕,但没有人认为吸烟会导致怀孕。反而是有缺陷家庭的少女更有可能吸烟,以及怀孕。有缺陷的家庭才是她们做出这些行为的原因。这件事的模型如下:
而不是:
有缺陷家庭的少女 吸烟 怀孕
甚至有报告称,日本不吃早餐的未成年女孩发生性行为的时间,比她们吃早餐的姐妹早两年(分别是17.5岁和19.4岁),由此认定相关模型是正确的,因果模型是错误的。这份报告没有在英文同行评议期刊上发表过,但是它出自日本家庭计划协会(Japan Family Planning Association),因此具备可信度毋庸置疑。这件事的模型应该是这样的:
而不是:
有缺陷家庭的青少年 不吃早餐 过早发生性行为
流行病学(源自拉丁语 epidamia ,即疾病的流行)是一门人口学,但在流行病学中,很容易混淆“因果”和“相关”这两个概念。
对“因果”的表述是这样的:
吃早餐 吃得更多 体重却没有道理地下降了
(或者)
不吃早餐 吃得更少 体重却没有道理地增加了
对“相关”的表述是这样的:
(或者)
做流行病学研究如果只关注早餐和体重,很容易将“相关”与“因果”混淆,其实为了区分它们,流行病学早就制定了“证据分级制度”。但流行病学家们有时不会十分严格地执行这份“证据分级制度”。
饮食冲突由来已久。曾经有一个临床试验,一组年轻人只吃素菜、喝清水,然后观察他们的容貌;另一组年轻人享用美味佳肴,同样观察他们的容貌。测试10天。过了10天,只吃素的年轻人的容貌比所有享用美味佳肴的年轻人,更加俊美健壮。
这是第一个被记录下来的临床试验,虽然当时它的变量控制做得非常糟糕。今天的我们一定能做得更好,现在我们已经知道,还有更为先进的方法来执行证据分级制度:
系统评价和荟萃分析
随机盲法对照实验
随机对照实验
队列研究
病例对照研究
横断面调查
病例报告
我将按照由弱至强的顺序,简单介绍一下这些方法。
这类报告以讲故事的方式描述病人的病史。“乔·博克斯先生一直吸烟,他刚刚过了80岁生日,因此吸烟能延年益寿。”再平庸的人也能看得出来,为什么病例报告只能提供微弱的因果证据。
相当于“快照式调查”。在这类研究中,人们会被问到两个问题,可能是:你早餐吃什么?你的体重是多少?上面提到的许多关于早餐的研究,都属于这一类,这些研究都是失败的,因为这类快照式的研究可能极具误导性。在一个时间点,可能刚好问到肥胖的参与者,他为了减肥而不吃早餐,或者是刚好瘦下来所以吃早餐。但让人瘦下来的原因不是吃早餐(反之亦然,让人变胖的原因不是不吃早餐);实际上是,肥胖的人比较有可能不吃早餐,身形苗条的人比较有可能吃早餐。因此,横断面调查或快照式调查,都可能得出百分之百错误的结论。
这类研究很少应用在早餐研究中,在此不做介绍。
队列研究是为了规避“快照式调查”存在的问题而进行的尝试。队列研究会挑选两组人,一组吃早餐,一组不吃早餐,若干年后再确认结果。在20世纪40、50和 60 年代,布拉德福德·希尔和理查德·多尔开展了一项著名的队列研究,揭示了吸烟会导致肺癌,两组研究对象分别是吸烟的医生和不吸烟的医生。布拉德福德和理查德于1954 年将他们的新发现公开发表,实际上在 20 世纪 30 、40 年代,为了推行希特勒的禁烟运动,德国科学家就有过这方面的发现。只不过,那时候民主国家没有人对纳粹科学感兴趣,德国的研究论文被英语国家完全忽略。
现在,我们正从观察转向实验,给参与者服用一种药物或采取其他干预措施(如不吃早餐),然后由科学家确认效果。
不过,光有实验组,少了对照组也没有意义。如果你让一组人服用药物,产生了效果,你就必须确认这些人完全没有其他原因产生这种效果,因此在临床医学中,我们要进行对照实验,将服药参与者对药物的反应,与未服药参与者的反应进行比较。但是对照组参与者一定不能由实验者挑选,因为这可能会导致结果出现偏差。因此,在临床医学中,我们进行随机对照实验时,会尽可能选择相似的两组参与者,对他们进行随机分配。
理想情况下,为了避免主观偏差,实验者和参与者都不应该知道谁是干预组,谁是对照组。遗憾的是,我想我无须解释早餐实验为什么无法进行盲法实验:盲法实验要求为对照组参与者提供安慰剂,但是我们无法提供可以冒充早餐的安慰剂。因此,最有力的实验方案无法应用到早餐研究中,但正如天文学展现的那样,没有全套实验方案,知识照样可以进步:即便没有实验,如果我们仔细观察,也能证明,地球在围绕太阳转,而不是太阳围绕地球转,前提是我们的观察必须细致入微,不带任何先入为主的偏见。
这是一个复杂的词组,描述的是一系列的复杂方法,通过这一系列方法,可以对多项实验结果进行整合,从而得出比任何一项单独实验都更可靠的结论。
临床医学制定了证据分级制度,可惜流行病学家忽视了证据分级制度,混淆了“相关”与“因果”,我希望大家能通过这本书发现其中的谬误。