喜剧演员尤金·米尔曼(Eugene Mirman)讲过一个统计学方面的笑话。他说自己经常告诉人们:“通过阅读,我发现美国人百分之百都是亚裔人。”
人们感到很奇怪,就问他:“但是,你不是亚裔人啊。”
这时候,尤金就会抖出包袱,非常自信地说:“通过阅读,我发现自己是亚裔人!”
《肥胖》( Obesity )杂志上的一篇文章,让我不由自主地想起了米尔曼的这个笑话。那篇文章在标题中提出了一个令人尴尬的问题:“所有美国人是否都会超重甚至肥胖?”也许觉得问句的力量还不够震撼,文章又给出了一个肯定的答案:“会的,到2048年就会这样。”
到2048年,我的年纪将是77岁,我不希望自己超重,但是这篇文章告诉我:我会的!
不用想都知道,《肥胖》杂志上的这篇文章引起了媒体的关注。美国广播公司(ABC)发出了“肥胖启示”的警告,《长滩电讯日报》( Long Beach PressTelegram )给出了一个直截了当的标题:“我们越来越胖了”。对这个现象稍加研究,我们就会想到最近美国人在思考国民道德现状时,面对各种不同现象所表现出来的焦躁多虑。在我出生之前,男孩子们都留长发,于是人们担心年青一代会不务正业。在我小的时候,我们喜欢玩街机游戏,于是人们觉得我们注定竞争不过勤劳的日本人。现在,我们经常吃快餐,于是人们又怀疑我们将身体虚弱、行动不便,像一摊泥一样,瘫在早已无法摆脱的沙发上死去,周围还堆满了空空的炸鸡桶。显而易见,这篇文章把这种焦虑当作经过科学验证的事实了。
我要告诉大家一个好消息:到2048年,不会人人都超重。为什么呢?因为不是所有的线都是直线。
但是,我们在前面讨论过,牛顿发现所有的线都与直线非常接近,由此催生了“线性回归”(linear regression)这个概念。社会学经常要用到线性回归分析这种统计学技术,就像居家维修要使用螺丝刀一样。我们在报纸上看到的那些内容,诸如:有很多亲戚的人会更幸福;“汉堡王”连锁店开得越多的国家,越容易面临道德沦丧的问题;烟酸摄入量减半的话,患足癣的危险就会加倍;收入每增加1万美元,美国人把选票投给共和党的可能性就会增加3%,等等。所有这些,都是线性回归分析的结果。
下面,我告诉大家线性回归分析的使用方法。假设你要分析两个事物之间的关系,比如大学学费与新生SAT平均分。你可能认为,SAT分数高的学校,很有可能收费也高,但是我们稍做数据分析,就会发现并非如此。毗邻北卡罗来纳州伯灵顿市的伊隆大学,新生数学与语言测试的平均分是1 217分,年均学费是20 441美元。与伊隆大学距离不远、位于格林波若的吉尔佛大学,学费稍高,为23 420美元,但是新生的SAT平均分仅为1 131分。
如果进一步研究多所学校的情况,比如2007年把学费与SAT分数情况报告给北卡罗来纳职业资源网的31所私立高校,就能清楚地看到某种趋势。
下图中每个点分别代表其中一所高校。靠近右上角的位置有两个点,SAT分数与学费都非常高,代表的是维克森林大学和戴维森学院。靠近底部的位置有一个孤零零的点,代表的是卡巴拉斯健康科学学院,是这些私立高校中唯一一所学费低于1万美元的大学。
上图表明,总的来说,分数高的学校收费也高。但是,高多少呢?这就需要在图中引入线性回归这个工具了。在上图中,所有的点很明显都不在同一条直线上。但是,这些点并不十分分散,我们可以徒手画出一条直线,从这些点比较集中的位置穿过。借助线性回归,无须猜测,就可以画出最接近于 所有点的直线。对于北卡罗来纳的高校,这方面的大致情况可用下图表示。
图中直线的倾斜角度约为28度,这意味着:如果学费真的完全取决于SAT分数,而且决定关系可由我在图中绘制的直线来表示,那么SAT分数每提高1分,与之相对应,学费就会增加28美元。如果新生的SAT平均分提高50分,就可以把新生的人均学费提高1 400美元。(从学生家长的角度看,孩子的分数提高100分,就意味着家长每年要多支付2 800美元的学费。由此可见,考试辅导班比我们预想的要贵得多!)
线性回归是一个非常实用的工具,用途广泛、操作简便,只需要在数据表上点击鼠标即可完成。这个工具可以用来处理包含两个变量的数据集(就像前文中我绘制的那些图),而且,在处理含有三个变量甚至1 000个变量的数据集时,效果同样好。在希望了解哪些变量对其他变量有作用以及作用方向时,我们第一个想到的就是线性回归。不夸张地说,线性回归可以处理所有数据集。
线性回归应用广泛,这既是一个长处,也会带来问题。我们尚未考虑正在建模的现象是否真的接近于线性,就可能会迫不及待地对其进行线性回归,但这样做肯定是不妥当的。的确,我说过,线性回归就像一把螺丝刀,但是从另一个方面看,它更像一把锯。如果未经考虑拿来就用,那么后果可能会相当可怕。
以上一章讨论的导弹发射为例。也许,导弹根本不是我们发射的,甚至有可能我们就是导弹要袭击的目标。因此,我们迫切希望尽可能准确地分析导弹的运动轨迹。
如果我们已经把导弹在不同时间点上的竖直位置绘制成5个点,那么这幅图大概如下图所示:
接着,我们迅速完成了线性回归并得出了完美的分析结果。我们画出的直线几乎正好从那5个点上穿过:
(一旦完成上述操作,就代表我们的手正在伸向锯子锋利的锯齿。)
这条直线为导弹的运动轨迹建立了一个精准的模型:在飞行过程中,导弹每分钟都会升高固定的高度,比如说400米。一小时之后,导弹会飞升到距离地面24 000米的高度。那么,导弹何时落地呢?根本不会落地!这条直线将一直向上延伸,这就是直线的特点。
(血花飞溅,皮开肉绽,凄厉的惨叫声。)
不是所有的线都是直线,所以导弹的运动轨迹绝对不可能是直线,而是抛物线。就像阿基米德的圆一样,近距离观察这条抛物线,就像一条直线。正因为如此,在跟踪到导弹之后,线性回归可以成功地告诉我们5秒之后该导弹所在的位置。但是,如果间隔了一个小时呢?想都别想!我们根据模型预测导弹会处于平流层下层,而实际上导弹可能就要落到我们的屋顶上了。
针对这种不假思索就进行线性回归的最生动警告,不是统计学家发出的,而是来自马克·吐温(Mark Twain)。他在小说《密西西比河上的生活》( Life on the Mississippi ) 中写道:
176年前,密西西比河在凯罗与新奥尔良之间的河段长1 215英里 。经过1722年的截弯取直之后,这个河段缩短为1 180英里,之后在美洲湾取直之后,缩短为1 040英里。再后来,这个河段又缩短了67英里,因此,现在它的长度仅为973英里……在176年的时间里,下密西西比河缩短了31英里多。因此,只要不是瞎子和白痴,稍做冷242英里,平均每年缩短1静的分析,我们就不难推测出,在距明年11月有100万年间隔的鲕状岩志留纪时期(Old Oolitic Silurian Period),下密西西比河应该有130万英里长,像一根钓鱼竿一样,远远地伸出墨西哥湾。同样,我们也会推测出,再过742年,下密西西比河将只有131英里长。到那时,凯罗与新奥尔良会连成一片,那里的人们在同一位市长与同一个市政委员会的领导下,勤勤恳恳地过着舒舒服服的日子。这就是科学的魅力,只要对事实稍加调查,我们就能生出无数的猜想。
微积分的方法与线性回归十分相似,两者都是纯机械性方法,用计算器就可以完成。但是,如果漫不经心,就会犯严重的错误。在微积分考试中,题目可能要求在水壶上凿一定尺寸的洞,让水以一定流速从壶中流出,并流淌若干时间,然后要求你计算壶中所剩水的重量。在时间比较紧张的情况下,学生做这类题目时很容易犯计算错误。有时,因为计算错误,学生可能会得出荒谬的结果,例如壶中水的重量是–4克。
如果学生的答案是–4克,并且潦草地在试卷上写下一行十分沮丧的话:“我算错了,但是我找不到哪里出错了”,那么,我会给他们一半的分数。
如果他们只写下“–4克”作为答案,他们就会得零分,哪怕整个推导过程都正确,只是在中间某个地方把一个数字搞错了。
计算积分或者进行线性回归,用计算机就能完成,但是,判断所得结果是否有意义,或者判断所采用的方法是否正确,则离不开人的智慧。我们在教授数学时,应该告诉学生如何应用人的智慧,否则,我们培养出来的学生从本质上就会与微软的Excel程序没什么两样,而且反应迟钝、漏洞百出。
但是,坦率地讲,有很多数学课程真的就是这样。下面我向大家介绍一个复杂漫长又充满争议的情况(尽管我长话短说,但是所说的内容仍然富有争议性)。几十年来,针对儿童的数学教育一直是所谓的“数学战争”的战场。一方面,有些老师强调熟记规则、解题过程流畅、遵从传统的运算法则,力求答案精准无误;另一方面,有些老师则认为在教学过程中应让学生掌握所学内容的含义,学会正确的思考方法,引导学生去发现,而不要求得出标准答案。第一种方法被称作传统教学,而第二种则被称作教学改革,尽管这种被视为打破传统、鼓励发现的方法已经以某种形式存在了几十年,但人们对所谓的“改革”是否真的可以称作改革依旧争论不休。在数学的盛会上讨论政治或者宗教,本身也无可厚非,但是以讨论数学教学法开始、以某人因为反对传统教学法或教学改革而怒气冲冲地拂袖而去收场,就很不应该了。
我自认为不属于任何一个阵营。有些改革派希望不要要求学生背诵乘法表,这样的做法我不敢苟同。在认真思考数学问题时,我们有时必须完成6×8这样的运算,如果我们每次都要使用计算器,思路就会被打断,无法认真思考。在写十四行诗时,如果每个单词都要查字典,那么这首诗将永远无法完成。
有的改革派步子迈得太大,他们甚至认为,如果经典运算法则(例如,“在求两个多位数的和时,如果需要,可以列竖式计算”)影响学生独立地了解数学对象的属性,就应该从课堂教学中移除。
这种观点让我觉得很可怕:这些运算法则是人们辛勤钻研的成果,是十分有用的工具,我们没有理由非得一切从零开始。
与此同时,我认为我们的确有充分的理由将某些运算法则从现代教学中移除。比如,我们无须教学生用笔算或心算的方式开平方(尽管从我个人的长期经验来看,用心算的方式开平方,可以在派对中吸引一大群没有社交经验的人)。计算器是人们辛勤钻研的成果,必要时我们可尽情使用。即使我的学生不会用长除法计算430除以12的商,我也觉得无伤大雅,但是我要求他们必须对数学有足够的感觉,能够估算出这道题的得数略大于35。
人们之所以过分强调运算法则与精确计算,原因在于运算法则与精确计算易于评判。如果我们把数学的目标仅定为“得出正确答案”,并以此作为测试依据,那么我们培养的学生很有可能考试成绩优秀,却对数学一窍不通。这样的结果对那些单纯以考试分数为唯一学习目标的人来说,是令人满意的,在我看来却不妥当。
当然,如果我们培养的大批学生对数学的含义浅尝辄止,无法快捷正确地解题,结果同样不能令人满意(事实上,这样的结果甚至更糟糕)。数学老师最不希望听到学生说“我明白这个概念,但是不会做题”。其实,这句话的意思就是“我没弄明白这个概念”,只不过这名学生并不自知。数学概念有时非常抽象,只有应用到具体计算当中才有意义。威廉·卡洛斯·威廉姆斯(William Carlos Williams) 说过一句简明扼要的话:凡理皆寓于物。
这场较量在平面几何领域进行得最为激烈。平面几何是教授证明方法的最后阵地,而证明是最基础的数学行为。在众多专业的数学人眼中,平面几何是捍卫“真正的数学”的最后防线。但是,我们在教几何学时,对证明过程的唯美、作用及意外发现应以怎样的度为宜呢?这个问题还没有明确的答案。几何教学很容易变成重复性练习,就像一次性完成30道定积分练习题那么枯燥乏味。这样的情形非常可怕,因此菲尔兹奖获得者戴维·芒福德(David Mumford)建议彻底放弃平面几何教学,代之以编程基础课程。毕竟,计算机程序与几何证明有很多共通之处:两者都要求学生从多个可选项中找出若干非常简单的内容,依次将它们组合到一起,形成序列,用于完成某个有意义的任务。
我没有芒福德那么偏激,事实上,我的观点比较温和。虽然有可能两边不讨好,但我认为数学教学既要重视答案的精确,也要鼓励明智的含糊,既要培养学生熟练运用已有运算法则的能力,又要引导他们在较短时间内掌握解题所需的常识。总之,数学教学应做到张弛有度,否则,我们所从事的活动就根本谈不上是数学教学。
这样的要求虽然比较高,但是,优秀的数学教师就应该埋头教学。至于数学战争的问题,还是交由管理部门去考虑吧。
到2048年,到底会有多少美国人超重呢?看看王友法(音)与合作伙伴完成的“肥胖”研究项目,我们就能猜到这个问题的答案。美国国家健康和营养调查(NHANES)选择大量有代表性的美国人作为样本,跟踪调查他们的健康数据,内容涉及听力衰退、性传播疾病等多个方面。该研究还给出了超重美国人的精确占比,在这项研究中,超重的定义是体重指数超过25。 毫无疑问,在最近几十年内,美国人的超重现象越来越普遍。20世纪70年代初,体重指数超过25的美国人不足半数,到90年代初,这个数字接近60%,到2008年,几乎有3/4的美国人都超重了。
我们可以用反映导弹在垂直方向上的飞行路线的方式,将肥胖的普遍程度随时间发生的变化绘制成图:
据此我们可以进行线性回归,其分析结果大致为:到2048年,这条线会越过100%。
因此,王友法在论文中断言,如果这种趋势继续下去,到2048年,所有美国人都会超重。但是,这种趋势不会也不可能继续下去。否则,到2060年,超重美国人的占比将达到109%。
在现实中,超重人口将不断增加,其走势如下图所示,可表示成朝100%接近的曲线。
在万有引力的作用下,导弹的飞行路线呈抛物线状,而超重人口的增长态势并不遵从某种严格的规则,不过与医疗卫生领域的研究结果一样,其轨迹也接近于抛物线。超重人口的比例越高,未来体重可能超重的人就越少,因此超重人口的比例向100%靠近的速度越慢。实际上,在100%以下的某个时候,增长曲线可能会变成水平线。我们身边总会有瘦子,实际情况也确实如此。仅仅过了4年,NHANES的分析结果表明,超重人口比例的增长速度就已经慢下来了。
但是,《肥胖》杂志刊登的这篇文章还掩盖了人们在数学与常识方面犯下的一个更严重的错误。线性回归易于操作,一旦尝试过,就会乐此不疲,因此,王友法及其合作伙伴将他们收集的数据按照种族与性别进行分组。例如,黑人超重的比例低于美国人的平均水平,更重要的是,他们当中超重人口的增长速度是美国超重人口平均增长速度的一半。如果我们将黑人的超重人口比例叠加到美国的超重人口比例之上,再结合王友法及其合作伙伴所做的线性回归,就会得到下图:
黑人们的情况多棒啊,他们要到2095年才会全体超重,在2048年,黑人超重人口的比例为80%。
看出其中存在的问题了吗?如果全体美国人在2048年都会超重,那么美国黑人中那1/5的不超重的人在哪里呢?难道被放逐到海外了吗?
在这篇论文中,这种基础性矛盾竟然无人提及。这样的流行病学分析跟上文所说的水桶中还剩–4克水的计算结果没有任何区别,简直毫无意义!