购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第1章

统计学是大数据时代最炙手可热的学问

基尼系数是否是衡量社会分配公平程度最完美的指标?视频 网站是如何知道你喜欢的电影类型的?祈祷真的能让病人的术后 康复状况改善吗?是什么导致自闭症发病率一直走高?哪些人最 有可能成为恐怖分子?

Naked Statistics

基尼系数是否是衡量社会分配公平程度最完美的指标?视频网站是如何知道你喜欢的电影类型的?祈祷真的能让病人的术后康复状况改善吗?是什么导致自闭症发病率一直走高?哪些人最有可能成为恐怖分子?

我注意到一个有趣的现象。学生们在课堂上常常抱怨统计学课程有多么难学和无关紧要;可一离开教室,他们又会在午饭时开心地讨论某位球星的击球成功率(夏天)或寒冷指数(冬天),又或者彼此成绩的平均分数(永恒的话题)。他们会指出美国职业橄榄球联盟(NFL)采用“传球效绩指数”用以将一个四分卫的场上表现浓缩为一个数字的不当之处,认为以此作为评价球员的依据略显武断,但可以通过调整其中所包含数据(完成率、平均过球码数、触地得分率、截球率等)的权重比例重新计算,以得出一个与原来不同,但同样可信的球员表现指数。但只要是看过橄榄球比赛的人都会觉得,没有比用一个单一数字来衡量四分卫的表现更加方便的了。

关于四分卫表现的这个评价指数是完美的吗?当然不是,无论是什么问题,统计学都极少提供唯一的“正确”方法。但是,这个指数是否以一种易于理解的方式提供了一些有意义的信息呢?那是肯定的,如果想快速地对某场比赛的两名四分卫的表现做出比较,那么这个指数会是一个不错的工具。我是芝加哥熊队的粉丝,在2011年季后赛期间,熊队与芝加哥包装工队进行了一场比赛,以后者的胜利告终。我可以通过很多种方式来描述那场比赛,包括长篇累牍的分析和令人眼花缭乱的原始数据,但这里我为大家提供了一种更加简洁的分析方法。芝加哥熊队的四分卫杰·卡特勒的传球效绩指数为31.8;与此同时,格林湾队的四分卫亚伦·罗杰斯的传球效绩指数为55.4。同样的,我们可以将杰·卡特勒与他之前跟格林湾队比赛时的表现进行对比,在那场比赛中他的传球效绩指数高达85.6。两者相比较,我想大家就不难理解为什么熊队在常规赛时击败了包装工队,但在季后赛时却输给了包装工队。

这对于概括场上进行的比赛非常有用。传球效绩指数是否起到了简化问题的作用?是的,但这同时也反映了描述统计学的优势和劣势。仅凭一个数字,你就可以知道杰·卡特勒在与格林湾的那场比赛中败给了亚伦·罗杰斯;但你却无法从这个数字中读出运动员在比赛中的运气是好是坏;不知道他是否传出了一个漂亮的过人球却被愚蠢的队友错过了,导致这个球最终被对方截获;不知道他是否在比赛的某些关键时刻顶住压力发挥出色(因为每一次的成功发球在统计时都被同等对待,不论是决定性的三次触地还是比赛接近尾声时那些毫无意义的发球);不知道那一场的防守是否糟糕透顶……读不出来的信息还有很多。

令人好奇的是,同样一群人,在谈论体育、天气或成绩的时候提到数据时还是兴高采烈的,但是当研究人员开始向他们解释基尼系数时,他们的手心却出汗了。基尼系数是衡量收入不均的标准经济学工具,我在之后的内容中将对其做出解释,但是现在我要说的最重要的事情是,基尼系数实质上与传球效绩指数没有多大区别,都是将一系列复杂数据浓缩成一个单一数字的便捷工具。正因如此,基尼系数也拥有描述统计学的大多数优势,如果你想比较两个国家或某个国家不同时期的收入分配情况,该系数就为你提供了一个简单易行的方式。

基尼系数用于衡量一个国家的财富(或收入)分配的公平程度,最小为0,最大为1。计算基尼系数可以看总资产,也可以看年收入;可以以个人为计算和比较单位,也可以以家庭为单位。所有这些数据都是紧密联系的,但不会完全相同。就像传球效绩指数一样,基尼系数只是一个用作比较的工具,其数字本身并无实质意义。在一个家庭财富均等的国家里,基尼系数为0;与此相反,如果一个国家的所有财富都集中在一个家庭里,那么这个国家的基尼系数等于1。或许你已经猜到了,一个国家的基尼系数越接近于1,那么这个国家的财富分配就越不公平。根据美国中情局提供的数据(顺便说一句,这可是一个巨大的数据收集机构),美国的基尼系数为0.45。那又怎么样?

如果将这一数字放到实际情况中,我们就可以得到许多信息。例如,瑞典的基尼系数为0.23,加拿大为0.32,中国为0.42,巴西为0.54,南非为0.65。 纵观这些数字,我们能够感觉到美国在收入的公平分配方面相对落后,情况比许多国家都要糟糕。我们同样可以对不同时期的收入分配的公平情况进行比较,1997年美国的基尼系数为0.41,但在接下来的10年内,基尼系数就上升到了0.45(最近一次来自美国中情局的数据是在2007年),这就客观地告诉我们在这10年的时间里,美国虽然变得更加富裕,但财富的分配也变得更加不公平。现在我们再来看一下其他国家在这一时期内基尼系数的变化情况,加拿大在过去10年中的收入分配情况基本上保持不变;瑞典经济虽然在过去20年的时间里得到了长足发展,但其基尼系数却从1992年的0.25降到了2005年的0.23,也就是说瑞典不但变得更为富裕,其社会也变得更加公平。

基尼系数是否就是社会分配公平程度最完美的衡量指标呢?绝对不是,正如传球效绩指数也不是衡量四分卫比赛表现的完美指标一样。不过,基尼系数确实以一种便捷易懂的形式为我们提供了一个重要社会现象的一些宝贵信息。

我们慢慢地又回到了前文中所提出的那个问题:学习统计学的意义是什么?统计学能够帮助我们处理数据,而数据只不过是包裹着华丽外衣的信息。在很多时候、很多事情上,数据不仅琐碎而且并非那么重要,比如比赛数据统计;但有的时候数据却能为你打开一扇洞察人类存在本质的窗户,比如基尼系数。

但是,正如所有信息宣传片都会指出的:这不是所有情况!谷歌首席经济学家范里安在接受《纽约时报》采访时曾说,在未来10年内统计学家将会成为“性感的职业”。对此我不得不承认,经济学家有的时候对“性感”的理解确实非同寻常。但我们还是来看看下面这些彼此不相干的问题:

我们如何确认那些在统考中作弊的学校?

网飞(Netflix)是如何知道你喜欢的电影类型的?

既然不能对人体进行癌症诱发试验,那我们如何才能得知哪些物质或行

为会诱发癌症?

祈祷真的能让手术病人的状况改善吗?

从顶尖高校毕业是否就意味着更高的经济收入?

是什么推高了自闭症的发病率?

统计学能够帮助我们回答这些问题(至少也会加快我们解决这些问题的步伐)。这个世界正在制造出越来越多的数据,而且速度越来越快。但是正如《纽约时报》所指出的,“数据只不过是知识的原材料”。无论是在寻找被低估的棒球运动员,还是在更公平地分配教师工资的问题上,统计学都是我们分析信息获得有意义结果的最有力工具。下面,我们就来快速了解一下统计学是如何赋予原始数据以意义的。

◇描述性数据——击球率与大学学分

保龄球的得分是一个描述性的数据,棒球的击球率也是。对于绝大多数美国的体育迷来说,从5岁开始,他们就已经精通这些赛场上的描述统计学了。在体育以及生活中的其他领域,我们使用数字来总结信息。棒球运动员米奇·曼托到底有多棒?他的击球率高达0.298。对于一个棒球迷来说,这就是一个极有意义的陈述、一个非常耀眼的成就,这个数字囊括了他长达18个赛季的棒球职业生涯(但我却觉得有那么一点儿沮丧,一个伟大运动员一生的奋斗到头来不过就是一个数字)。当然,棒球迷们也承认,像击球率这类描述性数据在总结一个运动员的价值时,具有其他衡量标准不可比拟的优势。

在美国,衡量一个学生的高中和大学学业表现的方法是计算平均成绩点数

(GPA),通俗点儿说就是学生在校的平均成绩。如果一门课的成绩为A,那么就可以获得4点,B是3点,C是2点,以此类推。当高中毕业生申请大学、大学毕业生找工作时,GPA就是评价他们学术潜力的一个方便快捷的指标。一个GPA为3.7的学生显然要比另一个GPA只有2.5的学生的实力强,这就使得GPA成为一个受人欢迎的描述性数据,不仅计算容易、理解容易,而且对不同学生进行比较也很容易。

但这一衡量指标并不完美。GPA没有反映不同学生所选课程的难易程度,假设一个GPA为3.4 的学生选的都是相对没有挑战性的课,而另一名GPA只有2.9的学生的课程表里尽是微积分、物理这类难学的课,我们能一口判定孰优孰劣吗?我以前所在的高中就试图解决这一问题,学校规定比较难学的课程会有额外的加分,这些课程如果期末成绩为A,那么就会有5点的奖励,而非原来的4点。但这也带来了新的问题,我的母亲很快就反应过来,在新的GPA计算方法下,对于一个选了很多加分课程的学生来说(比如说我),其他普通课程就算做到最好,也就是拿到了A,最终的平均分也会被拉下来。因此,我的家长不准我在高中选修驾驶课,因为即使我做到完美,也有可能会因为这门课而错失进入顶尖大学的机会,进而断送了我成为畅销书作家的美好前程。但不学开车也是不行的,于是父母自己掏钱送我去一家私人驾驶学校学开车,那个暑假的晚上我基本都是在车里度过的。

很疯狂吧?但本书的主题之一就是,对于描述统计学的过分依赖会带来误导性的结论或导致不良行为。上一句话我原先用的短语是“过分简化的描述统计学”,可后来我把“过分简化”给删掉了,因为这个形容词是多余的,描述统计学存在的意义就是简化,因此不可避免地会丢失一些内容和细节,任何一个数字工作者对此都要心知肚明。

◇用抽样数据来解决大问题

有多少无家可归的人在芝加哥街头流浪?已婚人士多久过一次性生活?这些问题看上去风马牛不相及,但事实上它们都可以通过对基本统计工具的运用予以解答(虽然答案并非那么完美)。统计学的一个核心功能就是使用手中已有的数据进行合理推测,以回答那些我们还未掌握所有信息的“大”问题。简言之,我们能够使用“已知世界”的数据来对“未知世界”进行推断。

那么,我们就从“流浪者”这个问题开始。对于一个大都市来说,要把生活在其中的无家可归者一个一个都数出来,不仅成本高昂,而且在实际操作中也困难重重。但这又是一个非常重要的数据,能够为当地政府开展社会救济、向州和联邦政府争取拨款以及在美国国会上获得支持提供依据。一种重要的统计学做法就是抽样,也就是在一小片区域内进行数据收集,比如10多个街区,然后再根据得到的数据进行推断,对整个城市的流浪人口作一个明智的判断。抽样所需的资源要比全城计数少得多,如果使用得当,同样可以获得准确的结果。

民意调查也是抽样的一种形式。由一定数量的家庭组成的样本能够代表所属全体人口的观点,舆情研究机构会与这些家庭取得联系,针对某一个特定事件或候选人的情况询问家庭成员的看法。显然,这要比联系整个州或美国所有家庭要简单。盖洛普民意调查和研究机构认为,一个符合统计学方法、包含1000个家庭的样本能够代表整个美国的所有家庭,两者的调查结果基本能够保持一致。

通过这种方式,我们统计出了美国人性生活的频率、对象和方式。20世纪90年代中期,芝加哥大学的国家民意研究中心(NORC)针对美国人性行为开展了一项非常雄心勃勃的研究,其选取了大量具有代表性的美国成年人作为样本,调查结果就是基于这些人面对各类问题时所做出的反应和回答得出的。如果你继续读下去,保证会在第10章找到这项研究的结论。说真的,现在有几本统计学的著作能够向你承诺这些?

◇概率、风险与考试作弊

从长远看,赌场总是能够挣到钱,而且无一例外。这并不是说赌场每时每刻都在赚钱,每当赌场里的钟声和口哨声响起时,就代表某位幸运的赌客刚刚赢走了几千美元。整个博彩事业是建立在机遇游戏之上的,也就是说任何一次骰子的投掷和扑克牌的翻牌都是不确定的。但与此同时,相关事件的潜在概率又是已知的,比如“黑杰克”抽中21点或“轮盘赌”转到红色的概率是固定的。当这些游戏的概率对赌场有利时(赌场当然不会亏钱),不管场内的钟声和口哨声有多热闹,或者赌客手里的赌注积累得有多大,赌场永远都是最终的赢家。

这一统计现象在生活中所产生的影响远比在赌场里大得多。许多公司会对某些最不愿意遇到的风险进行概率评估,公司的管理层都知道想要完全避免这些风险是不可能的,就像赌场没法保证赌客们每一手牌都会输一样。但是,任何一家面对不确定因素的公司都可以通过商业流程的设计来管理这些风险,将从环境灾难到不合格产品等一系列不利因素的出现概率降至可接受的范围内。华尔街各大公司经常会对它们的投资组合进行风险评估,充分考虑不同情景的出现概率以设计出合理的应对方案。2008年金融危机爆发的部分原因,就是一系列之前被认为是极不可能发生的市场事件都成为现实,就好像赌场里的每一位赌客在某一晚同时抽中大奖一样。我会在之后的章节里向大家解释,其实华尔街的投资模型都存在缺陷,这些公司用来评估风险的数据也过于局限,但此时此刻,我想说的是,任何一个风险评估模型都必须以概率作为基础。

面对难以接受的风险,如果个人和企业无法规避,就会通过其他方式寻求保护。保险业应运而生,通过收取保费,保险公司为其客户在遭遇如车祸、火灾等不良事件后提供保护。保险公司并不是通过消除这些不良事件来挣钱,因为车祸和火灾每天都会发生,甚至汽车有可能会一下子撞进房子里引起火灾。保险公司收取高额的保费,用于支付车祸、火灾等意料之中的风险的赔偿金,然后往往还会有大量盈余。(保险公司还可以通过宣传安全驾驶、在游泳池周围装设围栏、为每个卧室安装烟雾探测器等方式来减少预期的损失赔偿。)

概率在有些情况下甚至可以被用来判断考试作弊。一家由美国学术能力评估考试(SAT)的一位开发者创办的考试安全公司,专注于提供“数据取证”服务,为客户寻找考试作弊的蛛丝马迹。举个例子,在学校或考点进行的考试,多名考生以同样的答案答错同一道题的情况是极少见的,通常发生的概率只有不到百万分之一,如果有类似的情况出现,该公司就会予以标记。其数学逻辑源自一个事实,即当大部分考生对某道题都给出了正确答案时,我们并不会感到大惊小怪,因为这是他们应该做的事情。这些考生有作弊的可能,但他们凭一己之力做对题的可能性更大。但是当这一群考生答错题的时候,他们的错误答案不应该是完全一样的,如果错误答案完全一样,那么他们就有可能是相互抄袭(或者通过短信息分享答案)。此外,还有几种情况会引起该公司的注意,比如在一场考试中,考生在难题上的正确率大大高于容易的题(这意味着他们有可能提前就知道答案);又或者在一场考试中,收上来的答题卡上“错改对”的涂改痕迹要明显多于“对改错”(这意味着有可能是老师或监考人员在考试结束后对答题卡动了手脚)。

当然,你也不难看出概率也有其局限性。一大群考生在某道题上出现相同的错误答案的情况完全有可能是巧合,事实上,如果参与评估的学校越多,我们就越有可能认为这类情况实属巧合。并不是说我们一旦在统计时发现异常情况,就马上认定考试存在作弊现象。来自亚特兰大的德尔玛·金尼在2008年中了价值100万美元的彩票,谁知到了2011年又中了价值100万美元的彩票。这种同一个人连续两次中大奖的概率只有25万亿分之一,可我们不能仅凭概率几乎为零就以诈骗罪将金尼先生关进大牢(但我们或许可以调查一下,他是否有亲戚在彩票公司工作)。概率就像是武器库里的一件武器,需要使用者有较强的判断力。

◇哪些人最有可能成为恐怖分子?

吸烟会诱发癌症吗?虽然现在我们已经有了答案,但得出这个答案的过程却要比大多数人想象中的复杂许多。如果要求证一个科学假设,科学方法要求我们必须进行控制实验,也就是要有一个对照组,除了要求证的变量以外(如吸烟),实验组和对照组之间不能有任何不同。如果我们在这两组的观察结果中发现了明显的不同(如肺癌),那么我们就能完全推断这个变量是引起不同结果的原因。但是,我们不能以人为实验对象。如果我们的假设是吸烟能诱发癌症,那么就不能随便指定两组大学毕业生,将其分为吸烟组和不吸烟组,然后在年后的同学聚会上打听谁得了癌症—这是不道德的。(如果我们的假设是某种新研制的药品或疗法或许能够改善人类健康,那么我们可以在人身上进行控制实验。我们不能在明知可能会带来不良后果的前提下以人为实验对象。)

现在你或许会说,我们完全没有必要在一开始的时候就进行这项可能会违背伦理的实验。想观察吸烟所带来的影响?很简单,跳过这套令人头晕目眩的方法论,直接前往那群毕业生的20周年毕业聚会,去看看参加聚会的人数有多少就可以了。

不行。吸烟者和不吸烟者除了吸烟与否方面的不同,在生活的很多习惯方面都会有差异。比如,吸烟的人经常会有更多的嗜好,如酗酒和暴饮暴食,后两者也会给健康造成损害。就算在20周年聚会上那些吸烟者的健康状况尤其糟糕,我们也不能说这些都是吸烟造成的,也有可能是他们的其他坏习惯带来的。而且在数据的采集上我们也会遇到麻烦,要知道数据是我们作分析的依据,但那些吸烟的校友如果患上了严重的癌症,极有可能会缺席20周年聚会(已经离世的吸烟者就更不可能在聚会上露面了)。因此,由于那些健康状况良好的校友是最有可能出现在聚会上的,任何基于出席者健康状况的分析和推断(吸烟或其他变量)都会是有缺陷的,而且距离毕业的时间越长,比如40年或50年,这种缺陷就越严重。

我们不能像对待实验室里的小白鼠那样对待同胞,因此,统计学更像是侦探们做的事。数据里隐藏着线索和模型,沿着这些线索和模型,我们最终能够得到有意义的结论。就像那些让人印象深刻的罪案调查类美剧,如《犯罪现场调查:纽约篇》,剧中展现有魅力的警探和取证专家不放过丝毫细微的证据—烟蒂上的DNA、苹果上的咬痕、车座脚垫上的一根纤维,然后再根据这些证据顺藤摸瓜地抓住凶残的罪犯。这部剧最吸引人的地方就在于,里面的专家们并不是通过那些常规的证据,如目击证人、监控录像等来抓坏人的,而是借助了科技手段。统计学基本上也是干这些事情,凌乱无章的数据就像是犯罪现场,统计分析员就是警探,通过对原始数据进行分析和加工得到有意义的结论。

在读完本书第11章的内容之后,我希望你会对《犯罪现场调查:回归分析》产生兴趣,因为这部“美剧”与其他类似的动作警匪剧有一点儿不同。回归分析是研究者用来分割某两个变量之间关系的工具,如吸烟和癌症,但同时又要保证其他重要因素及其影响不变,如饮食、运动、体重等。如果你在报纸上读到每天吃一个麸皮饼可以减少结肠癌的发病概率,你完全不需要杞人忧天地想象着有一群不幸的人被关在联邦实验室的某个地下室,每天被强迫着吃下麸皮饼,而在隔壁大楼里的控制组则可以享用到培根和煎蛋。事实上,实验人员会对数以千计的人进行详尽的信息收集,包括他们吃麸皮饼的频率,然后用回归分析的方法来完成两个关键步骤:(1)量化吃麸皮饼和患结肠癌之间的关系(例如,在其他影响癌症发病率的因素完全相同的情况下,吃麸皮饼的人患结肠癌的发病率要比不吃麸皮饼的人低9%);(2)量化吃麸皮饼和结肠癌发病率下降之间的关系只是巧合的概率(如果真的成立,则否定了上述关于饮食和健康之间关系的发现,这对于该实验来说无疑是一个逆转)。

当然,《犯罪现场调查:回归分析》里的主演们都是俊男美女,比现实生活中处理这些数据的学者们要赏心悦目得多。这些俊男美女(所有人看上去都只有二十三四岁,但都惊人地获得了博士学位)会对大量数据进行分析,通过使用最先进的统计学工具来回答重要的社会问题:什么是打击暴力犯罪最有效的武器?

哪些人最有可能成为恐怖分子?在本书随后的内容里,将会为大家介绍一个概念—“具有统计学意义的”发现,也就是说,通过分析发现某两个变量之间的联系并不只是单纯的巧合。对于学术研究人员来说,这类发现在统计学上就代表“确凿的证据”。在那部美剧中,我看到一名研究人员在计算机实验室里“挑灯夜战”(因为白天的她作为沙滩排球队的队员代表美国队参加奥运会),在这名研究员把统计分析结果打印出来之后,她终于找到了一直以来孜孜以求的结论:在她的数据集合里,有一个她认为可能会是非常重要的变量与自闭症之间有着“具有统计学意义的”联系。她必须马上与同事们分享这一重大突破!

这位研究人员拿着那页纸飞奔到大厅,但由于她穿着高跟鞋和一件过于紧身的黑色短裙,所以速度稍微受到影响。她跑到了她的男朋友的面前—一个身材健硕、皮肤晒得黝黑的帅哥,对于一个需要在地下实验室里每天工作14个小时的人来说,他是怎么做到如此健康的呢?这名研究人员把统计结果拿给她的男友看,他轻轻捋了捋下巴上修剪得整整齐齐的山羊胡,从抽屉里拿出一把格洛克18型全自动手枪,插入位于腋下的手枪套里,理了理身上价值5000美元的波士西装(我又忍不住想问一句,对于一个起始年薪才3.8万美元的年轻人来说,这身西服是不是贵了一些?)。随后,这两位回归分析专家迅速走近他们的上司—一位刚刚经历了失败婚姻和戒酒的年迈老兵……

好吧,有这么精彩的情节铺垫,难怪大家能意识到上述统计研究的重要性,但其实就算没有电视剧编剧的努力,统计研究本身也应该是精彩万分的。所有我们关心的社会挑战都少不了对大量数据集合的系统性分析(在很多时候,相关数据的收集是非常耗费财力和时间的工作,但在分析的过程中又起到了非常关键的作用,有关这一点会在第7章的内容中讲到)。刚刚关于《犯罪现场调查:回归分析》这部美剧的描述,我或许会对剧中的人物有所修饰,但对他们所要面对的那些问题的重要性,我是一点儿都不夸张的。有一篇学术文献就是以恐怖分子和“人肉炸弹”为主题的,而这类课题要是直接以人(或实验室老鼠)作为研究对象,是很难获得有用的结论的。我所在研究生院的一位统计学教授写了一本书,叫作《恐怖分子从何而来?》,该书对全球的恐怖主义袭击进行了数据统计,得出的结论之一是:恐怖分子不是极端贫困的人,受教育程度也不低。这位普林斯顿大学的经济学家阿兰·克鲁格总结道:“恐怖分子通常来自受过良好教育的中产阶级或高收入家庭。”

这是为什么呢?好吧,这暴露了回归分析的一个局限所在。我们可以通过统计分析来确定两个变量之间的强烈联系,但却无法解释为什么存在着这样的联系,在某些情况下,我们也无法确定这种联系是否为因果关系,也就是说,不知道其中一个变量的变化是否真的能引起另一个变量的变化。在恐怖主义的例子中,克鲁格教授推测,由于恐怖分子的行动一般都带有政治目的,所以只有受过高等教育和家境殷实的人才有最大的动力去改变社会,这些人尤其忍受不了某些政府部门对自由的压制,从而走向恐怖主义。根据克鲁格教授的研究,在其他因素相同的前提下,恐怖活动频繁出现的国家往往是那些实行高压政策的国家。

以上的这个讨论又把我们带回了那个问题:学习统计学的意义是什么?意义并不是要去做数学计算题,或在朋友和同事面前炫耀你学到的高级统计技巧,而是通过学习知识来认清我们的生活。

◇统计数字背后的谎言与真相

即使是在最理想的情况下,统计分析也很少告诉我们“真相”。我们通常所能做的,只是用并不完美的数据来就事论事,因此,我们总会看到有一些态度严谨的学术爱好者不同意某些统计结果或推论,而最为基本的就是对需要解答的问题本身产生质疑。体育爱好者们对于谁是“史上最佳的棒球运动员”这一问题似乎永远都达不成共识,因为对于“最佳”二字从来就没有一个客观的定义。令人眼花缭乱的描述性数据可以从某些角度对这个问题进行回答,但总是无法给出一个令所有人都信服的最终答案。正如本书下一章即将讲到的,还有很多具有深刻社会意义的问题都成为上述挑战的牺牲品。美国中产阶级的经济健康到底出了什么问题?问题的答案取决于我们如何定义“中产阶级”和“经济健康”。

我们所能收集的数据以及所能进行的实验的种类总归是有限的。阿兰·克鲁格对于恐怖分子的研究也没有夸张到用几十年的时间对几千名年轻人进行跟踪,从而确定他们中的哪些人最后变成了恐怖分子,因为这根本就是不可能实现的。我们同样也不能创造出两个完全相同的国家,其中一个国家在政治上实行高压管制,而另一个没有高压政策,然后比较发生在这两个国家的自杀式爆炸数量的多少。即使允许我们在人身上进行大量的控制实验,想要成功也不是一件容易的事,况且哪来那么多的资金?针对我们之前所提出的那个有关祈祷是否能减少术后并发症的问题,研究人员专门对此进行了大规模的调查分析,在这个过程中耗费了整整24万美元(至于结果如何,请你耐心读到第13章就知道了)。

美国国防部前部长唐纳德·拉姆斯菲尔德有一句名言:“战争是为了与真实存在的敌人作战,而不是与假想敌作战。”不论你如何看待拉姆斯菲尔德的这句话(以及他对伊拉克战争的解读),我们在研究领域同样用得上这句话。我们运用最好的数据、理论和资源来进行统计分析,但这一过程并不等同于加法或除法,正确的技术不一定能够得到“正确的”答案,电脑也不一定比人脑更加准确和无懈可击,统计分析更像是完成一个警探所要干的工作(我可没有为《犯罪现场调查:回归分析》打广告的意思)。数据总是想要告诉我们一些信息,但是面对这些信息,聪明又诚实的人经常有不同的看法。

但谁告诉过你,只要是使用统计学的人就一定是聪明又诚实的呢?正如之前所述,本书是向1954年发行、销量超过百万的经典作品《统计数字会撒谎》致敬的。现实就是,你既可以用统计数字撒谎,也有可能因为统计数字而不小心犯错。无论是哪种情况,统计分析所包含的数学精度都会被亵渎。本书将会带你认识那些最常见的统计学方面的错误和曲解,这样你就不至于犯了错还被蒙在鼓里。

那么,让我们再次回到本章中反复出现的那个问题:学习统计学的意义是什么?

总结大量的数据。

做出正确的决定。

回答重要的社会问题。

认识并运用那些能够改善我们日常做法的模型,卖更多的尿片、抓更多

的罪犯……

识别作弊者,让作恶者受到法律的审判。

评价政策、项目、药品、医疗程序和其他创新的有效性。

揪出那些运用相同的统计学手段干坏事的败类。

如果你在做这些事情的同时,还能得体地穿着波士西装或黑色紧身短裙散发魅力,那么你将会成为《犯罪现场调查:回归分析》的下一位明星。 /JkU0J/o7mCCMsK71trD1cmLDpKDK/8v1zg7Jy9/0Flnh5aWm3V6qO/fqTloXFNg

点击中间区域
呼出菜单
上一章
目录
下一章
×