购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第1章
数据从哪里来

案例分析

你可能读了几个月的报纸,或者看了几个月的电视新闻,却没有见过一个代数公式。难怪你会认为代数看上去和日常生活完全无关。但是,你不可能一整天都接触不到统计数据和结果。比如,一则新闻提到在18~24岁年龄段的人中,有70%的人认为从互联网上下载音乐与购买二手音乐光碟或从朋友那里借来转录的做法没有区别。而对于65岁或以上的人来说,持相同观点的人只有36%。一篇更长的文章写道,得到高质量日间看护的低收入家庭的孩子,几年后在学业方面的表现更佳,与其他低收入家庭的孩子相比,未来更有可能考上大学、找到好工作。

这些数据是从哪里来的呢?为什么我们可以相信这些数据,或者不应该相信这些数据?好的数据是人类智慧劳动的成果,坏的数据则源于懒惰或者不求甚解的行为,只能误导他人。当有人向你抛来一个数字时,你应该问的第一个问题就是:它来自何处?

2008年美国总统大选期间,有一个全国性的项目叫作“大家去投票”,人们从罐中选择一粒软糖,代表他们支持的总统候选人。在佛罗里达州彭布罗克派恩斯的“咖啡苑”(Coffee Scene),顾客可以在每次买东西时挑选一粒蓝色或者红色的软糖。蓝莓软糖表示投票给民主党总统候选人巴拉克·奥巴马,红色草莓软糖表示投票给共和党总统候选人约翰·麦凯恩。

全美有34个州的超过100家餐馆参与了这项活动,每周一清点投票结果。截至2008年10月13日,投票总数超过211000张,麦凯恩在这场全国性的软糖投票中获得了53.5%的支持率。2004年美国总统大选期间的软糖投票结果,曾准确预测出小布什将赢得总统大选。约翰·麦凯恩却没有那么幸运,投票结果错误地预测麦凯恩将在2008年的美国总统大选中胜出。

对于这个投票结果,我们该如何解读呢?在本章的最后,你将了解到,针对这个软糖投票活动产生的数据,如何提出一些基础性问题。对这些提问的回答,将帮助我们评估这个投票数据的优劣,我们将在第2章深入探讨这个问题。

个体和变量

统计学是关于数据的科学。我们甚至可以说它是“数据的艺术”,因为只有通过正确的判断乃至好的品位和扎实的数学知识,才能得出好的统计数据。好的判断中的一大部分取决于你应该度量什么,以使得出的数据有助于解释你所关心的问题。我们先从一些与数据相关的基本术语入手。

个体与变量

个体 是一组数据所描述的对象。个体可以是一群人,也可以是一些动物或者其他物品。 变量 指的是某一个体的特征,不同个体的变量可以取不同的值。

举个例子,这是统计学课程结束时,教授手中的成绩数据库中的头几行:

在这里,个体指的是选修这门课程的学生。除了学生的姓名之外,还有三个变量。第一个变量是这名学生的专业,第二个变量是该名学生所得的分数(总分为500分),第三个变量是该名学生的成绩等级。

尽管统计学是和数字打交道,但并非所有的变量都要用数字表示。有些变量代表的是“类别”,只需将个体归入不同的组别或种类即可。在这个例子的三个变量中,只有总分数是用数值表示的,专业和等级都是类别变量。统计类别变量时,我们采用的是计数或者百分比的方式。例如,我们可以给出得到等级A的学生的百分比,或者给出主修心理学的学生的百分比。

选择变量时的错误判断,可能导致在数据上浪费大量时间和金钱却徒劳无功。怎样才能做出好的判断,这可能是个富有争议性的问题。下面的例子展示了在判断应该收集哪些数据时面临的挑战。

例1 谁在做资源回收?

是谁不嫌麻烦地在做资源回收呢?在加利福尼亚州某个城市的两个社区,暂且命名为“上流社区”和“中低社区”,实验人员花费了大量的时间和金钱,将住户拿到屋外的垃圾过磅称重。因为垃圾和回收物的数量是按照住户而不是人头计算,在这里,个体就是两个社区的所有住户,变量是每周路边回收箱里垃圾的重量。

“上流社区”每周平均的垃圾重量要比“中低社区”大,我们是否可以据此说富人更严肃地对待垃圾回收这件事呢?不能。有人注意到,“上流社区”的垃圾桶里有很多沉重的玻璃酒瓶。而在“中低社区”,人们扔进垃圾箱的多是轻质塑料汽水瓶和啤酒铝罐。结论是,重量很难告诉我们人们履行资源回收承诺的实际情况。

例2 你是哪个种族?

全美人口普查时调查人员会问“你属于哪个种族”,每个家庭成员都要回答这一问题。“种族”是一个变量,美国人口普查局必须给出种族的准确定义。普查表格上列出了一个种族名单,多年来美国政治能够顺顺当当不出问题,主要归功于这个名单。

名单上应该列出多少个种族?用什么名称来代表它们?需要把混合种族列为一个独立的类别吗?亚裔人想要划分出更多的种族,比如菲律宾人和越南人,因为亚裔人口一直在增长。太平洋岛国的人希望与其他较大的亚洲族群分开。黑人领袖不希望出现混合种族类别,因为担心太多的黑人选择这个类别,将减少黑人人口的官方统计数量。

2010年的普查表(图1–1)最终列出了6个亚洲族群(加上“其他亚裔人”)和3个太平洋岛国族群(加上“其他太平洋岛国人”),表上没有出现混合种族一项,但人们可以选择多个选项。也就是说,填报混合种族的人可能会被计入多个族群,因此这个数据会比总人口大。因为无法确定如何称呼黑色人种,人口普查局用了“黑色皮肤,非裔美国人或黑人”这一说法。拉丁裔呢?这是另外一个问题,因为他们可能属于任何一个种族,而且无法找到一个能让所有人都满意的说法来代表他们。因此,只能问人们是否属于“西班牙裔、拉丁裔或祖先来自西班牙”。

在种族问题上存在的争执提醒我们,数据反映了社会。种族是一个社会概念,而不是一个生物学事实。在普查中,你可以决定自己属于哪个种族。种族在美国是一个敏感问题,出现争执也不足为奇。人口普查局的方法似乎是一种不错的折中之策。

图1–1 2010年美国人口普查表第1页

观察研究

纽约扬基队的前接球手和经理约吉·贝拉,以其幽默的话语为人所知。他曾说:“你只要观察,就能看到很多东西。”有的时候,你能做的也只有观察了。想知道黑猩猩在野外的行为,你得观察。想研究老师和小朋友在教室中的互动行为,你也得观察。若观察者知道自己应该看的是什么,就会容易一些。黑猩猩专家可能对雌猩猩和雄猩猩的相互影响有兴趣,或者想知道黑猩猩群中的某几只黑猩猩是否有统治权,以及黑猩猩会不会猎食动物。事实上,大家一直以为黑猩猩是食草动物,直到珍妮·古道尔在坦桑尼亚的贡贝国家公园仔细观察了它们的行为。现在人们已经清楚地知道,肉类是黑猩猩日常饮食的一部分。

刚开始的时候,观察者可能不知道应该记录些什么。然而迟早会出现一些模式,帮助我们决定应该衡量哪些变量。比如,黑猩猩多久猎食一次?单独行动还是群体行动?多少只一起行动?只有雄性还是雌、雄都有?在它们的食物中肉类占多大比重?系统地观察,再加上清楚地定义变量,会比只观察更有说服力。以下是一个计划完善(且很花钱)的观察研究案例。

例3 高压电缆会引发儿童白血病吗?

电流产生磁场,所以电力会让人们暴露在磁场之中,住在高压电缆附近则增加了这种暴露的程度。强磁场确实会干扰实验室里做研究用的活细胞。如果我们住在高压电缆附近,那么磁场会对我们产生何种影响呢?一些数据表明,住在这种环境里,可能会有更多的儿童患上白血病。

我们不能为了做实验而让孩子们几周或者几个月暴露在高压电缆的磁场中。由于白血病比较少见,而且除了磁场之外,居住地之间还有很多不同,因此对于住在或多或少暴露在磁场中的住所的儿童,很难比较癌症发病率。较为简单的方法是从那些已患白血病的儿童着手,把他们和未患白血病的儿童做比较。我们可以查找许多可能的原因,例如食物、杀虫剂、饮用水、磁场等,看看这些患白血病的儿童和正常儿童有何不同。这些广泛的研究表明,我们有必要对磁场做进一步深入研究。

最终,有人花了5年时间和500万美元,对磁场进行了极为细致的研究。实验人员调查了638名白血病患儿和620名未患白血病的儿童的情况。实验人员走访了这些儿童的家,在他们的卧室和其他房间,以及房子的前门处测量了磁场强度。实验人员不仅对这些儿童住所附近的高压电缆情况做了记录,还对这些孩子的母亲在怀孕时的住处附近的高压电缆的情况也做了记录。结论是,没有任何证据证明磁场和儿童患白血病之间存在相关性。

“没有证据”显示磁场和儿童患白血病有关,但这并不表示暴露在磁场下就完全没有风险,而是说在经过非常严谨的研究之后,不能得出“磁场有导致儿童患白血病的风险”的结论。换言之,该项研究不能为观察到的结果提供有说服力的证据。有些批评家认为这个研究漏掉了一些重要的变量,或者参与研究的儿童不具有代表性。不过,一个有详尽计划的观察研究,肯定比随口,甚至带有情绪化地说出几个癌症病例,更令人信服。

反应变量与观察研究

反应变量 是用来表示研究结果的变量。

观察研究 指的是观察一些个体,并衡量我们感兴趣的变量,但并不试图影响反应变量。观察研究的目的是描述一个群体或一种状况。

知识普及

你可能会大吃一惊,一个对记者和科学家的抽样调查竟然会发现巨大的沟通鸿沟。记者认为科学家骄傲自大,而科学家认为记者愚昧无知。我们无意偏向哪一边,但从这项抽样调查中得出了一个有趣的结果:82%的科学家认为“媒体对于统计学的了解很少,无法对医药和其他领域的新发现做出客观的阐释”。

抽样调查

有句谚语说:“你不必吃完整头牛,就能知道肉老。”这就是抽样调查的精髓,即通过一部分获知全体的情况。“抽样调查”(sample survey)是一种很重要的观察研究方法。他们只研究目标对象中的一部分人,选中这些人并不是因为实验人员对他们特别感兴趣,而是因为他们具有代表性。以下是用来讨论抽样的词汇。

总体和样本

总体 (population)是指我们研究的全体对象。

样本 (sample)是总体的一部分,我们从样本中搜集信息,以便对总体做出推断。

请注意,总体就是我们想研究的所有目标对象。如果我们想得到关于美国大学生的信息,那么所有美国大学生就是我们的总体;即使在选取样本时,因受条件所限只能从一所大学里抽样,总体仍然不变。要想从样本中得出结论,必须先知道该样本代表的总体是什么。比如说,选前民意调查到底问了哪些人的意见?是所有成年人,美国公民,已登记的选民,还是民主党人?样本只包括我们成功获取信息的那些人,如果在调查中有些被选中的人联络不上,那么这些人就不包括在样本中。

总体和样本的区别,在统计学里是很基本的知识。以下的例子会说明总体和样本的区别,介绍抽样调查的一些主要用途,还会指出我们对样本中的个体进行衡量所涉及的变量。

例4 盖洛普民意调查

盖洛普和许多新闻机构经常进行民意调查,询问人们对各种问题的看法。此处要测量的变量,就是人们对公共问题的看法。尽管在选举期间特别受关注,但其实这类民意调查每年都会定期开展。

总体:18岁及以上的美国居民,其中包括非美国公民,以及非法移民。

样本:通过电话访谈的1000~1500人。

例5 当前人口调查

美国政府的经济和社会数据,来自对全美国的个人、住户或企业所做的大规模抽样调查。美国最重要的政府抽样调查是每月一次的“当前人口调查”(Current Population Survey,CPS)。在当前人口调查记录的变量中,有许多和住户中16岁以上人口的就业状况有关。政府公布的每月失业率就来自于当前人口调查,当前人口调查也记录了其他经济和社会变量。

总体:超过1.17亿个美国住户。请注意这里指的是住户,而不是个人或家庭。一个住户是由所有住在同一所房子中的人组成的,不管他们之间是否有血缘关系。

样本:每月走访的大约60000个住户。

例6 电视收视率调查

“市场调查”(market research)被用于了解消费者的喜好和他们的产品使用情况。市场调查的一个典型例子就是尼尔森媒介研究所做的电视收视率调查。尼尔森给出的结果关系到广告商愿意花多少钱购买某个节目的广告时间,以及这个节目是否还会继续播下去。

总体:超过1.14亿个拥有电视机的住户。

样本:大约25000个同意尼尔森公司用收视率记录仪采集他们观看电视节目情况的住户。

所记录的变量包括住户的人数、年龄和性别,是否每个时段都开着电视机,以及谁在看、看什么节目。

例7 综合社会调查

“综合社会调查”(General Social Survey,GSS)一般由芝加哥大学全国民意研究中心每隔一年进行一次,是最重要的社会科学抽样调查。调查变量涉及调查对象的个人和家庭背景、经历和习惯,以及对从堕胎到战争的各种话题的态度和看法。

总体:美国住户中的成年人(18岁及以上),不包括诸如监狱囚犯和住在学校宿舍的成年人,也不包括无法用英语交流的人。

样本:大约3000名在住所中接受调查的成年人。

练习

1.1 联邦政府资助。 美国有线电视新闻网民意调查公司在2010年9月1日~2010年9月2日做了一项民意调查,他们问:

(a)你认为联邦政府是否应该资助从人体胚胎中提取干细胞的研究?

(b)美国有线电视新闻网民意调查报告说对1024名随机挑选的美国成年人进行了电话访谈,你认为这个调查的总体是什么?样本是什么?

大部分统计研究使用的样本都是“广义”的样本。比如,例3中的638个白血病患儿被视为所有白血病患儿的代表。我们通常把“抽样调查”这个词留到有计划地抽取样本,对总体进行研究的时候才用。那些白血病患儿是专门治疗儿童癌症的治疗中心的病人,专家认为,即使他们全都来自一些特殊的医院,也可以代表所有的白血病患儿。抽样调查可不能依赖专家观点,而要从一个总体开始,采用可以量化的特定方法从中抽取能代表总体的样本。从第2章到第4章,我们将专门讨论抽样调查这门艺术和科学。

普查

抽样调查只观察总体的一部分,为什么不观察全部呢?普查才需要观察总体。

普查

普查 (census)是试图把总体纳入样本的抽样调查。

美国宪法规定每10年要做一次全国人口普查。要对这么大的总体做普查,既费钱又耗时。即使美国联邦政府负担得起普查费用,仍然还得利用抽样调查的方法,比如通过当前人口调查获取失业率及其他许多变量的即时数据。若政府真的询问全美每一个成人的工作状况,那么这个月的失业率数据恐怕要等到明年才会得到。为了省钱,2010年的普查只有10个问题,其中5个是常规问题,另外5个问题要求被调查的住户中的所有人都要回答。

所以,从时间和金钱的角度来看,抽样调查比普查划算,而且抽样调查还有其他优点。假如你要测试烟花或保险丝的功能是否正常,最好使用抽样调查法,因为测试过的产品就不能用了。还有,比起普查,抽样调查反而可能会得到更精确的结果。派职员去检查所有50万个零配件是否合格,不如让他仔细做一个样本抽查,人在烦躁的时候是不会得到准确结果的。

美国人口普查局的经验提醒我们,普查只能“试图”对总体进行抽样调查。在写本书的时候,美国2010年的普查结果还未公布,但人口普查局估计2000年普查遗漏了0.12%的美国人口,其中包括2.78%的黑人,他们大多住在内陆城市。即使有政府的强大资源做后盾,普查也不能做到不出错。那么,为什么要做普查呢?政府需要每个街区的详细资料,才能划分出人数大致相同的选区。美国人口普查的主要作用,就是提供这些本地信息。

知识普及 普查是否过时了?

美国从1790年开始,每10年进行一次人口普查。但是,科技日新月异,全国性人口普查很有可能被其他方式取代。丹麦没有人口普查,法国也准备取消人口普查。丹麦对全国居民进行登记,居民有身份证,只要搬家就得变更登记信息。法国打算用一个大型抽样调查取代人口普查,这个调查将在不同的区域轮流进行。美国人口普查局也有类似的想法,美国社区调查(American Community Survey)项目已经启动,而且繁杂的普查问卷在2000年就被取消了。

实验

抽取样本的目的,是为了了解总体的真实情况,而且在搜集信息时应尽量避免受到干扰。所有观察研究都遵循同一原则:观察就好,但别干扰。当珍妮·古道尔刚开始在坦桑尼亚观察黑猩猩时,曾设立了一个食物补给站,黑猩猩在那里可以吃到香蕉。随后她便认识到这个做法不对,因为这很有可能会改变黑猩猩的行为。

“现在吃那根香蕉吧,那位和善的统计专家正盯着我们看呢。”

另一方面,我们做某些实验的目的就是要改变行为。在实验过程中,我们不只是观察个体或者问他们问题,而是刻意做了某些处理,以便观察其反应。实验可以帮助我们解答诸如“阿司匹林能降低心脏病发作的风险吗”,“如果让大学生在看不到商标的情况下品尝百事可乐和可口可乐,大部分学生会更喜欢百事可乐吗”之类的问题。

实验

实验 (experiment)中实验人员会刻意对某些个体进行某些处理(treatment),以观察其反应。实验的目的是研究某个特定的处理是否会导致个体的反应发生变化。

例8 帮助领取福利救济的母亲们找工作

华盛顿特区城市研究所报告说,大多数领取福利救济的成年人都是有一个或两个孩子的二三十岁的单身母亲。针对这些领取福利救济的母亲的观察研究表明,大部分人都有工作能力,有些人还自愿参加工作培训以提高自身的工作技能。是否应该要求所有身体健康的领取福利救济的妈妈们都参加工作培训和找工作呢?这项观察研究无法告诉我们这样的政策会产生什么影响。就算这项观察的对象是所有领取福利救济的母亲们的一个合适的样本,那些参加培训和找工作的母亲也可能在很多方面与其他没这样做的母亲存在差异。例如,实验人员从观察中了解到前者接受过更多的教育,她们也有可能在价值观和动机方面不同于后者,而这些特征是无法观察到的。

想要知道这样的计划能否帮助那些母亲脱离福利救济,可以采用这样的方法:选择两组申请福利救济的母亲,要求其中一组参加工作培训,而另一组不参加。这是一个实验。若干年后,通过比较两组人的收入和工作记录就可以看出,要求她们参加工作培训是否能达到我们预期的效果。

练习

1.2 把讲义上传到班级网站上。 为了确定怎样做对学生的帮助最大,一位教育研究者查阅了他所教的几个班级的学生的网上留言,他发现学生们提到最多的是教师讲义被上传到班级网站上供大家下载这件事。于是,该研究者建议教师将讲义上传至班级网站。这是一个观察研究还是一项实验?

福利救济的例子说明,实验比观察研究更有效。从原则上说,实验可以为“因果关系”(cause and effect)的存在与否提供良好的证据。如果我们适当地设计实验,就可以从两组较为相似的领取福利救济的母亲开始。她们之间当然会存在年龄、受教育程度、子女人数及其他方面的差别。但是,当我们检视两组中所有实验对象的年龄、受教育程度、子女人数时,发现这两个组的情况很接近。实验过程中,虽然她们的生活都不一样,但是两组实验对象之间只有一项“系统性差异”(systematic difference),那就是一组参加了工作培训,而另一组没有。大家都经过了同样的经济繁荣或不景气的状况,以及观念的改变,等等。如果参加培训的那一组在工作表现和赚钱方面都远胜另一组,我们就可以说参加工作培训确实带来了令人满意的结果。

实验可以提供好的证据,证明某项处理的确产生了某种反应,这是统计学的一个重要概念。这个概念还附带了一个重要的提醒:统计结论是针对一群个体从“平均的角度”(on the average)得出的结论,而非针对任何特定的个体。从平均的角度看,参加工作培训的实验对象的收入比没参加的人高。这说明我们预期的目标达成了,但并不代表每个参加培训的人都会受益。这个概念也会引发一个大大的疑问:如果我们希望工作培训计划能增加实验对象的收入,那么,只让某些女性参加,却不让其他人参加,会不会有点儿不道德?在第5章和第6章中,我们将会说明怎样设计好的实验,在第7章中我们将会讨论相关的伦理问题。

小结

本章要点

• 任何一个统计研究都会记录关于一些个体(人、动物或物品)的数据,也就是一个或多个变量的值。

• 有些变量,比如年龄和收入,属于定量数据数值,而有些变量,比如职业或性别,则属于定性数据。要确保研究变量可以给你想要的信息。

• 对于任何一项统计研究,你最需要知道的是数据是如何产生的。观察研究是指,在只观察而不造成干扰的情况下搜集信息。

• 抽样调查是观察研究当中很重要的一种方式。抽样调查是从某个特定的总体中抽取样本,然后从样本中获得有关总体的信息。

• 普查试图对总体中的每个个体进行测量。

• 实验会对个体做某种处理,然后观察个体的反应。实验的目的通常是,了解某种处理是否会引起某种反应。

在依靠数据信息推导出结论的过程中,我们面临的第一个问题就是数据来自何处。统计研究结论的本质和有效性都取决于这一点。数据来自两个渠道:观察研究和实验。观察研究适合在无干扰的情况下描述某个群体或状况并得出结论。抽样调查是一种观察研究,我们通过观察总体的一部分(样本),得出有关总体的结论。实验适用于判断一种处理是否会产生不同的反应。

在后面几章,我们将更深入地讨论数据的来源。我们将会看到怎样进行良好的观察研究和实验,我们还会看到糟糕的观察研究或实验是如何破坏我们想要获得的结论的有效性的。

案例分析与评估

用你从本章所学知识来回答本章开头的软糖民意调查案例中的几个基本问题。为了参加这项调查,人们必须走进商店,并从碗里选择一块软糖。

• 这项调查是一个抽样调查、普查还是实验?

• 调查的总体是谁?

• 调查中的个体是谁?

• 对于每个个体,该研究测量了什么变量?

• 这些变量的值是数字吗?

练习

1.1 见本书第12页。

1.2 见本书第16页。

1.3 每加仑 英里 数。 以下是描述2011年不同型号汽车的油耗状况(MPG,每加仑英里数)的数据集的一小部分。

(a)在这个数据集里,个体是什么?

(b)对于每个个体,该研究衡量了哪些变量?其中哪些变量的值是数字?

1.4 美国棒球运动员的年薪。 以下是美国职业棒球大联盟在2011赛季的第一天公布的部分球员资料:

(a)这个数据集描述的个体是什么?

(b)除了球员姓名外,这个数据集还包括哪几个变量?哪些变量的值是数字?

1.5 谁在做资源回收? 在例1当中我们提到在同一个城市的两个不同社区间比较资源回收的成效时,重量不是理想的变量。那么,你建议用什么变量来替代重量?

1.6 在孕妇中做抽样调查。 怀孕和哺乳期女性每周至少应该吃12盎司鱼类或海鲜,才能使她们的婴儿的大脑得到最好的发育。这是来自一个私营和联邦机构的顶级科学家小组的建议。一位营养学家想知道孕期女性是否每周都会吃至少12盎司鱼类。为此,她找到了一份当地孕妇健身俱乐部的340名会员的名单,从中随机选择了60名并给她们寄出了调查问卷,最终她只收回了21份问卷。该项研究的总体是什么?用于获取信息的样本是什么?在该营养师联络的女性中,寄回问卷的人占比多少?

1.7 死刑。 盖洛普新闻服务机构发布的一条消息说,根据2011年10月6日~2011年10月9日所做的民意调查,他们发现当被问到“你赞成对谋杀犯处以死刑吗”的问题时,61%的美国人回答“是”。在该消息的结尾,你会读到“这个结果是基于随机电话访谈全国1005名18岁及以上成年人得到的”。这个抽样调查测量的变量是什么?你认为盖洛普的这项民意调查的总体是什么?样本是什么?

1.8 政治倾向的性别差异。 在美国,政治倾向似乎存在性别差异,女性比男性更倾向于支持民主党。一位政治学者访问了许多选民,男性和女性都有。她问他们,上一次国会选举时把票投给了民主党还是共和党。这项研究是不是实验?你做出判断的理由是什么?该项研究测量了哪些变量?

1.9 总体是什么? 针对下面几个抽样调查,将总体尽可能明确地指出来。也就是说,总体是由哪些个体组成的,哪些个体属于总体?如果题目提供的信息不足,你可以做出合理的假设。

(a)一项民意调查联络了972位成年人,问他们:“你更愿意为政府工作还是在公司工作?”

(b)视频接口线的一端有能插入电脑显示器插口的针型槽。如果里面的插针弯曲或损坏了,这条接口线就不能用了。一家电脑商店从供应商处批量采购视频接口线,从每批中抽出5条线检查插针情况。如果发现有插针弯曲或损坏的情况,则将整批接口线退回给供应商。

(c)美国社区调查计划联络300万个美国住户,全美每一个县中都有一些住户会被调查。该调查会询问每个住户关于居住状况、经济情况及社会地位等问题。

1.10 总体是什么? 针对下面几个抽样调查,将总体尽可能明确地指出来。也就是说,总体是由哪些个体组成的,哪些个体属于总体?如果题目提供的信息不足,你可以做出合理的假设。

(a)一位社会学者想知道,有多大比例的青少年认为美国各州应把法定最低饮酒年龄降至18岁。她选择了一个样本,是一个大城市的5所高中,并访谈了每所学校所有的12年级学生。

(b)一名医学研究者想知道前美国国家橄榄球联盟(NFL)运动员中患阿尔茨海默病的比例。他从仍在世的人员名单中随机挑选了20名,并通过访谈来判断他们是否患有阿尔茨海默病的迹象。

(c)当地电台脱口秀主持人想知道有宗教信仰的人是否比没有宗教信仰的人更信任他们的邻居。电台收到了51个听众的电话反馈。

1.11 青少年的睡眠需求。 《华盛顿邮报》一篇文章报道了一个关于青少年睡眠需求的研究。实验人员测量了一天当中各个时间段青少年唾液中产生的促进睡眠的褪黑素的含量。他们发现,青少年的褪黑素水平在夜间要比成年人和儿童的褪黑素水平高,在早上仍保持在较高水平上。参加该项研究的青少年都是自愿的。褪黑素水平较高表明需要睡眠,因此实验人员建议高中生的上课时间应该推迟一些,以满足学生的睡眠需求。这项研究是一个实验、抽样调查还是观察研究?请给出答案并说明你的理由。

1.12 高压电缆和白血病患儿。 在例3对于高压电缆和白血病患儿关系的研究中,实验人员比较了两组个体,并且测量了许多可能关乎两组之间差异的变量。请详细说明为何这项研究不是实验。

1.13 治疗前列腺疾病。 一项大型研究使用了加拿大全民医疗系统的记录,来比较两种前列腺疾病治疗方法的有效性。其中一种是传统的手术治疗,另一种是不需要做手术的新疗法。记录中有许多病人的资料,这些病人,有的选择了手术治疗,有些选择了新疗法。研究显示,选择新疗法的病人在8年内的死亡率较高。请说明为何这是观察研究而非实验。

1.14 燕麦和胆固醇。 吃燕麦餐可以降低坏胆固醇(LDL)的水平?以下是研究这个问题的两种方法:

第一种方法是:一位研究者找到500位40岁以上的成年人,他们都定期食用燕麦或燕麦类食品。他将每个人都和一位不定期食用燕麦或燕麦类食品的同龄成年人进行比较,测量他们的坏胆固醇水平。

第二种方法是:另一位研究者找了1000位40岁以上的成年人,他们都没有定期食用燕麦或燕麦类食品,也都愿意参与这项研究。她随机安排其中500人每天早餐食用燕麦,而其他人继续按平时的习惯吃早餐。6个月后,她比较了两组人的坏胆固醇水平。

(a)请说明为什么第一种研究方法是观察研究,而第二种研究方法是实验。

(b)为什么在燕麦是否可以降低坏胆固醇水平的问题上,实验可以提供更多的有效信息?

1.15 酒精和女性癌症患者。 《华盛顿邮报》有一篇关于女性饮酒与癌症的研究报道。从1996年起,一群英国的实验人员开始收集128万名50~64岁女性的详细信息。实验人员记录了三年中这些自愿参加该研究的女性报告的饮酒量,并探究了在平均7年后出现的68775个女性癌症患者与她们饮酒之间是否有关联。他们发现,即使这些女性每天平均只摄入10克酒精(大约相当于一杯酒),她们患乳腺癌、肝癌和直肠癌的风险也会增加。

(a)这是不是实验?请说明理由。

(b)我们更喜欢在志愿参加调查研究的人中做抽样调查。那么,实验人员感兴趣的总体是什么?他们测量了哪些变量?

1.16 课本的成本。 一名学生想知道一本教材的成本是否取决于其页数。于是,该学生走进校园书店,从书架上随机选择了一本教材,并记录下它的页数和价格。这项研究的总体是什么?样本是什么?该学生测量的变量是什么?

1.17 选择你的研究类型。 你认为,要回答下列三个问题,实验、抽样调查或观察研究,哪种方式最好?

(a)你们学校的篮球队在主场比赛中犯规次数多还是在客场比赛中犯规次数多?

(b)大学生对学校提供给他们的娱乐设施满意吗?

(c)可以进行课程录音的大学生是否比那些不能进行课程录音的学生表现更好?

1.18 选择研究目标。 研究一个有关大学生或其行为、想法的问题,最适合用以下哪种方法。

(a)抽样调查。

(b)观察研究。

(c)实验。

1.19 网上练习。 从例4到例7所提到的抽样调查都可以在网上找到:

• 盖洛普民意调查(例4):www.gallup.com。

• 当前人口调查(例5):www.bls.gov/cps。

• 电视收视率调查(例6):www.nielsen.com/us/en/measurement/television-measurement.html。

• 综合社会调查(例7):www.norc.org/Research/Projects/Pages/general-society-survey.aspx。

我们建议读者浏览盖洛普网站,了解当前民意调查的结果和有关调查方法的说明。

访问盖洛普调查网站,选择一个可供非订阅用户浏览的民意调查,判断其中的总体和样本是什么,以及样本中包含了多少人。

1.20 网上练习。 你可以在美国国家环境健康科学研究所(NIEHS)的网站(网址为:www.niehs.nih.gov/health/topics.agents/emf)上找到有关暴露在高压电缆下对健康的影响报告。尽管少量对于成年人暴露在高压电缆下的研究,表明成年人患癌症与住所的电磁场没有必然联系,但该网站上提到的NIEHS科学家对此问题的结论是什么?为什么? +UvxXJbXjQDXTwnk2ABuamZ8AGmmYt3ryvILLjJix4LBQUcbuq/y4BmqBnNzSRcj

点击中间区域
呼出菜单
上一章
目录
下一章
×