统计学的世界（第8版）最新章节_戴维·穆尔著

第4章
真实世界中的抽样调查

案例分析

某项民意调查访问了随机抽样的1000个人后，公布了调查结果，其中包括误差范围。我们对此是不是应该满足了呢？恐怕不行，因为有许多调查并没有把和样本相关的信息全部告诉我们。皮尤研究中心（Pew Research Center）效仿几家较好的民意调查机构的做法，然后把调查过程的细节详述如下。

大部分民意调查是利用电话进行的，用随机拨号的方式取得所有住户的一个随机样本。在剔除传真号码和公司的办公电话之后，皮尤必须拨打2879个住宅电话，才能得到一个1000人的样本。这2879个电话可以分成以下几种情况。

在2879个有效的住宅电话当中，有33%的电话无人接听。在接听电话的人里面，有35%的人不愿接受访问。无回应（nonresponse）的人（包括不接听电话、不愿接受访谈、未完成访谈的人）为1658人，占2879人的58%。皮尤在5天里，选一个星期中的不同日子和每天的不同时段，每个号码都拨打5次。其他很多调查一般只拨打一次电话，而且在接听电话的人当中，常常有超过一半人不愿接受访问。尽管皮尤研究中心成功地访谈了1000人，我们可以信任这个调查结果吗？学完本章，你就会知道这个问题的答案。

抽样误差

随机抽样方法在选取样本时可以消除偏差，也可以控制变异性的大小。那么，是不是只要我们看到“随机抽样”和“误差范围”这两个关键词时，就可以信任调查结果了呢？它当然好于自愿回应的调查方法，但是否像我们期望的那么好，就不一定了。在真实世界里抽样，比起从教科书练习里的名单当中抽一个简单随机样本要复杂得多，结果也较不可靠。置信度说明并不能把真实抽样的所有误差来源都反映出来。

抽样中发生的误差

抽样误差（sampling error）是抽样所造成的误差。抽样误差使得样本结果和普查结果不同。

随机抽样误差（random sampling error）是样本统计量和总体参数之间的差距，是在选取样本时由随机性造成的。置信度说明中的误差范围指的是随机抽样误差。

非抽样误差（nonsampling error）是和“从总体中抽取样本”这个做法无关的误差。非抽样误差即使在人口普查中也有可能出现。

大部分的抽样调查都会遇到随机抽样误差以外的误差。这些误差可能导致偏差的产生，使得置信度说明失去意义。好的抽样方法中包含减少各种误差来源的技术。这种技术有一部分是统计科学，因为随机样本与置信度说明都属于统计科学的范畴。然而在实际应用中，要得到好的样本，光靠好的统计方法是不够的。我们来看看抽样调查有些什么样的误差来源，以及调查人员该如何解决。

抽样误差

随机抽样误差是抽样误差的一种。误差范围可以告诉我们随机抽样误差的严重程度，而我们可以通过选择随机样本的大小，来控制随机抽样误差。另一个抽样误差的来源是使用了糟糕的抽样方法，比如自愿回应。糟糕的方法是可以避免的，但其他的抽样误差可就没那么好对付了。抽样之前必须先有一份“清单”，上面列出总体中的所有个体，以便我们从中抽取样本，我们称为“抽样框架”（sampling frame）。从理论上说，抽样框架应该包括总体当中的每一个个体。但是，总体的清单通常很难取得，所以大部分的样本都会存在涵盖不全的问题。

虽然退出现代社会有时会让人觉得无聊，不过只要能加剧民意调查的涵盖不全问题，泰德就觉得这样做是值得的。

如果抽样框架原本就漏掉了某些群体，那么即使我们从中抽取随机样本，所得结果还是有偏的。比如，假设我们用电话黄页作为抽样框架进行电话调查，就会漏掉那些未登记的住户。在大城市里，超过一半的住户都没有登记电话号码，所以对于城市电话黄页来说，就会存在严重的涵盖不全和偏差问题。实际上，电话抽样调查用的是随机数字拨号设备，在指定区域内随机拨打电话。从效果上看，这个抽样框架包含了所有住户的电话号码。

涵盖不全

在抽取样本的过程中，如果总体当中的有些部分根本未被纳入选择范围，就会发生涵盖不全的问题。

例1 我们的确做不到全面涵盖

大部分民意调查都无力做到全面涵盖美国所有成年人这样庞大的总体。如果进行电话访谈，就漏掉未安装电话的2%的住户。如果只访谈普通住户，住在宿舍的学生、监狱里的犯人以及大部分军人就会被排除在外，也会遗漏无家可归或住在收容所里的人。由于打电话到阿拉斯加和夏威夷的成本很高，所以大多数民意调查的抽样范围都局限在邻近的州。很多民意调查只用英语进行，这使得某些移民住户被排除在样本之外。

存在于大部分抽样调查中的涵盖不全问题，最常见的就是漏掉了年轻人、穷人或居无定所的人。随机拨号系统所生成的样本，可以说很接近于有电话住户的随机样本，但并不包含阿拉斯加和夏威夷地区。在谨慎执行的抽样调查中，误差通常不大。真正的问题出现在有人接听电话（或无人接听电话）的时候，现在该非抽样误差登场了。

非抽样误差

非抽样误差是连人口普查都可能无法避免的问题。非抽样误差中的一种是“处理误差”（processing error），也就是在机械化工作时犯的错误，例如，计算错误或将受访者的回答输入电脑时犯的错误。电脑的普及使得处理误差比以前大大减少了。

例2 电脑辅助访谈

调查人员手持写字板的日子已经成为过去，现在的调查人员都是用笔记本电脑进行面对面访谈，或者一边做电话访谈，一边看着电脑屏幕。调查人员从电脑屏幕上读取问题，再用键盘输入答案。电脑会自动跳过不相干的问题，例如，只要受访者说自己没有小孩，后续就不会出现有关孩子的问题。电脑可以检查有关问题的答案是否一致，还可以随机排列问题的顺序，以避免用相同顺序提问所导致的偏差。

电脑软件也可以做记录管理，记录哪些人已经回答过了，并将答案存档。在以前，要把答案从纸上转录入电脑是一项很烦琐的工作，也是处理误差的一个主要来源，而现在这些已经成为历史。电脑甚至可以安排电话调查的致电时间，并考虑到受访者所在的时区。如果有人在第一次接听电话时有意接受访谈却没有时间，电脑还会重新约定致电时间。

另一种非抽样误差是“回应误差”（response error），它出现在受访者给出不正确的回答时。受访者也许会谎报年龄或收入，对于是否使用过禁药没有如实回答。在被问到上个星期一共抽了几包烟时，他很可能记错。受访者也许没听懂问题，但他宁愿胡乱回答，也不愿显得自己无知。若被问到在一段固定时间内的行为，受访者尤其容易因记忆错误而造成回应误差。比如，美国“全国健康调查”（National Health Survey）问大家去年总共去医院看了几次病，翻看健康记录之后，调查人员发现，受访者会忘掉60%的看病次数。有关敏感话题的调查也容易出现回应误差，从以下的例子即可看出。

例3 种族效应

1989年，纽约市有了第一位黑人市长，弗吉尼亚州也有了第一位黑人州长。在这两件事情发生时，在投票点访问刚投完票的选民后估算出的胜负差距，都比官方公布的实际差距大。调查机构相当肯定，一部分选民在接受访谈时说了谎，因为他们不愿承认自己反对黑人候选人。这个现象被称作“社会合意性偏误”（social desirability bias）或“布拉德利效应”。这个说法来自洛杉矶前黑人市长汤姆·布拉德利，即使在选举前最后一天的民意调查中领先，他仍在1982年的加州州长选举中落败了。

这一效应在2008年美国总统大选期间受到了媒体的青睐。在选举前几周，民意调查显示巴拉克·奥巴马有可能大幅领先。即便如此，民主党仍担心这些民意调查的结果可能因为“布拉德利效应”而过度乐观。事实证明，他们的担心是多余的。但是，一些政治学者声称在预测初选结果时，发现巴拉克·奥巴马和希拉里·克林顿之间在种族问题上存在“布拉德利效应”（例如，在新罕布什尔州初选时，民意调查结果预测奥巴马将领先希拉里8%的票数，而实际上希拉里领先奥巴马3%的票数）。

现代科技再加上注重细节，就可以把处理误差降至最小。技巧娴熟的调查人员也可以大幅度地减少回应误差，特别是在做面对面访谈的时候。但是，像无回应这种最严重的非抽样误差，并没有什么简单的解决方法。

无回应

无回应（nonresponse）指的是，无法得到已经被选入样本的个体的信息。无回应最常见的原因是，联络不上受访者或受访者拒绝接受访谈。

无回应是抽样调查面临的最严重的问题。人们越来越不情愿回答问题，尤其是在电话里。电话推销、答录机以及来电显示的普及，降低了人们对电话调查的回应比例。封闭的社区和有保安把守的大楼，降低了面对面访谈的比例。无回应会导致调查结果有偏差，因为不同群体无回应率不同。例如，老人和大城市居民的无回应比例就比较高。无回应造成的偏差很容易超过误差范围所描述的随机抽样误差。

“你可以打电话、发电子邮件或站在门口一整天，但我的答案还是‘无可奉告’！”

例4 无回应的问题有多严重？

“当前人口调查”是我所知道的美国所有调查中回应率最高的：在其调查的住户中，仅有7%～8%的住户没有回应。人们一般会对当前人口调查这类政府调查做出回应，而且当前人口调查会先拜访样本中的每个人，再进行电话访谈。

“综合社会调查”（第1章例7）也会联系样本中的每个人，而且这项调查是由一所大学发起的。即便有这些优势，最近的综合社会调查仍有29%的无回应率。

媒体、市场调查公司或民意调查机构所做的调查情况如何呢？我们一般无法知道其无回应率，因为他们不肯说，这本身就是一个坏信号。我们从前面皮尤研究中心提供的数据，就可以看出情况有多糟糕。皮尤得到了1221个回应（其中有1000人属于他们锁定的总体），以及总共1658个无人接听电话、拒绝接受访谈或未完成访谈的情况，无回应率是58%。皮尤研究中心已经比其他调查机构做得更到位了。有内部人士透露，民意调查的无回应率常常达到其初始样本量的75%～80%。

做抽样调查的人知道一些降低无回应率的技巧。只要对方肯接听电话，受过严格训练的调查人员就有办法让他们不挂掉电话。没访谈成功的，隔一段时间再打回去也有用，或者在打电话之前先给受访者寄封信。但是，既要寄信，又要反复打电话回去，会拖慢调查进度，所以，那些需要很快得出结果来满足媒体好奇心的民意调查就不会使用这些方法。即便是过程最严谨的调查，也仍然会被无回应所困扰，而且无法完全解决这个难题。

误差范围中不包含什么？

一项抽样调查中所公布的误差范围，只包括随机抽样误差。涵盖不全、无回应以及其他问题也会造成大偏差，但是误差范围中并不包含这些问题。

严谨的抽样调查会告诉我们这些真相。比如，盖洛普调查就会坦承：“除了抽样误差以外，问题的措辞以及实施调查时遇到的实际困难，都会导致民意调查结果产生偏差或误差。”说得太对了！

无回应是不是导致很多调查结果都无效了呢？不一定。在本章开头的案例中，我们介绍了皮尤研究中心所做的一项“标准”的电话调查。皮尤研究中心其实也执行了一套“严格”的调查程序：在打电话之前先寄信，然后在8周内不断打电话，再寄信给拒绝受访的人，等等。这些做法把无回应率降到了30%，而标准调查的无回应率是58%。然后，皮尤比较了两项调查中调查对象对同样的问题给出的答案。两个样本在年龄、性别及种族等方面都相当接近，只不过后一个样本中的人更富有。两个样本对除种族以外的所有话题有相近的看法，一开始不肯接受访问的人，对黑人的同情度也都比较低。总的来说，标准调查所得的结果，其准确程度在合理的范围之内。不过，就像例3一样，种族问题仍然是一个例外。

问题的措辞

影响抽样调查结果的因素还有问题的措辞。想把问题完全表述清楚，难度出乎意料。有个调查问及“stock 的所有权”，大部分得克萨斯州的牧场主人都回答“是”，可是他们拥有的大概不是在纽约证券交易所可以买卖的那种。

例5 措辞造成的巨大差异

2009年2月，盖洛普民意调查提出了一个有关美国联邦政府插手银行经营的问题，样本被分成了两部分，提问的方式也不同。一部分人被问及是否支持“联邦政府暂时接管有可能倒闭的大型银行以便稳定经济局势”，另一部分人则被问及是否支持“联邦政府暂时将有可能倒闭的大型银行国有化以便稳定经济局势”。前者中有54%的人表示支持，后者中只有37%的人表示支持。

“国有化”看上去是一个负面词汇。在提问时略微改变措辞，可能会造成结果的巨大差异。

问题的措辞总是会影响问题的答案。如果问题的措辞倾向于某个答案，那么这又是一个非抽样误差的来源。有一招常见的把戏，就是问受访者是否赞同某项政策以便达到某种目标。比如，“你是否赞成禁止私人拥有枪械以降低犯罪率”，“你是否赞成判处死刑以降低暴力犯罪的比例”，这些都是“加了料”的问题，很可能会诱使担心犯罪率的人给出肯定的答复。下面的例子就是有诱导性倾向的问题造成的影响。

例6 竞选财务问题

赞助政治选举活动一直是一件颇具争议性的事情。以下是调查问卷中与此相关的两个问题：

是否应该通过立法的方式消除所有可能的特殊利益集团向候选人捐赠大额资金的机会？

是否应该通过立法的方式禁止利益集团赞助选举活动？利益集团有权捐款给其所支持的候选人吗？

第一个问题是由罗斯·佩罗提出的，他是1992年美国总统大选的第三方候选人。这个问题在写信回应者中得到了99%的支持率。但我们知道自愿回应调查的结果是无效的，所以扬克洛维奇–克兰西–舒尔曼调查机构通过随机抽样的方法问了同样的问题，结果有80%的人回答“是”。佩罗的问题几乎是在要求人们回答“是”，所以扬克洛维奇–克兰西–舒尔曼，用较中立的立场重新提出这个问题。在被问及这一问题时，样本中只有40%的人赞成禁止政治选举捐款。

练习

4.1 我们应该做资源回收吗？下面的问题是否倾向于某种回复？如果是，其所倾向的答案是什么？

考虑到不断加剧的环境恶化和资源稀缺问题，你愿意支持对资源密集型消费品进行回收的举措吗？

如何应对非抽样误差

非抽样误差，尤其是无回应，躲也躲不掉。严谨的抽样调查应该如何处理这些问题呢？一种方法是，用其他住户来取代无回应的人。因为城市里的无回应率比较高，如果用无回应住户附近的其他住户来取代，就可以减小偏差。另一种方法是，在数据搜集工作完成之后，所有专业的调查机构都会用统计学方法给有回应的数据加权，以纠正偏差。如果城市里有太多的住户无回应，就给城市里有回应的那些数据加权。如果样本里有太多女性，就给男性的数据加权。举例来说，以下是《纽约时报》对其某次抽样调查的部分描述：

考虑到每个住户的人数和电话机数量有所不同，也为了对样本中的个体在地理位置、性别、种族、年龄以及受教育程度等方面的差异做出调整，此调查结果已经过加权处理。

其目标是使调查结果“好像”是从一个在年龄、性别、住户地理位置以及其他各种变量都和总体相符合的样本中得来的。

确定权重这件事，为统计学家创造了许多工作机会。这也表明，抽样调查所宣布的结果很少像表面上看起来的那么简单。盖洛普公司宣布，他们访谈了1523位美国的成年人，发现有57%的人在过去12个月当中买过彩票。从表面上看，1523的57%是868，所以在盖洛普的样本中应该有868个人买彩票。然而，事实并非如此。盖洛普公司无疑用了某些特殊的统计技巧，给实际得到的结果加权。也就是说，57%这个数字是这项盖洛普调查在没有人不回应的情况下，所应该得到结果的最佳估计。加权的确可以修正偏差，但通常也会增加变异性。在宣布误差范围之前必须把这些问题都考虑进去，这又给了统计学家更多的工作机会。

真实世界中的抽样设计

简单随机抽样的基本概念很清楚：从总体中抽取一个简单随机样本，用从这个样本得到的统计量，估计总体的参数值。现在我们已经知道，为了能够对无回应问题做出补救，样本统计量被人在背后“动过手脚”。统计学家也会对我们钟爱的简单随机样本“进行处理”，在真实世界中，大部分抽样调查使用的是比简单随机样本更加复杂的样本。

例7 当前人口调查

当前人口调查关注的总体包括美国的所有住户（阿拉斯加和夏威夷也包含在内），样本是分阶段抽取的。人口普查局把美国分成2007个地区，称为“基本抽样单位”（PSU），大体上是把邻近的县作为一个基本抽样单位。在第一阶段抽取754个基本抽样单位，这不是一个简单随机样本。如果所有的基本抽样单位被抽中的概率相同，那么样本中可能会漏掉芝加哥和洛杉矶，而428个人口密集的基本抽样单位会自动加入样本。另外1579个基本抽样单位被分成326组，称为“层”（strata），即将在很多方面类似的基本抽样单位放在一起。对于每个层，从中随机选出一个基本抽样单位作为代表。

第一阶段抽取的754个基本抽样单位被细分为“普查街区”（census block），这是更小的地理区域。普查街区再按照住户种类、种族等条件分层。同一个普查街区的住户依地理位置排序，每4户左右被分成一“群”（cluster）。最终取得的样本是从街区的每一层抽取的群，而不是住户。调查人员会去被抽中的群中的每一个住户处进行访谈。从每一个街区的层里抽出的群也不是简单随机样本。为了确保抽出的群在地理位置上是分散的，抽样时会先随机选一个群，然后抽取比如清单上的第10个、第20个群等。

当前人口调查的设计反映了在现实生活中，进行面对面访谈的样本所具有的一些共性。先把住户组合成基本抽样单位，再集合成群，然后分阶段抽样，最后抽出的是群，这样的做法可以节省调查人员大量的交通时间。在例7中提到的各种概念中，最重要的是“分层样本”（stratified sampling）。

分层样本

选取分层随机样本的步骤如下：

第一步：将抽样框架中的个体先分成若干群，被称为层。分层的标准是，你对于这些层有特别的兴趣，或者同一层中的个体有相似的性质。

第二步：每层各取一个简单随机样本，把它们合起来就是我们要的样本。

要选出适当的“层”，必须根据抽样前对总体的了解。你或许会把大学里的学生依本科生和研究生分成两层，也可能按照住校生和不住校生分成两层。分层样本在几个方面优于简单随机样本：首先，因为要在每层分别抽取简单随机样本，我们可以在每层分别决定样本的大小，因此可以分别得到各层的结论。其次，分层样本的误差范围通常比同样大小的简单随机样本小，因为同一层中个体之间的相似程度比整个总体的个体之间大，所以使分层样本可以消除样本统计量的某些变异性。

现在我们告诉你一件事，可能会让你感到很惊讶：分层样本违反了简单随机样本最吸引人的一个性质，即分层样本未必会给总体中每个个体相同的被抽中的机会，因为有些层在样本中所占的比例有可能被刻意地提高了。

例8 学生分层样本

一所大学有30000名学生，其中有3000人是研究生。如果从全体学生中抽取一个包含500名学生的简单随机样本，那么每个学生被抽中的概率是相同的，这个概率是：

我们预计在简单随机样本中大约只有50名研究生，因为全部学生的10%是研究生，所以我们希望简单随机样本中有10%的学生是研究生。但是，大小为50的样本不够大，无法准确地反映研究生的意见。所以，我们可能更希望有一个包含200名研究生和300名本科生的分层样本。

你知道该怎样选出这样的分层样本吧？给研究生编上0001～3000的代码，用表A选择大小为200的简单随机样本。再给本科生编上00001～27000的代码，用表A选出大小为300的简单随机样本。最后将这两部分样本合并，就是你要的分层样本了。

在这个分层样本中，每个研究生被抽中的概率是：

每名本科生被抽中的概率小一些，是：

由于我们有两个简单随机样本，所以很容易分别了解大学生和研究生的意见。用速算公式可以算出样本统计量的误差，对研究生来说，大约是：

对于本科生来说，大约是：

因为例8中的分层样本刻意加重了研究生的比例，所以必须对最后的结论做出调整，才能得到所有学生意见的无偏估计。请注意，我们的速算法只能用于简单随机样本上。事实上，要做专业分析的话，还得考虑到总体包含30000个个体这一事实，所以统计学家又有更多的工作机会了。

练习

4.2 分层样本。 “随机”大学的统计学院有5个系和10个本科专业。使用表A，从第111行开始，选出一个包含一个系代表和一名学生代表的分层样本，参加由校长发起的接待活动。

例9 电话访谈的苦恼

从理论上说，随机拨打号码的电话访谈可以用简单随机样本。电话访谈没必要分群，但是分层仍可以降低变异性，所以电话访谈经常采用两阶段抽样：先抽取一个前缀码（区号加上电话号码的前三位），然后按照前缀码随机拨打抽取的个别号码（后4位）。

电话号码简单随机样本的真正问题是，属于住户用的电话号码太少了。这只能怪科技发展了。传真机、调制解调器和移动电话占据了很多新号码。1988～2008年，美国住户数量增加了29%，但电话号码的数量却增加了120%。有分析师认为，很快我们将需要把电话号码的位数从10位增加到12位（包括区号）。这会导致问题变得更严重。电话访谈现在采用的是“清单上的样本”，就是检查电子号码簿，在做随机抽样前，先把下面没有电话号码的前缀码都划掉。这样可以少拨打一些无人用的电话号码，但是，那些住在所有电话都未登记在电子号码簿上的地区的人就会被漏掉。因此，那些下面没有电话号码的前缀码要做独立抽样（还是分层）——也许样本量会比较小——以弥补这个漏洞。

移动电话的普及给电话访谈带来了一些其他问题。随机数字拨号设备不适用于移动电话号码。移动电话号码是由提供服务的移动电话公司所在的位置决定的，不一定对应着用户的实际住址。这使得诸如按照地区进行分层样本的复杂做法很难行得通。

知识普及纽约，纽约

他们说纽约市更大、更富、更快、更粗鲁了，这可能确有所指。专业抽样调查公司佐格比国际说，在美国，平均拨打5个电话才有一个人接听。但如果在纽约，则需要打12个电话才会有一个人接听。因此，调查公司都会派最好的调查人员在纽约做电话访谈，而且常常因为他们必须面对的压力而付给他们奖金。

或许是电话访谈遭遇的问题提醒了盖洛普公司，近年来，它已经在大多数民意调查的结尾部分对调查方法的说明中删掉了“随机抽样”字样。这可以避免人们误会其调查结果来自简单随机样本。在关于盖洛普全球意见调查和盖洛普福利指数（在盖洛普网站上）所用调查方法的详细介绍中，样本被描述为包含了随机样本的样本。

【统计学中的争议】哈里斯在线调查

哈里斯在线调查（Harris Poll Online）已经创建了一个包含超过600万名志愿者的研究平台。根据其网站介绍，“该平台包括居住在美国的各行业人士，以及全世界200多个国家的居民”，而且“这几百万人中还包括潜在的调查对象，他们通过在线、电话、邮件或现场方式参与进来，增加了人口覆盖率和代表性”。

当哈里斯进行一项在线调查时，这些人会成为抽样框架。一个样本将从中选出，并采用统计方法对样本的回复进行加权处理。哈里斯在线调查常会采用“倾向指数加权法”（propensity score weighting），这是哈里斯自创的一种互动技术，也被用于（在适当的时候）调整调查对象在网上的相似性。哈里斯在线调查声称“这个程序提供了在精确度和代表性方面的额外保障”。

你是否信服哈里斯在线调查可以提供诸如美国成年人那样经过良好定义的总体的准确信息？为什么？

有关哈里斯在线调查和网络调查的一般信息，请浏览www.harrispol lonline.com/question.asp, www.harrisinteractive.com/partner/methodology.asp等。

网络调查带来的挑战

互联网对人们做的很多事都产生了深刻的影响，其中也包括统计调查。通过互联网进行“网络调查”变得越来越普及，网络调查比传统的调查方法有更多优势，可以以较低的成本收集传统调查方法无法获得的大量数据。任何人都可以将想要调查的问题放在提供免费服务的网站上，几乎所有人都能通过互联网获得大量数据。而且，网络调查可以将多媒体形式的调查内容传递给受访者，开辟了新的调查领域，使得对传统调查方法来说非常难实现的调查也可以进行。有人甚至提出，网络调查将会逐步取代传统调查方法。

尽管网络调查很容易实施，但并不容易获得好的结果。其原因也包括我们在本章讨论的许多问题，其中的三大主要问题是自愿回应、涵盖不全和无回应。自愿回应有若干表现形式。一些网络调查要求受访者点击进入一个特定网页参与调查，Misterpoll.com就是这类网站。访问这个网站的人可以参与正在进行的调查，创建自己的调查，也可以对同一调查进行多次投票。其他网站则通过发布消息、发送电邮和在高浏览量的网站上做广告，吸引大家参与网上调查。其中一个例子是佐治亚理工大学GVU（图形、视觉和可用性中心）在20世纪90年代所做的10个系列调查。

尽管Misterpoll.com声明该网站上的调查主要是出于娱乐目的，但GVU的调查声明似乎带有某种合法性。www.cc.gatech.edu/gvu/usersur_veys/网站上的声明称，从这些调查中得到的信息“被视为有关网络演示图形开发的独立、客观的观点”。

第三类，也是更复杂的例子，当调查机构创建了其自认为包含了志愿者和用户，并且具有代表性的小组，用这样的小组作为抽样框架时就会出现。从这个组里随机选择一个样本，邀请那些被选中的人参与调查。这个方法的一个非常复杂的版本被用于哈里斯在线调查。

网络调查，例如哈里斯在线调查，在一个良好定义的抽样框架中随机选择样本的做法是合理的，只要该抽样框架清晰地代表了一些较大的总体或者调查目标只是该抽样框架中的成员。这类例子包括将浏览该网站的访客当作总体，采用系统抽样法，将所有第n次浏览网站的人选入样本的网络调查。其他例子还有大学校园所做的一些网络调查。所有学生可能都有电邮账号和互联网接口，电邮账号清单就可以被当作一个抽样框架，从中选出一个随机样本。如果调查感兴趣的总体是该校的所有学生，这类调查就可以获得非常不错的结果。

例10 医生和安慰剂

安慰剂是一种“傻瓜”疗法，比如盐胶囊，对于患者没有直接疗效，但可能让患者产生反应，因为他们对治疗有一定预期。有行医执照的医师有时是否会给患者开出安慰剂呢？针对芝加哥地区医卫学校内的医生做一次网络调查是有可能的，因为这些医生几乎都在邮件地址清单上。

发出一封电子邮件，向所有医生解释本项研究的目的，答应他们可采用匿名方式在线做出回应。其结果是，有45%的受访者说他们有时会在治疗中给患者使用安慰剂。

还有一些网络调查方法被用于消除自愿回应所带来的问题。一种方法是将网络作为参与调查的众多方式中的一种，美国劳工部劳工统计局和人口普查局已经采用了这种方法。另一种方法是从一些组里选择随机样本，但是不依赖志愿者建立这样的组，小组成员采取随机抽样的方式进行招募（例如随机拨打电话）。电话访谈可以被用来收集背景信息，确认哪些人可以上网，并从中招募合适的人加入小组。如果调查的目标总体是互联网用户，这个方法应该也可以取得可靠的结果。皮尤研究中心就采用了这种方法。

也许最积极的方法，或者说试图从更一般的总体中获得随机样本的方法，就是“跟踪调查”（following）。从感兴趣的总体中选取一个随机样本，向这些被选中的人提供必需的设备和工具，以便他们参与后续的网络调查。这个方法在本质上与尼尔森电视收视率调查所用的方法相似。这个方法几年前曾被一家公司——互联调查（InterSurvey）采用，但这家公司现在已经倒闭了。

那些采用网络调查方法的机构仍面临着一些挑战。即便互联网和电邮不断普及（根据2009年的《美国统计摘要》，截至2009年，有79%的18岁及以上的美国成年人在家或在公司上网，有71%的人在家里上网），采用网络调查，也会出现涵盖不全的问题。对回复进行加权处理以纠正可能出现的偏差，也不能解决问题，因为研究表明，互联网用户在很多方面是不同的，这导致传统的加权方法没有了用武之地。

此外，即便所有美国人都能上网，仍不可能有一个囊括了所有网络用户的名单用作抽样框架，也不会有类似随机数字拨号的设备，可以从所有网络用户中抽取随机样本。

最后，网络调查通常具有非常高的无回应率。提高电话和电邮调查的回应率的方法对网络调查也有用，但会导致网络调查的成本更高、难度更大，以致抵消了它的一些优势。

概率样本

我们从例7到例10中可以清楚地看出，抽样设计是专家的工作，连大部分统计学家也无法胜任。所以，我们无须花精力在这些细节上，而只需要了解它的主要概念是好的抽样设计利用随机性从总体中抽取个体即可。也就是说，所有好的样本都是“概率样本”（probability sample）。

概率样本

概率样本是利用概率抽取的样本。我们先要知道哪些样本是可能的，以及每个可能的样本被抽中的概率是多少。有些概率样本，比如分层样本，并不包括总体的所有可能样本，即使那些包括在其中的样本，被抽中的概率也未必一样。

举例来说，一个包含300名本科生和200名研究生的分层样本，必定是由300名本科生和200名研究生组成的；而一个简单随机样本可以由任意500名学生组成。这两种都属于概率样本。我们只需要知道，从概率样本得到的估计值和从简单随机样本得到的估计值同样好。如果把样本加大，我们同样可以做出客观的置信度说明，以及缩小误差范围。像自愿回应调查的样本这种非概率样本就没有这些优点，也无法提供值得信任的调查结果。现在我们已经知道，大部分全国性的样本都比简单随机样本复杂，不过我们常常假设好的样本就是简单随机样本。这样做既可以保留重要的概念，也可以隐藏烦琐的细节。

在相信调查结果之前应该问的问题

如果调查者使用好的统计技术，并且认真准备抽样框架，注意问题的措辞，减少无回应率，意见调查与其他抽样调查就可以提供精确而且有效的信息。可是，有很多调查，尤其是那些倾向于影响公众意见而不只是为了了解公众意见的调查，并不能提供精确而且有效的信息。在你相信一些调查结果之前，应该先问以下问题：

• 谁做的调查？就算是政治民意调查，也应该请专业的调查机构来做，专业机构为了自己的名誉会好好地做调查。

• 总体是什么？也就是说，调查旨在获取哪些人的意见。

• 样本是怎样选取的？注意看调查说明中有没有提到随机抽样。

• 样本有多大？除了样本大小以外，最好还有误差范围，即样本统计量中的95%会落在哪个区间。

• 回应率是多少？也就是说，原来选定的调查对象中有多少人确实提供了完整的信息。

• 用什么方式联络受访者？电话、邮寄信件，还是面对面访谈？

• 调查是什么时候做的？是不是刚好在一件可能影响调查结果的事情发生之后？

• 调查问题的措辞如何？

学术界的调查机构和美国政府的统计部门，都会在公布抽样调查的结果时回答上述问题。全国性的民意调查通常不公布回应率（往往很低），但会提供其他信息。编辑和新闻播报员有一个坏习惯，常常会删掉这些“无聊”的内容而只报告结果。利益团体、地方报纸及电视台所做的许多抽样调查，则根本不理会这些问题，因为其调查方法事实上根本不可靠。假如有政客、广告商或地方电视台发布民意调查的结果，却没有提供完整的信息，那么我们最好持怀疑态度。

小结

本章要点

• 真实世界中的抽样调查是很复杂的。即便是专业的抽样调查，也无法准确地给出关于总体的信息。

• 抽样调查中存在许多潜在的错误来源。抽样调查结果里提到的误差范围，只是指随机抽样误差，也就是在选取随机样本时，因随机性而产生的样本统计量的变异性。

• 其他种类的误差没有被包括在误差范围内，也没办法直接衡量。抽样误差是由抽样这个行为造成的误差。随机抽样误差与涵盖不全是抽样误差中常见的两种。当总体中个体未被列入抽样框架的时候，就会产生涵盖不全的问题。抽样框架是总体中全部个体的清单，样本就是从这里面抽取的。

• 然而，在大部分严谨执行的调查中，最严重的误差是非抽样误差。这些误差和抽取样本的行为没有关系，就连普查中也可能会有非抽样误差。

• 抽样调查面对的最大问题就是无回应，即调查对象联络不上，或者拒绝回答问题。

• 处理资料时发生的错误（处理误差）或者回应者给出了错误答案（回应误差），也都属于非抽样误差。

• 问题的措辞也会对调查对象的答案产生很大的影响。

• 设计抽样调查的人会使用一些统计技巧来设法减小非抽样误差，他们也会采用比简单随机样本复杂的概率样本，比如分层样本。

• 只要你观察一些基本要素就可以对一项抽样调查的质量做出评估，这些要素包括：是否采用随机样本，样本的大小，误差范围，无回应率以及问题的措辞。

在第3章，我们看到随机样本可以为提供一个有关总体参数的结论奠定良好的基础。在这一章，我们知道了即便选取一个随机样本，我们的结论也会因为涵盖不全、处理误差、回应误差、无回应和问题的措辞而变得不准确。因此，我们在收集数据时必须足够细心，以确保我们得出的结论是有效的。在某些情况下，更复杂的概率样本，比如分层样本，有助于纠正非抽样误差。本章提供了一个问题清单，可以帮助你评估其他人或机构所做抽样调查结果的好坏。

案例分析与评估

用本章学的知识评估本章开头的案例，并做以下练习：

• 回答本章最后一节提出的问题。

• 皮尤调查的结果有效吗？请参考“网络调查带来的挑战”一节内容做出回答。

练习

4.1 见本书第75页。

4.2 见本书第80页。

4.3 哪类误差？下面哪些是抽样误差，哪些是非抽样误差，回答并解释你的答案。

（a）受访者对自己过去使用毒品的情况说谎。

（b）录入数据时出现了输入错误。

（c）数据来自受访者浏览某个网站并在线回答问题。

4.4 哪类误差？下面是一项抽样调查中出现的误差，请指出哪些是抽样误差，哪些是非抽样误差，并给出理由。

（a）用电话黄页作为抽样框架。

（b）连打5次电话都无法联络到受访者。

（c）调查人员挑选大街上的人做访问。

4.5 不在误差范围之内。盖洛普公司于2008年2月所做的一项调查表明，有43%的美国人认为自己是棒球迷，这个结果低于平均水平。自从盖洛普公司1993年开始做这项调查以来，平均有49%的美国人声称他们是棒球迷。最高比例出现在1998年，当时塞米·索萨和马克·麦格威尔打破了罗杰·马里斯的单季全垒打纪录，促使56%的美国人认为自己是棒球迷。盖洛普公司的调查报告写道：

对于该样本所得到的调查结果，我们有95%的把握宣布，由抽样和其他随机效应所产生的最大误差范围是±5%。

对于调查结果可能的误差来源，举一个未包含在误差范围内的例子。

4.6 大学生父母在线调查。一项关于大学生父母的在线调查于2007年2～3月进行。对美国大学生父母数据库或学生优势数据库中的41000位家长发出电邮，邀请家长们参加在线调查。在被邀请的父母中，共有1727人完成了在线调查。这项调查可匿名参与，但每位家长只能提交一次答案。

该调查的结果之一是有33%的母亲和其在校读书的孩子每日联络至少一次。

（a）该项调查的回应率是多少？（回应率是样本——那些被邀请参与调查的人——实际回复的比率。）

（b）使用速算公式估算当随机样本大小为1727时的误差范围。

（c）你认为这个误差范围是关于这个调查结果的一个好的指标吗？请说明你的理由。

4.7 客户调查。一家在线商城从去年在该商城购买过商品的客户名单中随机选取了一个大小为100的样本，问他们是否满意该在线商城的服务。如果同时选择两个大小为100的简单随机样本，这两个样本可能给出略有不同的结果。这种差异来自抽样误差还是非抽样误差？该调查公布的误差范围是否包含了这种误差？

4.8 电话无人接听。电话访谈中常出现的一种无回应情况是“铃响却无人应答”。也就是说，拨打的是一个有效号码，但没人接听。意大利国家统计局（Italian National Statistical Institute）检视了从新年到复活节，以及7月1日到8月31日这两段时间内，意大利政府对住户所做的一项调查的无回应情况。所有的电话都是在晚上7点到晚上10点之间拨打的，但在其中一个时间段内有21.4%的电话“铃响却无人应答”，在另一个时间段内有41.5%的电话“铃响却无人应答”。你认为比较高的无人接听的比例出现在上述哪一段时间？为什么？并说明为什么无回应率高的时候，样本结果很不可靠。

4.9 保护环境与刺激经济。以下是在2009年12月进行的一项有关保护环境和刺激经济的调查时提出的两个问题：

人们在决定重要的事情时，经常需要做出让步或妥协。一般而言，当需要做出折中处理时，哪一个对你来说更重要：刺激经济还是保护环境？

哪个问题更让你担心：由于担心保护环境会损害经济发展，美国不愿意采取必要的行动以预防全球变暖造成的灾难性影响；还是美国将会采取对抗全球变暖的措施，但那些行动将损害美国经济的发展？

在回答第一个问题时，有61%的人说刺激经济更重要，但在回答第二个问题时，只有46%的人担心美国采取行动抵御全球变暖会破坏美国经济。第二个问题的措辞引发的人们对经济的担忧比第一个问题少，对此你怎么看？

4.10 宪法修正案。你正在为一项有人提出的宪法修正案设计民意调查问卷的问题。你可以问人们是否愿意支持通过这项修正案来“修改宪法”或者“增加宪法条款”。

（a）你为何认为这两个问题会产生不同的支持率？

（b）在这两种说法中，哪一个会产生更高的支持率？为什么？

4.11 缴纳税款。 2011年4月，一项盖洛普调查对人们缴纳的个人收入所得税数量问了以下两个问题：

你认为你今年需要缴纳的个人收入所得税是否公平？

你认为你要缴纳的个人收入所得税是偏高、大致合适还是偏低？

对于其中一个问题，有57%的人回答税额公平或大致合适；而对于另一个问题，回答公平或大致合适的人的比例仅为43%。你认为这两种答案分别属于哪个问题？为什么？

4.12 调查问题的措辞。以下调查问题表述得清楚吗？措辞有没有倾向于某一个答案？（调查问题如果会激起某种情绪，就被视为带有倾向性措辞。）

（a）以下哪一项最能代表你对枪械管制的意见？

1. 政府应该把所有人的枪都收走。

2. 我们有权拥有并携带枪械。

（b）对于飞涨的汽油价格，我们应该考虑在一小部分阿拉斯加荒原上开采石油，以便减少美国对外国石油的依赖。你同意吗？

（c）你是否认为对美国执法机构的额外限制，削弱了其在“9·11”恐怖袭击发生前发现它的能力？

4.13 糟糕的调查问题。

（a）请你写一个带有倾向性的问题，让大部分人的回答会倾向于两个答案中的某一个。

（b）请你写一个语意混淆不清、很难回答的问题。

4.14 评估一项调查。 2009年12月，《华尔街日报》刊登了一篇有关美国总统奥巴马的支持率的文章，该文同时提到只有22%的美国人认可国会的工作。新闻报道通常对于抽样调查的描述都很简短，以下是《华尔街日报》关于此次调查的报道的一部分：

这项民意调查的结果，是通过电话访问全国各地共1008位成年人所得到的，其中包括一个只使用移动电话的104位受访者的样本。这项调查是由调查机构Peter D.Hart和Bill McInturff在12月11～14日进行的。

样本是从350个地理区域中选出，在每个地理区域中选取的样本大小和该区域的人口数成正比。抽取住户时所使用的方法是，让每个电话号码，不论有没有列在电话黄页上，都有一样的中选概率。移动电话号码样本是从一份全美移动电话用户名单中选取的。

本章最后一节列了很多项关于相信调查结果之前该问的问题，《华尔街日报》对这些问题给出了怎样的答案？

4.15 评估一项调查。《纽约时报》上刊登了一篇有关经济和失业率的文章，引用了一项抽样调查的结果，例如调查对象中有48%的失业成年人“曾经历过情绪和健康问题，如压抑或焦虑”。以下是该报关于“民意调查应如何进行”内容的一部分：

有一项民意调查通过电话访问了美国各地的1650位成年人，访问时间是12月5～10日……

有线电话交换机样本是用电脑从全国超过69000个有效住宅电话交换机中随机选出的。

在每个选中的交换机的基础上，把随机数字加上去，构成完整的电话号码。这样一来，不论有没有出现在电话黄页上的电话号码都可以包括在内。在每个住户中，也用随机方法选择一位成年人接受访问。

为了增加覆盖率，在这个样本的基础上还增加了一些通过随机拨打手机号码联系受访者。

调查人员在调查过程中会多次拨打每个电话号码，对于无回应的电话号码，还会在白天或夜晚的不同时间再次拨打。

本章最后一节列出了很多个在相信调查结果之前应该问的问题，《纽约时报》对这些问题给出了怎样的答案？

4.16 封闭型和开放型问题。问题基本上可分为封闭型与开放型两种。封闭型问题会提供一组固定的答案让受访者选择；开放型问题则要求受访者用自己的话作答，调查人员把受访者的回答抄录下来之后再分类。

开放型问题的例子如下：

你对来世有什么看法？

封闭型问题的例子是：

你对来世有什么看法？你认为

a. 有来世，入口只取决于你的行为？

b. 有来世，入口只取决于你的信仰？

c. 有来世，每个人都会永远生活在那里。

d. 没有来世。

e. 不知道。

开放型问题和封闭型问题各有什么利弊？

4.17 有没有说实话？许多受访者当被问到关于不法活动或者是敏感问题时，都会说谎。有一项研究把一群白人随机平均分成三组，每个人都会被问到是否用过可卡因。对第一组人采取电话访问的形式，有21%的人说“有”。第二组人采取面对面访谈的形式，有25%的人说“有”。第三组也是采取面对面访谈的形式，但答案被填在匿名的表格上，然后装在一个信封里，有28%的人说用过可卡因。

（a）你觉得上述哪一个结果最接近事实？为什么？

（b）另外举出两个例子，你觉得用电话访问得到的比例会比实际的低。

4.18 你投票了吗？ “当前人口调查”询问美国60000个住户样本中的成年人，有没有在2008年的总统选举中投票，63.6%的人回答“有”，误差小于0.5%。事实上，在美国所有成年人中，只有61.6%的人在那次选举中投了票。当前人口调查的结果和真实值的差距比误差范围大很多，你认为这是为什么？

4.19 在派对上抽样。某个派对上有20名21岁以上的学生，以及40名不到21岁的学生。你需要从21岁以上的人中随机抽出两位，从不到21岁的人中随机抽出4位来访问，问他们对饮酒的态度。你给了派对上每个学生同样大的中选概率，这个概率是多大？为什么你的样本不是一个简单随机样本？

4.20 分层样本。某个俱乐部有20名学生会员和10名教师会员。

学生名单如下：

巴莱特多布梅尔约瑟莱瑟曼舒艾特

布雷克道格拉斯科尔施密特米勒斯文森

拜尔福克斯考斯特纳尔逊汤普森

康罗伊弗莱兰德格拉夫全温纳

教师名单如下：

伯林纳迪恩汉斯奥兹特克拉姆齐

克莱格米尔富林纳米勒珀尔图尔克门

俱乐部可以免费送三名学生和两名教师去参加一个大会，采用随机抽样的方式来决定送谁去。

（a）用表A选出一个包括3名学生及2名教师的分层样本。

（b）学生康罗伊被选中的概率是多大？教师迪恩被选中的概率是多大？

4.21 分层样本。一所大学有2000名男教师和800名女教师。主管公平雇用的官员想从所有教师中抽取随机样本，听取他们的意见。为了充分了解女性教师的意见，他决定抽取一个包含200名男教师和200名女教师的分层样本。他有一份按照英文字母排序的女性教师名单和男性教师名单。

（a）说明应该怎样编号和用随机数字表选取需要的样本。从表A的第122行开始，抽出你样本中的前5名女教师与前5名男教师。

（b）2000名男教师中任何一位被选中的概率是多大？800名女教师中任何一位被选中的概率是多大？

4.22 会计师查账。会计师在查账时，会用分层样本来查证诸如应收账款之类的记录。分层的依据是每个项目的金额，他们通常会把金额最高的几个项目全部放入样本。某家公司查证5000项应收账款。其中有100项的金额超过50000美元，有500项在1000～50000美元之间，其余4400项低于1000美元。把这三组当作层，假设你决定在金额最高的层中，每一项都要查证，中等金额的层查证5%，金额低的层只查1%。你需要从中抽取样本的这两层应该怎样编号？使用表A从第115行开始从这两层中各抽出前5项。

4.23 抽样悖论。例8比较了两个简单随机样本，分别是一所大学的本科生和研究生。本科生样本占本科生总体的比例比较小，只有1/90，而研究生样本则占研究生总体的1/15。但是，在本科生中每90人抽取1人的抽样误差，反而比在研究生中每15人抽取1人的还要小。向一个不懂统计学的人解释，这是为什么。

4.24 评估一项民意调查。练习4.14中有《华尔街日报》对于一项抽样调查的部分描述，从中可以看出，样本是分几个阶段抽取的。为什么？第一阶段无疑采用了分层样本，虽然该报并未明说。说明一下，为什么从全美数量众多的区域中抽取简单随机样本，而不用分层样本，并不是一个好主意？

4.25 多阶段抽样。《科学》杂志中有一篇文章，探讨的是欧洲和美国，对于转基因食品的态度有无不同。这就需要做抽样调查了。欧洲的调查是在欧洲的17个国家中各抽取一个1000名成年人的样本。以下是部分描述：“欧盟民意调查（Eurobarometer）是一项多阶段针对随机概率样本的面对面访谈。”

（a）多阶段是什么意思？

（b）你可以看到第一阶段是分层样本，都包括哪几层？

（c）随机概率样本是什么意思？

4.26 高中在线课程。成年人对高中在线课程有什么看法？城市、郊区和乡村的成年人对这个问题的意见有什么不同吗？为了寻找答案，实验人员想问成年人以下问题：

高中的课程可以从网上获得，这种情况已经很普遍了。你认为在你们社区，公立高中是否应该要求每个学生至少学一门在线课程？

因为大部分人住在人口稠密的城市或郊区，如果抽取一个简单随机样本，可能只包含很少的乡村成年人。而且，从很大一个区域做随机抽样的费用很高，最好是先抽出学区，而不是直接抽取成年人。请你提出一个合适的抽样设计，并说明你为什么要这样设计。

4.27 系统随机样本（systematic random sample）。 “当前人口调查”（例7）的最后一个阶段用了一个系统随机样本，下面这个例子可以说明系统随机样本是怎么一回事。假设我们要在宿舍楼的100个房间中抽出4个房间。因为100/4=25，所以我们可以把100个房间的清单拆分成4个清单，每个清单上有25个房间。用表A从前25个房间中随机选出一个房间，样本会包括选出的这间以及这间之后的第25、第50及第75个房间。比如，最先选中13号房，则系统随机样本就包括号码为13、38、63与88这4个房间。请你用表A从200个房间的清单中选出一个包含5个房间的系统随机样本，从第120行开始。

4.28 系统随机样本不是简单随机样本。练习4.27描述了一个系统随机样本，和简单随机样本一样，系统随机样本也给予每个个体相同的被选中的机会。即便如此，为什么系统样本却不是简单随机样本。

4.29 设计一项针对学生的抽样调查。学生自治会计划从学生当中抽取随机样本，了解他们对校园停车的意见。学校提供了一份20000名学生的注册名单作为抽样框架。

（a）你会用什么方法选出一个200名学生的简单随机样本？

（b）你会用什么方法选出一个200名学生的系统随机样本？（参考练习4.27对系统随机样本的说明。）

（c）学生名单上标注了学生是住校（8000名学生）还是未住校（12000名学生）。你会用什么方法抽取一个包含50名住校生和150名不住校生的分层样本？

4.30 从学生中抽样。你想知道和你同校的学生对于学校推动的实验课程额外收费政策有什么看法。你申请到了经费，可以访问500名学生。

（a）定义你这项研究的总体是什么，比如，是否包括非全日制学生？

（b）说明你的抽样设计，比如，你会不会采用一个以专业进行区分的分层样本？

（c）你预计会遇到什么实际困难，比如，你怎样联络样本中的学生？

4.31 购物中心访谈。第2章的例1描述了在购物中心进行的访谈。这是任意样本的例子，为什么它不是概率样本？

4.32 引产手术。以下是针对同一个话题的三个民意调查问题和调查结果：

• 美国高等法院近期通过了一项认定引产手术为非法的法律，你支持还是反对美国高等法院的这项判决？结果表明有53%的人支持，有34%的人反对。

• 美国高等法院近期通过了一项认定引产手术为非法的法律。引产手术是在妊娠中后期进行的人工流产手术，有时胎儿已经长得足够大，可以在宫外存活。美国高等法院判决该类手术为非法，无论孕妇的健康状况如何。你支持还是反对美国高等法院的这项判决？结果表明有47%的人支持，有43%的人反对。

• 我想问你对引产手术的看法，这种手术一般在妊娠中后期做。你认为美国高等法院应该宣判这种手术为非法吗？结果表明，有66%的人认为非法，有28%的人认为合法。

用这个例子讨论用民意调查来了解大众看法的困难性。

4.33 网上练习。皮尤研究中心的网站是www.people-press.org，登录该网站并浏览其重磅调查。本章最后一节列出了关于民意调查我们应该问的一些问题，皮尤研究中心的这个网站是如何回答这些问题的？你可能会发现该调查结尾的链接有助于你找到这些问题的答案。

4.34 网上练习。美国民意调查协会的网站上有一些关于民意调查的讨论，可以在www.aapor.org/Poll_andamp_Survey_FAQs.htm.上找到。点击Questions to Ask When Writting about Polls，找到如何评估一项调查是好是坏的建议。点击Bad Samples，可以看到一些坏调查的例子。

4.35 网上练习。哈里斯在线调查不再提供其所做调查的误差范围的说明。哈里斯研究机构的网址是www.harrisinteractive.com/Insights/HarrisVault.aspx?PID=434。浏览该网站，在近期调查的结尾部分读读“方法论”，写一个简单的报告，解释为何哈里斯不再提供关于误差范围的说明。

4.36 网上练习。登录盖洛普网站www.gallup.com/Home.aspx并浏览其最近做的调查，包括结尾部分中有关调查方法的说明。其样本是否来自随机抽样？

第4章 真实世界中的抽样调查

第4章
真实世界中的抽样调查