购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第二节
调查资料搜集

调查资料的搜集方法不同于其他资料的搜集方法,是通过调查来获得,从调查对象所包含的范围角度来讲,主要包括普查和抽样调查两种类型,从具体的调查方式的角度来讲,主要涉及问卷调查法、访谈法和敏感问题调查法等,而且不同的调查方式所搜集的资料,其应用范围和应用价值存在明显差异。

一、普查

普查是为了某种特定目的而专门组织的一次性的全面调查。一个国家或者一个地区为详细调查某项重要的国情、国力,往往需要专门组织开展普查,主要用来调查不能够或不适宜用定期全面的调查报表来收集的资料,以搞清重要的国情、国力。现阶段,由我国政府相关部门组织开展的普查工作主要包括人口普查(最近一次是第六次人口普查)、经济普查(最近一次是第二次经济普查)等。

普查作为一种特殊的调查资料搜集方式,具有以下几个特点:

1.一次性或周期性 由于普查涉及面广、调查单位多,需要耗费大量的人力、物力和财力,通常需要间隔较长的时间才开展一次。如我国的人口普查从1953年至2010年共进行了6次,基本上每隔10年开展一次人口普查。近年来,我国的普查工作更加规范化、制度化,相关部门规定,我国今后的普查工作中,每逢末尾数字为“0”的年份进行人口普查,每逢“3”的年份进行第三产业普查,每逢“5”的年份进行工业普查,每逢“7”的年份进行农业普查,每逢“1”或“6”的年份进行统计基本单位普查。

2.规定统一的标准时点 标准时点是指对被调查对象登记时所依据的统一时点。调查资料必须反映调查对象的这一时点上的状况,以避免调查时因情况变动而产生重复登记或遗漏现象。例如,我国第六次人口普查的标准时点为2010年11月1日0时,就是要反映这一时点上我国人口的实际状况;农业普查的标准时点定为普查年份的1月1日0时。

3.规定统一的普查期限 在普查范围内各调查单位尽可能同时进行登记,并在最短的期限内完成,以便在方法和步调上保持一致,保证资料的准确性和时效性。特别是针对人的各类调查,由于人口具有可流动性,如果不能在统一的期限内完成调查,那么,就会出现同一个人在不同的地方都被接受了调查或者都没有被调查的情况,导致重复或漏报,使得数据不准确。

4.规定统一的项目和指标 普查时必须按照统一规定的项目和指标进行登记,不准任意改变或增减,以免影响汇总和综合。同一种普查,每次调查的项目和指标应力求一致,保证统计口径的一致,以便于进行历次调查资料的对比分析和观察社会经济现象发展变化情况。普查涉及的指标数量要适度,不能太多,也不能太少,因为普查工作费时费力,如果指标太多,要花费的人力物力和财力是非常大的,如果指标太少,就会存在不准确的问题。

二、抽样调查

抽样调查(sampling survey)是一种非全面调查,是指从总体中抽取一定数量的具有代表性的个体而开展的调查。抽样调查的目的是按照科学的原理,从若干单位组成的总体中,抽取部分样本单位来进行调查、观察,用所得到的样本调查数据对总体作出推断。

抽样调查的应用先驱之一是法国著名数学家Laplace,早在18世纪(1786年)就利用人口出生统计样本资料,估计了当时全法国的人口总数,开创了应用抽样调查资料作出科学推断的先河。1895年,另一位欧洲的统计学家,挪威的A.K.Kiaer,首次在全国范围里釆用科学的抽样方法,抽选并调查了一定数量的有代表性的城市和乡村,推算了当时挪威全国的国民收入和财富,由此而写成的论文引起了当时世界各国政府和统计学界的极大关注。

抽样调查有很多分类方法。根据抽取样本的方法,可以分为概率抽样和非概率抽样;根据抽样的阶段,可以分为单阶段抽样和多阶段抽样;按调查时间顺序可分为回顾性调查(如病例-对照研究)、前瞻性调查(如队列研究)、现况调查和历史前瞻性调查;按时间的维度可分为横断面调查和纵向调查。常用的抽样方法如下:

(一)概率抽样

概率抽样(probability sampling)也称随机抽样,是指遵循随机化原则而进行的抽样,总体中每个单位都有一定的机会被选入样本。每个单位被抽中的概率是已知的,或是可以计算出来的。调查实践中经常采用的概率抽样方式主要包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等。

1.简单随机抽样(simple random sampling) 是从包括 N 个单位的总体中随机地抽取 n 个单位作为样本,每个单位入样的概率是相等的。简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。

所谓随机原则就是在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中。但是,随机不等于“随便”“随意”,随机有严格的科学含义,可以用概率来描述,而“随便”和“随意”则带有人为的主观因素。随机与随便的本质区别就在于,是否按照给定的入样概率,通过一定的随机化程序抽取样本单位。例如,要在一栋楼内抽取10位居民作为样本开展调查,若采用随机原则抽样,就需要事先将居住在该楼的所有居民制作抽样框,通过一定的随机化程序(如使用随机数表)抽取10位居民作为样本,这样可以保证居住在该楼的每位居民都有一定的机会被选中。如果调查人员并不是采取上述随机抽样的方法,而是站在楼前,将某一时点开始走出楼门的10位居民选入样本进行调查,这种抽样方法不能使居住在该楼内的所有居民都有一定的机会被抽中,已经在该时点前走出楼外的居民不可能被抽中,在调查时段不走出楼门的居民也没有机会被抽中,这种抽样方法就是随便抽样,不属于随机抽样。

简单随机抽样突出的特点是简单、直观,在抽样框完整时,可以直接从中抽取样本。但简单随机抽样在实际应用中也有一些局限:首先,它要求包含所有总体单位的抽样框,当 N 很大时,构造这样的抽样框并不容易;其次,根据这种方法抽出的单位很分散,给组织实施调查增加了困难;最后,这种方法没有利用其他辅助信息以提高估计的效率。所以,在规模较大的调查中,很少直接采用简单随机抽样,一般是把简单随机抽样和其他抽样方法结合在一起进行使用。

2.分层抽样(stratified sampling) 是将总体中的全部个体按某种特征或某种规则划分为若干层,然后从每个层中独立、随机地抽取样本,将各层的样本结合起来构成最终的样本,对总体进行估计。

第四次国家卫生服务调查的第一阶段的抽样中,将全国所有的县(市或市区)按照一定的方法进行分层,最后分为五层,第一层有201个县(市或市区),占整个县(市或市区)的8.2%;第二层有650个县(市或市区),占26.5%;第三层有698个县(市或市区),占28.5%;第四层有691个县(市或市区),占28.2%;第五层有212个县(市或市区),占8.6%。按照一定的方法确定调查的县(市或市区)样本量为90,具体抽取的样本为:第一层抽取了8个县(市或市区);第二层抽取了23个县(市或市区);第三层抽取了26个县(市或市区);第四层抽取了25个县(市或市区);第五层抽取了8县(市或市区)。样本量在各层的分配见表2-1。

表2-1 样本量在各层的分配

分层抽样有许多优点:样本的代表性较好,这种抽样方法保证了样本的结构与总体的结构比较相近,从而可以有效地提高估计的精度;分层抽样在一定条件下为组织实施调查提供了方便(当层的划分是按行业或行政区划进行时);分层抽样既可以对总体进行估计,也可以对各层进行独立的分析和估计;各层可以根据实际选择不同的抽样方法和资料搜集方法。

3.整群抽样(cluster sampling) 是先将总体分成若干个群,从中随机抽取几个群,抽中群内的全部个体组成调查的样本。

整群抽样划分群的原则是尽量扩大群内的差异,而缩小群间的差异。群与群之间无重叠,即任何一个总体单位只属于某一个群;全部总体单位毫无遗漏,即任何一个总体单位必定属于某一个群;每一个群包含的单位数可以是相同的,也可以是不同的,但必须是确知的。

与简单随机抽样相比,整群抽样的特点在于:抽取样本时只需要确定群的抽样框,而不必要求具有所有个体单位的抽样框,这就大大简化了编制抽样框的工作量;由于群通常是由那些地理位置邻近的或隶属于同一系统的个体单位所构成,因此调查的地点相对集中,从而节省了调查费用,方便了调查的组织实施。整群抽样的缺点:往往由于不同群之间的差异较大,抽样误差通常比较大。

4.系统抽样(systematic sampling) 是将总体中的所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。

典型的系统抽样是等距抽样,先对总体中的全部个体按照与研究现象无关的特征排列编号,然后根据所要抽取的样本量的大小,确定抽样间隔 k ,接着从数字1~ k 随机抽取一个数字 r ,对应编号的个体作为初始单位,以后每隔一个 k 抽取一个个体。如总体包含的单位数为 N ,则抽样间隔 k = N / n ,一般要取整。

系统抽样的主要优点是操作简便,容易得到一个在总体中分布均匀的样本;如果有辅助信息,对总体内的单位进行有组织的排列,可以有效地提高估计的精度。系统抽样的缺点是对估计量方差的估计比较困难;当总体中的个体有周期性趋势或增加(减少)趋势时,容易产生偏倚;抽到的样本较为分散,不易组织调查。

5.多阶段抽样(multi-stage sampling) 指在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样调查方法。

最简单的多阶段抽样是二阶段抽样,第一阶段抽取的单位称为初级抽样单位,第二阶段抽取的单位称为二级抽样单位,也是最终抽样单位。例如,某县要调查高血压患病情况,采用两阶段抽样调查,第一阶段抽取几个乡镇,乡镇就是初级抽样单位,第二阶段从抽中的乡镇直接抽取一定数量的居民,居民就是二级抽样单位。将这种方法推广,使抽样的阶段数增多,就称为多阶段抽样(multi-stage sampling)。例如第一阶段抽取初级抽样单位,第二阶段抽取二级抽样单位,第三阶段抽取接受调查的最终抽样单位就是三阶段抽样;同样,还有四阶段抽样、五阶段抽样等。不过,即便是大规模的抽样调查,抽取样本的阶段也应当尽可能地减少,因为每增加一个抽样阶段,就会增加一份估计误差,用样本对总体进行估计也就更加复杂。国家卫生服务调查所采用的抽样方法就是多阶段抽样,第一阶段是以县(市或市区)为抽样单位,第二阶段是以乡镇(街道)为抽样单位,第三阶段以村为抽样单位,最后是住户为样本个体,即最终抽样单位。

多阶段抽样具有整群抽样的优点,它保证了样本相对集中,从而节约了调查费用;不需要包含二级甚至更低级抽样单位的抽样框,在以后的各阶段抽样中,仅仅需对那些已抽中的单位准备下一级单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开。在较大规模的抽样调查中,多阶段抽样是经常被采用的方法,适用于抽样调查的面特别广,包括没有一个包含所有总体单位的抽样框,或总体范围太大、无法直接抽取样本等情况。多阶段抽样主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。

(二)非概率抽样

非概率抽样(non-probability sampling)是相对于概率抽样而言的,指抽取样本时不是依据随机化原则,而是根据研究者的意愿、判断或方便程度等条件,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样往往会产生较大的抽样误差,而且还无法估计这种误差的大小,难以保证样本的代表性。虽然根据非概率抽样的样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。因此,在大型的正式调查中,很少采用非概率抽样,常常在探索性研究、研究初期、无法确知总体边界难以实施概率抽样等情况下才会使用。非概率抽样的方式有许多种,可以归为以下几种类型。

1.方便抽样 调查过程中由调查员依据方便的原则,选取样本进行调查的方式。如调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行的调查;某医生调查某病患病的情况,直接对就诊的病人进行调查等等。这种抽样调查不属于概率抽样,也不属于随机抽样,但是,在很多的研究实践中却被误认为是随机抽样,而且还进行总体的推断分析,这些做法都是错误的。

方便抽样的最大特点是容易实施,调查的成本低,但这种抽样方式也有明显的弱点。例如,样本单位的确定带有随意性,因此,方便样本无法代表有明确定义的总体,将方便样本的调查结果推广到总体是没有任何意义的。因此,如果研究的目的是对总体有关的参数进行推断,使用方便样本是不合适的。但在科学研究中,使用方便样本可以产生一些想法,对研究内容有初步认识,或建立假设。

2.判断抽样 又称为立意抽样,是指研究人员根据经验、主观判断和对研究对象的了解来选择和确定样本的调查方法。例如,某奶粉生产企业欲了解消费者对奶粉成分的需求,调查一些年轻的母亲,因为她们购买奶粉的数量较大,并对奶粉的成分有更高的要求,通过她们,可以了解消费者购买奶粉时的选择意向。

判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性,当研究者对自己的研究领域十分熟悉,对研究总体比较了解时采用这种抽样方法,可获代表性较高的样本。判断抽样的抽样成本比较低,也容易操作,但由于样本是人为确定的,没有依据随机的原则,因而调查结果不能用于对总体参数进行估计。

3.滚雪球抽样 在滚雪球抽样中,首先选择一组调查对象,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,再由这些人提供第三批调查对象……依次类推,样本如同滚雪球般由小变大。例如,欲对冬泳爱好者进行某项调查,调查人员首先找到若干名冬泳爱好者,然后通过他们找到更多的冬泳爱好者。

滚雪球抽样的主要优点是容易找到那些属于特定群体的被调查者,根据物以类聚、人以群分的规律去找寻被调查者,调查的成本也比较低。它适合对特定群体进行研究的资料搜集,如对吸毒者、性工作者的调查均可采用滚雪球抽样的方法。

4.配额抽样 也称为定额抽样,首先将总体中的所有单位按一定的标准分为若干类,然后在每个类中按照各层样本数与该层总体数成比例的原则主观抽取样本。定额抽样与分层抽样很接近,最大的不同是分层抽样的各层样本是随机抽取的,而定额抽样的各层样本是非随机的。

配额抽样操作比较简单,而且可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似。但因为在抽取具体样本单位时,并不是依据随机原则,所以它属于非概率抽样。

三、调查方式选择

科学研究所涉及的调查方式包括很多,每种调查方式都有特定的优点和不足,有其使用的范围和条件,调查方式的选择需要考虑多种因素进行综合确定,包括调查总体的性质、样本量、调查目的、调查时限要求、经费多少等。比较常见的调查方式有以下几种:

(一)问卷调查法

问卷调查法也称问卷法,是调查者运用统一设计的问卷向调查对象了解情况或征询意见的调查方法。例如,2008年我国进行的第四次国家卫生服务调查中,采用问卷调查法对56400住户进行了调查,家庭健康询问调查问卷包括八个问题表格:《家庭一般情况调查表》《家庭成员健康询问调查表》《15~49岁已婚育龄妇女(在婚、离婚、丧偶)调查表》《5岁以下儿童调查表》《60岁及以上老年人口调查表》《两周病伤调查表》《住院病人调查表》和《农村地区外出务工及随行家庭成员调查》。

问卷中所设计的问题可以分为三种类型:

1.封闭型问题 指问卷将问题的几种主要答案、甚至一切可能的答案都全部作为选项列出,然后由被调查者从中选取一种或几种答案作出回答。第四次国家卫生服务调查的八大调查问卷中的大部分问题都属于封闭型问题。例如:调查新型农村合作医疗参加情况时,“您家没有参加或退出的最主要原因是什么?”具体的答案列出8个选项:①不值得参加。②付不起参合费。③因为报销少,还是看不起病。④不愿意支付参合费。⑤报销太麻烦。⑥不信任该制度的管理或管理不好。⑦对该制度了解不够。⑧身体好没必要参加。

2.开放型问题 指问卷对问题不提供任何具体答案,而由被调查者自由回答。例如:“您认为实施新型农村合作医疗之后对您的就医选择有哪些帮助?”

3.混合型回答 指封闭型回答与开放型回答相结合,实质上属于半封闭、半开放的回答类型。例如:“您生病后是否去医院就诊过?0是,1否(请说明主要原因)。”

(二)访谈法

访谈法是调查者直接向被调查者进行口头提问、当场记录的一种调查方式。访谈法在一般的研究中具有广泛的使用性,但是访谈法对调查者的要求较高。

访谈法根据被访谈者的数量可以分为:①焦点小组访谈法:也叫小组座谈法或小组讨论法,它是挑选一组具有代表性的被调查者,在一个装有单向镜或录音、录像设备的房间中,采用小型会议的形式,由主持人引导对研究主题进行讨论,从而获得信息的一种调查方法。②深入访谈法:是指调查员和一名被调查者在轻松自然的气氛中就某一问题进行深入讨论,目的是让被调查者自由发言,充分表达自己的观点。

(三)敏感问题调查法

在医疗卫生领域的研究中,经常会涉及一些不受被调查者欢迎、容易引起尴尬的敏感性或高度私密的问题,如销售药品的回扣是多少?婚前有无性行为?考试是否作弊?这类问题,如果直接调查,被调查者很可能会拒绝回答,导致应答率很低或得到不可靠的数据。因此,必须采取特殊的科学可行的方法进行调查,主要包括:

1.释疑法 在问题前面写一段消除顾虑的文字,或是在调查表的引言部分写明替被调查者严格保密,并说明将采取严格的保密措施。

2.假定法 用一个假定条件句作前提,然后再询问被调查者的看法。如:“如果目前没有偷税漏税的相关法律限制,你会偷漏税吗?”

3.转移法 把本应该由被调查者根据自己的实际情况回答的问题,转移到由被调查者根据他人的情况来阐述自己的想法,如“有人认为在校大学生发生婚前性行为是正常的,您觉得呢”?

4.随机应答技术(randomized response technique,RRT) 通过设计两个相互无关的问题或者相互对立的问题,让被调查者随机选择回答哪个问题,事先约定不管抽到哪个问题都如实回答,通过其回答来推断出某种行为的发生率。当研究者的主要目的在于估计某种隐私行为的概率时,随机应答技术是比较理想的选择。因为调查者和其他回答者均不知道被调查者回答的是哪个问题,因此被调查者能够放心地如实回答。 PF920fRLq52kopsaAsm2Zb9ksyHrfNVAzpPgJ4g2TmXauFIrey4vbw92C+Xx7bd8

点击中间区域
呼出菜单
上一章
目录
下一章
×