数据收集的方式是指获取数据的组织形式。如果要收集总体中每一个个体的数据,这种调查组织形式就是普查。例如,我国的人口普查,每10年进行一次,会对每个人的个人特征数据进行调查;我国的第三产业普查,也是每10年进行一次。普查耗时耗力,当总体单位数很大时一般难以实施,因此不经常进行。如果研究人员通过一定的抽样技术对总体进行抽样,获取代表性样本的数据,这种调查组织形式就是抽查。抽查既可以节约时间和金钱,又可以用样本的数据去推断总体的数量特征,是一种常用的数据收集方式。因此,在数据收集阶段,要解决的一个关键问题就是如何抽样。抽样的形式可以分为两大类,即随机抽样和非随机抽样。
1.随机抽样
随机抽样又称概率抽样,是指按照随机原则从总体中抽取样本单位,使得每个总体单位有一定的机会被选入样本,保证样本具有代表性的抽样方式。随机抽样有以下特点。
(1)按照随机原则抽选样本单位。所谓随机原则,是指样本单位的抽取不受任何主观因素及其他系统性因素的影响,总体中的每个单位都有一定的机会被抽选为样本单位。
(2)能用样本的指标数值推断总体指标数值。根据数理统计原理,抽样调查中的样本指标和对应的总体指标之间存在内在联系,而且两者的误差是可以计算出来的,因此提供了用实际调查部分信息对总体数量特征进行推断的科学方法。
(3)抽样误差可以事先计算并加以控制。以样本资料对总体数量特征进行推断,不可避免地会产生代表性误差,但抽样调查的代表性误差是可以根据有关资料事先计算并进行控制的,故可以保证推断结果达到预期的可靠程度。
随机抽样最主要的优点是,由于每个样本单位都是随机抽取的,根据概率论不仅能够用样本统计量对总体参数进行估计,还能计算出抽样误差,从而得到对总体目标变量进行推断的可靠程度。但随机抽样比较复杂,对调查人员的专业技术要求高,调查中需要确定抽样框,也就是确定抽样单位的名单,而构建和维护一个高质量的抽样框费用很高,抽样单位可能非常分散,而且不能轻易更换样本单位,这就增加了调查成本。
2.非随机抽样
非随机抽样又称非概率抽样,是指抽取样本的时候不按照随机原则,而是按照研究人员的专业知识、经验、态度或其他条件来抽取样本的抽样方式。
非随机抽样获得的样本,一般不能应用推断统计的方法进行分析。只有当以下几种情况出现时,才使用非随机抽样:①严格的概率抽样几乎无法进行;②调查目的仅是对问题的初步探索或提出假设;③调查对象不确定或根本无法确定;④总体各单位间离散程度不大,并且调查人员有丰富的调查经验。