数据收集的方法是指获取统计数据的渠道或途径。从数据的来源看,常用的方法有直接观测法、试验法、调查法,以及通过数据库、社会公开出版物、互联网等进行收集。直接观测法、试验法、调查法主要用于收集一手数据,而通过数据库、社会公开出版物、互联网主要用于收集二手数据。
1.一手数据的收集方法
直接观测法是指针对研究目的,对被调查对象进行直接观测,从而获得所需要的数据。直接观测法是获取数据最简单的方法,它的优点是成本相对较低。例如,想要了解一个班级学生的学习情况如何,研究人员可以通过选择一个班级中的样本来收集观测数据,对样本中的每个学生询问其过去一年中的学习情况,以了解整个班级学生的学习情况。
试验法是通过在一定条件下的规模试验,根据试验结果得到想要的数据。这种方法的应用范围比较广泛,很多社会科学领域都在使用。例如,研究人员可以随机地选择学生,用一定的方式将学生分成两组,分别用不同的教学方法进行教学,通过一个学期的教学试验判断两种不同教学方法对成绩是否产生显著性影响。
调查法是通过对调查对象的各个方面进行调查而获取数据。因其成本较低且得到的信息较全面,所以是数据收集最常用的方法,在国内外的社会调查中被广泛使用。调查法要考虑的一个重要方面是回答率的问题。回答率是指调查对象中能做出回答的人所占的百分数。过低的回答率会影响调查的结果。因此,研究人员要提高回答率,提高数据的可靠性,在调查中可以通过面访、电话访问、自填式问卷等方式收集调查数据。
面访是访问者事先准备好一系列调查的提纲或问题,通过提问的方式直接从受访者那里获取数据。面访的优点是回答率比较高,由于当面提问,有问题可以当面解答,所以回答误差也比较小;缺点是成本比较高,当距离比较远的时候面访比较困难。
电话访问是访问者按照事先拟定的问题直接通过电话向受访者提问并期待回答。电话访问的问题比较少且简洁,其优点是成本比较低;缺点是回答率比较低,如果提出的问题受访者不感兴趣,受访者可能会直接挂断电话。
自填式问卷是指研究人员把设计好的问卷发放给受访者,由受访者根据问题自行填写答案的数据收集方法。问卷大多用邮寄、个别分送或集体分发等多种方式发送。一般来讲,问卷中的问题比面访和电话访问中的问题更为详细、完整和易于控制。这种调查的成本比较低,适用于大样本数据调查。但是,由于受访者对问题的理解能力会有偏差,所以回答率比较低,回答误差比较大。
2.二手数据的收集方法
数据库是按照数据结构来组织、存储和管理数据的仓库,是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。国家统计局和各地区统计部门都拥有自己的统计数据库,任何一家企业基本都会有自己的数据库,还有一些专门为模型检验、投资研究等提供专业服务的数据平台也提供数据库,在进行数据分析的时候可以直接从数据库中调取企业历年的经营数据。例如,锐思数据库、万得数据库等,这些数据库参照国际通用数据库的设计标准,又结合中国金融市场的实际情况,以实证研究为导向整体设计而成,成为很多科研人员研究的数据来源。
社会公开出版物是指经国家审定的出版单位出版、向社会公开发行的出版物。例如,公开出版的图书、报纸、杂志、专业性的数据刊物、统计年鉴和统计报告等。研究人员可以通过文献检索等方法从中获取想要的数据。
通过互联网收集数据是指利用搜索引擎等工具,从互联网收集想要的数据资料,或者在一些门户网站上直接下载相关的数据,例如,通过直接在网上查找券商行业研究报告,查看招股说明书或公司财报等获取数据。由于越来越多的报纸、杂志、电台等传统媒体在网上发布资讯,还有政府、企业等机构也纷纷上网发布报告,因此互联网成为信息的海洋,信息蕴藏量极其丰富。互联网调查充分利用了互联网的开放、自由、平等、广泛和直接等特性,使得调查具有传统调查手段和方法所不具备的一些独特性优势,即调查的及时性、低成本、交互性、客观和突破时空的限制。因此,通过互联网收集数据也是调查者常用的一种方法。