购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第一节
统计数据整理的基本内容

统计数据整理是统计工作的重要组成部分,是确保统计工作有效和高效的基础,它居于统计调查与统计分析的中间环节,有承前启后的重要作用。

一、统计数据整理的含义和作用

统计数据整理是按照统计研究的要求,对调查所收集到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体综合数量特征的工作过程。例如,由人口普查得来的原始资料是说明每个居民的性别、年龄、民族、职业等标志的具体表现,而统计研究的目的是要了解人口总体的特征。因此,只有将这些原始资料进行分类和综合,才能得到全国男女人口总数,分民族、分地区的男女人口总数等说明人口总体特征的数字资料。

广义的统计数据整理还包括系统地积累原始资料,并根据其他分析需要而对加工整理过的统计资料进行再加工。

统计数据整理是整个统计工作和研究过程的中间环节,是对社会经济现象的认识从感性上升到理性的过渡阶段,统计数据整理既是统计调查阶段的继续和深入,又是统计分析的基础,它具有承前启后的作用。统计调查所收集到的资料只有通过科学的审核、分类、汇总等整理工作,才能使统计在认识过程中实现由个别到总体、由特殊到一般、由现象到本质、由感性到理性的转化,才能从整体上反映出事物的数量特征。否则统计调查所得的资料再丰富、再完备,也难以发挥其作用,统计调查就将徒劳无益,统计分析也将无法进行。

二、统计数据整理的原则和步骤

(一)统计数据整理的原则

对统计数据进行加工整理,要遵循以下三个原则。

一是要分清现象的质与量。事物和现象具有品质和数量两个方面的属性。品质是说明根本特征或属性的,具有稳定性;数量则是用各种不同的数值表示的,具有易变性。在对统计资料进行加工整理时,要根据研究的目的和调查对象的特点,区分并把握事物质的方面和量的方面的特征及其差别程度。

二是要把握事物的全貌。事物和现象的特征是多方面的,每一个方面的特征对于了解这一事物都有一定的作用,不能只顾一方面而忽视另一方面。对统计资料进行整理,就要研究事物的全貌,描绘事物的整个发展过程,揭示事物的总体特征和规律性。

三是要抓住现象的本质特征。对特定的事物和现象来说,一般有一个方面或几个方面的特征是基本的、关键性的,能表现事物本质;而其余特征可能只有辅助、补充的意义。统计数据整理必须在对事物和现象进行深刻研究的基础上,对统计资料进行加工整理,以抓住最基本、最关键的特征。

(二)统计数据整理的步骤

统计数据整理是一项系统、科学的工作,需要有组织、有计划地进行。统计数据整理的全过程包括审核和检查统计资料,统计数据的预处理,统计分组与汇总,编制统计表或绘制统计图,统计资料的积累、保管和公布五个环节,需要按照一定的步骤进行。在进行统计数据整理之前,还应先设计并编制统计数据整理方案,对调查中收集到的资料进行整理,详细说明如何进行统计分组、采用哪些汇总指标等问题,形成统计数据整理方案。审核和检查原始资料、统计数据的预处理是统计数据整理的前提,统计分组是统计数据整理的基础,统计汇总是统计数据整理的中心,编制统计表或绘制统计图则是统计数据整理的结果。各个环节相互联结,共同构成了统计数据整理的工作过程。其中,统计分组与汇总、编制统计表或绘制统计图是统计数据整理的基本方法。统计数据整理的步骤如图3-1所示。

图3-1 统计数据整理的步骤

三、统计数据的计量尺度

统计数据是总体单位标志或统计指标的具体数量表现。要对客观现象进行计量,首先必须弄清数据的计量尺度问题。人们根据对研究对象计量的不同精确程度,将统计数据的计量尺度由低到高、由粗略到精确分为四个层次,即定类尺度、定序尺度、定距尺度和定比尺度。

定类尺度是最粗略、计量层次最低的计量尺度。它按照客观现象的某种属性对其进行分类,但没有顺序或大小之分。例如,性别(男、女)、颜色(红、黄、蓝)或民族(汉族、苗族、朝鲜族)等。也可以使用数值作为某种分类的代码,但并不反映其类别的优劣、量的大小或顺序。例如,学生按专业分为统计学、金融学、税收学等,并用“1”代表统计学,用“2”代表金融学,用“3”代表税收学,等等。定类尺度的主要数学特征是“=”或“≠”。在统计处理中,对于不同的类别,虽然可以计算单位数,但它不代表第一类的一个单位可以相当于第二类的几个单位。

定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。定序型数据具有内在固有大小或高低顺序,但它又不同于定距型数据,一般可以数值或字符表示。例如,职称变量可以有初级、中级和高级三个取值,可以分别用1、2、3等表示,年龄段变量可以有老、中、青三个取值,可以分别用A、B、C等表示。这里无论是数值型的1、2、3还是字符型的A、B、C,都是有大小或高低顺序之分的,但数据之间是不等距的,因为初级和中级职称之间的差距与中级和高级职称之间的差距是不相等的,定序尺度的主要数学特征是“<”或“>”。

定距尺度也称等距尺度或区间尺度,它不但可以用数值表示现象的不同类别和顺序大小的差异,而且可以用确切的数值反映现象之间在量上的差异。值得注意的是,定距尺度没有绝对零点,其主要数学特征是“+”或“-”。例如,经度(或纬度),虽然经度(或纬度)的零度并不意味着没有经度(或纬度),但每个单位所代表的经度(或纬度)的差异是相同的。

定比尺度又称比率尺度或比较水平,也称比例尺度或等比尺度,是一种除具有上述三种尺度的全部性质之外,还有测量不同变量(社会现象)之间的比例或比率关系的计量尺度。定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数进行对比而形成的相对数(或平均数),用来反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业职工的工资总额与该企业的职工人数对比,计算出平均工资,并以平均工资反映该企业职工的平均收入情况。定比尺度的主要数学特征是“×”或“÷”。定比尺度在统计对比分析中应用十分广泛。

统计数据的四种计量尺度比较如表3-1所示。

表3-1 计量尺度比较

总之,标志及统计指标的具体数量表现都是统计数据,统计数据是统计实践活动所取得的成果,也是开展统计分析的基础。统计数据的计量尺度、表现形式纷繁复杂,而统计正是通过对纷繁复杂的数据进行收集、整理和分析,从而认识现象发展的趋势和规律性的。

四、统计数据的预处理

(一)初级数据资料的审核

对于初级数据资料,应该主要从数据资料的真实性、完整性、正确性和及时性进行审核。

真实性审核:主要是检查初级统计数据是否准确,是否经过任何形式的篡改或误报。在数据分析和决策过程中,初级数据的真实性至关重要,因为基于错误数据得出的结论可能会导致错误的决策。可以主要采取以下几种方法确保初级数据的真实性:确保收集过程的准确性和完整性,这是保证数据真实性的第一步;要评估数据来源的可信度,确保数据提供者的声誉和专业知识;确保数据收集和处理遵守相关的法律法规和道德标准;确保数据的收集方法、处理过程和分析方法的公开。

完整性审核:主要是检查调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。

正确性审核:主要是检查所填报的资料是否准确可靠。常用的审核方法有两种。一是逻辑检查。首先从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。例如,在一张调查表中,被调查者的年龄是12岁,职业是大学教师,其中应该有一个是错误的;又如,若在某劳动密集型行业的报表中,一家企业的企业规模为小型,而职工人数却是20000人,这其中也必定有一处错误。其次是检查各项目之间有无相互矛盾的地方。例如,企业的净产值大于同期总产值就是明显的逻辑错误。二是计算检查,即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。例如,期初数加本期增加数减本期减少数等于期末数,而若本期增加数多于本期减少数,期末数却没有期初数多,就一定是在哪个环节出现了差错,就要复查。

及时性审核:保证统计资料的及时性也是一个全局问题。及时性审核主要是检查所填报资料的所属时间、数据形成和提供等方面的时效性。及时性要求各填报单位及时完成各项调查的上报任务,从时间上满足各部门对统计资料的要求。一项统计任务的完成,是许多单位共同努力奋斗的结果,任何一个填报单位不能按规定的时间提供资料,都会影响全面的综合工作,从而贻误整个统计工作的进行。因此,保证统计调查的及时性要求各填报单位增强全局意识,认真遵守统计制度和统计纪律。

(二)次级数据资料的审核

对于次级资料,在完整性和准确性审核的基础上,要突出审核资料的适用性和时效性。在审核资料的适用性时,由于二手资料可以来自多种渠道,有些资料可能是为特定目的通过专门调查取得的,或是已经按特定目的要求做了加工整理。对于使用者来说,首先应该弄清资料的来源、口径以及有关的背景资料,以便判断资料的可靠程度,确定这些资料是否符合分析研究的需要,以及是否需要重新加工整理等,不能盲目生搬硬套;也可以从指标间的相互关系以及指标的变动趋势来检查资料的正确性;对不能满足现在要求、缺漏或有疑问的资料,要进行有科学根据的推算、弥补和修正。

对于时效性较强的问题,应对资料的时效性进行审核,因为所取得的资料如果过于滞后,就失去了研究意义。一般来说,应尽可能使用最新的统计数据资料。数据资料经过审核后,确认适合实际需要,才有必要做进一步的加工整理。

(三)数据资料审核后的订正

资料审核后的订正主要是指在发现有迟报、漏报和缺项等情况时,要及时催报、补报;如有不正确之处,则应分不同情况做如下处理。

一是对可以肯定的一般错误可代为更正,并通知原单位。

二是对可疑之数或无法代为更正的错误,应要求原单位复查更正。

三是如果所发现的差错在其他单位也可能发生,则应将错误情况通报所有单位,以免发生类似错误。

四是对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。

以上处理方式主要适合统计报表等通过报告法获取的资料。若是用采访法获取资料,处理方案要尽可能介绍详细、明确,并力争获得被调查者的全力支持,若是问卷调查,则必须在现场发现才能予以订正。

五、统计数据资料的筛选

数据资料的筛选是在所收集到的资料中找出符合特定条件的资料,或者删除不符合特定条件的资料。

对审核过程中发现的错误,应尽可能予以订正。调查结束后,当发现数据资料中有的错误无法进行订正,或者发现有的数据资料不符合调查要求而又无法弥补时,就要对数据资料进行筛选。数据资料的筛选包括两方面的内容:一是将某些不符合要求的数据资料或者有明显错误的数据资料予以剔除;二是将符合某种特定条件的数据资料筛选出来,将不符合特定条件的数据资料予以剔除。

六、统计数据资料的排序

数据资料的排序是指按一定顺序将数据资料排列,以便研究者通过查阅资料发现一些明显的特征或趋势,从而找到解决问题的线索。排序也有助于对数据资料检查纠错,为统计归类或分组等提供依据。在某些场合,排序本身就是分析目的之一。例如,世界500强企业排行榜、中国500强企业排行榜、纳税大户排行榜等,通过这些信息,经营者不仅可以了解自己企业所处的位置,清楚自己的差距,还可以了解竞争对手的状况,从而有效制定企业的发展规划和战略目标。

排序时,对于定类资料,如果是字母型资料,则排序有升序和降序之分,但习惯上人们更愿意使用升序排列,即由小到大排序,因为升序与字母的自然排列相同;如果是汉字型资料,则排序方式有很多,比如,可以按汉字的首位拼音排序,也可以按笔画排序,其中,也有按笔画多少的升序和降序排列。交替运用不同方式排列,在汉字型资料的检查纠错过程中十分有用。

在数值型资料中,定距资料和定比资料通常有递增和递减两种排序。设一组资料为 x 1 , x 2 ,…, x n ,递增排序后可表示为 x 1 < x 2 <…< x n ,递减排序后可表示为 x n >…> x 2 > x 1

排序后的资料称为顺序统计量,无论是品质资料还是数据型资料,排序均可借助于升序和降序功能完成。

同步思考3-1 ▶▶▶

1.为什么要进行统计数据整理?资料审核的完整性、正确性与及时性发生矛盾时应该怎样处理?

2.什么是定类尺度、定序尺度、定距尺度和定比尺度?如果用一班的期末统计学成绩与二班进行比较,这种方法属于哪一种数据计量尺度? /DbY6WbS6WNlqKpULRVO6u0PbhBS/g61dc9hBxEBNP1CCFVxzOcw4BDjT+EbsLI8

点击中间区域
呼出菜单
上一章
目录
下一章
×