购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.1.1 分类数据、顺序数据和数值型数据

1.分类数据

分类数据是只能归于某一类别的非数值型数据,它是对事物进行分类的结果,是分类变量的具体表现,数据表现为类别,是用文字来表达的。例如,性别可以分为男和女两类,因此性别变量的具体表现“男性”“女性”即为分类数据;我国的民族可以分为汉族、满族、藏族、蒙古族、维吾尔族等,因此民族变量的具体表现“汉族”“满族”“藏族”“蒙古族”“维吾尔族”等即为分类数据。虽然也可以用1或0表示男性与女性,用1、2、3、4、5等表示汉族、满族、藏族、蒙古族、维吾尔族等,但是这些数字没有大小比较之分,只是不同类别现象的一个代码,并不代表真正的值,不能进行数学计算。

用分类数据对现象进行分析时,由于不同类别间地位平等,没有高低、大小之分,各变量之间的顺序是可以改变的,因此这种数据也叫无序分类数据,它是数据中最粗略、计量层次最低的数据。

2.顺序数据

顺序数据是只能归于某一有序类别的非数值型数据,是顺序变量的具体表现,数据表现为有顺序的类别。例如,高校教师的职称可以分为助教、讲师、副教授和教授四类,因此职称变量的具体表现“助教”“讲师”“副教授”“教授”即为顺序数据;业主对住房的满意度可以分为很满意、满意、一般、不满意、很不满意五个等级,因此住房满意度变量的具体表现“很满意”“满意”“一般”“不满意”“很不满意”即为顺序数据;某银行的会员卡可以分为银卡、金卡、钻石卡三个等级,因此会员卡等级变量的具体表现“银卡”“金卡”“钻石卡”即为顺序数据。可以用数字1、2、3、4来表示职称数据,用5、4、3、2、1来表示住房满意度数据,用1、2、3表示银行会员卡等级数据,但这些数字代码只能体现一种顺序或程度,不能体现事物之间的具体数量差别。

由于客观现象的不同类别间存在顺序性差异,用顺序数据在对现象进行分析时,其顺序是不能随意排列的,因此这种数据也叫有序分类数据。

3.数值型数据

数值型数据不仅能反映事物所属的类别和顺序,还能反映事物类别或顺序之间的数量差距,有的数据可以通过对比计算来体现数据的相对程度,其结果表现为具体的数值。数值型数据是数值型变量的具体表现,是比顺序数据高一层次的数据,它不仅能将现象区分为不同类型并进行排序,而且可以准确地指出类别之间的差距。数值型数据是最常见的统计数据,现实中处理的数据大多数是数值型数据。例如,某地区企业的产值、利润、固定资产、职工人数、劳动生产率、资金周转率等都是数值型数据。

分类数据和顺序数据只能用文字或数字代码来表现品质特征或属性特征,因此统称为定性数据,也称品质数据;数值型数据用数值来表现事物的数量特征,因此称为定量数据,也称数量数据。

上述三种数据类型对事物的计量层次是由低级到高级、由粗略到精确逐步递进的。高层次数据具有低层次数据的全部特性,只要将高层次数据转化为低层次数据即可,例如,将考试成绩的百分制转化为五级制,相应的数值型数据就转化为顺序数据了。因此,适用于低层次数据的统计方法,也适用于高层次数据。例如,在描述数据的集中趋势时,对分类数据通常是计算众数,对顺序数据通常是计算中位数,但对数值型数据同样也可以计算众数和中位数。反之,适用于高层次数据的统计方法,则不能用于低层次数据,因为低层次数据不具有高层次数据的数学特性。例如,对于数值型数据可以计算数值平均数,但对于分类数据和顺序数据则不能计算数值平均数。

不同类型的数据,运用的统计计算方法也不同。例如,对于分类数据,通常计算出各组的频数或频率,计算其众数和异众比率等;对于顺序数据,可以计算其中位数和四分位差;对于数值型数据,还可以用更多的统计方法进行处理,如计算各种统计量、进行参数估计和检验等。不同类型的数据选用的统计方法也不同。例如,研究分类数据和顺序数据的关系时,可以进行频数分析、列联分析等;研究分类数据与数值型数据的关系时,可以用方差分析等;研究数值型数据之间的关系时,可以进行相关分析与回归分析等。 l9gaQDUQXtxOVmmnZVp8K3RT9153V4PfWC/TVvvzzI2RzVb9oJJYvus26F4gI4qx

点击中间区域
呼出菜单
上一章
目录
下一章
×