收集数据前,先要对客观事物进行计量。人口的性别(男、女)、文化程度(高、中、低)、民族(汉、满、回、蒙古等),这些关于事物属性的分类,称为定性数据;长度、重量、身高、产值等,可以用精确的数字或数值来描述,称为定量数据。理论上,一切对象均可量化,量化类型无外乎四种:定类尺度、定序尺度、定距尺度、定比尺度。其中,定类尺度和定序尺度是定性数据,定距尺度和定比尺度是定量数据。这个排列是从较粗略(低)的计量到较精密(高)的计量变化。一般而言,较精密的计量尺度可以转换为较粗略的计量尺度,反之则不行。变量是随时发生变化的量,在SPSS中,变量名不区分大小写,“ABC” “aBc” “abc”都一样。变量名应容易读懂,披露所含数据用途,少用难懂的缩写。
定类尺度也称类别尺度或名义尺度,测量变量的类型,定类尺度之间的关系平等,不能进行加减运算。
1.请问你的性别是:
A.男 B.女
2.大部分情况下,你在哪里看电影:
A.电影院 B.电脑 C.电视 D.其他
3.请问你喜欢哪种题材的电影?(可多选)
A.爱情片 B.科幻片 C.恐怖片 D.喜剧片
E.枪战片 F.武侠片 G.动画片 H.其他
定序尺度也称等级尺度或顺序尺度,对变量各类之间进行排序。定序尺度比定类尺度高级,不仅指出类别,而且指出不同类别的大小。定序尺度可以比较大小,但也不能加减。
1.请问你的年级是:
A.大一 B.大二 C.大三 D.大四
2.您喜欢旅游吗?
A.非常喜欢 B.喜欢 C.一般 D.不太喜欢
E.不喜欢
3.广告对我影响力很小。
A.非常符合 B.比较符合 C.难以确定 D.比较不符合
E.不符合
定距尺度也称等距尺度或区间尺度,不仅能将变量区分类别和等级,还可以确定变量之间的数量差别和间隔距离。定距尺度只能进行加减运算,不能进行乘除运算。如一个班级某门课程的考分,可以从高到低分类排序,形成 90 分、80 分、70 分,直到 0 分的序列。它们不仅有明确的高低之分,还可以计算差距,90 分比80 分高 10 分,比 70 分高 20 分等等。定距尺度的计量结果表现为数值,可以进行加减运算,但不能进行乘除运算,原因在于等级序列中没有固定的、有确定意义的“0”。例如,学生甲得分 90 分,学生乙得 0 分,可以说甲比乙多得 90 分,却不能说甲的成绩是乙的 90 倍或无穷大。“0”分在这里不是一个绝对的标准,并不意味着乙学生毫无知识。就如同不能说 40℃比 20℃暖和 2 倍一样。没有确定的标准的“0”位,但有基本的确定的测量单位,如学生成绩的测量单位是 1 分,质量价差的测量单位量 1 元,温度的测量单位是 1℃,等等,这是定距尺度的显著特点。在广告和市场研究中,真正的定距尺度很少,一般把定序尺度当作定距尺度来处理。
定比尺度与定距尺度差别很小。两者细微差别在于对“0”的理解不同。在定距尺度中,“0”无意义,不表示“无”;在定比尺度中,“0”有意义,表示“无”。在大量日常生活中,长度、重量、产量、利润等变量,“0”都是表示该事物不存在,因而大多数情况下使用的是定比尺度。有时也认为定距尺度是定比尺度的特殊情况。对于定比尺度,所有统计方法都可使用。
表 2-1 对比了每种尺度衡量标准的特征。
表2-1定类、定序、定距和定比尺度对比
区分测量的层次和数据的类型十分重要,不同类型的数据应采用不同的统计方法来处理。比如,对定类数据,通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和 x 2 检验等;对定序数据,可以计算其中位数和四分位差,计算等级相关系数等非参数分析;对定距或定比数据,可以用更多的统计方法来处理,如计算各种统计量、进行参数估计和检验等。通常处理的多为数量数据。
适用于低层次测量数据的统计方法,也适用于较高层次的测量数据,因为后者具有前者的数学特性。比如:在描述数据的集中趋势时,对定类数据通常是计算众数,对定序数据通常是计算中位数,但对定距和定比数据同样也可以计算众数和中位数。反之,适用于高层次测量数据的统计方法,则不能用于较低层次的测量数据,因为低层次数据不具有高层次测量数据的数学特性。比如,对于定距和定比数据可以计算平均数,但对于定类数据和定序数据则不能计算平均数。