描述性统计量是研究随机变量变化综合特征(参数)的重要工具,它们集中描述了变量变化的特征,如果仅需要了解统计量的值,则使用描述过程计算更加简明。
SPSS的描述性分析的功能和上节介绍的“频率”基本类似,主要以计算数值型单变量的统计量为主,但是没有图形功能。
描述性过程还有个特殊功能,那就是可将原始数据转换成标准常态评分值,并以变量值的形式存入数据库中,以便后续分析时使用。
调用此过程可对变量进行描述性统计量分析,计算并列出一系列相应的统计指标,包括平均值、总和、标准差、最大值、最小值、方差、范围和标准误差平均值等,并且可将原始数据转换成标准Z分值存入数据库,即在数据集中生成一个新的变量,该变量自动命名为“Z+原变量名称”,大小即为原变量的标准常态变换结果。
所谓Z分值是指某原始数值比其均值高或低多少个标准差单位,高的为正值,低的为负值,相等的为零。
在数据窗口建立或打开一个数据文件后,即可进行描述性分析。
在数据编辑窗口中选择主菜单栏中的“分析”选项,然后选择“描述统计”子菜单,选择“描述”命令,打开如图3-13所示的对话框。
图3-13 “描述”对话框
在左侧的源变量框中选择一个或多个变量作为待分析的变量,单击
按钮移入“变量”框中。
源变量框下方有一个“将标准化值另存为变量”复选框。如果选中该复选框,表示对“变量”框中选中的变量进行标准化,产生相应的Z分值,并且作为新变量保存在数据窗口中,新变量的变量名为“Z+原变量名”。例如,“班级”变量对应的新变量名称为“Z班级”。
标准化计算公式:
其中,X i 为变量x的第i个观测值,X为变量x的平均数,S为标准差。Z分值表示一个变量值与该变量的平均值之差是标准差的倍数。
单击右侧的“选项”按钮,打开如图3-14所示的“描述:选项”对话框,在该对话框中可以指定输出哪些基本统计量及输出结果显示的顺序。
图3-14 “描述:选项”对话框
基本统计量的功能在本章的前部分已经讲过,读者可参照前文进行学习,此处不再赘述。系统默认的摘要变量包括平均值、标准差、最小值和最大值。
与前面所讲的不同之处在于,“描述:选项”对话框中增加了“显示顺序”选项组,用于设置输出顺序。当“变量”框中有多个变量时,“显示顺序”框确定其输出顺序:选择“变量列表”表示按“变量”框中的排列顺序进行输出;选择“字母”表示按各变量的首字母顺序进行输出;选择“按平均值的升序排序”表示按平均值的升序排列;选择“按平均值的降序排序”表示按平均值的降序排列。
设置完毕后,单击“继续”按钮确认设置并返回到“描述”主对话框,然后单击“确定”按钮执行统计量的描述性分析。
随着居民生活水平的提高,我国学生体重、身高和年龄的对比关系呈逐年上升趋势。为了让读者更好地理解描述性分析过程,我们以“学生体检数据.sav”文件为例,对某校3个班级中的16名学生的体检数据进行描述性分析,以班级为单位列表计算年龄、体重、身高的统计量,要求包括极差、最小值、最大值、平均值、标准差和方差。
具体数据见表3-4。
表3-4 3个班级的学生体检数据表
续表
在本例中需要对所有数据进行分组,以班级作为分组变量。在“描述”过程中并没有提供分组的功能,分组功能的实现需要借助上一章所讲的“拆分文件”过程,具体操作读者可参照第2章。
下面讲解具体的操作步骤。
(1)在打开数据文件后,按“班级”变量对数据进行分组。在主菜单栏中的“数据”菜单中选择“拆分文件”命令,打开拆分文件的对话框,选中“比较组”复选框,然后将“班级”变量选入“分组方式”文本框,单击“确定”按钮即可完成分组。
(2)在主菜单栏中打开“描述”对话框,在变量列表框中选择“年龄”“体重”“身高”变量,单击
按钮将选中的变量移到“变量”框,并且选择“将标准化值另存为变量”复选框,即要求以变量形式保存Z分值。
(3)选择完变量后,单击“选项”按钮,进入“描述:选项”对话框,进行统计量的选择。在本例中,选择“范围”“最小值”“最大值”“平均值”“标准差”“方差”。然后单击“继续”按钮确认选择并返回主对话框。
(4)设置完毕后,单击“确定”按钮,系统将执行描述性分析。单击“粘贴”按钮将得到如下所示的语法命令语句程序。
具体分析结果见表3-5。
表3-5 描述性统计分析结果
续表
从表3-5中可以看到各统计量的值,包括观测量个数、最小值、最大值、平均值、标准差和方差。表中给出了3个班级的相应统计量,随着平均年龄的增加,体重和身高的平均值都在明显增加;同时,相应的标准差也有增大的趋势。
这时打开原数据集,可以看到增加了Z性别、Z年龄、Z体重3列,这是变量的Z分值,如图3-15所示,可以将其保存起来做其他分析。
图3-15 保存了Z分值的数据集