平均值过程计算一个或多个自变量类别中因变量的子组平均值和相关的单变量统计,也可以通过比较两个样本的均值来判断两个总体的均值是否相等。零假设:两个样本的均值没有显著差异。
(1)打开数据文件,选择“分析”→“比较平均值”→“平均值”,弹出“平均值”对话框,如图5-1所示,各项含义如下。
● 因变量列表:从左侧的变量列表中选择一个或多个变量进入其中。
● 自变量列表:从左侧的变量列表中选择一个或多个变量进入其中。其中自变量列表还可以选择一层或多层变量,通过单击 完成。
图5-1 “平均值”对话框
(2)单击 按钮,弹出“平均值:选项”对话框,如图5-2所示,设置输出的统计量,各项含义如下。
● Statistic:该列表用于显示统计量,包括中位数、组内中位数、标准平均值误差等,可以通过单击 按钮,将左边需要统计的项目选入右边的“单元格统计”中。
统计量中有一些如平均值、中位数等,第4.1.1节已经介绍,不再重复。其余各项含义如下:
➢ 第一个:显示在数据文件中遇到的第一个数据值。
➢ 最后一个:显示在数据文件中遇到的最后一个数据值。
➢ 调和平均值:在组中的样本大小不相等的情况下用来估计平均组大小。调和平均值是样本总数除以样本大小的倒数总和。
➢ 几何平均值:数据值的乘积的n次根,其中n代表个案数目。
➢ 总个案数的百分比:每个类别中的个案总数的百分比。
➢ 总和的百分比:每个类别中的总和百分比。
● 单元格统计:显示选中需要统计的统计量。
● 第一层的统计。
➢ Anova表和eta:选择此项,即对第一层次进行方差方差分析,显示单因素方差分析表,可以得出第一层次的分组的均值之间是否存在显著差异。
➢ 线性相关度检验:选择此项,即对第一层次进行线性检验,计算与线性和非线性成分相关联的平方和、自由度和均方,以及F比、R和R方。
图5-2 “平均值:选项”对话框
实例一:“data05-01.sav”数据文件是调查了社会上400名男女性的年龄、受教育年限、储蓄金额,如图5-3所示。现要求利用平均值检验对男女性之间储蓄金额是否有差异进行检验。
图5-3 “data05-01.sav”数据
(1)打开“data05-01.sav”数据文件,选择“分析”→“比较平均值”→“平均值”,弹出如图5-1所示的“平均值”对话框。
(2)在左侧的变量列表中选中“储蓄金额”变量,单击 按钮,将其选入“因变量”列表;将“性别”变量选入“自变量”列表中。
(3)单击 按钮,弹出如图5-2所示的“平均值:选项”对话框,统计量为系统默认,勾选“Anova表和eta”和“线性相关度检验”复选框,单击 按钮返回主对话框。
(4)完成所有设置后,单击 按钮执行命令。
从表5-1和表5-2可以看出个案数为400,其中男性的个案为166,储蓄金额的平均值为198239.97,标准偏差为100439.918,女性的个案为234,储蓄金额的平均值为192834.38,标准偏差为84223.143。
表5-1 个案处理摘要
表5-2 报告储蓄金额
从表5-3和表5-4可以看出,显著性为0.560,大于0.05,说明男性与女性的储蓄金额之间没有显著差异,此外,相关性测量中Eta的平方为0.001。
表5-3 ANOVA 表a
a.少于三组,因此无法计算 储蓄金额*性别 的线性度量。
表5-4 相关性测量