对于两个总体分布未知的样本,如果要检验这两个独立样本之间是否具有相同的分布,就要用到两独立样本的非参数检验,两独立样本的非参数检验是用于检验从不同总体中抽取的两个独立样本之间是否存在显著差异,零假设是两个独立样本来自的总体分布无显著性差异。
两独立样本K-S检验的基本思想与单样本K-S检验大致相同,主要差别在于两独立样本检验是以变量值的秩作为分析对象,而非变量本身。
首先,将两组样本混合并按升序排序;然后,分别计算两组样本秩的累计频数和累计频率;最后,计算两组累计频率的差值,得到秩的差值序列并得到 D 统计量,计算得到概率 p 值,如果 p 小于显著性水平,则拒绝零假设,认为两总体分布有显著性差异,反之则两总体分布无显著性差异。
常用的检验类型如下:
(1)Mann-Whitney U(曼-惠特尼)。
该检验是最常用的两个独立样本检验,主要是检验两个样本总体上的位置是否相等,等同于对两个组进行的Wilcoxon等级和Kruskal-Wallis检验。Mann-Whitney U检验对来自两个组的观察值进行组合和等级排序,在同数的情况下分配平均等级。
如果两个总体的位置相同,那么随机混合两个样本,然后计算组1分数领先于组2分数的次数,以及组2分数领先于组1分数的次数。Mann-Whitney U 统计是这两个数字中较小的一个。Wilcoxon W 统计量是具有较小等级平均值的组的等级之和。
(2)Kolmogorov-Smirnov Z(柯尔莫戈洛夫-斯米诺夫)。
该方法的计算是建立在两个样本的累积分布最大绝对差值的基础上的,当这个差值很大时,将这两个分布视为不同的分布,同时检测两个样本在位置和形状上是否存在差异。
(3)Moses(莫斯极限反应)。
假定实验变量在一个方向影响某些主体,而在相反方向影响其他主体。该方法是为了减少极端值的影响,控制样本数据的跨度,是对实验组中的极值对该跨度影响程度的测量。因为意外的离群值可能轻易使跨度范围变形,所以在剔除了各5%最大和最小值后,比较两个样本的极差是否相等。
(4)Wald-Wolfowitz(瓦尔德-沃尔福威茨)游程。
该方法是对两个样本数据进行组合和排秩后的游程检验,如果两个样本来自同一总体,那么两个组应随机分布在整个等级中。
(1)打开数据文件,选择“分析”→“非参数检验”→“旧对话框”→“两个独立样本”,弹出“两个独立样本检验”对话框,如图6-11所示,各项含义如下。
●检验变量列表:将左侧变量列表中的变量选入其中。
●分组变量:将左侧的变量列表中的变量选入其中。选入分组变量后,激活“定义组”按钮,单击弹出“双独立样本:定义组”对话框,如图6-12所示,在“组1”、“组2”两个框中输入分组变量值,表示进行两组比较,一般输入“1”和“2”。
●检验类型:包括曼-惠特尼、柯尔莫戈洛夫-斯米诺夫、莫斯极端反应、瓦尔德-沃尔福威茨游程。
图6-11 “两个独立样本检验”对话框
图6-12 “两独立样本:定义组”对话框
(2)“精确”按钮和“选项”按钮的用法见第6.1.1节卡方检验。
实例五:“data06-05.sav”数据文件是两个组投篮命中数的统计,如图6-13所示。现要求利用两独立样本非参数检验来检验两个组投篮命中数之间是否存在差异。
图6-13 “data06-05.sav”数据
(1)打开“data06-05.sav”数据文件,选择“分析”→“非参数检验”→“旧对话框”→“两个独立样本”,弹出如图6-11所示的“两个独立样本检验”对话框。
(2)在左侧的变量列表中选中“投篮命中数”变量,单击 按钮,将其选入“检验变量列表”,在左侧的变量列表中选中“组别”变量,单击 按钮,将其选入“分组变量”。
(3)单击“定义组”按钮,弹出如图6-12所示的“双独立样本:定义组”对话框。
(4)在“组1”、“组2”两个框中分别输入“1”和“2”,在“检验类型”栏中勾选“曼-惠特尼”“柯尔莫戈洛夫-斯米诺夫”“莫斯极端反应”“瓦尔德-沃尔福威茨游程”复选框。
(5)单击“精确”按钮,弹出如图6-2所示的“精确检验”对话框,勾选“仅渐进法”,单击“继续”按钮返回主对话框。
(6)单击“选项”按钮,弹出与图6-3类似的“两独立样本检验:选项”对话框,在“统计”选项栏中勾选“描述性”复选框和“四分位数”复选框,在“缺失值”栏中勾选“按检验排除个案”选项,单击“继续”按钮返回主对话框。
(7)完成所有设置后,单击“确定”按钮执行命令。
从表6-8和表6-9可以看出,1组的秩平均值为9.95,2组的秩平均值为11.05, U 值为44.500, W 值为99.500, Z 统计量为-0.420,渐进显著性(双尾)为0.675,大于0.05,不能拒绝零假设,认为两组的投篮命中数不存在显著差异。
表6-8 秩
表6-9 检验统计a
a.分组变量:组别。b.未修正结。
从表6-10和表6-11可以看出,1组和2组的人数均是10个,观测到的控制组范围(跨度)为20,显著性为1.000;修正后的控制组范围(截头范围)为11,显著性为0.089。两个显著性都大于0.05,故不能拒绝零假设,认为1组和2组的投篮命中数不存在显著差异。
表6-10 频率
表6-11 检验统计a,b
a.莫斯检验。b.分组变量:组别。
从表6-12和表6-13可以看出,1组和2组的人数均是10个,最极端绝对差值为0.200,最极端正差值为0.200,最极端负差值为-0.100,K-S值为0.447,渐进显著性为0.988,大于0.05,故不能拒绝零假设,认为两组的投篮命中数不存在显著差异。
表6-12 频率
表6-13 检验统计 a
a.分组变量:组别。
从表6-14和表6-15可知,1组和2组的人数均是10个,最小游程数为7, Z 值为-1.608,精确显著性水平为0.051;最大游程数为16, Z 值为2.527,精确显著性水平为0.996。两个显著性均大于0.05,故不能拒绝零假设,认为1组和2组的投篮命中数不存在显著差异。
表6-14 频率
表6-15 检验统计a,b
a.Wald-Wolfowitz 检验。b.分组变量:组别。c.有5个组内结,涉及15个个案。