跟前面的检验方法一样,Stata的两独立样本检验是非参数检验方法的一种,其基本功能是判断两个独立样本是否来自相同分布的总体。这种检验过程是通过分析两个独立样本的均数、中位数、离散趋势、偏度等描述性统计量之间的差异来实现的。
【例5.2】 表5.2给出了广东省东北部和西北部主要年份的年降雨量。试用两独立样本检验方法判断两个地区的年降雨量是否存在显著差异。
表5.2 广东省东北部和西北部主要年份年降雨量(单位:mm)
在用Stata进行分析之前,我们要把数据录入Stata中。本例中有3个变量,分别是年份、地区和降雨量。我们把年份变量设定为year,把地区变量设定为group,并且把粤东北定义为1,把粤西北定义为2,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作在第1章中已详细讲述过了。录入完成后数据如图5.5所示。
图5.5 案例5.2的数据
先保存数据,然后开始展开分析,步骤如下:
进入Stata 16.0,打开相关数据文件,弹出主界面。
在主界面的Command文本框中输入如下命令(旨在用两独立样本检验方法判断两个地区的年降雨量是否存在显著差异):
ranksum sum,by( group)
设置完毕后,按回车键,等待输出结果。
在Stata 16.0主界面的结果窗口可以看到如图5.6所示的分析结果。
通过观察分析结果,我们可以看出共有24个有效样本参与了假设检验,Prob > |z| =0.3556,远大于0.05,所以需要接受原假设,也就是说,两个地区的年降雨量存在显著差异。
上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。Stata 16.0的强大之处在于,它提供了更加复杂的命令格式以满足用户更加个性化的需求。
例如,我们只针对year变量大于1990的观测样本进行两独立样本检验,那么操作命令即为:
ranksum sum if year>1990,by( group)
在命令窗口输入命令并按回车键进行确认,结果如图5.7所示。
图5.6 分析结果图
图5.7 分析结果图
通过观察分析结果,我们可以看出共有18个有效样本参与了假设检验,Prob > |z| = 0.3099,远大于0.05,所以需要接受原假设,也就是说,两个地区的年降雨量存在显著差异。