顾名思义,多独立样本检验用于判断多个独立的样本是否来自相同分布的总体。
【例5.4】 某公司新招聘的一批员工毕业于4所不同的高校,并且来源于4所不同高校的员工构成了4个独立的样本。待到实习期结束后,高管对这些新员工进行考察打分,结果如表5.4所示。试用多独立样本检验方法分析毕业于不同高校的员工在工作上的表现是否有显著的差异。
表5.4 员工考核成绩
在用Stata进行分析之前,我们要把数据录入Stata中。本例中有两个变量,分别为高校和分数。我们把分数变量设定为goal,把高校变量设定为school,并且把A、B、C、D四所高校分别定义为1、2、3、4,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作在第1章中已详细讲述过了。录入完成后数据如图5.11所示。
图5.11 案例5.4的数据
先保存数据,然后开始展开分析,步骤如下:
进入Stata 16.0,打开相关数据文件,弹出主界面。
在主界面的Command文本框中输入如下命令(旨在用多独立样本检验方法分析毕业于不同高校的员工在工作上的表现是否有显著的差异):
kwallis goal,by( school)
设置完毕后,按回车键,等待输出结果。
在Stata 16.0主界面的结果窗口可以看到如图5.12所示的分析结果。
图5.12 分析结果图
通过观察分析结果,我们可以看出有4组,每组有15个,共有60个有效样本参与了假设检验,p值远小于0.05,所以需要拒绝原假设,也就是说,毕业于不同高校的员工在工作上的表现有显著的差异。
上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。Stata 16.0的强大之处在于,它提供了更加复杂的命令格式以满足用户更加个性化的需求。
例如,我们只针对goal变量大于75的观测样本进行多独立样本检验,那么操作命令即为:
kwallis goal if goal>75,by( school)
在命令窗口输入命令并按回车键进行确认,结果如图5.13所示。
图5.13 分析结果图
通过观察分析结果,我们可以看出参与分析的样本由4组变为2组,共有17个有效样本参与了假设检验,p值远小于0.05,所以需要拒绝原假设。