两相关样本检验的基本功能是可以判断两个相关的样本是否来自相同分布的总体。
【例5.3】 为了分析一种新药的效果,特选取了52名病人进行试验,表5.3给出了试验者服药前后的血红蛋白数量。试用两相关样本检验方法判断该药能否引起患者体内血红蛋白数量的显著变化。
表5.3 患者服药前后血红蛋白的数量变化
(续表)
在用Stata进行分析之前,我们要把数据录入Stata中。本例中有两个变量,分别是服药前血红蛋白数量和服药后血红蛋白数量。我们把服药前血红蛋白数量这一变量设定为qian,把服药后血红蛋白数量这一变量设定为hou,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作在第1章中已详细讲述过了。录入完成后数据如图5.8所示。
图5.8 案例5.3的数据
先保存数据,然后开始展开分析,步骤如下:
进入Stata 16.0,打开相关数据文件,弹出主界面。
在主界面的Command文本框中输入如下命令(旨在使用两相关样本检验方法判断患者体内血红蛋白数量是否发生显著变化):
signtest qian=hou
设置完毕后,按回车键,等待输出结果。
在Stata 16.0主界面的结果窗口可以看到如图5.9所示的分析结果。
图5.9 分析结果图
可以看出本结论与通过检验均值得出的结论是一致的。本检验结果包括符号检验、单侧检验和双侧检验3部分。符号检验的原理是通过用配对的两组数据做差,原假设是两组数据不存在显著差别,所以两组数据做差的结果应该是正数、负数大体相当。在本例中,期望值是有26个正数,26个负数,然而实际的观察值却是38个正数,所以两组数据存在显著差异。也就是说,该药引起了患者体内血红蛋白数量的显著变化。单侧检验和双侧检验的结果解读在前面的章节多有涉及,这里不再赘述。
上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。Stata 16.0的强大之处在于,它提供了更加复杂的命令格式以满足用户更加个性化的需求。
例如,我们只针对qian变量大于12的观测样本进行两相关样本检验,那么操作命令即为:
signtest qian=hou if qian>12
在命令窗口输入命令并按回车键进行确认,结果如图5.10所示。
图5.10 分析结果图
通过观察分析结果,我们可以看出期望值是有21个正数、21个负数,然而实际的观察值却是30个正数,所以两组数据存在显著差异,也就是说该药引起了患者体内血红蛋白数量的显著变化。