多因素方差分析的基本思想基本等同于单因素方差分析,不同之处在于其研究的是两个或者两个以上因素对于试验结果的作用和影响,以及这些因素共同作用的影响。多因素方差分析所要研究的是多个因素的变化是否会导致试验结果的变化。由于较少用到三因素以及三因素以上方差分析,因此下面以双因素方差分析为例进行介绍。
【例6.2】 将40只大鼠随机等分为4组,每组10只,进行肌肉损伤后的缝合试验。处理方式由两个因素组合而成,A因素为缝合方法,分别为外膜缝合和内膜缝合,记作a1、a2;B因素为缝合后的时间,分别为缝合后1月和2月,记作b1、b2。试验结果为大鼠肌肉缝合后肌肉力度的恢复度(%),如表6.2所示,从而考察缝合方法和缝合后时间对肌肉力度的恢复度是否有显著影响。
表6.2 大鼠肌肉缝合后肌肉力度的恢复度测量数据
在用Stata进行分析之前,我们要把数据录入Stata中。本例中有3个变量,分别是肌肉力度的恢复度、缝合方法和缝合后时间。我们把肌肉力度的恢复度变量设定为renew,把缝合方法变量设定为method,并且其中的缝合方法a1设定为1、缝合方法a2设定为2,把缝合后时间变量设定为time,并且其中的缝合方法b1设定为1、缝合方法b2设定为2,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作在第1章中已详细讲述过了。录入完成后数据如图6.4所示。
图6.4 案例6.2的数据
先保存数据,然后开始展开分析,步骤如下:
进入Stata 16.0,打开相关数据文件,弹出主界面。
在主界面的Command文本框中输入如下命令(旨在考察缝合方法和缝合后时间对肌肉力度的恢复度是否有显著影响):
anova renew method time method# time
设置完毕后,按回车键,等待输出结果。
在Stata 16.0主界面的结果窗口可以看到如图6.5所示的分析结果。
图6.5 分析结果图
通过观察分析结果,我们可以看出共有40个有效样本参与了方差分析。
· 可决系数(R-squared)以及修正的可决系数(Adj R-squared)都非常接近1,这说明模型的拟合程度很高,也就是说模型的解释能力很强。
· Prob > F Model=0.0000,说明模型的整体是很显著的。
· Prob > F method =0.0000,说明变量method的主效应是非常显著的。
· Prob > F time =0.0000,说明变量time的主效应是非常显著的。
· Prob > F method#time = 0.1506,说明变量method与变量time的交互效应是不显著的。这一点也可以从下面的命令中得到验证。
在主界面的Command文本框中分别输入以下命令并按回车键:
test method test time test method#time
可以得到如图6.6所示的结果。
图6.6 分析结果图
在上面的例子中,因为变量method与变量time的交互效应是不显著的,所以我们可以构建更加简单的不包含两者交互效应的方差分析模型。在主界面的Command文本框中输入以下命令并按回车键:
anova renew method time
可以得到如图6.7所示的结果。
图6.7 分析结果图
至此,我们以两个因素介绍了多因素方差分析的应用。事实上,多因素方差分析的模型构建是非常灵活的,如果存在3个或者3个以上因素,要纳入任何一项变量间的交互效应,就只需要指定有关变量名称,并且之间用“#”连接(注意,之前的很多Stata版本用的是“*”)即可。
上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。Stata 16.0的强大之处在于,它提供了更加复杂的命令格式以满足用户更加个性化的需求。
例如,我们只针对renew变量大于11的观测样本进行多因素方差分析,那么操作命令为:
anova renew method time method# time if renew>11
在命令窗口输入命令并按回车键进行确认,结果如图6.8所示。
图6.8 分析结果图
通过观察分析结果,我们可以看出共有34个有效样本参与了方差分析。
· 可决系数(R-squared)以及修正的可决系数(Adj R-squared)都非常接近1,这说明模型的拟合程度很高,也就是说模型的解释能力很强。
· Prob > F Model=0.0000,说明模型的整体是很显著的。
· Prob > F method =0.0000,说明变量method的主效应是非常显著的。
· Prob > F time =0.0000,说明变量time的主效应是非常显著的。
· Prob > F method#time = 0.8482,说明变量method与变量time的交互效应是不显著的。