



两独立样本 t 检验也称为成组 t 检验,用于判断两组之间的均数的差异是否显著。举一个简单的例子:比较男女之间的体重是否存在差异。
两独立样本 t 检验的前提是数据需满足独立性、正态性和方差齐性。如果不满足正态性和方差齐性,建议直接使用非参数秩和检验。
下面模拟一项研究,分析不同处理方法中实时荧光定量聚合酶链式反应(Polymerase Chain Reaction,PCR)检测两个靶标的阈值循环数(Cycle Threshold,Ct)值是否有差异,收集的变量有两个,数据见表2.1。其中:
□ 实验组:实验组的Ct值。
□ 对照组:对照组的Ct值。
表2.1 两种处理组PCR检测Ct值(部分)
(1)打开GraphPad Prism软件,如图2.1所示,在CREATE下选择Column选项。
图2.1 创建分析文件
(2)选中Data table下的Enter or import data into a new table单选按钮,再选中Options下的Enter replicate values,stacked into columns单选按钮。
(3)单击Create按钮,完成分析文件的创建。
将在Excel中整理好的数据直接复制进GraphPad Prism中,如图2.2所示。此处仅罗列部分数据,共有两列,分别是实验组和对照组,然后将其命名为data。
图2.2 输入数据并重命名
1)正态性检验
单击工具栏中的
按钮,弹出的对话框如图2.3(a)所示,选择Column analyses下的Normality and Lognormality Tests选项,单击OK按钮。弹出的对话框如图2.3(b)所示,GraphPad Prism提供了以下4种正态性检验的方法。
□ D'Agostino & Pearson正态性检验,其首先计算偏度和峰度,然后计算这些值与高斯分布预期值的差异,从而得到 P 值。如果 P 值较大,则数据符合正态分布;如果 P 值较小,则数据不符合正态分布。
图2.3 正态性检验
□ Anderson-Darling检验,其将数据的累积分布与累积高斯分布进行比较得到 P 值。考虑了累积分布曲线各部分的差异,是一种敏感且有效的方法。
□ Shapiro-Wilk正态性检验,当数据中的每个数值都唯一时,Shapiro-Wilk检验效果较好。若有多个数值相同,则效果可能会受到影响。该方法适用于小样本。
□ Kolmogorov-Smirnov检验,其比较数据的累积分布与累积高斯分布之间的最大差异,从而得到 P 值。该方法适用于大样本。
本例中保持默认设置,同时采用4种方法进行正态性检验,单击OK按钮。
正态性检验结果如图2.4所示,4种检验方法的结果并不一致。一般GraphPad Prism推荐以D'Agostino & Pearson法的结果为主。因此本案例数据可认为符合正态分布。
图2.4 正态性检验结果
2)进行成组 t 检验
单击工具栏中的
按钮,弹出的对话框如图2.5(a)所示,选择Column analyses下的t tests(and nonparametric tests),单击OK按钮,弹出新的对话框。
□ Experimental Design选项卡如图2.5(b)所示。选择Experimental design下的Unpaired单选按钮表示非配对设计。本案例的数据经正态性检验后均服从正态分布,所以在Assume Gaussian distribution中选择Yes, Use parametric test单选按钮,即 t 检验。在Choose test中默认选择Unpaired t test. Assume both populations have the same SD单选按钮,即先认为当前数据满足方差齐性,再根据后续的分析结果决定是否要重新选择方法。
□ Residuals选项卡如图2.5(c)所示。该选项卡可以绘制残差相关图形,帮助判断数据是否服从正态分布、是否满足方差齐性。这里保持默认,不选择任何选项。
□ Options选项卡如图2.5(d)所示。Calculations下的P value选项选择Two-tailed(recommended)单选按钮,即双侧检验。在Graphing options下勾选Graph CI of difference between means(Estimation Plot)复选框,绘制差值及其95%置信区间;在Additional results下勾选Descriptive statistics for each data set复选框,进行描述性统计。
□ 最后单击OK按钮。
如果数据没有通过正态性检验,可以在Assume Gaussian distribution下选择No, Use nonparametric test单选按钮,进行非参数秩和检验。在Choose test下选择Mann-Whitney test.Compare ranks单选按钮,确定进行曼-惠特尼秩和检验,如图2.6所示。秩和检验的结果建议绘制箱线图或小提琴图。
图2.5 两独立样本 t 检验方法选择与参数设置
3)结果解释
成组 t 检验输出结果如图2.7(a)所示。
□ 查看当前数据是否满足方差齐性,在F test to compare variances结果中,P value=0.2532>0.05,表明数据满足方差齐性。如果方差齐性检验没有通过,则建议使用非参数秩和检验,而不要进行所谓的方差不齐校正或者变量变换。
□ 查看 t 检验结果, t = 2.448, P =0.0209<0.05,即两种处理组PCR检测Ct值存在显著性差异。
□ 查看描述性结果,A列的均值为22.67,B列的均值为24.60。B列与A列的差值及其标准误为1.933±0.7896,差值的95%置信区间是0.3159~3.551。
另外,在Descriptive statistics结果中罗列了更加详细的结果,如图2.7(b)所示,分别提供了实验组、对照组各自的Minimum(最小值)、25% Percentile(第25百分位数)、Median(中位数)、75% Percentile(第75百分位数)、Maximum(最大值)、Mean(均数)、Std.Deviation(标准差)、Std.Error of Mean(均值标准误)、Lower 95% CI和Upper 95% CI(均值95%CI上下限)。
图2.6 非正态数据的非参数检验设置
图2.7 成组 t 检验输出结果
Estimation Plot结果如图2.8所示,差值的95%置信区间不包含0,亦说明两组之间存在显著性差异。如果上下误差线包含0,则表示两组之间不存在显著性差异。
图2.8 两样本均值差±95%置信区间
(1)单击图2.2导航栏Graphs下的New Graph,弹出的对话框如图2.9(a)所示,选择Mean/median & error选项卡下的第1个图形,在Column bar graph下设置Plot为Mean with SD,即均数和标准差,单击OK按钮生成柱状图草图,如图2.9(b)所示。
注意: 图2.9(a)中提供了多种图形,如散点图、箱式图、小提琴图、折线图等,限于篇幅无法一一罗列绘制步骤,读者在实操过程中可自行尝试,也可以参阅本书的配套视频,其中有详细介绍。
图2.9 图形选择及柱状图草图
(2)在草图的 x 轴任意一处双击,即可弹出 x 轴的设置对话框,如图2.10(a)所示。
□ Automatically determine the range and interval选项默认是被勾选的,表示自动化处理 x 轴的范围和刻度线等,此处取消勾选,进行手动设置。
□ Ticks direction选项设置为Down,表示 x 轴的刻度线朝下,即在图形外部。
□ Ticks length表示刻度线长度的设置,此处选择Short,即短刻度线。
□ 其他选项保持默认即可,单击OK按钮。关于坐标轴的详细设置参见1.4节。
(3)在草图的 y 轴任意一处双击,即可弹出 y 轴的设置对话框,如图2.10(b)所示。 y 轴的设置与 x 轴的设置完全相同,此处不再过多罗列。
□ Ticks direction选项设置为Left。
□ Ticks length选项设置为Short。
□ Minor ticks选项设置为2。
□ 其他选项保持默认即可,单击OK按钮。
图2.10 x 轴、 y 轴设置界面
(4)在草图中,双击图形内部实验组柱状图,弹出的对话框如图2.11(a)所示。
□ 在Bars and boxes系列选项中,在Fill选项中设置柱状图的填充色为绿色,在Border选项中设置柱状图的边框粗细为1/4pt,在Border color选项中设置柱状图的边框颜色为黑色。
□ 在Error bars系列选项中,在Color选项中设置误差线的颜色为黑色,在Style选项中设置误差线的类型为T型,在Dir选项中设置误差线的方向为Above,即上方。
□ 其他选项保持默认,单击OK按钮。
对照组柱状图的设置方法与此相同,如图2.11(b)所示,不再重复罗列。
(5)单击工具栏中的
按钮,自动添加显著性标记。通过双击显著性标记区域,弹出的对话框如图2.12所示,可以对显著性标记进行优化。
□ 在Display options下若选择P value(number)and brackets,则显示显著性差异 P 值。若选择Asterisks(P value classification)and brackets,则用星号表示显著性。
□ P value threshold选项用于显著性标记绘制的筛选,如果选择Only comparisons with P value less than or equal to 0.05,则只绘制 P ≤0.05的两两比较,而对于 P >0.05的两两比较则不绘制其显著性标记图。
此外,在Line/bracket and text options选项中还可以设置显著性连线的长度、形状和颜色等格式。
图2.11 柱状图设置界面
图2.12 显著性标记绘制和修改
最终将获得如图2.13(a)所示的效果。除了柱状图以外,还可以选择绘制其他类型的图形,如图2.13(b)~(f)所示,这些图形的绘制步骤见配书视频教程。
图2.13 美化后的成组 t 检验图形
注意: 在进行成组 t 检验时,需要满足一定的前提条件,即样本数据应来自正态分布或近似正态分布的总体,各观察对象间相互独立并且不能相互影响,两样本的方差应相等或至少相近。