在现实生活中,很多数据都是二值的,如男性和女性、合格和不合格、已婚和未婚等,通常用0和1来表示这类数据。如果进行 n 次相同的实验后,实验的结果只有两类(0和1),这两类出现的次数可以用离散型随机变量 X 来描述。
随机变量 X 为0的概率设为 p ,则随机变量 X 为1的概率设为 q ,即1- p ,这样就形成了二项分布,而二项分布检验就是来检验样本中这两个类别的观察频率是否等于给定的检验比例,零假设是样本来自的总体分布与指定的二项分布无显著差异。
二项分布检验在小样本中采用精确检验方法,对于大样本采用近似检验方法。精确检验方法计算
n
次试验中成功的次数小于或等于
x
次的概率,即
。对于大样本采用
Z
检验统计量,在零假设成立下
Z
检验统计量近似服从正态分布,定义为
上式进行了连续性校正,当 x 小于 n /2时加0.5,当 x 大于 n /2时减0.5。
SPSS将自动计算上述精确概率和近似概率,如果概率值小于显著性水平,拒绝零假设,认为样本来自的总体与指定的二项分布存在显著差异;如果概率值大于显著性水平,接受零假设,认为样本来自的总体与指定的二项分布无显著差异。
执行菜单栏中的“分析”→“非参数检验”→“旧对话框”→“二项检验”命令,弹出如图4-6所示的“二项检验”对话框,进行相关参数的设置即可完成二项分布检验。下面通过具体案例讲解如何在SPSS中进行二项分布检验。
图4-6 “二项检验”对话框
本例的数据文件是抽查一批灯泡合格率的资料,如图4-7所示。现要求利用二项分布检验来检验这批灯泡的合格率是否达到95%。
图4-7 “data04-02.sav”数据
(1)打开“data04-02.sav”文件,执行菜单栏中的“分析”→“非参数检验”→“旧对话框”→“二项检验”命令,弹出“二项检验”对话框。
(2)在左侧的变量列表中选中“合格率”变量,单击
按钮,将其选入“检验变量列表”,在“定义二分法”选项区中单击“从数据中获取”单选按钮,在“检验比例”文本框中输入“0.95”,如图4-8所示。
图4-8 “二项检验”对话框
(3)单击“精确”按钮,弹出如图4-9所示的“精确检验”对话框,单击“仅渐进法”单选按钮,单击“继续”按钮。
(4)在图4-8所示对话框中单击“选项”按钮,弹出如图4-10所示的“二项检验:选项”对话框,在“统计”选项区中勾选“描述”和“四分位数”复选框,在“缺失值”选项区中单击“按检验排除个案”单选按钮,单击“继续”按钮。
图4-9 “精确检验”对话框
图4-10 “二项检验:选项”对话框
(5)完成所有设置后,单击“确定”按钮执行命令,此时会弹出二项检验等分析结果。
由表4-4可以看出,一共抽取了200个灯泡,其中合格的为186个,不合格的为14个,精确显著性水平为0.130,大于0.05,不能拒绝零假设,认为该批灯泡的合格率达到95%。
表4-4 二项检验