在现实生活中,很多数据的取值都是二值的,如男性和女性,合格和不合格、已婚和未婚等,通常用0和1来表示这类数据。如果进行n次相同的实验后,实验的结果只有两类(0和1),这两类出现的次数可以用离散型随机变量X来描述。随机变量X为1的概率设为p,则随机变量X为1的概率设为q,即1-p,这样就形成了两项分布,而二项分布检验就是来检验样本中这两个类别的观察频率是否等于给定的检验比列,零假设是样本来自的总体分布与指定的二项分布无显著差异。
二项分布检验在小样本中采用精确检验方法,对于大样本采用近似检验方法。精确检验方法计算n次试验中成功的次数小于等于x次的概率,即 。在大样本下采用Z检验统计量,在零假设成立下Z检验统计量近似服从正态分布,定义为 ,上式进行了连续性校正,当x小于n/2时加0.5,当x大于n/2时减0.5。
SPSS将自动计算上述精确概率和近似概率,如果概率值小于显著性水平,拒绝零假设,认为样本来自的总体与指定的二项分布存在显著差异;如果概率值大于显著性水平,接受零假设,认为样本来自的总体与指定的二项分布无显著差异。
(1)打开数据文件,选择“分析”→“非参数检验”→“旧对话框”→“二项式”,弹出“二项式检验”对话框,如图6-5所示,各项含义如下。
● 检验变量列表:将左侧的变量列表中的变量选入其中。
● 定义二分法。
➢ 从数据中获取:如检验变量为二分变量,则选此项。
➢ 分割点:如检验变量不是二分变量,则在“分割点”框中输入分割数值,大于等于分割数值为一组,小于分割数值为另一组。
● 检验比例:输入检验的概率值。
图6-5 “二项式检验”对话框
(2) 按钮和 按钮的用途见第6.1.1节卡方检验。
实例二:“data06-02.sav”数据文件是抽查一批灯泡合格率的资料,如图6-6所示。现要求利用二项式检验这批灯泡合格率是否达到95%。
图6-6 “data06-02.sav”数据
(1)打开“data06-02.sav”数据文件,选择“分析”→“非参数检验”→“旧对话框”→“二项式”,弹出如图6-5所示的“二项式检验”对话框。
(2)在左侧的变量列表中选中“合格率”变量,单击 按钮,将其选入“检验变量列表”,在“定义二分法”栏中勾选“从数据中获取”,在“检验比例”框中输入0.95。
(3)单击 按钮,弹出如图6-2所示的“精确检验”对话框,勾选“仅渐进法”,单击 按钮返回主对话框。
(4)单击 按钮,弹出如图6-3所示的“二项式检验:选项”对话框,在“Statistics”选项栏中勾选“描述性”复选框和“四分位数”复选框,在“缺失值”栏中勾选“按检验排除个案”选项,单击 按钮返回主对话框。
(5)完成所有设置后,单击 按钮执行命令。
从表6-4可以看出,一共抽取了200个灯泡,其中合格的为186个,不合格的为14个,精确显著性水平为0.130,大于0.05,不能拒绝零假设,认为该批灯泡的合格率达到95%。
表6-4 二项式检验
a.备用假设声明第一组中的个案比例小于.95。