购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

4.4 列联表分析

列联表分析通过频数交叉表来讨论两个或多个变量之间是否存在关联,并提供了各种双向表检验和相关性测量。

基本思想与假设检验基本一致,先建立一个零假设,认为两个变量之间是没有关联的,然后进行χ 2 检验,计算发生概率,通过概率是否达到显著性水平来判断接受或拒绝零假设。

式中A是实际频数,T是期望频数。

4.4.1 参数设置

(1)打开数据文件,选择“分析”→“描述统计”→“交叉表格”,弹出“交叉表格”对话框,如图4-20所示,各项含义如下。

● 行列表:从左侧的变量列表中选择一个或多个变量进入其中作为行变量。

● 列列表:从左侧的变量列表中选择一个或多个变量进入其中作为列变量。

● 层:分层变量,决定频数分布表的层,如果要增加一个分层变量,就单击 按钮,再选择一个分层变量。如果选择一个或多个层变量,那么将对每个层变量的每个类别产生单独的交叉制表。

● 在表层中显示层变量:选中该复选框表示选择在交叉表中将层变量显示为表层,可以创建视图来显示行和列变量的整体统计,以及允许深入层变量的类别。

● 显示群集条形图:选中该复选框表示结果中会输出群集条形图,帮助汇总个案组的数据。对于在“行”下指定的变量的每个值,均有一个复式条形图。“列”下指定的变量用来定义每个聚类内的条形图的变量。对于此变量的每个值,均有一组不同颜色或图案的条形图。如果在“列”或“行”下指定多个变量,那么为每个双变量组合生成一个复式条形图。

● 取消表格:勾选该复选框表示结果中不输出交叉表。

图4-20 “列联表分析”对话框

(2)单击 按钮,弹出“精确检验”对话框,如图4-21所示,各项含义如下。

● 仅渐进法:基于渐进分布计算的概率值,一般情况下值小于0.05,则认为显著。

● Monte Carlo:统计量是精确显著水平的无偏估计。

➢ 置信度框中可输入0.01-99.9的置信水平。

➢ 样本数框中可输入1-1000000000之间的样本数。

● 精确:精确计算概率,当值小于0.05,则认为显著,行、列变量之间相互独立,适合在期望数有小于5的情况下使用。

图4-21 “精确检验”对话框

(3)单击 按钮,弹出“交叉表格:统计”对话框,如图4-22所示,该对话框是用来选择统计分析量,各项含义如下。

● 卡方:卡方检验包括皮尔逊卡方检验、似然比卡方检验等,当两个表变量都是定量变量时,用来检验行变量和列变量之间是否相关。

● 相关性:选择此项,将生成 Spearman 相关系数 Rho,用来测量等级顺序之间的相关性。当两个表变量都是定量变量时,相关产生 Pearson 相关性系数R,这是变量之间的线性相关性测量。

● 名义选项栏。

➢ 相依系数:基于卡方统计的相关性测量。取值在0至1之间,其中0表示行变量和列变量之间不相关,值越接近1,表示变量之间的关联性越强。

➢ Phi和Cramer V:基于卡方统计的相关性测量。取值也在0至1之间,值越接近1,表示关联性越强。

➢ Lambda:一种相关性测量,它反映使用自变量的值来预测因变量的值时,误差成比例缩小。取值也在0至1之间,值为0表示自变量对于预测因变量没有帮助,值为1表示自变量能完全预测因变量。

➢ 不确定性系数:一种相关性测量,它表示当一个变量的值用来预测其他变量的值时,误差成比例下降的程度,取值也在0至1之间,值越接近1,表示该变量能很好预测其他变量的程度就增加。

● 有序选项栏,对于行和列都包含已排序值的表,请选择伽玛、Kendall’s tau-b和Kendall’s tau-c。要根据行类别预测列类别,请选择Somers’d。

➢ 伽玛:测定两个有序变量之间对称相关性的统计量,取值在-1至1之间,+1表示完全正关联,0表示无相关,-1表示完全负关联。

➢ Somers’d:用于检验两个有序变量之间的关联性,取值在-1至1之间,绝对值渐进1表示两个变量之间高度关联,绝对值渐进0表示两个变量之间关联程度很低。

➢ Kendall’s tau-b:将结考虑在内的有序变量或排序变量的非参数相关性测量。取值在-1至1之间,符号表示两个变量之间关系的方向,绝对值表示相关程度的大小。

➢ Kendall’s tau-c:与Kendall’s tau-b基本一致,只是不考虑结的影响。

● Kappa:用于检验对同一对象两种观测方法是否一致,取值在-1至1之间,取值为1表示两者完全一致,取值为0表示两者没有关联。如果两个变量的数据存储类型不相同,那么不计算 Kappa。对于字符串变量,两个变量必须具有相同的定义长度。

● 风险:用于危险度分析,表明事情的发生与某因素之间的关联性,当某因素发生的可能性非常小时,使用比数比统计量来测定相对危险度。

● McNemar:两个二分变量相关性的非参数检验,使用卡方分布检验响应改变,用来检测试验干预导致响因变量的变化。

● Cochran’s and Mantel-Haenszel统计:两个二分变量独立性检验的统计量,条件是给定一个或多个分层变量定义的协变量模式,在框中可输入相对风险检验的零假设值,默认为1。

● 按区间标定:当一个变量为定量变量,而另一个变量为分类变量时,请选择Eta。分类变量必须进行数值编码。

➢ Eta:关联度统计量,取值在0至1之间,值接近1表示两个变量之间高度关联,值接近0表示两个变量之间关联程度很低。

图4-22 “交叉表格:统计”对话框

(4)单击 按钮,弹出“交叉表格:单元格显示”对话框,如图4-23所示,设置单元格显示内容,各项含义如下。

● 计数复选框。

➢ 观察值:显示实际频数,系统默认。

➢ 期望值:显示期望频数。

➢ 隐藏较小计数:选择此项,在输入框中输入一个数值n的整数,则可以隐藏频数小于指定整数n的计数。n必须大于或等于2。

● 百分比复选框误。

➢ 行:显示行百分比,单元格频数占所在行观测量的百分比。

➢ 列:显示列百分比,单元格频数占所在列观测量的百分比。

➢ 总计:单元格频数占全部观测量的百分比。

● z-检验。

➢ 比较列的比例:勾选此项,将计算列属性的成对比较,并指出给定行中的哪对列明显不同。使用下标字母以APA样式格式在交叉表中标识显著性差异,并以0.05显著性水平对其进行计算。

➢ 调整 p值(Bonferroni 方法)。列比例的成对比较使用了 Bonferroni 修正,可在进行了多个比较后调整观察到的显著性水平。

● 残差。

➢ 未标准化:观察值与期望值之差。

➢ 标准化:残差除以其标准差的估计,均值为0,标准差为1。

➢ 调节的标准化:单元格的残差除以其标准误差的估计值。

● 非整数权重:单元格计数通常为整数值,但是如果数据文件当前按某个带小数值的权重变量进行加权,那么在计算单元格计数之前可以进行截断或舍入。

➢ 四舍五入单元格计数:单元格中的个案权重按原样使用,但累积权重要四舍五入。

➢ 截断单元格计数:在计算任何统计之前,个案权重按原样使用,截断单元格中的累积权重截取整数部分。

➢ 四舍五入个案权重:对个案权重进行四舍五入。

➢ 截断个案权重:对个案权重进行截取整数部分。

➢ 无调节:不对单元格进行调节,个案权重按原样使用且使用小数单元格计数。但是,当需要精确检验时,单元格中的累积权重或者截断或者四舍五入。

➢ (5)单击 按钮,弹出“交叉表:表格格式”对话框,如图4-24所示,可以选择按行变量值的升序或降序来排列行。

图4-23 “交叉表格:单元格显示”对话框

图4-24 “交叉表:表格格式”对话框

4.4.2 列联表分析的SPSS实现

实例四:“data04-04.sav”数据文件是一份关于工作满意度的调查问卷的结果,如图4-25所示。现要求利用列联表分析对男女员工对工作满意度是否有差异进行分析。

图4-25 “data04-04.sav”数据

(1)打开“data04-04.sav”数据文件,选择“分析”→“描述统计”→“交叉表格”,弹出如图4-20所示的“交叉表格”对话框。

(2)在左侧的变量列表中选中“性别”变量,单击 按钮,将其选入“行变量列表”;选中“工作满意度”变量,单击 按钮,将其选入“列变量列表”,并勾选“显示集群条形图”。

(3)单击 按钮,弹出如图4-21所示的“精确检验”对话框,勾选“仅渐进法”选项。单击 按钮返回主对话框。

(4)单击 按钮,弹出如图4-22所示的“交叉表格:统计”对话框,勾选“卡方”复选框。单击 按钮返回主对话框。

(5)单击 按钮,弹出如图4-23所示的“交叉表格:单元格显示”对话框,勾选“观察值”复选框、“期望值”复选框、“行”复选框、“列”复选框和“四舍五入单元格计数”选项。单击 按钮返回主对话框。

(6)单击 按钮,弹出如图4-24所示的“交叉表:表格格式”对话框,勾选“升序”选项。单击 按钮返回主对话框。

(7)完成所有设置后,单击 按钮执行命令。

4.4.3 描述性分析的结果分析

从表4-11可以看出样本数为448,没有缺失值。

表4-11 个案处理摘要

从表4-12可以看出每种组合的实际计数、预期计数、百分比在性别内、百分比在工作满意度内,例如女性对工作不满意的实际计数有18例,预期计数为11.9,在所有女性的工作满意度中占8.8%,在男和女总共的不满意计数中占69.2%。

表4-12 性别*工作满意度交叉表

从表4-13可以看出卡方检验的结果。卡方检验的零假设是:男女之间对工作满意度没有差异。表中两种检验的双向显著性水平都小于0.05,所以否认零假设,即男女之间对工作的满意度存在显著差异。没有单元格的预期计数小于5,最小预期计数为11.90,小于25。

表4-13 卡方检验

a.0 个单元格(0.0%)具有的预期计数少于 5。最小预期计数为 11.90。

从图4-26可以看出男和女对工作的满意度存在差异。

图4-26 工作满意度条形图 v8iX8D7d8ZlVANgJ+Z2KS8sTaOTiZV8LyTlu1KXNA5YmglLFbB5eG3szkfAqGJtJ

点击中间区域
呼出菜单
上一章
目录
下一章
×