语言学研究统计分析方法最新章节_鲍贵著

◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎

5.2
α 系数

KR20 只适用于二分数据，是 α 系数的特例。如果选项或题项应答包含多个可能的数值，则使用推广的 α 系数。 α 系数用于测量量表的内部一致性（internal consistency），即量表内各题项是否体现同一个构念（construct），也可以用于测量不同评估者之间评分结果的相对一致性程度。

α 系数有两种计算方法。第一种方法利用题项相关矩阵，计算公式为：

其中， k 是题项数， p 是题项之间相关系数平均值。由于该公式利用标准化分数（即相关系数），由此计算出的系数为标准化 α ，称作系数 α （coefficient α ）。

另外一种计算 α 系数的方法，常称作Cronbach’s α ，利用题项方差和协方差矩阵，计算公式为：

其中， k 是题项数，为题项之间平均协方差（covariance），为各题项平均方差（variance， S ² ）。协方差测量两个变量 X 和 Y 共同变异的程度，计算公式为：

由于相关矩阵由方差和协方差矩阵推导而来，系数 α 和Cronbach’s α 通常会近似。不过，如果各个题项方差差异大，则这两个系数的差异会变大。若累计题项标准分（ Z 分数）求量表总分，使用标准化 α ；若累计题项原始分求量表总分，则使用Cronbach’s α （Di Iorio，2005，p.188）。 α 系数同其他信度系数一样，取值范围介于0～1之间。信度的参考标准是： α ＞0.9，很好（excellent）； α ＞0.8，好（good）； α ＞0.7，可接受（acceptable）； α ＞0.6，有疑问（questionable）； α ＞0.5，差（poor）； α ＜0.5，不可接受（unacceptable）（George＆ Mallery，2006，p.231）。

Cronbach’s α 95％置信区间估计能够提供关于 α 系数点估计精确性的信息。根据Duhachek＆Iacobucci（2004），Cronbach’s α 的95％置信区间计算公式为：

其中， ASE 为 α 的标准误差。 ASE 的计算公式为：

其中， Q 是Cronbach’s α 的方差， n 是样本量。统计量 Q 的计算公式为：

其中， k 是题项数， j 是元素值为1的 k ×1向量， V 是方差－协方差矩阵，是矩阵 V 各个元素之和，tr V ² 是矩阵 V 自乘后矩阵的迹，tr V 是矩阵 V 的迹，tr ² V 是矩阵 V 迹的平方，是矩阵 V 自乘后矩阵元素之和。

如果某个测量结果的内部一致性很低，则需根据被测量的构念定义调整或增减题项。因为测量信度估计并非针对测量工具本身，而是针对测量的结果，即基于样本的数据，所以对某个样本测量信度高并不意味着在其他样本中就一定能够得到同样高的信度。因此，实际研究中应报告针对研究样本的信度数据。如果与其他同类研究相比，研究者发现同一测量工具在自己的研究中信度很低，则应考虑参与者的特征，看看是否由于参与者应答的波动性、对答案的猜测或题项表述的模糊性导致测量随机误差增大，或者检查施测的方式，看看是否由于测试环境的变化或施测程序没有标准化导致测量的随机误差增大。 α 系数只能反映量表或测试题项内部一致性，不能反映量表的稳定性，即不能体现再测信度。因此，研究中往往需要报告多个信度系数。另外，如果一个量表包括多个分量表（subscales），则应对每个分量表进行信度检验。

假如某研究者设计了一个5点式利克特量表（Likert scale）调查文科学生对统计学课程的畏惧感。量表共有5个题项，每个题项有5个选择：1＝毫无畏惧；2＝不太畏惧；3＝无所谓；4＝较畏惧；5＝很畏惧。通过对20名文科学生的调查，得到每个题项的以下测量结果：

试计算该问卷测量的信度。

研究者可以自己编写函数，计算系数 α 和Cronbach’s α 。根据公式5.3，可以编写函数alpha.1计算系数 α ：

alpha.1＜－function（x，k）｛

cor＜－cor（x）＃ matrix of correlations

p＜－mean（cor［！row（cor）＝＝col（cor）］）＃ mean of correlations

alpha.1＜－k＊p／（1＋p＊（k－1））＃ coefficient alpha

print（alpha.1）

｝

根据公式5.4，可以编写函数alpha.2计算Cronbach’s α ：

alpha.2＜－function（x，k）｛

cov＜－cov（x）＃ matrix of variances and covariances

varbar＜－mean（diag（cov））＃ mean of variances

covbar＜－mean（cov［！row（cov） col（cov）］）＃ mean of covariances

alpha.2＜－（k＊covbar／varbar）／（1＋（k－1）＊covbar／varbar）＃ Cronbach’s alpha

print（alpha.2）

｝

在以上两个函数中，x是数据框，k是题项数。

针对本例，根据每个题项的测量结果，创建以下R数据框：item＜－data.frame（item1，item2，item3，item4，item5）。利用以上两个函数，执行命令alpha.1（item，k＝5）和alpha.2（item，k＝5），得到系数 α ＝0.71（保留四位小数，则为 0.713 6），Cronbach’s α ＝0.71（保留四位小数，则为0.714 8）。这两个标准化和非标准化 α 值基本相同，且是可以接受的测量信度值。

如要计算Cronbach’s α 的95％置信区间，则可以根据公式5.8编写并执行以下R代码得到 Q ＝0.189 058 9：

已知 n ＝20，根据公式5.7，得到 ASE ＝0.097 2。将 ASE 值代入公式5.6，得到Cronbach’s α 的95％置信区间：［0.52，0.91］。Cronbach’s α 的95％置信区间较大，点估计不够准确。

前一节讨论 KR20 系数时，在所举的例子中， KR20 ＝0.66。既然 KR20 是 α 系数（Cronbach’s α ）的特例，那么利用函数alpha.2也应得到同样的结果。在同样的例子中，执行命令alpha.2（item，k＝5）同样得到Cronbach’s α ＝0.66。

需要提醒的是，如果问卷中有反向措辞题项（reverse－phrased items），信度分析前要对这些题项反向计分（reverse scoring）。譬如，统计学畏惧调查5点量表包括的绝大多数题项是消极的，譬如“标准差令我头痛”，应答方式为1～5个选项，依次代表“非常不同意”到“非常同意”。选择“5”（即“非常同意”）意味着应答者觉得标准差令其很困扰。如果量表中包括若干反向题项，譬如“我学了95％置信区间后很开心”，应答者选择“5”（即“非常同意”）则表现出积极情绪，与其他题项的测量不一致，因此需要将“5”记作“1”，意思是“我非常不同意‘我学了95％置信区间后很不开心’”。因此，在5点式量表中，为了使计分方式统一，就要对反向题项分值按如下方式转换：1→5，5→1，2→4，4→2。反向措辞的好处在于减少应答偏差（response bias）。

计算标准化和非标准化信度系数、Cronbach’s α 95％置信区间等结果可以调用psych数据包中的函数alpha（x），其中x为数据框或矩阵。譬如，在关于统计学畏惧调查的例子中，执行R命令alpha（item）得到以下结果：

以上结果中，raw a＿lpha指Cronbach’s α （非标准化 α ），std.alpha指系数 α （标准化 α ）。这两个值基本相同，且说明信度尚可。Cronbach’s α 95％置信区间为：［0.52，0.91］。另外一种信度测量为 G 6 （smc）。G6是Guttman’s Lambda 6的缩称；smc是the squared multiple correlation的缩称，意为多元相关系数的平方（）。G6的计算公式为： G 6＝1－，其中为题项之间方差与协方差矩阵各个元素之和。是各个题项之间相关系数的平均数。S／N（the Signal／Noise ratio，信号－噪声比），计算公式为： S ／ N ＝／（1－），其中 n 为题项数，是各个题项之间相关系数的平均数（）。ase为 α 的标准误差；mean和sd分别指各个被试题项分值平均数的均值和标准差。为各个相关系数的中位数。

Reliability if an item is dropped报告中，如果剔除某个题项能够使α值明显增大（使信度提高），则应考虑删除该题项。本例中剔除任何题项都没有使α值超过0.71，因此可保留所有题项。

在题项统计量（Item statistics）结果中，n是样本量，raw.r指某个题项分值与量表总分值之间的相关系数，称作题项－整体相关（item－total correlation）系数。以item1与量表总分值之间的相关系数的计算为例，执行R命令total＜－item1＋item2＋item3＋item4＋item5和cor（item1，total），得到raw.r＝0.78。std.r指在每个题项分值标准化之后（即求 Z 分数）计算题项－整体相关系数。仍以item1与量表总分值之间的标准化相关系数的计算为例，执行R命令total2＜－scale（item1）＋scale（item2）＋scale（item3）＋scale（item4）＋scale（item5）和cor（scale（item1），total2），得到std.r＝0.75。由于总分值中包括了相关题项本身的分值，题项与整体有相关性是理所当然的。r.cor是校正题项重合与量表信度后的题项－整体相关系数，计算较复杂，且不太常用，建议在实际研究中忽略这一项。

较为常用的相关系数是r.drop，即计算某个题项与所有其他题项之间的相关系数，为校正的题项－整体相关（corrected item－total correlation）系数，又称题项－其他项（item－rest）相关系数。譬如，计算item1与其他4项之间的相关系数的R命令和计算结果为：

＞rest1＜－item2＋item3＋item4＋item5

＞cor（item1，rest1）

［1］0.565922

在一个可信的量表中，所有的题项都应与其他题项整体相关。如果某个题项校正的题项－整体相关系数（r.drop）小于0.3，说明该题项与其他题项整体之间相关度低，可考虑将该题项从量表中剔除。本例中，所有校正的题项－整体相关系数（r.drop）均在0.3以上，说明各个题项与其他题项整体之间均有不同程度的相关性。R命令alpha（item）输出的最后一张表（Non missing response frequency for each item）报告每个题项反应类别的频率（含缺失频率）。本例没有缺失值。

5.2 α 系数

5.2
α 系数