心理与行为定量研究手册最新章节_王孟成著

3.4 认知诊断模型

由于个体在头脑中的认知过程无法知晓，只有通过他们在测验上的作答反应进行评估。若使用已校准好的题目（题目参数已知），只需估计个体参数，即估计个体的知识状态即可；若测验是新开发的，那么个体参数和题目参数就需要同时估计，并以此来评价测验/题目的质量。为此，心理测量学家开发出了多种认知诊断模型（Cognitive Diagnostic Model，CDM）来实现上述目标。依据属性之间的作用机制，可以分为不同类型的CDM。第一种为补偿式模型，该模型假设：当个体未掌握题目所考查的某个属性时，答对该题目的概率可由掌握了的其他属性进行弥补。这意味着，正确作答概率不会由于未掌握某个属性而急剧降低。补偿的重参数化统一模型（C-RUM；Hartz，2002）是代表。第二种为连接模型，要求个体掌握全部属性，才能正确作答，DINA和NIDA模型（Junker et al.，2001）是代表。第三种为非连接模型，只要被试掌握题目考查属性的子集，就有较高的正确作答概率，DINO模型（Templin et al.，2006）是代表。第四种为每多掌握一个属性，该属性就会单独提升正确作答概率，该模型为加法诊断模型（A-CDM；de la Torre，2011）。

随着CDM的研究发展，简约模型可被整合进一个更加广义的诊断模型中，例如GDM（von Davier，2008）、LCDM（Henson et al.，2009）和G-DINA模型（de la Torre，2011）。通过对这些广义模型进行参数约束，便可得到DINA等一系列简约模型。广义模型的优势在于对同一份测验数据进行估计时，不必事先选定某个简约模型（实际上，同一份测验只使用某个简约模型进行估计的做法是不妥的，不同题目可能适合于不同模型）。根据结果，可知晓每道题目是由何种诊断模型估计得到。由于每道题目都是由“最佳模型”估计，数据模型拟合更好，个体知识状态估计更加精确（郭磊等，2013）。

3.4.1 G-DINA模型

G-DINA模型可以区分出种知识状态，表示题目j所考查的属性个数， = ，通常有 ≤K _j 。表示与相对应的缩减知识状态，即只考虑在题目j所考查的属性上的掌握情况，。记 = 表示KS为的个体答对题目j的概率，便可得到G-DINA模型的表达式：

式中可取，log 和log it ，分别表示恒等链接、log链接和logit链接。δ _j0 是题目j的截距项，δ _jk 是与α _k 对应的主效应，是与α _k 和α _k ′对应的二阶交互项，是与对应的最高阶交互项。因此，每道题目将有个题目参数需要估计。关于G-DINA模型的更多细节，请参见de la Torre（2011）论文。

3.4.2 简约模型

由于G-DINA是饱和模型，对该模型的参数加以约束便可得到诸如DINA、DINO、A-CDM等简约模型。例如，若只保留饱和模型中的截距项δ _j0 和最高阶交互项，将其余题目参数设置为0，便可得到DINA模型：

若保留截距项δ _j0 和主效应项δ _jk ，并做如下约束：δ _jk =-δ _jk′k ″=…= （-1），其中k = = - 1，且k″ > ，其余题目参数设置为0，便可得到DINO模型：

若将恒等链接的G-DINA模型中的所有交互作用项设置为0，便可得到A-CDM：