由于个体在头脑中的认知过程无法知晓,只有通过他们在测验上的作答反应进行评估。若使用已校准好的题目(题目参数已知),只需估计个体参数,即估计个体的知识状态即可;若测验是新开发的,那么个体参数和题目参数就需要同时估计,并以此来评价测验/题目的质量。为此,心理测量学家开发出了多种认知诊断模型(Cognitive Diagnostic Model,CDM)来实现上述目标。依据属性之间的作用机制,可以分为不同类型的CDM。第一种为补偿式模型,该模型假设:当个体未掌握题目所考查的某个属性时,答对该题目的概率可由掌握了的其他属性进行弥补。这意味着,正确作答概率不会由于未掌握某个属性而急剧降低。补偿的重参数化统一模型(C-RUM;Hartz,2002)是代表。第二种为连接模型,要求个体掌握全部属性,才能正确作答,DINA和NIDA模型(Junker et al.,2001)是代表。第三种为非连接模型,只要被试掌握题目考查属性的子集,就有较高的正确作答概率,DINO模型(Templin et al.,2006)是代表。第四种为每多掌握一个属性,该属性就会单独提升正确作答概率,该模型为加法诊断模型(A-CDM;de la Torre,2011)。
随着CDM的研究发展,简约模型可被整合进一个更加广义的诊断模型中,例如GDM(von Davier,2008)、LCDM(Henson et al.,2009)和G-DINA模型(de la Torre,2011)。通过对这些广义模型进行参数约束,便可得到DINA等一系列简约模型。广义模型的优势在于对同一份测验数据进行估计时,不必事先选定某个简约模型(实际上,同一份测验只使用某个简约模型进行估计的做法是不妥的,不同题目可能适合于不同模型)。根据结果,可知晓每道题目是由何种诊断模型估计得到。由于每道题目都是由“最佳模型”估计,数据模型拟合更好,个体知识状态估计更加精确(郭磊 等,2013)。
G-DINA模型可以区分出
种知识状态,
表示题目j所考查的属性个数,
=
,通常有
≤K
j
。
表示与
相对应的缩减知识状态,即只考虑在题目j所考查的属性上的掌握情况,
。记
=
表示KS为
的个体答对题目j的概率,便可得到G-DINA模型的表达式:
式中
可取
,log
和log it
,分别表示恒等链接、log链接和logit链接。δ
j0
是题目j的截距项,δ
jk
是与α
k
对应的主效应,
是与α
k
和α
k
′对应的二阶交互项,
是与
对应的最高阶交互项。因此,每道题目将有
个题目参数需要估计。关于G-DINA模型的更多细节,请参见de la Torre(2011)论文。
由于G-DINA是饱和模型,对该模型的参数加以约束便可得到诸如DINA、DINO、A-CDM等简约模型。例如,若只保留饱和模型中的截距项δ
j0
和最高阶交互项
,将其余题目参数设置为0,便可得到DINA模型:
若保留截距项δ
j0
和主效应项δ
jk
,并做如下约束:δ
jk
=-δ
jk′k
″=…= (-1)
,其中k =
=
- 1,且k″ >
,其余题目参数设置为0,便可得到DINO模型:
若将恒等链接的G-DINA模型中的所有交互作用项设置为0,便可得到A-CDM: