由于个体在头脑中的认知过程无法知晓,只有通过他们在测验上的作答反应进行评估。若使用已校准好的题目(题目参数已知),只需估计个体参数,即估计个体的知识状态即可;若测验是新开发的,那么个体参数和题目参数就需要同时估计,并以此来评价测验/题目的质量。为此,心理测量学家开发出了多种认知诊断模型(Cognitive Diagnostic Model,CDM)来实现上述目标。依据属性之间的作用机制,可以分为不同类型的CDM。第一种为补偿式模型,该模型假设:当个体未掌握题目所考查的某个属性时,答对该题目的概率可由掌握了的其他属性进行弥补。这意味着,正确作答概率不会由于未掌握某个属性而急剧降低。补偿的重参数化统一模型(C-RUM;Hartz,2002)是代表。第二种为连接模型,要求个体掌握全部属性,才能正确作答,DINA和NIDA模型(Junker et al.,2001)是代表。第三种为非连接模型,只要被试掌握题目考查属性的子集,就有较高的正确作答概率,DINO模型(Templin et al.,2006)是代表。第四种为每多掌握一个属性,该属性就会单独提升正确作答概率,该模型为加法诊断模型(A-CDM;de la Torre,2011)。
随着CDM的研究发展,简约模型可被整合进一个更加广义的诊断模型中,例如GDM(von Davier,2008)、LCDM(Henson et al.,2009)和G-DINA模型(de la Torre,2011)。通过对这些广义模型进行参数约束,便可得到DINA等一系列简约模型。广义模型的优势在于对同一份测验数据进行估计时,不必事先选定某个简约模型(实际上,同一份测验只使用某个简约模型进行估计的做法是不妥的,不同题目可能适合于不同模型)。根据结果,可知晓每道题目是由何种诊断模型估计得到。由于每道题目都是由“最佳模型”估计,数据模型拟合更好,个体知识状态估计更加精确(郭磊 等,2013)。
G-DINA模型可以区分出 种知识状态, 表示题目j所考查的属性个数, = ,通常有 ≤K j 。 表示与 相对应的缩减知识状态,即只考虑在题目j所考查的属性上的掌握情况, 。记 = 表示KS为 的个体答对题目j的概率,便可得到G-DINA模型的表达式:
式中 可取 ,log 和log it ,分别表示恒等链接、log链接和logit链接。δ j0 是题目j的截距项,δ jk 是与α k 对应的主效应, 是与α k 和α k ′对应的二阶交互项, 是与 对应的最高阶交互项。因此,每道题目将有 个题目参数需要估计。关于G-DINA模型的更多细节,请参见de la Torre(2011)论文。
由于G-DINA是饱和模型,对该模型的参数加以约束便可得到诸如DINA、DINO、A-CDM等简约模型。例如,若只保留饱和模型中的截距项δ j0 和最高阶交互项 ,将其余题目参数设置为0,便可得到DINA模型:
若保留截距项δ j0 和主效应项δ jk ,并做如下约束:δ jk =-δ jk′k ″=…= (-1) ,其中k = = - 1,且k″ > ,其余题目参数设置为0,便可得到DINO模型:
若将恒等链接的G-DINA模型中的所有交互作用项设置为0,便可得到A-CDM: