一般而言,任何数学模型的成立都需要满足一些基本假设,并指定模型中可观测和不可观测结构之间的关系。在IRT中,基础项目反应模型的许多命题与论断是在一些前提假设的基础上建立起来的,确定研究数据是否满足某特定模型的基本假设将为模型的选择提供有用信息(Traub,1983)。与经典测量理论相比,项目反应理论是建立在强假设基础上的(Hambleton et al.,1985)。一般来说,项目反应理论主要包括以下三个基本假设:
潜在特质是项目反应理论中的一个重要概念,指向个体内部的心理特征,如能力、人格、兴趣等,在项目反应理论的研究中,个体的潜在特质是研究所关注的重点之一,一般用变量θ来表示。而该假设的含义为任何一个项目反应模型都是建立在有限的潜在特质空间维度的基础上的。其中,潜在特质空间维度又称能力维度,是指被试的测验成绩是由被试的若干种心理特质或能力θ 1 ,θ 2 ,…,θ n 所决定的,这一n维空间称为潜在特质空间。在基础项目反应模型中,潜在特质空间单维性假设是一个非常重要的假设,即量表中包含的项目所测量的潜在特质是处在单维空间中的,在此单维空间中,不同被试之间的潜在特质水平可以相互比较。简而言之,基础项目反应模型假设被试的潜在特质处于同一单维空间中,被试的测验结果只取决于同一种潜在特质或能力,而其他潜在特质或能力的影响都可以忽略不计,即组成测验的所有项目均测量同一种能力或潜在特质。不过,值得注意的是该假设已被逐步发展出的多维项目反应模型逐渐突破。
该假设包含了两个方面的含义:一方面,同一被试(或同一水平的被试)在任意一个项目上的作答反应都不会受到同一测验上的任何其他项目的影响,这意味着个体在特定项目上的作答反应不会受到测验中任何其他项目的内容、形式或结构的影响;另一方面,在同一项目上,不同潜在特质水平被试的作答反应之间不会相互影响,这意味着个体的作答结果只决定于该个体本身的潜在特质水平的高低,此为局部独立性假设。当满足局部独立性时,任何作答模式发生的概率相当于被试在各测验项目上所得分数的发生概率的乘积。局部独立性假设是项目反应理论最基本的假设,项目反应理论所做出的一切推论都必须以局部独立性假设为前提(Wainer et al.,1990)。
如前文所述,项目特征函数(Item Characteristic Function,ICF)是用来描述被试特质参数与被试在某项目上的正确作答概率之间关系的数学模型。换言之,项目特征函数是一种数学函数,它将被试正确作答某特定项目的概率与研究所测量的潜在特质或能力建立起了联系。在基础项目反应模型中,依据项目参数的不同特征(区分度、难度、猜测度等参数)可建立起不同特质参数值与该特质水平的被试正确作答该项目的概率之间的非线性回归函数。研究人员试图以图形的形式来描述被试在某特定项目上的正确作答概率与其潜在特质水平之间的函数关系,由此得到的能够反映被试潜在特质水平与项目正确作答概率之间关系的“S”形曲线即项目特征曲线(ICC)。总而言之,项目特征曲线假设的基本含义是指被试在项目上的正确作答概率与其潜在特质或能力之间存在函数关系,体现了一种非线性的预测关系。
本小节介绍了三种常见的二级计分IRT模型,在二级计分测验中,每个项目的得分均由0、1组成,正确作答的概率记作P(θ),错误作答的概率记作1-P(θ),被试在项目上的正确作答概率与被试的特质水平有一定的函数关系,能够表述这种关系的函数有很多,不同的项目特征曲线假设对应着不同的项目反应模型。到目前为止,研究者已经提出了众多的IRT模型,如正态肩形模型、Logistic模型等,其中较为成熟且较为常用的当属单参数Logistic模型(One-Parameter Logistic Model,1PLM)、二参数Logistic模型(Two-Parameter Logistic Model,2PLM)以及三参数Logistic模型(Three-Parameter Logistic Models,3PLM)。其中,1PLM属于Rasch模型(Wright,1968;Rasch,1960),模型中仅包含难度参数,二参数Logistic模型包含了难度和区分度两个参数(Lord,1952;Birnbaum,1968),三参数Logistic模型包含了难度、区分度和猜测度三个参数(Lord,1952;Birnbaum,1968)。
三种Logistic模型的数学计算公式及基于各模型的ICC曲线如图2.2—图2.4所示。
单参数Logistic模型(1PLM)为:
图2.2 基于单参数Logistic模型的ICC曲线
二参数Logistic模型(2PLM)为:
图2.3 基于二参数Logistic模型的ICC曲线
三参数Logistic模型(3PLM)为:
图2.4 基于三参数Logistic模型的ICC曲线
图 2.4所示的曲线图即项目特征曲线(ICC)。其中,exp是以自然常数e为底的指数函数,j为被试的编号;θ j 表示第j位被试的能力水平(潜在特质水平);i是项目的编号,α i 、β i 和c i 分别代表第i道题的区分度参数、难度参数和猜测参数;P ij (θ j )表示能力水平(潜在特质水平)为θ j 的第j个被试在第i道题上的正确作答概率。在项目参数中,难度参数β代表项目的难度,在项目特征曲线(ICC)中体现为曲线在横轴方向的位移,项目的难度参数越大,则表明若要正确作答该项目就需要比较高的能力水平。在实际应用中,难度参数β的一般取值范围为[-3,3];区分度参数α代表项目的区分度,它的数值越大,表示该项目对于不同能力水平的被试的鉴别力越强,即该项目可以很好地区分开能力水平较高和能力水平较低的被试;反之,若区分度参数值较小,则表明不能很好地将不同能力水平的被试区分开来。一般而言,区分度参数要在0.8以上项目较优。在项目特征曲线中,区分度参数可通过项目特征曲线的斜率来体现,项目特征曲线的斜率越大,则代表该项目的区分度越高。在ICC曲线中,θ j = β i 这一点的斜率与项目的区分度成正比,该点的斜率越大则表示项目的区分度越高。由式(2.1)可知,当θ j = β i 时,被试有 50%的概率正确作答该项目。此外,猜测参数(c)代表即使被试对于如何解答测验项目完全没有头绪时,仅靠猜测也能答对该项目的概率,若猜测参数的数值较大,表示不论被试能力水平高低,均容易答对该项目;反之,则表明被试仅凭猜测不易答对该项目。猜测参数在项目特征曲线中体现为曲线的下渐进线延长线与纵坐标交点处的高度,在实际应用中,项目的猜测参数不宜过高。
图 2.2所示的是固定项目区分度参数与难度参数为1,被试特质水平范围在-6~6的项目特征曲线,当被试的特质水平为 1 时(θ=β),正确作答该项目的概率为 0.5;如图 2.3 所示,当θ =β=1时,项目特征曲线相应位置的斜率为0.8,反映了该项目的区分度为0.8,相比于图2.2中区分度为 1的项目来说,图 2.3所示的项目在区分不同特质水平的被试时所表现出的鉴别能力稍弱一些;图2.4所示的项目特征曲线的纵轴起点值为0.2,可见该项目的猜测参数并不为0,这代表即使被试能力水平较低,也有正确作答该项目的可能性。
通过对模型中的各项参数的估计,可以确定测验项目是否能够很好地反映出被试的能力水平(潜在心理特质水平)。研究人员可根据各自的研究目的,自行选择不同类型的IRT模型。一般而言,典型行为测验(如人格测试)选用二参数Logistic模型(2PLM)比较适宜。因为对于这类测试的项目来说,很难保证完全一致的区分度,且被试无须猜测,因此仅需保留区分度参数以及难度参数,而不需猜测参数,故 1PLM和 3PLM都不太适合。而对于最高行为测验,如智力测验,一般会存在猜测行为,故选用3PLM比较适宜。