本小节通过蒙特卡洛(Monte Carlo)模拟方法采用MATLAB软件自编一个简单的 0-1评分CAT程序,以帮助读者更好地理解上述内容。本实例以 1PLM为测量模型,主要目的是通过模拟比较两种CAT选题策略的表现,两种策略分别是随机选题策略(作为比较基准)和“难度b匹配能力θ”的选题策略。模拟细节描述如下:
①从标准正态分布N(0,1)中随机抽取1000名被试的能力值θ。
②从N(0,1)中随机抽取400个题目的难度值b。
③采用MLE和EAP相结合的方式对被试能力进行估计或更新。具体地讲,当至少作答完5道题目且作答模式既包括 0 又包括 1 时,采用MLE方法估计能力;否则,采用EAP方法估计能力。当使用N-R算法的MLE方法不收敛时,换用“格搜索”方法(Grid Search,G-S)。
④使用固定长度的终止规则,即每名被试作答30道题就结束测验。
⑤制作横坐标为能力真值θ、纵坐标为能力估计值 的散点图,并在图中为每种选题策略都画一条45度直线和一条回归线。
⑥所有题目的难度参数和所有被试的能力参数都控制在[-4,4]的范围内,在实施N-R算法时将迭代精度设为0.001,在实施G-S算法时将格宽度(或称为步长)设为0.00001。
主程序的MATLAB代码如下:
限于篇幅,这里不提供上述主程序中调用的子程序(即Parameter_Simulation、Random_ISS、Matching_ISS、Response_Simulation、MLE_Method、Grid_Search和EAP_Method)代码,感兴趣的读者可以根据前文所述原理或公式自编程序以实现相应功能。
两种选题策略的模拟比较结果如图 4.3所示。图中横坐标表示能力真值θ,纵坐标表示能力估计值 ,实线代表 45度直线,虚线表示回归线。从图中可以发现:①“难度b匹配能力θ”选题策略得到的 45 度直线与回归线几乎重合,而随机策略产生的两条线存在一定程度的偏离;②相对于随机选题策略,“难度b匹配能力θ”选题策略得到的散点更向45度直线上靠拢。这两点都可以说明“难度b匹配能力θ”选题策略的能力估计精度较随机选题策略更高。
图4.3 随机选题策略和“难度b匹配能力θ”选题策略的模拟比较结果