2.2 二级计分项目反应理论模型
二级计分项目反应理论模型是一组用于阐述考生在二级计分项目中的答题行为与潜在能力之间关系的数学模型。在二级计分项目中,考生在题目上的得分只有0分、1分两种可能性,如选择题。二级计分项目反应理论模型包括单参数模型(Rasch, 1960)、双参数模型(Birnbaum, 1968)、三参数模型(Birnbaum, 1968)。这三种模型最重要的区别是用于描述项目特征的参数量不同。
2.2.1 单参数模型
单参数模型,又称Rasch模型(Rasch, 1960),是二级计分项目反应理论模型中最简约的模型。该模型仅采用难度参数b描述项目特征。能力为θj的考生答对项目i的概率,用单参数模型可表示如下:
其中,bi为项目i 的难度参数,是项目特征曲线上答对概率为50%的拐点。拐点的位置越靠右边,说明项目的bi值越大,即项目难度越大,需要考生具有更高的能力值才能答对该题。从理论上说,难度值的范围从负无限大到正无限大,但实际上难度值通常在(-2,2)的范围内(Baker, 1985; Hambleton& Swaminathan, 1985; Hambleton et al., 1991; Embretson & Reise, 2000).
2.2.2 双参数模型
在双参数模型中,除了难度参数b以外,还增加了区分度参数a(Birnbaum, 1968)。能力为θj的考生答对项目i的概率,用双参数模型可表示如下:
其中,ai为项目i 的区分度参数,bi为项目i 的难度参数。ai就是项目特征曲线上拐点难度参数bi值上的斜率。区分度值越大,说明该项目越能更好地区分考生的能力水平。从理论上说,区分度值的范围从负无限大到正无限大,但实际上区分度值通常在(0,2)范围内(Hambleton et al., 1991)。
比较公式(1)和公式(2)我们可以看出,双参数模型比单参数模型仅多了区分度参数 ai,即双参数模型允许不同项目具有不同的区分度,单参数模型则认为所有项目的区分度相同。换言之,双参数模型是单参数模型的拓展,如果限定双参数模型中的区分度参数值为1,则双参数模型就会变成单参数模型。
2.2.3 三参数模型
在三参数模型中,除了难度参数b与区分度参数a 以外,还增加了猜测度参数 c(Birnbaum, 1968)。能力为θj的考生答对项目i的概率用三参数模型可表示如下:
其中,ci为项目i的猜测度参数。ci为项目特征曲线的下端渐近线,指考生单靠猜测答对该项目的概率。下端渐近线的位置越高,即ci值越大,说明能力值低的考生猜对该项目的概率越大。从理论上说,猜测度值的范围介于0到1之间,但实际上猜测度值通常小于0.3(Harris, 1989)。由于三参数模型包含猜测因素,因此三参数模型中的难度参数bi为项目特征曲线上答对概率为(1+c)/2的拐点。
同样,比较公式(2)和公式(3)可以看出,三参数模型与双参数模型非常相似,只是在三参数模型中加入了猜测度参数 ci。如果该项目不存在猜测答题的可能性,如二级计分简答题项目,猜测度参数 ci就等于0,因此,三参数模型便简化为双参数模型。简而言之,三参数模型是双参数模型的拓展,双参数模型是单参数模型的拓展。
2.2.4 二级计分模型的项目信息量与测试信息量
在经典测量理论中,测量精确度以信度来表示,信度越高,表示测量精确度越高。参加同一考试的所有考生的测量精确度被假定为相同,所以只有一个信度值。在项目反应理论中,测量精确度用信息量来表示,不论是单一项目还是整个测试,对不同能力的考生会提供不同的信息量。
项目信息量指该项目在整个能力区间的每个点上所能提供的测量精确度(Hambleton et al., 1991)。对于二级计分项目反应理论模型,项目信息函数Ii(θ)可表示为:
其中,Pi(θ)是能力为θ的考生答对项目i的概率,是 Pi(θ)的一阶导数。项目信息量越大,测量就越精确。对于二级计分项目而言,当考生能力值等于项目难度值时,其项目函数曲线达到最高点。并且,区分度参数值越大,项目信息量函数曲线越凸起;区分度参数值越小,项目信息量函数曲线越平坦(DeMars, 2010)。
测试信息量指一项测试在整个能力区间的测量精确度。测试信息量TI(θ)等于测试中所有项目的信息量的总和:
在最大似然估计法中,测试信息量I(θ)与能力估计标准误差SE(θ)存在反向关系,其关系可以用以下公式表示: