4.3 典型题（含考研真题）详解_戴海崎《心理与教育测量》（第4版）笔记和课后习题（含考研真题）详解-QQ阅读男生武侠网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

4.3　典型题（含考研真题）详解

一、单项选择题

1误差变异越大，信度越低；误差变异越小，信度越高。这里的误差指的是（　　）。[统考2019研]

A．抽样误差

B．随机误差

C．系统误差

D．计算误差

【答案】B

【解析】心理测量中的误差主要有随机误差和系统误差，系统误差只影响效度并不影响信度，随机误差既影响信度也影响效度，因此随机误差的大小会直接影响信度的高低。

2当测验信度增大（趋向于1）时，测量标准误的变化趋势是（　　）。[统考2015研]

A．减小，趋向于0

B．增大，趋向于无穷大

C．减小，趋向于测验分数标准差

D．增大，趋向于测验分数标准差

【答案】A

【解析】每个人两次测量的分数之差可以构成一个新的分布，这个分布的标准差就是测量的标准误，是此次测量中误差大、小的客观指标，其公式为

式中，S_E为测量的标准误，S_x为实得分标准差，r_xx′是测量的信度。因此，当测验信度趋向于1时，测量标准误减小并逐渐趋向于0。

3由于幼儿的智力发展迅速，收集幼儿智力测验信度资料的最佳方法是（　　）。[统考2013研]

A．再测法

B．复本法

C．分半法

D．方差分析法

【答案】C

【解析】分半信度指的是将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。A项，再测法，幼儿的智力发展迅速，所以不可以使用再测。B项，复本信度指两个平行测验测量同一批被试，但是这个平行测验很难构造。

4信度系数不仅可以解释测验总变异中的随机测量误差，还可以解释（　　）。[统考2012研]

A．样本标准差

B．组间误差

C．真分数变异

D．组内误差

【答案】C

【解析】信度是一个被测团体的真分数的变异数与实得分数的变异数之比。即：

式中r_xx代表测量的信度，代表真分数变异，代表总变异数，即实得分数的变异。根据

可得

5一个研究若前后数次施行，所得的结果很接近，这说明该研究的哪项指标很高（　　）。[北京大学2011研]

A．信度

B．内部效度

C．外部效度

D．构思效度

【答案】A

【解析】信度指测量结果的稳定性程度，即用同一测验工具多次测量某人的同一心理品质，所得测量结果间的一致性程度。

6关于各类信度系数及其主要的误差方差来源，下列描述不正确的是（　　）。[北京大学2011研]

A．重测信度的主要误差方差来源是时间取样

B．分半信度的主要误差方差来源是内容取样

C．同质性信度的主要误差方差来源是内容的异质性

D．重测复本信度的主要误差方差来源是评定者间差异

【答案】D

【解析】重测复本信度的主要误差方差来源应是时间取样和内容取样。评分者信度的主要误差方差来源是评定者间的一致性。

7某测验的信度为0.64，实得分数的标准差为5，该测验的标准误为（　　）。[统考2010研]

A．0.36

B．1.04

C．3.00

D．4.36

【答案】C

【解析】根据标准误的公式，代入数据，得：

8重测信度的主要误差源是（　　）。[统考2009研]

A．内容取样

B．时间取样

C．统计方法

D．评分者

【答案】B

【解析】重测信度是指同一个测验先后施测于同一批被试，比较这两次测验结果的一致性程度。其中时间的长短是影响其信度的关键因素。如果时间太短则被试可能存在记忆；如果时间太长，则被试的消失率或者被试本身的成熟发育等会影响测验结果。

9衡量测验跨时间一致性的信度称为（　　）。[统考2008研]

A．重测信度

B．复本信度

C．同质性信度

D．评分者信度

【答案】A

【解析】不同的信度考查的内容不同。重测信度衡量测验跨时间的一致性；复本信度（连续施测）衡量测验两个平行测验内容之间的一致性，复本信度（间隔施测）衡量两个平行测验内容之间跨时间的一致性；同质性信度衡量一个测验所测内容间的一致性；评分者信度衡量评分者间的一致性。

10将测验对等分半后，两半测验得分的相关系数为0.60，校正后该测验的分半信度是（　　）。[统考2007研]

A．0.70

B．0.75

C．0.80

D．0.85

【答案】B

【解析】利用分半法计算测验的信度，可能会低估原长度测验的信度，所以需要用斯皮尔曼-布朗公式对分半信度系数进行修订，根据校正公式

可知校正后该测验的分半信度是0.75。

11同质性信度主要反映测验内部（　　）间的一致性。

A．两半测验

B．题目与分测验

C．所有题目

D．分测验与测验

【答案】C

【解析】同质性信度主要反映的是所有题目间的一致性。当各个测题的得分有较高的正相关时，不论题目的内容和形式如何，则测验为同质的。相反，表面看起来题目都是测的同一特质，但各个题目间相关很低或负相关时，则测验为异质的。分半信度测的是两半测验的一致性。

12在不同时间内用同一测验重复测量同一被试者，所得结果的一致程度称为（　　）。

A．信度

B．效度

C．难度

D．区分度

【答案】A

【解析】信度主要是指测量结果的可靠性或一致性，可用重测信度、复本信度、内部一致性信度、评分者信度进行评估。在不同时间内用同一测验重复测量同一被试者，所得结果的一致程度即为重测信度。效度，即测量的有效性程度，是测量工具确能测出其所要测量特质的程度。难度即测试题目的难易程度。区分度是指测试题目对所测试的属性的鉴别力。

13重测信度即（　　）。

A．等位性系数

B．稳定性系数

C．相关系数

D．X系数

【答案】B

【解析】重测信度又称稳定性系数。它的计算方法是采用重测法，即使用同一测验，在同样条件下对同一组被试者前后施测两次测验，求两次得分间的相关系数。

14以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越（　　）。

A．大

B．低

C．小

D．不确定

【答案】A

【解析】再测法使用同一测验，在同样条件下对同一组被试者前后施测两次测验，求两次得分间的相关系数。复本法以两个等值但题目不同的测验（复本）来测量同一群体，然后求得被试者在两个测验上得分的相关系数。两种求信度的方法都受到测验时间间隔的影响，间隔时间越短所测得的信度系数越大。

15信度只受（　　）的影响。

A．系统误差

B．随机误差

C．恒定效应

D．概化理论

【答案】B

【解析】信度是测验的稳定程度，随机误差既影响效度也影响信度，系统误差只影响效度不影响信度。恒定效应是对测验分数的稳定的影响，只影响效度不影响信度。概化理论是测验理论之一。

16一个包括40个题目的测验的信度为0.80，欲将信度提高到0.90，通过斯皮尔曼-布朗公式的导出公式计算出至少应增加（　　）个题。

A．40

B．60

C．100

D．50

【答案】D

【解析】根据斯皮尔曼-布朗公式，可得

因此，欲将信度提高到0.90需增加题目数：40×2.25－40＝50。

17一般而言，若获得信度的取样团体较为异质的话，往往会（　　）测验的信度。

A．高估

B．低估

C．忽略

D．不清楚

【答案】A

【解析】任何相关系数都要受到团体中分数分布的范围所影响，而分数范围与样本团体的异质程度有关。一般而言，若获得信度的取样团体较为异质的话，往往会高估测验的信度，相反则会低估测验的信度。

18斯皮尔曼-布朗公式：

式中r_hh为（　　）的相关系数，r_xx为测验在原长度时的信度估计值。

A．全测验

B．原测验

C．两半测验间

D．全部分数

【答案】C

【解析】斯皮尔曼-布朗公式是分半信度的修正公式。分半信度指采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式，实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半，并分别计算每位被试在两半测验中的得分，求出这两半分数的相关系数。

19复本信度又称等值性系数。它是以两个等值但题目不同的测验（复本）来测量同一群体，然后求得被试者在两个测验上得分的相关系数。复本信度反映的是测验在（　　）上的等值性。

A．时间

B．题目

C．评分

D．内容

【答案】D

【解析】复本信度反映的是测验在内容上的等值性，故又称等值性系数。

20对于不同平均能力水平的团体，题目的（　　）会影响信度系数。

A．难度

B．表达方式

C．代表性

D．效度

【答案】A

【解析】测验的信度不仅受取样团体中个别差异程度的影响，也会由于不同团体间平均能力水平的不同而不同。这是因为，对于不同水平的团体，题目具有不同的难度，每个题目在难度上的微小差异累计起来便会影响信度。

21以下公式中，可以用来计算同质性信度的是（　　）。

A．斯皮尔曼-布朗公式

B．卢仑公式

C．克隆巴赫公式

D．弗朗那根公式

【答案】C

【解析】同质性信度是指测验内部所有题目间的一致性程度。计算方法有：库德-理查逊信度系数，克隆巴赫α系数，荷伊特信度。ABD三项都是用来计算分半信度的。

22当测验的信度减少（接近0）时，测量的标准误将会怎样变化？（　　）

A．减小，趋向于零

B．只要趋向于1.0，它就会要么增大，要么减小

C．增大，趋向于测验的标准差

D．增大，逼近无限大

【答案】C

【解析】测量的标准误与信度之间的关系是：

其中S_E为测量标准误，S_x为实得分标准差，r_xx′是测量的信度。所以当r_xx′减少（接近0）时，S_E增大并趋向于S_x。

23根据测量理论，（　　）的做法会降低测验的信度。

A．增加同类题目的数目

B．提高被测群体的同质性

C．对主试进行统一培训

D．筛选题目，使题目难度中等且正态分布

【答案】B

【解析】信度估计值大都是以相关为基础的，而相关系数的大小往往取决于全体被试得分的分布情况。当被试团体异质（即团体内水平彼此差异大）时，全体被试的总分分布必然较广，以相关为基础计算出来的信度值必然会大。当团体内部水平相差不大（同质）时，其得分分布必定会较窄，以相关为基础计算出来的信度值必然会小。

24如果某测验的信度系数为0.90，那么该测验中与测量目的有关的变异造成的变异占（　　）。

A．90%

B．10%

C．大于90%

D．小于90%

【答案】D

【解析】真分数方差还可以分成两部分：与测量目的有关的方差和与测量目的无关的方差。信度是指一组测量分数的真实方差与实得方差之比，或者指真实方差占总方差的百分比。效度是指与测量目的有关的分数方差与总方差的比率，其值小于信度。

25关于信度的指标，下列选项中正确的是（　　）。

A．信度系数，即实得分数方差与真分数方差的比值

B．信度指数即是信度系数

C．测量标准误与信度呈负相关

D．测量标准误与信度呈正相关

【答案】C

【解析】测量标准误

因此测量标准误与信度呈负相关，即信度增加，则标准误变小。

26如果某测验的信度系数为0.80，那么该测验中真分数造成的变异占（　　）。

A．80%

B．20%

C．64%

D．36%

【答案】A

【解析】根据信度的定义

其中r_xx代表测验的信度，代表测验中实得分数的变异，代表对测验中真分数的变异。因此，测验中真分数造成的变异应该为测验信度r_xx，即80%。

27在计算重测信度时，两次施测的间隔时间不宜太短，是为了避免（　　）。

A．被试学习经验的积累

B．被试身心状况的发展变化

C．被试出现遗忘

D．练习效应

【答案】D

【解析】重测信度估计两次测试的时间间隔要恰当，间隔时间太长，被试品质发生了变化，会造成低估测验信度，间隔时间太短，练习和记忆会造成高估测验信度。

28对重测信度的理解正确的是（　　）。

A．使用同一测验，在不同条件下，对同一组被试前后两次实施之间的相关系数

B．使用同一测验，在同样条件下，对同一组被试前后两次实施之间的相关系数

C．使用同一测验，在同样条件下，对不同被试前后两次实施之间的相关系数

D．使用不同的测验，在不同条件下，对同一组被试前后两次实施之间的相关系数

【答案】B

【解析】重测信度考察的是时间因素对信度的影响，因此只有两次施测仅有时间因素不同，才可以将测验成绩的变化归因为时间因素。因此，重测信度是在除了时间不同以外，其他条件都相同的条件下，被试两次测验的相关系数。

29同质性信度（　　）。

A．是检验测验内部所有题目的一致性

B．是用同一测验重复测量的一致性程度

C．是检验两个测验在内容上的等质性

D．主要指测验题目的内容和形式，而不论其正、负相关性

【答案】A

【解析】同质性主要代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时，不论题目的内容和形式如何，则测验为同质的。相反，即使所有题目看起来好像测量同一特质，但相关很低或为负相关时，则测验为异质的。B项是重测信度，C项是复本信度。

30分半信度所考察的误差来源是（　　）。

A．时间取样

B．内容取样

C．时间取样和内容取样

D．评分者之间的差异

【答案】B

【解析】分半信度，在估计信度系数时，只需一种测验形式，实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半，并分别计算每位被试在两半测验上的得分，求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度，因而属于内部一致性信度系数。因此分半信度所考察的误差来源是内容取样。

31甲被试在韦氏成人智力测验中言语智商为102，操作智商为110。已知两个分数都是以100为平均数，15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88，那么甲被试的操作智商（　　）于言语智商。

A．等

B．低

C．显著高

D．不显著高

【答案】D

【解析】根据差异分数的标准误公式

得S_Ed＝7.5，Z＝（110－102）/7.5＝1.067。由于1.067＜1.64，所以甲被试的操作智商不显著高于言语智商。

32信度系数一般在0.90以上的测验类型是（　　）。

A．人格测验

B．兴趣测验

C．态度量表

D．成就测验

【答案】D

【解析】一般的能力测验和成就测验的信度系数都在0.90以上，有的可以达0.95；而人格测验、兴趣、态度、价值观等测验的信度一般在0.80～0.85或更高些。

33两次实施测验（　　）。

A．间隔时间越长越好

B．间隔时间越短越好

C．应连续进行

D．间隔以2～4周为宜，最好不超过6个月

【答案】D

【解析】如果两次施测相隔的时间太短，则记忆犹新，练习的影响较大；如果相隔的时间太长，则身心的发展与学习经验的积累等足以改变测验分数的意义，而使相关降低。最适宜的时距随测验的目的、性质和被试特点而异，一般是两周到四周较宜，间隔时间最好不超过六个月。

二、多项选择题

1在经典测量理论中，表示测验结果精确程度的指标有（　　）。[统考2011研]

A．测验信度

B．测验效度

C．测验标准误

D．测验正确率

【答案】AC

【解析】测验结果的精确程度是指测验分数与真分数的接近程度。测验信度和测验标准误反映了这种测验结果的精确程度。

2使用同一测验，在同样条件下对同一组被试者前后施测两次测验，求两次得分之间的相关系数，叫______，又称______。（　　）

A．复本信度

B．重测信度

C．稳定性系数

D．分半信度

【答案】BC

【解析】重测信度，又称稳定性系数。它的计算方法是采用重测法，即使用同一测验，在同样条件下对同一组被试者前后施测两次测验，求两次得分之间的相关系数。

3信度系数在解释个人分数的意义时的作用是（　　）。

A．估计误差分数的范围

B．估计真实分数的范围

C．了解实得分数再测时可能的变化情形

D．了解误差分数的大小

【答案】BC

【解析】从信度可以解释个人分数的意义，这就是测量标准误的应用。它有两个作用：其一是估计真实分数的范围；其二是了解实得分数再测时可能的变化情形。

4，公式中S_E为测量的标准误，S_x是所得分数的标准差，r_xx′为测验的信度系数。从公式中可以看出，测量的标准误与信度之间的关系是（　　）。

A．信度越低，标准误越小

B．信度越低，标准误越大

C．信度越高，标准误越大

D．信度越高，标准误越小

【答案】BD

【解析】从公式中可以看出测量的标准误和信度之间是负相关，即两个变量变化的方向相反，信度越低，标准误越大；信度越高，标准误越小。

5信度系数（　　）。

A．可以解释为总的方差中有多少比例是由真实分数的方差所决定

B．也可以解释为测验的总变异中真分数造成的变异占百分之几

C．其分布是从0.00到1.00的范围

D．不能提示测量的误差比例是多少

【答案】ABC

【解析】信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的，也就是测验的总变异中真分数造成的变异占百分之几。因此，1－r_xx就是测验随机误差比例。D项是错误的。

6测验的信度体现在（　　）。

A．测验结果在不同的时间阶段具有一致性

B．同一测验内各个部分题目所测的是同一行为或行为特征

C．不同评分者对同一测验结果的评分一致

D．测量内容与未来的行为是一致的

【答案】ABC

【解析】信度是一个测验的可信程度，包括重测信度、复本信度、内部一致性信度和评分者信度，不同的信度反映测验误差的不同来源。A项指复本信度，B项指内部一致性信度，C项指评分者信度，D项是预测效度。

7间隔一段时间对某测验的两个复本再进行信度评估（　　）。

A．称重测复本信度

B．称稳定与等值系数

C．是更为严格和更为广泛的应用

D．没有应用价值

【答案】ABC

【解析】如果两个复本的施测相隔一段时间，则称重测复本信度或稳定与等值系数。稳定与等值系数既考虑了测验在时间上的稳定性，也考虑了样本反应的一致性，因而是更为严格的信度考察方法，也是应用较为广泛的方法。

8一般来说，在一个测验中增加同质的题目，可以使信度提高。下列描述中正确的是（　　）。

A．测验越长，越遵循报酬递增率原则

B．测验越长，被试者受猜测因素的影响就越小

C．测验越长，测验的测题取样或内容取样就越有代表性

D．测验太长，有时反而会引起被试者的疲劳和反感而降低可靠性

【答案】BCD

【解析】BC两项是增加测验长度的好处，D项是盲目增加测验长度的不良影响。测验长度与信度的关系是，测验题目较少时，遵循报酬递增率原则，随着测验题目的增加，信度逐渐提高，当到达一个最佳水平时，获得最佳的信度，之后出现报酬递减率原则，随着题目的增加，信度逐渐降低。因此，A项是不正确的。

9信度相关系数与样本团体的差异程度的关系表现在（　　）。

A．获得信度的取样团体为异质，会高估测验的信度

B．获得信度的取样团体为同质，会低估测验的信度

C．获得信度的取样团体为异质，会低估测验的信度

D．获得信度的取样团体为同质，会高估测验的信度

【答案】AB

【解析】样本团体为同质时，由于被试之间能力差不多，其得分分布较窄，以相关为基础计算出来的信度值必然偏小，会低估测验的信度。样本团体为异质时，被试能力之间的差异较大，被试总分分布较广，以相关为基础计算出来的信度值必然偏大，会高估测验的信度。

三、名词解释

1同质性信度[苏州大学2014研]

答：同质性信度也称内部一致性信度，是指测验内部所有题目间的一致性程度。即一个测验所测内容或特质的相同程度。

2测量的标准误[华中师范大学2004研]

答：测量的标准误是指每个人两次测量的分数之差构成一个新的分布的标准差。它是此次测量中误差大小的客观指标，有了这一指标，我们就可以对团体中任何一个人的测验成绩作出恰当的解释（即，能通过区间估计的办法指出测量的精度）。一个测量的标准误可用下式计算：

（式中S_E为测验的标准差，S_x为实得分标准差，r_xx′是测量的信度）。

四、简答题

1某5点评分的态度量表共8题，100个被试在各题上得分的方差分别是0.81，0.82，0.86，0.79，0.83，0.85，0.76，0.77，测验总分的方差为14.00，请计算该测验的同质性信度。[首都师范大学2015研]

答：同质性信度反映的是测验内部的一致性，即项目同质性。当被试在同一测验里表现出跨项目的一致性时，就称测验具有项目同质性。也就是测验里各测题得分为高相关时，即为同质，反之测题间低相关则为异质。

（1）该题为非0、1计分，因此可以使用克隆巴赫α系数来计算该测验的同质性信度。

（2）克隆巴赫α系数的计算公式为

其中表示所有被试在第i题上的分数变异，为测验总分的方差，K为题目数。

（3）将题干中的数据代入公式得：α＝8/（8－1）×[1－（0.81＋0.82＋0.86＋0.79＋0.83＋0.85＋0.76＋0.77）÷14]＝0.613。该测验的同质性信度为0.613。

2信度估计方法。[南开大学2014研]

答：信度是指测量结果的稳定性程度。用同一测量工具反复测量某人的同一种心理特质，则其多次测量的结果间的一致性程度就称为信度。信度的估计方法有：

（1）重测信度

重测信度是指用同一个量表对同一组被试施测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数：

式中，x和x(＿)是第一次测量的实得分数及实得分数的平均值，y及y(＿)是第二次测量的实得分数及实得分数的平均值，r_xx是重测信度。

当信度值较大时，说明前后两次测量的结果比较一致，测量工具比较稳定，被试的心理特质受被试状态和环境变化的影响较小。用这种测量结果来预测人在短期内的情况是比较好的，因为该结果具有较好的跨时间上的稳定性。

（2）复本信度

复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度，其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。如果两个复本测验是同时连续施测的，则称这种复本信度为等值性系数。等值性系数的大小主要反映两个复本测验的题目差别所带来的变异情况。如果两个复本测验是相距一段时间分两次施测的，则称这种复本信度为稳定性与等值性系数。

（3）分半信度

分半信度是指将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。分半信度的计算方法和等值复本信度的计算方法类似，只不过被试在两半测验上得分的相关系数只是半个测验的信度，还必须用斯皮尔曼-布朗公式加以校正：

式中，r_hh为两半分数间的相关系数，r_xx为整个测验的信度值。

（4）同质性信度

同质性信度也称为内部一致性系数，是指测验内部所有题目间的一致性程度。库-理信度系数和克隆巴赫系数是估算同质性信度比较好的方法。

①K-R₂₀公式：

其中，K是题目数，p_i为答对第i题的人数的比例，q_i为答错第i题的人数的比例，为测验总分的变异。此公式仅适用于（0、1）记分的测验。

②K-R₂₁公式：

其中，各指标含义与K-R₂₀相同，只是p与q分别表示题目的平均通过率和平均失败率。此公式只有当所有题目的难度接近时才适用。

③克隆巴赫α系数：

其中，表示所有被试在第i题上的分数变异，其余指标的含义与K-R₂₀相同。

3请指出各种信度系数所对应的误差来源。[首都师范大学2014研]

答：信度主要包括重测信度、复本信度、分半信度、同质性信度、评分者信度，各种信度系数所对应的误差来源如下：

（1）重测信度系数对应的误差来源

重测信度是指用同一个量表对同一组被试施测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。除去主试、施测环境和被试等方面的误差，它的独特误差来源主要有：

①施测过程中所产生的遗忘和练习效应；

②在两次施测的间隔时间内，被试在所要测查的心理特质方面获得了学习机会。

（2）复本信度系数对应的误差来源

复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度，其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。它的误差来源有：

①不能获得严格意义上的平行测验；

②施测过程中产生的顺序效应和迁移效应；

③在两次施测的间隔时间内，被试在所测量的心理特质上获得了学习机会。

（3）分半信度系数对应的误差来源

分半信度是指将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。它的误差来源是：不同的分半方法的分半信度不同，可能是由于将测验分为相平行的两半的方法不同而产生误差。

（4）同质性信度系数对应的误差来源

同质性信度也称内部一致性系数，它是指测验内部所有题目之间的一致性程度。克隆巴赫α值还是所有可能的分半信度的平均值，它只是测量信度的下界的一个估计值。即α值大，必有测量信度高；α值小时，却不能断定测量信度不高。它的误差来源产生于题目是否同质，这包括两个方面：

①所有题目都测的是同一种心理特质；

②所有题目得分之间都具有较高的正相关。

（5）评分者信度系数对应的误差来源

评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。在心理与教育测量工作中，客观题的评分很少出现误差，但主观题的评分常常会造成误差。它的误差来源主要是多个评分者之间的个体差异，对相同答案的不同评定，这种个体差异不可能完全消除，只能最大程度地依赖正规的测查程序和统计方法来减小它。

4什么是测验的信度？影响信度的主要因素有哪些？[统考2007研]

答：（1）信度的含义

信度是测量结果的稳定性或一致性程度。其实质是对测验控制误差的能力、对测验的结果准确、可靠地传达真值信息能力的量度。理论上定义为对一组测量分数的真实方差与实得方差的比率，即

式中，r_xx代表测量的信度，代表真分数的变异数，代表实得分数的变异数（总变异数）。常用的信度的估计方法有重测信度、复本信度、评分者信度和分半信度。

（2）影响信度的主要因素

①受试者方面。单个被试：其身心健康状况、动机、注意力、持久力、求胜心、作答态度等会影响测量误差。团体被试：整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度，若团体的平均水平太高或太低，会使测验总分的分布变窄，低估测量的真正信度。

②主试者方面。施测者若不按指导手册中的规定施测，或故意制造紧张气氛，或给被试一定的暗示、协助等，则测量信度会大大降低；阅卷评分者若评分标准掌握不一，或前紧后松，甚至是随心所欲，也会降低测量信度。

③施测情景方面。在实施测验时，考场是否安静，光线和通风情况是否良好，所需设备是否齐备，桌面是否合乎要求，空间宽窄是否恰当等因素都可能影响到测量的信度。

④测验工具方面。试题取样不当，内部一致性低，题数过少，题意模糊，题目太难或太容易等都会影响信度。

⑤施测间隔时间。以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越大；间隔时间越久，其他变异介入的可能性越大，受外界的影响也越多，信度系数便越低。

5某智力测验的信度r＝0.75，某次施测得到分数的标准差为3.00，则该测验的标准误是多少？若某被试得分为100，试估计其真分数95%的置信区间？

答：（1）测验标准误为：

（2）该被试真分数95%的置信区间为：

即95%的置信区间为：[97.06，102.94]。

6甲被试在韦氏成人智力量表测验中言语智商为102，操作智商为110。已知两个分测验都是以100为平均数，15为标准差的标准分数。假设言语测验和操作测验的信度为0.93和0.94，问：甲被试的操作智商是否显著高于言语智商？

答：根据题意可知，应使用两平均数之差的显著性检验，并且假设两总体正态。

（1）提出假设

H₀：甲被试的操作智商不显著高于言语智商。

H₁：甲被试的操作智商显著高于言语智商。

（2）计算相关统计量

先求出差异标准误：

（3）确定显著性水平及临界值：α＝0.05，Z_0.05＝1.64

（4）做出统计决断：

∵Z＜Z_0.05；

∴接受H₀，即甲被试的操作智商不显著高于言语智商。

7小明在一次统考中的语文、数学成绩转换成T分数（平均数为50，标准差为10）后，分别为65和70，二者的差异是否有意义？（已知这次语文、数学考试的信度分别为0.84和0.91）

答：小明的这两门功课的T分数之间差异的标准误是：

0.05水平Z值双侧检验临界值为1.96，1＜1.96，即p＞0.05，故两者差异并不显著。

8已知某个测验的信度为0.75，要使该测验的信度达到0.90，必须增加多少题目？

答：根据公式

变形，代入数据，得：

因此，新测验的题目数应是原来测验的3倍，即为了达到所要求的信度，要增加原测验题目数的2倍。

本周热推：

北京大学数学系《高等代数》（第3版）配套题库【名校考研真题＋课后习题＋章节题库＋模拟试题】（上册）2020年马克思主义哲学考研题库【名校考研真题＋经典教材课后习题＋章节题库＋模拟试题】北京大学哲学系《中国哲学史》（第2版）配套题库【名校考研真题＋章节题库＋模拟试题】2018考研英语（二）：老蒋讲作文肖前《马克思主义哲学原理》（合订本）笔记和典型题（含考研真题）详解