您的位置 首页 成考院校

自考心理测量各章复习重点三

第5章 信度

1、 信度就是指:精确测量結果的稳定性和一致性。由于心理测试一般 精确测量人的行为,个人行为会因为各式各样的缘故,因时、因事、因地而造成变化,这种要素有一些是不经意的,有一些是原有的,人到进行心理测试时的个人行为也会受以上要素的危害,进而使测试結果与真正結果不完全一致,因此我们要用信度来考量测试的稳定性和一致性。

2、 信度的实际操作化界定:

(1) 偏差基础理论觉得:一个人的测验分数X是由真正成绩(T)和偏差(E)两一部分组成的,公式计算是X = T E.

(2) 因而信度就被界定为:一组精确测量成绩的真正标准差与实得标准差的比,或是就是指真正标准差占总标准差的百分数。公式计算为:rxx = 1-SE 2/SX 2

(3) 依据统计学基础理论,真正标准差与实得标准差的比是一个相关系数r的平方米,因此大家把这类相关系数r的平方米称为信度系数。

(4)计算方法为:rxx = ST2/SX2

3、 因为偏差的来源于信度的可分成:这类归类是根据信度的传统式界定-真分数基础理论。

(1) 重测信度:考虑到的偏差来源于是時间抽样。

(2) 复本信度:考虑到的偏差来源于是內容抽样。

(3) 分半信度:它考虑到的偏差来源于也是內容抽样,它与复本信度的区别是:分半信度考察一个测试內容的两截题型精确测量的是不是同一个心理特征个人行为。

(4) 无偏性信度(內部一致性指数):考虑到的是测试內容是不是异质性。

(5)得分者信度:考虑到的偏差来源于是得分者间的区别。

4、 信度的表明方式 :

(1) 信度系数和信度指数值:

1 信度系数:rxx = rx2T = S2T/S2

2 信度指数值:rXT = ST/SX

(2) 精确测量标准误:SE = SX 1-rxx

5、 信度的实际意义:

(1) 信度系数能够表述为样版测验分数的总标准差中有多少占比是真分数标准差,也就是测试的总基因变异中真分数导致的基因变异占百分之几十。它立即告知大家精确测量的偏差有多大。

(2) 精确测量的标准误能够告知大家有多大概率真正成绩在某一成绩范畴内,而且能够预测分析实得分数再比测很有可能的转变 状况。

6、 信度的功效:

(1) 表述预测分析本人分数的意义。

(2) 表述真正成绩与实得分数间的关联,确立告知大家测试偏差尺寸。

(3) 新编的测试信度应高过原来的类似测试或类似测试。

(4)得出结论说某测试较为靠谱,务必是根据情景的,经数次确认的。

(5) 它是明确测试优劣的一个指标值。一般的标准是:

1 当rxx< 0.70时,测试不可以用以对本人加以分析或预测分析,并且不可以做团队间较为。

2 当0.70≤rxx<0.85时,可用以团队较为。

3 当rxx ≥0.85时,才能够用于辨别或预测分析个人成绩或功效

7、 重测信度:有时候也叫可靠性,关键对于時间自变量。

(1) 重测信度采集数据得方式 是:相同一组被试间距一定的時间反复检测一次。

(4) 重测信度的计算方式是积差相关法,因此rxx便是皮尔逊的积差相关指数。

(7) 重测信度的间隔时间挑选依测试特性和目地而定,假如测试是用以长期性预测分析,则精确测量间距长一些。对少年儿童的智力测试一般是两个星期到四周为宜。对成人,间距可到大半年,非常少超出6个月。

(13)应用重测信度应留意:非是全部测试都能够测算重测信度。而且重测信度仅仅体现了随机偏差的危害,而不是体现被试心理特征的长期性转变 。

8、 复本信度:又叫等价性指数。

(1) 数据收集方式 是:给被试施测2个內容等价但题型不一样的测试,求2组标值的有关。计算方式普遍的也是积差相关法。

(2) 复本信度的多少体现了2个相互之间复本的测试等额的的水平,而不是体现一个测试自身受随机偏差危害的尺寸。复本信度的多少重要在于复本测试的挑选,因此施题型抽样难题,换句话说是测试的內容抽样难题。

(3)复本信度好于重测信度的地区是:防止了重测产生的记忆性和训练效用;可用以长期性跟踪科学研究前后左右精确测量;降低了舞弊的概率。

(4)复本信度的缺陷:有一些测试的复本难以寻找;有一些测试因正转移效用使测试特性更改;如精确测量的內容非常容易受训练的危害,复本信度也没法消除这类训练效用。

(5)重测复本信度,即再不一样的時间里施测2个等价的测试(复本),获得的有关便是重测复本信度,也叫平稳等价指数。它比单一的重测信度或复本信度都需要严苛、全方位一些。

9、 斯皮尔曼-布郎公式计算:rnn = nrtt/1 (n-13、 1)rtt,14、 rnn是校准之后的相关系数r,15、 rtt是实得的相关系数r,16、 n为rnn相匹配的测试长短与rtt 相匹配的测试长短之比。分钟时,17、 n = N/(N/2)= 2(N为测试总长),18、 因此分半法信度的校准公式计算是:rxx = 2 rnn/1 rhh 在其中rhh为两截测试的相关系数r。

(1) 卢伦公式计算:rxx = 1-Sd2/Sx2 在其中Sd2是两截测验分数之差的标准差,Sx2为总标准差。

(2) 从理论上剖析,分半信度体现的事实上是两截测试可以精确测量同样內容或心理特征的水平。

10、 內部一致性信度(无偏性信度):无偏性就是指测试的全部题型间特性的一致性,即测的是同一种心理状态特性或个人行为。无偏性是精确测量单一特性的必备条件。这儿讲的无偏性就是指测试题型评分体现的心理状态特性一致,无偏性的辨别规范是:题型间呈高成正比,假如有关很低或者呈成反比,则题型为异质性。

(1) 库德和里查德森明确提出的K-R20公式计算只合适预测分析题型是二分法记分的。克伦莫扎特α指数合适于非二分法记分的测试的內部一致性信度可能法。

(2) 从无偏性信度的含意大家可以看出,分半信度是求测试两截中间的一致性或无偏性,而无偏性是求全部题型间的一致性。因而分半信度事实上是无偏性信度的一种,能够做为测试同质性评价的粗略地可能指标值。由于能够依据测试评分来推理或认证某类定义或基础理论设计构思,因而无偏性信度也是一种设计构思区分效度,或叫结构效度,它事实上接近信度与区分效度中间。

11、 得分者信度:有一些心理测试的评分并不是依据客观性的记分系统软件记分的,是由得分者来给被试评分,因而,那样的测试的稳定性怎样在于得分者得分的一致性和可靠性怎样。

得分者信度因得分者总数不一样而可能方式 不一样。如果是2个得分者,单独对被试的反映得分,则可以用积差相关来测算,或用斯皮尔曼级别有关法测算。假如得分者在三人之上,并且是级别得分,则可以用“肯德尔和睦指数”(W)去求得分者信度。

12、 以精确测量标准误表明信度的益处是:

(1) 信度的单位与测验分数的企业同样,因而表述本人成绩时十分立即,能立即强调容许测验分数转变 的范畴。

(2) 测试同质性是否并不危害精确测量标准误的尺寸。精确测量标准误的存在的不足时:没法较为不一样测试间的信度多少。较为不一样测试的信度用信度系数(rxx)表述本人成绩时要精确测量标准误(SE)。

13、 普遍的危害信度的要素有:样版特点、测试的长短、测试的难度系数、精确测量的间隔时间等。

14、 大家做信度磨练时,经常选择一个与常样子本特性同样的样版施测,依据被试评分求出信度系数。

(1) 样版团队评分遍布的危害:求信度的样版团队评分遍布假如较为狭小得话信度就低。

(2) 样版团队异质性的危害:样版团队异质性得话,测验分数的遍布就比同质性样版的要广,成绩的离差就大,样版的标准差就大,信度就高。事实上,高信度可能是隐匿性高信度,是由样版团队的异质性导致的。但假如常模整体规定各式各样的人,则异质性的信度样版求取的信度便是真信度。这时候,反过来的状况就必须校准信度。

(3)样版团队均值工作能力水准的危害。因为信度也会因样版间团队均值工作能力水准的不一样而不一样,因而在求信度时,一定要留意信度样版与常模整体间是不是一致。

15、 测试的长短:在别的标准平等的状况下,测试越长,信度越高。缘故取决于:

(1) 测试越长,即题型越多,测试的內容抽样就越有可能有象征性。

(2) 测试越长,被试的猜想要素危害就越小。

16、 测试的难度系数:难度系数对信度的危害之存有于一些测试中,如智力测试、造就测试、能力倾向测试、文化教育测试等。测试的难度系数对信度有间接性危害,由于假如测试过难,被试的评分会集中化在低系统分区。过度非常容易,成绩则集中化在高系统分区。二种状况都使信度样版的评分范畴变小,基因变异量减少,进而小看测试信度。

17、 测试的间隔时间:这一要素之对重测信度和不另外精确测量时的复本信度有影响,对其他的信度而言不会有间隔时间难题。

第六章 区分效度

1、 区分效度就是指:测试能精确测量到所需精确测量的目标的水平。这一界定包括着双层含意:测试精确测量哪些?测试对精确测量总体目标的精确测量精准度和真实有效多少钱?

2、 区分效度的公式计算为:rxy = SV2/SX2它是与精确测量总体目标相关的真正成绩标准差与总标准差的比例。在其中rxy是常见的区分效度表示法;SV2是“相关的真正标准差”,也就是由测试所要精确测量的心理状态自变量造成的标准差,也叫合理标准差;SX2是总标准差。

3、 信度和效度的区别是:二者所涉及到的偏差不一样:信度仅考虑到不经意的随机偏差占测试总基因变异的占比,区分效度则还包含与测试不相干的但平稳的数据误差。

(1) 信度是区分效度的必需并非充要条件。

(2) 区分效度是受信度牵制的。

4、 区分效度的特性:区分效度的真正含意就是指测试結果的区分效度,也就是测试結果的精确水平。

(1) 区分效度具备相对。

(2) 区分效度具备持续性。测试的实效性仅有水平上的区别。

(3) 区分效度也不是立即就可以精确测量到的,它是以现有的直接证据逻辑推理而成的。

5、 区分效度的类型:内容效度、设计构思区分效度和效标关系区分效度。

6、 效标关系区分效度就是指:测试总成绩与外在标20、 准(效标)中间的有关水平,体现的是用测试预测分析个人在某类情景下个人行为的主要表现怎样的实效性水平。因为外在规范变成调查测试实效性的参考规范,因而通称为效标。

7、 阿丝丁把效标分成2个层级:一是基础理论叙述水准的“意识效标”,二是实际操作界定水准的“效标精确测量”。

(1) 意识效标是效标底基础理论界定,效标精确测量是效标底实际操作界定,效标精确测量务必能真真正正体现意识效标。

(2)效标精确测量的一个关键特点是普遍性。因此因保证:

1 防止成见危害效标精确测量,尤其是以级别鉴定为效标4 精确测量时,得分者的主观性成见会出现非常大危害。

2 避免效标环境污染,即指本人的效标因鉴定者了解个人的测验分数(也叫预测分析源成绩)而遭受危害。

8、 常见的效标:课业造就、疾病诊断、具体工作业绩、独特训炼考试成绩、效标团队较为、此前合理的测试、级别鉴定。

9、 同时效度:它的效标材料是和测验分数类似另外收集的。一般状况下,它能够替代预测分析区分效度。

10、 预测分析区分效度的效标是历经一段时间之后才得到的,预测分析区分效度体现的是以测验分数预测分析一切效标情景或一段时间后被试的行为的水平。

11、 设计构思区分效度便是:心理测试对某一基础理论定义或特性精确测量的水平。因而,科学研究设计构思区分效度便是要弄清楚:测试精确测量的是啥设计构思(定义或特性)?测验分数的基因变异中有多少来自于测试的基础理论设计构思?设计构思区分效度是沒有单一指标值的,它是由各层面直接证据积累起來加以分析的。

12、 明确设计构思区分效度的基本上流程:创建理论框架、依据理论框架演练出相关测试考试成绩的假定、用逻辑或实证研究的方式 来证实假定。

13、 明确设计构思区分效度的方式 :测试內部的方式 、测试间的方式 、效标区分效度的科学研究、试验和观察认证。

(1) 测试内方式 :这类方法是根据科学研究测试内部构造来定义基础理论设计构思,进而为设计构思区分效度给予直接证据。

(2) 明确方式 是:剖析测试的内容效度和测试的內部一致性剖析。测试的內部一致性能够由分半信度、α指数、KR20或KR21等指标值来考量,他们调查的是测试题型是不是同质性,分测试与总测试是不是一致或同质性,这种都能够证实测试所精确测量的设计构思是不是有效,因此组成了确认设计构思区分效度多少的直接证据。

(3) 有时候剖析被试对题型的反映特性还可以做为设计构思区分效度的直接证据。

(4) 测试间的方式 :根据剖析好多个测试间的相关分析,找到其相同之处,开展推论这种测试精确测量的特性是啥,还可以明确这种测试设计构思区分效度怎样。非常简单的方式 是测算二种测试中间评分的有关。区分效度是设计构思区分效度的又一个直接证据。因素分析法也是创建设计构思区分效度的常见方式 。

(5)测验法和观察确认:观查试验前和试验后成绩的差别也是认证设计构思区分效度的方式 之一。

14、 内容效度就是指:测试题型对相关內容或个人行为整体抽样的适度性水平。由于这类区分效度主要是调查测试的內容,因而叫内容效度。

(1) 要想使测试的内容效度高,务必又2个标准:內容的范畴或个人行为整体务必定义名确;测试题型应该是所定义的內容范畴的象征性样版。

(2) 内容效度的明确方式 :权威专家分辨、分辨、统计分析方法。

15、 表层区分效度就是指:一个测试看上去好像是精确测量所需测的物品的水平。也就是说,当这些未训练有素的被试或测试运用者觉得某测试是合理的测试时,该测试就会有表层区分效度。

16、 区分效度的指标值就是指:效标关系区分效度和设计构思区分效度的的指标值。区分效度指标值一般有:区分效度指数、统计推断主要参数、预估表等。

17、 区分效度指数:它是最常见的区分效度指标值,尤其是效标关系区分效度。它是以皮尔逊积差相关指数来表明的。区分效度指数的现实意义常以关键性指数来表明,关系式是rx2y,区分效度指数的平方米便是关键性指数,测试恰当预测分析或表述的效标底标准差占总标准差的占比。

18、 区分效度的别的指标值:一些叙述不一样团队的差别的统计指标(主要参数)还可以做为区分效度的指标值,例如:t磨练、F磨练、重合百分数等。

19、 区分效度的影响因素:测试自身的要素、测试施测的样版的特性、效标底特性等。

(1) 针对测试自身要素又可分成:测验题目地品质、测试的长短、测试执行中的影响、被试的要素等。

(2) 样版的特性:

1 危害之一是:不一样的团队对同一测试的反映很有可能会不一样,因被试的情况不一样,对测试的题型很有可能采用彻底不一样的方式 来回应。

2、响之二是:同一个测试,区分效度团队的特性不一样,区分效度也会出现非常大区别。区分效度团队的特性包含年纪、性別、文化教育水平、智商水准、主观因素、岗位等相关的特性,1这种特性特性使测试对不一样的团队具备不一样的预测分析工作能力。故称之为干预自变量。

3 危害之三是:样版团队的异质性。别的标准同样的情况下,样版无偏性越高,区分效度越低。

关于作者: admin

热门文章

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注