趋中回归与超常分数重现概率

 

趋中回归在心理测验中是一种非常普遍的现象。有时候,这种现象很明显,让人觉得不屑一顾;有时候,这种现象又很隐秘,使得不少大师级的学者都受其蒙骗。例如,对实验效度和趋中回归卓有研究的Campbell,就被人指出他在一项研究中,受到趋中回归现象的误导[1]。所以,研究趋中回归,无论理论上还是实践上都很有必要。本文首先在趋中回归定义的基础上,充分展示它与通常的回归以及测验信度的联系,给出了趋中回归(包括真分数的趋中回归)的基本性质。然后叙述了超常分数重现问题的背景,对一定的重测信度值,计算了若干常见分布的超常分数重现概率;在正态分布下建立了超常分数重现概率与重测信度的关系,以及超常分数重现概率与超常分数界值的关系,并用一个例子说明了重现概率的应用。最后对如何在心理学研究中避免和减少趋中回归的误导进行了初步的讨论。

趋中回归现象

当某些被试在一个变量上的取值远离群体均值(特别低或特别高),这些被试在同一个变量上的另一次观测值或在其它相关的变量上的观测值,往往会比较靠近均值。这就是所谓的趋中回归(regression toward the mean)现象。

其实,“趋中回归”并不是什么新概念,它就是当年英国生物学家兼统计学家Galton所说的“回归”(regression)[2-4]。他根据人体身高具有遗传性却不会出现两极分化的事实,得出如下结论:高个子人群的子代平均身高虽然高于子代总平均身高(遗传的影响),但低于他们父代的平均身高;矮个子人群的子代平均身高虽然低于子代总平均身高,但高于他们父代的平均身高。就是说,子代的身高有向平均值靠拢的趋向,Galton用“回归”一词来描述子代身高与父代身高的这种关系。

不过,现在统计中通常所说的“回归”一词,已经没有多少原始含义,只是沿用成习,人们继续使用这个词而已。这样一来,当需要考虑Galton所说的回归时,为了避免混淆,使用“趋中回归”一词。(本文中,如果只说“回归”,指的是通常统计中的回归,“回归”与“趋中回归”是两个不同的但又关联的概念。)趋中回归是一种非常普遍的现象。例如,一个球队在上一届联赛中表现出色,在下一届联赛的表现往往不如上一届;一个走红的文学作品(小说、电影或电视剧等),其续集(如果有的话)往往令人失望;高考状元在大学期间的成绩很难保持名列前茅;在一个场合表现得非常聪明(或愚笨)的学生在另一个场合往往表现得没那么聪明(或愚笨),等等。然而,这种司空见惯的趋中回归现象,所引起的结果经常被错误地解释[1]。

在考虑趋中回归问题时,通常只考虑两个变量正相关的情形(在负相关的情形,可将其中一个变量作反向变换)。最常见的情形是X代表前测,Y代表后测,它们测量了相同的特质并且有相同的尺度(单位)。1989年Lund对趋中回归给出了如下的定义[5]:对一个给定的总体,趋中回归是在一个变量上预测的标准分与预测变量(自变量)的标准分之差。如果用X来预测Y,则趋中回归等于Z[,X]-Z[,Y](其中Z[,X]表示预测变量X的标准分,Z[,Y]表示由X预测的变量Y的标准分)。1999年Campbell和Kenny将趋中回归刻画为“由于自变量与因变量不是完全相关,因变量(标准化的)预测值往往不像(标准化的)自变量那样极端”。

© 版权声明

相关文章