张厚粲《现代心理与教育统计学》(第4版)笔记和课后习题(含考研真题)详解
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第4章 差异量数

4.1 复习笔记

本章重点

ü  百分位差的概念、性质、作用、计算方法和应用

ü  四分位差的概念、性质、作用、计算方法和应用

ü  标准差的概念、性质、作用、计算方法和应用

ü  方差的概念、性质、作用、计算方法和应用

ü  标准分数的概念、性质、作用、计算方法和应用

在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况,这些特殊性常表现为数据的变异性。因此,只用集中量数不可能真实地反映出它们的分布情形。为了全面反映数据的总体情况,除了必须求出集中量数外,还需要使用差异量数。

差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称离散量数(measure of dispersion),包括全距、四分位差、百分位差、平均差、标准差和方差。

一、全距与百分位差

(一)全距

1.全距(range)又称两极差,用符号R表示。它是说明数据离散程度的最简单的统计量。把一组数据按从小到大的顺序排列,用最大值(maximum)减去最小值(minimum)就是全距。计算公式为:

 (公式4.1)

2.全距是最简单、最易理解的差异量数,计算也最简单,但也是最粗糙和最不可靠的值。这种差异量数,仅仅只利用了数据中的极端值,其他数据都未参与运算过程发挥作用。如果两极端值有偶然性或属于异常值时,全距不稳定,不可靠,也不灵敏。全距明显地受取样变动的影响。

3.全距只是一种低效的差异量数,主要用于对数据作预备性检查,了解数据的大概散布范围,以便确定如何进行统计分组。

(二)百分位差

百分位数(percentile),又称百分位点,是指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比。第百分位数(P-percentile)就是指在其值为的数据以下,包括分布中全部数据的百分之,其符号为

由于以全距表示一组数据的离散程度时,受极端数的影响很不准确,因此,有人提出取消分布两端10%的数据,即用之间的距离作为差异量数,即百分位差。

1.百分位数的计算

(1)公式如下:

 (公式4.2)

式中,Pp为所求的第P个百分位数;Lb百分位数所在组的精确下限;F为百分位数所在组的次数;为小于的各组次数的和;N为总次数;i为组距。

(2)如果得到了向上累加频数分布表,求百分位数的步骤如下:

找到P百分位数所对应的名次,即n×P%;

从累加频数中找到该名次所在的分组,以及该组的频数f和组距i;

找到该分组区间精确下限值Lb和此值以下的累加频数Fb

将上面的这些数据代入公式即可计算n×P%对应的数值。

(3)常用的百分位差除-外,还有P93-P7。这两种百分位差,虽然比全距较少受两极数值的影响,但仍然不能很好地反映中间数据的分布情况,因此只作为主要差异量数的辅助量数,在实践中很少使用。

2.百分位数与百分等级(又称为地位量数)

(1)除了运用公式4.2计算百分位数外,还可运用累加次数分布曲线图对百分位数求解。要计算Pn的百分位数,先从右边标有n%的刻度位置向图中的曲线画一条与横轴平行的线,再从这条平行线与曲线的交点处向横坐标画垂直线,垂直线与横轴相交处的刻度值就是Pn的百分位数。需要注意的是,用这种方法求得的百分位数由于受图中曲线精确程度的影响,与用公式计算结果相比,只是一个粗略的估计值。

(2)利用百分位数的计算公式也可以计算出任意分数在整个分数分布中所处的百分位置,称为该分数的百分等级(percentile rank,符号为PR)。

百分等级是一种相对位置量数,它是百分位数的逆运算,在心理和教育研究中广泛应用。当分数按照大小顺序排列后,用百分等级就可以表示任何一个分数在该团体中的相对位置。百分等级的计算公式是:

 (公式4.3)

式中,PR为百分等级;X为给定的原始分数;f为该分数所在组的频数;为该分数所在组的精确下限;为小于的各组次数的和;N为总次数;i为组距。

(三)四分位差

1.四分位差(quartile deviation),也可视为百分位差的一种,通常用符号Q来表示,指在一个次数分配中,中间50%的次数占全距的一半。在一组数据中,它的值等于P25到P75距离的二分之一。这个差异量数能够反映出数据分布中中间50%数据的分布情况。

2.四分位差的计算,基于两个百分位数,即P25和P75。这两个点值与中数一起把整个数据的次数等分为四部分,因此称它们为四分值,或四分位数(quartile)。由于P25之下占有总次数的四分之一,故P25又称为第一四分位(Q1),中数或P50称为第二四分位(Q2),P75称为第三四分位(Q3)。四分位差就是第三四分位与第一四分位之差的一半。它的计算公式如下:

 (公式4.4)

如果是对未分组的数据求四分位差,Q1和Q3可依照未分组数据求中数的方法求得。

在分组数据中,Q1和Q3计算方法如下:

用上面这两个公式计算的Q1和Q3实际上就是P25、P75的值。

3.四分位差通常与中数联系起来共同应用。中数可以看作是第二四分位点,即50%点,因此中数有时也常用Q2表示。

二、平均差、方差与标准差

(一)动差体系

动差(moment)是力学上测量力的旋转趋势的名称。旋转趋势的大小随力点与原点距离大小而变化。动差就是力与该距离的乘积。统计学用此概念来表示次数分布的离散情况。它把各组次数当作力学上的力,用数值(或组中值))与原点之差作为距离来计算动差,并且把以平均数为原点的动差称为中心动差(centrel moment)。常见的中心动差有:

式中,是用来表示一个分布中峰态性的指标;是用来表示一个分布中偏斜度或偏态性的指标;是用来表示一个分布中离中趋势的指标,也就是“方差”。它的平方根就是标准差,是应用最为广泛的一种差异量数;无法用来表示数据分布的差异度,因为∑xi=0。在实际应用过程中,一级动差一般不取其代数和(∑fx),而是取绝对和()作为分子来反映分布的差异情况,这就是平均差。

(二)平均差

平均差(average deviation或mean deviation),是次数分布中所有原始数据与平均数绝对离差的平均值。一般用符号A.D.或M.D.来表示。如果使用原始数据求平均差,使用下面的公式:

 (公式4.5)

式中,A.D.为平均差;xi为离均差。

如果使用归类分组数据计算平均差,使用的公式为:

 (公式4.6)

式中,f为各组次数;为各组中点值对平均数离差的绝对值。

平均差是根据分布中每一个观测值的离均差计算求得的,较好地反映了次数分布的离散程度。离均差(deviation from the mean,或者deviate)表示了每一个观测值与平均数的距离大小,正负号说明了重量施于什么方向,离均差的总和为零,标志着完全平衡。有时简称为离差或偏差。由于平均差在计算中要对离均差取绝对值,不利于进一步做统计分析,应用受到了限制,属于一种低效差异量数,在统计实践中不太常用。

(三)和方

根据求平均差的公式,为了避免负数出现,不能直接取离均差的数值,也不宜取其绝对值,最好的办法就是取离均差的平方。如果把每一个原始数据与平均数之差,即离均差的平方相加起来,就得到了离均差的平方和(sum of deviation square或sum of square,SS),称为均方和或和方。其公式如下:

直接用原始数据计算和方的公式:

(四)方差与标准差

1.计算公式

用和方再除以总个数,得到的值就是方差。其基本公式表示如下:

 (公式4.7)

方差(variance),也称变异数、均方。作为样本统计量,用符号s2表示,作为总体参数,用符号σ2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。方差是度量数据分散程度的一个很重要的统计量。它就是前面讲过的动差体系中的二级动差,用二级动差表示全部数据分布的差异度,这种方法消除了平均差不便于代数运算的缺点。

标准差(standard deviation),即方差的平方根,用s或SD表示,若用σ表示,则是指总体的标准差。方差与标准差是最常用的描述次数分布离散程度的差异量数。本章 只是讨论样本数据,故方差的符号用s2,标准差的符号用s。计算标准差的基本公式如下:

 (公式4.8)

运用公式4.7与4.8分别求方差与标准差,都要先求平均数,再求离均差。若平均数不一定是一个整数或者有不能除尽的数,那么在计算过程中就会引入计算误差,计算也会很冗繁。此时可以直接使用原始分数计算方差与标准差。公式如下:

 (公式4.9)

 (公式4.10)

式中,为原始数据的平方和;为原始数据总和的平方;N为数据个数。

上面的这两个公式分别与公式4.7与4.8是等价的,它源于求方差与标准差的基本公式。

在计算方差与标准差的这些公式中,公式4.7利用平均数计算,直观容易理解,但平均数是一个导出分数值,当小数位有限制时,方差和标准差容易受平均数的影响而使精度受损。公式4.9则利用了每一个原始分数来计算方差,其精确度更高,可以消除计算误差,尤其利用计算机时既不怕计算繁复,又可消除计算误差使精确度更高,所以它就是经常使用的最好方法。

2.计算分组数据的标准差与方差

当数据分组编制成次数分布表后,计算方差与标准差就可用下面的公式:

 (公式4.11)

 (公式4.12)

上面的公式是由计算方差与标准差的基本公式推演而来,其中第二个公式称为组距离差计算法。公式中(其中AM为估计平均数,为各分组区间的组中值,为组距,f为各组区间的次数,N=∑f为总次数)。次数分布的原始数据分别用各分组区间的组中值代表,落入各分组区间数据的总离均差用fx表示。

3.总标准差的合成

由于方差具有可加性特点,在已知几个小组的方差或标准差的情况下,可以计算出几个小组联合在一起的总的方差或标准差。只有在应用同一种观测手段,测量的是同一个特质,只是样本不同时,才能合成方差和标准差。

计算总方差和总标准差的公式如下:

 (公式4.13)

 (公式4.14)

式中,为总方差、sT为总标准差;si为各小组标准差;为各小组数据个数;为总平均数,为各小组的平均数)。

(五)方差与标准差的性质和意义

1.性质

(1)方差是对一组数据中各种变异总和的测量,具有可加性和可分解性特点。统计实践中常利用方差的可加性去分解和确定属于不同来源的变异性(如组内、组间等),并进一步说明各种变异对总结果的影响,是以后统计推论中最常用的统计特征数。

(2)标准差是一组数据方差的平方根,它不可以进行代数计算,但有以下性质:

每一个观测值都加一个相同常数C之后,计算得到的标准差等于原标准差。即如果,则有。这一性质表明,若一组数据中的每一个数都加上一个相同的常数,则这组数据彼此的离散程度并不改变,而只是数据分布在数轴上以常数为距离做整体平移。

每一个观测值都乘以一个相同的常数C,则所得的标准差等于原标准差乘以这个常数。即若,则有

结合以上两点,每一个观测值都乘以同一个常数C(C≠0),再加一个常数d,所得的标准差等于原标准差乘以这个常数C。即若(C为不等于零的常数),则有

2.方差与标准差的意义

(1)方差与标准差是表示一组数据离散程度的最好指标。其值越大,说明次数分布的离散程度越大,该组数据较分散;其值越小,说明次数分布的数据比较集中,离散程度越小。方差与标准差是统计描述与统计推断分析中最常用的差异量数。在描述统计部分,只需要标准差就足以说明一组数据的离中趋势。

(2)标准差具备一个良好的差异量数应具备的条件:

反应灵敏,每个数据取值发生变化,方差或标准差都随之变化;

计算公式严密确定;

容易计算;

适合代数运算;

受抽样变动影响小,即不同样本的标准差或方差比较稳定;

简单明了,这一点与其他差异量数比较稍有不足,但其意义还是较明白的。

(3)标准差与其他各种差异量数相比,具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,就可以知道落在平均数上下一个标准差、两个标准差,或三个标准差范围之内的数据所占的百分比。切比雪夫定理指出,随机变量落在平均值附近的概率与标准差有一定的数量关系。

三、标准差的应用

作为一个非常优秀的差异量数,标准差有着非常广泛的用途。

(一)差异系数

1.差异系数的概念

差异系数(coefficient of variation),又称变异系数、相对标准差等,它是一种相对差异量,用CV来表示,为标准差对平均数的百分比,其计算如下:

 (公式4.15)

式中,s为某样本的标准差;为该样本的平均数。

2.差异系数在心理与教育研究中的应用

(1)同一团体不同观测值离散程度的比较。

(2)对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。

3.应用差异系数比较相对差异大小时的注意事项:

(1)测量的数据要保证具有等距尺度,这时计算的平均数和标准差才有意义,应用差异系数进行比较才有意义。

(2)观测工具应具备绝对零,这时应用差异系数比较分散程度效果更好。因此,差异系数常用于重量、长度、时间,编制得好的测验量表。

(3)差异系数只能用于一般的相对差异量的描述,至今尚无有效的假设检验方法,因此对差异系数不能进行统计推论。

(二)标准分数

标准分数(standard score),又称基分数或Z分数(Z-score),是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。

1.计算公式

 (公式4.16)

式中,X代表原始数据;为一组数据的平均数;s为标准差。

它是一个原始分数与平均数之差除以标准差所得的商数,无实际单位,与原始分数和平均数的距离()成正比,与该组分数的标准差成反比。如果一个数小于平均数,其值就为负数;如果一个数大于平均数,其值为正数;如果一个数的值等于平均数,其值为零。可见Z分数可以表明原分数在该组数据分布中的位置,故称为相对位置量数。当把原始分数转换为Z分数后,只需要看Z分数的数值和正负号,就立即可以明确每一个原始分数的相对地位。Z分数表示其原分数在以平均数为中心的相对位置,这比平均数和原分数表达了更多的信息。

把原始分数转换成Z分数,就是把单位不等距的和缺乏明确参照点的分数转换成以标准差为单位,以平均数为参照点的分数。因为在一个分布中,标准差所表示的距离是相等的,以标准差为单位就使单位等距了。以平均数为参照点,也就是以0为参照点,因为等于的原始分数转换成标准分数后,其值为0。原始分数转换成Z分数,就是转换为以1为标准差,以0为参照点(平均值)的分数,从而可以明确各个原始分数的相对地位,并且分数间也有了相互比较的基础。正因为它以1(1个标准差)为单位,以0为参照点,故名标准分数。

2.标准分数的性质

(1)Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。

(2)一组原始分数转换得到的Z分数可以是正值,也可以是负值。凡小于平均数的原始分数的Z值为负数,大于平均数的原始分数的Z值为正数,等于平均数的原始分数的Z值为零。所有原始分数的Z分数之和为零,Z分数的平均数也为零。即,根据求平均数及Z分数的公式可以证明。

(3)一组原始数据中,各个Z分数的标准差为1,即。根据Z分数的第二条性质和标准差公式可以推证。

(4)若原始分数呈正态分布,则转换得到的所有Z分数值的均值为0,标准差为1的标准正态分布(standard normal distribution)。

了解标准分数的性质,对于标准分数的应用极为重要。

3.标准分数的优点

(1)可比性。标准分数以团体平均分作为比较的基准,以标准差为单位。因此不同性质的成绩,一经转换为标准分数(均值为零,标准差为1),相当于处在不同背景下的分数,放在同一背景下去考虑,具有可比性。

(2)可加性。标准分数是一个不受原始分数单位影响的抽象化数值,能使不同性质的原始分数具有相同的参照点,因而可以相加。

(3)明确性。知道了某一被试的标准分数,利用标准正态分布函数值表,可以知道该分数在全体分数中的位置,即百分等级,也就知道了该被试分数在全体被试分数中的地位。所以,标准分数较原始分数意义更为明确。

(4)稳定性。原始分数转换为标准分数后,规定标准差为1,保证了不同性质的分数在总分数中的权重是一样的。在心理测验中,使用标准分数可以弥补由于测试题目难易程度不同,造成不同性质测试之间标准差相距甚远,使得各个测试对总分所起的作用不同,即无形中增大了某一测试的权重的不足,使分数能更稳定、更全面、更真实地反映被试的水平。这在学科测验和人事选拔中尤其重要,有利于录取的公正性。

4.标准分数的应用

Z分数不仅能表明原始分数在分布中的地位,而且能在不同分布的各个原始分数之间进行比较,同时,还能用代数方法处理,因此,它被教育统计学家称为“多学科表示量数”,有着广泛的用途。

(1)用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。

Z分数可以表明各个原始数据在该组数据分布中的相对位置,它无实际单位,可对不同的观测值进行比较。这里所说的数据分布中相对位置包括两个意思:表示某原始数据以平均数为中心,以标准差为单位所处距离的远近与方向;表示某原始数据在该组数据分布中的位置,即在该数据以下或以上的数据各有多少。如果在一个正态分布(或至少是一个对称分布)中,这两个意思可合二为一;但在一个偏态分布中,这两个意思就不能统一。

在实际的教育与心理研究中,经常会遇到属于几种不同质的观测值,此时,不能对它们进行直接比较,但若知道各自数据分布的平均数与标准差,就可分别求出Z分数进行比较。

一个原始分数被转换为Z分数后,就可知道它在平均数以上或以下几个标准差的位置,从而知道它在分布中的相对地位。当原始分数的分布是正态分布时,只要求出分布中某一原始分数的Z分数,就可以通过查正态分布表得知此原始分数的百分等级,从而知道在它之下的分数个数占全部分数个数的百分之几,进一步明确此分数的相对地位。

(2)计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。

不同质的原始观测值因不等距,也没有一致的参照点,因此不能简单地相加或相减。计算平均数时要求数据必须同质,否则会使平均数没有意义。但是,当研究要求合成不同质的数据时,如果已知这些不同质的观测值的次数分布为正态,这时可采用Z分数来计算不同质的观测值的总和或平均值。

(3)表示标准测验分数。

经过标准化的教育和心理测验,如果其常模分数分布接近其正态分布,为了克服标准分数出现的小数、负数和不易为人们所接受等缺点,常常是将其转换成正态标准分数。转换公式为:

 (公式4.17)

式中,Z'为经过转换后的标准正态分数;a、b为常数;,指转换前的标准分数;a为测验常模的标准差。

标准分数经过这样的线性转换后,仍然保持着原始分数的分布形态,同时仍具有原来标准分数的一切优点。例如,早期的智力测验中是运用比率智商(IQ)作为智力测查的指标。

这种表示智力的方法有一定局限性,因为人到成年以后智力不再随年龄的增加而提高,到了老年智力甚至会衰退,仍用上面的公式表示则不好。因此,韦克斯勒在韦氏成人智力量表中使用离差智商这一概念表示一个人在同龄团体中的相对智力。

在这个公式中,,其中X为原始分数,为某团体或年龄组的平均数,s为该年龄组的标准差。离差智商中的常数100与15实际为总平均数与标准差。到了后来,比奈测验也改用了离差智商概念来表示儿童的智力水平,比奈-西蒙智力测验中使用了公式。类似的标准测验分数还有普通分类测验(AGCT)等等。应用正态标准分数能更清楚地表明某一分数在相应团体中的位置。但是,以标准差为单位,常常会带有许多小数,在进行比较时还必须满足原始数据的分布形态相同这一条件。在实际研究中,由于各种原因,很难保证不同数据的理论分布形态相同。为了克服这些缺点,在教育与心理测量研究中,人们更多的是对Z分数进行线性转换,使之符合理论上的正态分布,这种分数通常称为“正态化的标准分数”。

(三)异常值的取舍

在一个正态分布中,平均数上下一定的标准差处,包含有确定百分数的数据个数。根据这个原理,在整理数据时,常采用三个标准差法则取舍数据,即如果数据值落在平均数加减三个标准差之外,则在整理数据时,可将此数据作为异常值舍弃。

四、差异量数的选用

(一)优良差异量数具备的标准

鉴定一个差异量数,是不是一个良好的统计指标,主要看是否具备以下标准:

1.应该是根据客观数据资料获得的,而不是人为的主观估计决定的;

2.应该是根据全部观测值计算得出来的,而不是个别数据计算的结果,否则就不能代表全部数据的分布特征;

3.应当简明,容易理解,不应过于带有数学抽象性质;

4.计算应该方便、容易、迅速;

5.应该最少受到抽样变动的影响(样本的稳定性),在反复取样过程中具有相对恒常性;

6.应当能够采用代数方法计算。

(二)各种差异量数优缺点比较

1.标准差计算最严密,它根据全部数据求得,考虑到了每一个样本数据,测量具有代表性,适合代数法处理,受抽样变动的影响较小,反应灵敏;缺点是较难理解,运算较繁琐,易受极端值的影响。

2.方差的描述作用不大,但是由于它具有可加性,是对一组数据中造成各种变异的总和的测量,通常采用方差的可加性分解并确定属于不同来源的变异性,并进一步说明各种变异对总结果的影响。因此,方差是推论统计中最常用的统计量数。

3.全距计算简便,容易理解,适用于所有类型的数据,但它易受极值影响,测量也太粗糙,只能反映分布两极端值的差值,不能显示全部数据的差异情况,仅作为辅助量数使用。

4.平均差容易理解,容易计算,能说明分布中全部数值的差异情况,缺点是会受两极数值的影响,但当数据较多时,这种影响较小,因有绝对值也不适合代数方法处理。

5.百分位差易理解,易计算,不易受极值影响,但不能反映出分布的中间数值的差异情况,也仅用作补助量数。

6.四分位差意义明确,计算方便容易,对极端值不敏感,较不受极端值影响。当组距不确定,其他差异量数都无法计算时,可以计算四分位差。但是,四分位差无法反映分布中所有数据的离散状况,不适合使用代数方法处理,受抽样变动影响较标准差大。

通过比较,可以发现标准差、方差价值较大,它们的应用也比较广泛,因此,一般称标准差、方差为高效差异量。相比较而言,其他差异量数,如全距、平均差、百分位差和四分位差等缺点比较明显,应用也受到限制,故称他们为低效差异量数。

(三)各种差异量数之间的关系

在样本数量相当大(N≥500)时,标准差约为全距的六分之一,即全距约六倍于标准差;在小样本中,全距和标准差的比率要小一些。使用标准差与全距之间的这种比率关系,还可对实际计算得到的标准差进行核对。

当次数分布的N值相当大,分布形式呈正态分布时,各种差异量数之间存在着固定的数量关系:

上面等式中的s表示标准差,AD是平均差,Q是四分位差。

(四)如何选用差异量数

1.在选用差异量数时,可以考虑下面这些因素:

(1)当样本是随机取样时,s(标准差)、Q(四分位差)、R(全距),这几个差异量数的可靠性依次降低;

(2)当要求计算要容易、快捷时,R、Q、s依次变得繁杂;

(3)当要求统计量进一步使用时,s远远胜过其他差异量数;

(4)在偏态分布中,Q比s更常用;

(5)当分布是截尾分布时,只有Q能正确地指出分布的变异性。

2.除此之外,在选用差异量数时,同时应考虑选用合适的集中量数。差异量数与集中量数是描述数据特征的两类最基本的统计量,它们共同描述一组数据的全貌,即集中趋势和离中差异。这两种量数之间既有密切联系,也有严格区别。集中量数描述的是次数分布的典型性,指的是量尺上的一个点值,差异量数反映了次数分布的变异性,是量尺上的一段距离。一组数据集中量数的代表性如何,可用差异量数的大小来说明。差异量数越小,集中量数的代表性则越大;差异量数越大,集中量数的代表性则越小;差异量数为零时,表明这组数据的集中量数彼此相等,且等同于原始数据,这种情况只有在原始数据都完全相同的情况下才会出现。但几组数据如果集中量数都相同,这并不表明它们的差异量数也相同。

3.要想描述一组数据的全貌,必须同时使用集中量数和差异量数。因为集中量数描述数据的典型性特点,差异量数描述的是数据的变异性特点。当选用中数作为描述一组数据的集中量数时,差异量数通常选用Q或其他百分位差为宜,因为它们计算方法的原理是一致的,都是用插值法求得的。大多数情况下,人们更多地是用平均数和标准差一起来描述一组数据的全貌。