第2章 协方差分析
2.1 什么是协方差分析
在研究过程中,常常会遇到以下各种情形:比较两种教学法的效果时,需要考虑到学生原来学习水平的影响;比较不同安眠药的效果时,需要排除被试体重的影响;比较不同车型的驾驶难度时,不能忽视驾驶员经验的影响等。这类研究有两个特点:一是存在一个或数个与因变量共同变化的连续变量。这些变量虽然不是本次研究的对象,但是无法忽视,因为它们与因变量有一定的关联,在本章中我们称之为协变量(covariate)。二是研究的最终目的是要了解自变量对因变量的影响。这就是本章协方差分析(analysis of covariance, ANCOVA)的主要内容。
根据以往的知识,若要了解协变量是怎样影响因变量的,可以用回归分析。如图2.1(a)所示,分别表示组1与组2的因变量Y在协变量X上的回归直线。若想知道是否存在组间差异,可用方差分析。图2.1(b)是不考虑协变量X的影响时,用方差分析比较两组因变量的平均值有无显著差异的示意图,图中表示两组因变量的平均值。
图2.1(a)回归分析示意图
图2.1(b)方差分析示意图
当需要考虑协变量的影响时,应该如何比较组间平均值呢?最直接的思路是将回归分析与方差分析结合起来(图2.2)。在协变量X、因变量Y组成的平面直角坐标系内,表示组1数据的重与组2的重在y轴上的垂直距离,其分别是两组关于X变量的平均值。是否等于0,用方差分析可以求得。而则表示将两组重心的横坐调整到总平均处后两点间在y轴上的垂直距离。请读者留意此时,两条回归线必须平行,才能保是常量。如果两条回归线不平行,将随X的变化而变化,其差值就不是常量了。由图2.2可知,协方差分析是回归分析与方差分析的结合体——控制了协变量影响后的方差分析。
图2.2 协方差分析示意图
用数学公式来表达,因变量Y可写作
式分别是因变量Y、协变量X、随机误差ε在第j个水平上的第i个观察值(i=1,2,……,I;j=1,2,……,J)。μ是Y的平均值,αj是第j个水平上的自变量A的主效应,β是X的斜率。这里,Y, X是连续变量,自变量A是离散变量或分组变量。另外,式中要求X的斜率β不受组别影响,即不论哪一组j,β是相同的。图2.2中两组数据的回归线平行,就符合这个要求。