计量经济学
上QQ阅读APP看书,第一时间看更新

§2.1 回归分析的相关概念

一、回归的含义

回归一词最早由高尔顿(Francis Galton)提出。在一篇研究父母身高与子女身高相互关系的论文中,高尔顿发现,虽然有一个趋势,父母高,子女也高;父母矮,子女也矮,但给定父母的身高,子女的平均身高却趋向于或者回归到全体人口的平均身高。也就是说,当父母双亲都异常高或异常矮,则子女的身高有趋向于人口总体平均身高的趋势。这种现象被称为高尔顿普遍回归定律。这就是回归一词的原始含义。

在现代,回归一词已演变为一种新的概念。回归分析就是研究被解释变量对解释变量的依赖关系,其目的就是通过解释变量的已知或设定值,去估计或预测被解释变量的总体均值。在下面的几个例子中,我们可以清晰地看到回归分析的实际意义。

(1)高尔顿普遍回归定律:高尔顿的目的在于发现为什么人口的身高分布有一种稳定性。在现代,我们并不关心这种解释,我们关心的是:在给定父辈身高的情形下,找到儿辈平均身高的变化规律。就是说,我们如果知道了父辈的身高,就可预测儿辈的平均身高。假设我们得到了一组父亲和儿子身高的数据,制成如图2.1所示的散点图。图2.1按统计分组的方法将父亲身高分为若干组。

在图2.1中,对应于设定的父亲身高,儿子身高有一个分布范围。随着父亲身高的增加,儿子的平均身高也在增加。画一条通过儿子平均身高的线,说明儿子的平均身高是如何随着父亲身高的增加而增加的,这条线就是回归线。

(2)在经济学中,经济学家要研究个人消费

图2.1 给定父亲身高儿子身高的分布

支出与个人可支配收入的依赖关系。这种分析有助于估计边际消费倾向,就是可支配收入每增加一元引起消费支出的平均变化。

(3)在企业中,我们很想知道人们对企业产品的需求与广告费开支的关系。这种研究有助于估计出相对于广告费支出的需求弹性,即广告费支出每变化百分之一时需求变化的百分比,这有助于制定最优广告策略。

(4)农业工作需要预计粮食产量,需要研究粮食产量与播种面积、施肥量、降雨量之间的依赖关系。

这种一个变量依赖于另一个或多个变量的事例在经济系统中普遍存在。回归分析就是要研究这种变量之间的依存关系。

二、统计关系与确定性关系

如果给定一个变量X的结果值就可确定另一个变量Y的结果值,则称变量Y是变量X的函数,即X,Y之间是函数关系。在经典物理学中,给定电阻R,电流I和电压V之间的关系即为函数关系,即这种典型的变量关系是确定性关系。

在经济系统中,这种变量之间的函数关系或确定性关系很少见。常见的是变量之间是一种不确定的关系,即使变量X是变量Y的原因,给定变量X的值也不能具体确定变量Y的值,而只能确定变量Y的统计特征,通常称变量X与Y之间的这种关系为统计关系。例如,企业总产出Y与企业的资本投入K、劳动力投入L之间的关系就是统计关系。虽然资本K和劳动力L是影响产出Y的两大核心要素,但是给定K,L的值并不能确定产出Y的值。因为,总产出Y除了受资本投入K和劳动力投入L的影响外,还要受到技术进步、自然条件等其他因素的影响。

三、回归分析与相关分析

与回归分析密切相连的是相关分析。相关分析主要测度两个变量之间的线性关联度,相关系数就是用来测度两个变量之间的线性关联程度的。例如,啤酒消费与气温、统计学成绩与数学分析成绩、身高与体重等等之间的相关程度,就可用相关系数来测度。而在回归分析中,我们的主要目的在于根据其他变量的给定值来估计或预测某一变量的平均值。例如,我们想知道能否从一个学生的数学分析成绩去预测他的统计学平均成绩。

在回归分析中,被解释变量Y被当作是随机变量,而解释变量X则被看作非随机变量。而在相关分析中,我们把两个变量都看作是随机变量。例如,在学生的数学分析成绩与统计学成绩的分析中,如为回归分析,则统计学成绩是随机变量,数学分析成绩是非随机变量,即数学分析成绩被固定在给定的水平上,以此求得统计学的平均成绩。而在相关分析中,两者处于平等地位,不存在谁为解释变量,谁为被解释变量的问题,两者均为随机变量。