第二节 计量经济学的研究对象
计量经济学的两大研究对象:横截面数据(Cross Sectional Data)和时间序列数据(Time Series Data)。前者旨在归纳不同经济行为者是否具有相似的行为关联性,以模型参数估计结果显现相关性;后者重点在分析同一经济行为者不同时间的资料,以展现研究对象的动态行为。
新兴计量经济学研究切入同时具有横截面及时间序列的资料,换言之,每个横截面都同时具有时间序列的观测值。这种资料称为面板数据(Panel Data)。面板数据研究多个不同经济体动态行为之差异,可以获得较单纯横截面或时间序列分析更丰富的实证结论。例如诺贝尔经济学奖得主格兰杰(C. Granger)指出,在回归模型中对一组检验进行诠释进而揭示因果关系是可行的,其所提出的格兰杰因果关系检验强化了回归分析的说服力。
经典实例
当代计量经济学的主要研究领域
当代计量经济学研究,主要集中在单位根检验、时间序列模型、波动模型、向量自回归模型与向量误差修正模型、离散选择模型与受限模型和面板数据模型六个领域。其他研究领域还有非参数与半参数估计、广义矩估计、贝叶斯估计、分数积分研究、模拟与自举技术等。
一、横截面数据
横截面数据是指在同一时间(时期或时点)截面上反映一个总体的一批(或全部)个体的同一特征变量的观测值,是样本数据中的常见类型之一。横截面数据是由同一时间、不同统计单位、相同统计指标组成的数列。与时间序列数据相比较,其区别在于组成数据列的各个数据的排列标准不同,时间序列数据是按时间顺序排列的,横截面数据是按照统计单位排列的。例如,工业普查数据、人口普查数据、家庭收入调查数据。
横截面数据不要求统计对象及其范围相同,但要求统计的时间相同,即必须是同一时间截面上的数据。与时间序列数据完全一样,横截面数据的统计口径和计算方法(如价值量的计算标准)也应当是可比的。例如,为了研究某一行业各个企业的产出与投入的关系,需要关于同一时间截面上各个企业的产出Q和劳动投入L、资本投入K的横截面数据。这些数据的统计对象显然是不同的,因为是不同企业的数据,但是关于产出Q和投入L、K的解释、统计口径和计算方法仍然要求相同,即各企业的Q、L、K在统计上要求可比。
分析横截面数据时,应主要注意两个问题:一是异方差问题,由于数据是在某一时期对个体或地域的样本的采集,不同个体或地域本身就存在差异;二是数据的一致性,主要包括变量的样本容量是否一致、样本的取样时期是否一致、数据的统计标准是否一致。
二、时间序列数据
时间序列数据是在不同时间点上收集到的数据。这类数据反映某一事物随时间的动态变化状态,如1949—2009年的国内生产总值。时间序列数据除了年度数据之外,还有季度数据、月度数据、周度数据、天度数据、时度数据等。
时间序列分析是根据系统观测得到的时间序列数据通过曲线拟合和参数估计等建立数学模型的数量方法。基本原理:一是承认事物发展的延续性,应用过去数据,推测事物的发展趋势;二是考虑到事物发展的随机性,因为任何事物的发展都可能受偶然因素影响,为此要利用加权平均法对历史数据进行处理。该方法常应用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、环境污染控制等方面。
一个时间序列通常由趋势、季节变动、循环波动和不规则波动四种要素组成。趋势是时间序列在长时期内呈现出来的持续向上或持续向下的变动;季节变动是时间序列在一年内重复出现的周期性波动,是诸如气候条件、生产条件、节假日或风俗习惯等因素影响的结果;循环波动是时间序列呈现出非固定长度的周期性变动,是涨落相同的交替振动;不规则波动是时间序列中除去趋势、季节变动和循环波动之后的随机波动。
不规则波动通常总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。只含有不规则波动的序列也称为平稳序列。
相关链接
时间序列数据的输入与编辑
EViews 6.0软件操作步骤:
(1)创建工作文件。打开EViews工作界面,选择File/New/Workfile菜单命令,如图1-2所示。
图1-2 新建工作文件的命令
(2)完成Workfile Create。选择Workfile structure type(文件结构类型)为Dated-regular frequency(时间序列),选择Date specification(时间标准)中的Frequency(频率)为Annual(年度),Start(开始年份)如1978年,End(结束年份)如2014年,单击OK按钮,如图1-3所示。
图1-3 新建工作文件的对话框
出现c(常数项)和resid(残差项)两个数据系列,如图1-4所示。
图1-4 常数项和残差项系列
(3)创建工作组。选择Quick/Empty Group(空组)菜单命令,如图1-5所示。
图1-5 新建工作组的命令
出现Group组变量与数据输入界面,如图1-6所示。
图1-6 数据输入界面
(4)输入变量名与变量对应的样本数据。在obs(观察值)文本框中输入Y与x1,x2等变量名,将鼠标移出格子外并单击,得到Series create对话框,如图1-7所示;可以选择变量的属性,如Numeric series(数值系列)。
图1-7 变量属性对话框
在NA(数值)时间系列中输入样本数据,如1-8所示。
图1-8 变量样本数据输入
在文件界面自动增加了y,x1,x2数据系列,如图1-9所示。
图1-9 变量数据系列
三、面板数据
面板数据有时间序列和横截面两个维度。当这类数据按两个维度排列时,排在一个平面上,其与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板。例如,A、B、C、D四个城市在2000年的GDP分别为8,9,10,11(亿元),这是横截面数据;A城市2000~2003四年的GDP分别为8,9,10,11(亿元),这就是时间序列数据;A、B、C、D四城市2000~2003四年的GDP(亿元)分别为:
A城市(2000~2003):8,9,10,11 B城市(2000~2003):9,10,11,12
C城市(2000~2003):10,11,12,13 D城市(2000~2003):11,12,13,14
这就是面板数据。面板数据可以克服时间序列分析受多重共线性的困扰,能够提供更多的信息、更多的变化、更多的自由度和更高的估计效率。
相关链接
面板数据的输入与编辑
EViews 6.0软件操作步骤:
(1)创建工作文件。打开EViews工作界面,选择File/New/Workfile菜单命令。
(2)完成Workfile Create。选择Workfile structure type(文件结构类型)为Balanced Panel(平衡面板),选择Panel specification(面板标准)中的Frequency(频率)为Annual(年度),Start(开始年份)如1978,End(结束年份)如2014,在Number of cross文本框中输入截面数据成员个数,如图1-10所示。单击OK按钮。
出现c(常数项)和resid(残差项)、crossid(截面项)、dateid(时间序列项)四个数据系列,如图1-11所示。
图1-10 面板数据属性设置
图1-11 变量数据系列
(3)创建Pool(数据库)对象。选择Object/New Object(新对象)菜单命令,如图1-12所示。
图1-12 建立新对象
出现New object对话框,在Type of object(对象类型)列表中选择Pool(数据库),在Name for object(对象名)文本框中输入对象名称,单击OK按钮,如图1-13所示。
图1-13 建立Pool对象
出现Pool的编辑窗口,可以在窗口输入截面成员的标识名。例如中国省际面板数据,可以选取湖南省、湖北省、河南省、江西省、安徽省中部五省份,分别用字母HN、HB、HN、JX、AH表示,一般每一个标识名占一行,如图1-14所示。
(4)输入Pool对象的样本数据。打开Pool对象,选择View/Spreadsheet(stacked data)电子表格菜单命令,如图1-15所示;在弹出的对话框里输入序列名称,如Pool01,如图1-16所示,单击OK按钮;出现Pool01数据表,单击工具栏中的Edit+/-可对样本数据进行输入和编辑,如图1-17所示。
图1-14 Pool编辑窗口
图1-15 Pool电子表格
图1-16 Pool对象序列名称输入
图1-17 Pool对象样本数据输入