(二)主要研究方法
空间俱乐部趋同识别、检验、影响因子筛选、影响因子检验以及空间趋同俱乐部形成和演变机制分析等工作,需要根据不同的需求,构建不同的空间计量模型。本书将借助计算机工具,利用不同软件,依据不同的研究内容选取合适模型,对中国各空间趋同俱乐部进行研究和探讨,本书拟用到的主要研究方法如下。
1. 空间俱乐部趋同识别方法
空间俱乐部趋同的识别(即对研究区域进行科学分组或者分成区域集群),首先要对研究区域进行区域分组,根据各区域组的空间相关性,判断该组是否存在空间俱乐部趋同现象。区域分组的方法较多:一类是采用预先设定的标准来分组,如Tsionas(2001)采用NUTS-3的分类方法对希腊进行区域分组。Gallo(2001)为了使初始组包括的区域数目大致相同,采取了5类划分标准,低于欧洲平均GDP的65%、欧洲平均GDP的65%~95%、欧洲平均GDP的95%~110%、欧洲平均GDP的110%~125%、高于欧洲平均GDP的125%。
另一类是采用探索性空间数据分析方法对研究区域进行分组,这种分组方法分两步走。
第一步是构建空间权重矩阵。空间权重矩阵是模型化了的区域之间空间依赖性的最重要工具,或者更准确地说,每一个区域都要通过被空间权重矩阵W内生引入的一个纯粹空间模式的方法与其他的邻居区域发生联系(即每一个区域都是通过由空间权重矩阵定义的空间模式来与其邻居区域联系在一起的)。关于空间权重矩阵的定义有许多种,其中较为常用的有两种:第一种是依据空间的相邻性,根据直接或间接相邻又可将研究空间的权重矩阵分成一阶相邻权重矩阵和二阶相邻权重矩阵等;第二种是依据研究区域的空间距离来构建空间权重矩阵。这两种方法构建的空间权重矩阵均具有很强的客观性,避免了很多人为因素的干扰。根据空间趋同俱乐部的概念和研究要求,本书将采用一阶相邻空间权重矩阵,对研究区域进行空间分组。空间权重矩阵的公式为式(1-1):
上述矩阵中元素wij的取值规则为:
第二步是测度空间自相关,进行区域分组。空间自相关可以由探索性空间数据分析方法得到的Moran’s I系数(Baumont et al.,2003)或Getis-Ord统计量(Fischer,Manfred and Stirböck, 2006)来测度,进而进行区域分组。Moran’s I系数的计算公式为式(1-2)(Anselin, 2000、2002、2003):
式(1-2)中,n是观测单元的数量,wij是空间权重矩阵W的一个元素,xi和xj是区域i和区域j观测值偏离均值的量,s0是标准化要素,其值等于空间权重矩阵要素的和,即。
如果把空间系数矩阵进行标准化处理,即每一行的元素的和等于1,则式(1-2)就变成了式(1-3):
或者用矩阵表示为式(1-4):
其中,W是空间权重矩阵,X是观测值xi相对于均值的偏离量所组成的列向量。从式(1-4)中可以简单地看出,Moran’s I系数值介于[-1,1],大于0表示正的空间自相关,小于0表示负的空间自相关。对于空间区域而言,如果区域与其“邻居”之间的相似性大于差异性,那么Moran’s I系数大于0,反之亦然。利用Moran’s I系数可以把研究区域划分为4种不同类型:HH型,即高收入的区域和高收入的邻居区域;LL型,即低收入的区域和低收入的邻居区域;HL型,即高收入的区域和低收入的邻居区域;LH型,即低收入的区域和高收入的邻居区域。其中HH和LL表示正的空间自相关性,即相似性特征集聚在一起;相反,LH和HL表示负的空间自相关性,即差异性特征集聚在一起(张伟丽,2009)。
此外,区域分组的方法还有CART等很多方法,在此不再赘述。
2. 空间俱乐部趋同检验方法
空间俱乐部趋同检验的目的就是对上述具有空间自相关特性的区域组进行辨别,分别对利用探索性空间数据方法得到的4个区域组(HH组、HL组、LH组和LL组)进行检验,把存在趋同的区域组检验出来。主要依据空间滞后模型、空间截面模型和空间误差模型进行检验。首先,在同一空间区域组内,进行绝对β趋同中的OLS回归检验,依据检验结果,得到各组的诊断性检验值。另外,为了确定各组的空间依赖的形式(空间滞后模型或空间误差模型),利用拉格朗日乘数检验值(为LMERR、LMLAG)及其稳健性进行判断。Anselin(1988a)和R.Florax(1995)提出的决定原则,如果LMLAG比LMERR更显著,而且RLMLAG显著但RLMERR不显著,那么,用于检验的合适模型就是空间滞后模型。与此相反,如果LMERR比LMLAG更显著,且RLMERR显著但RLMLAG不显著,那么合适的检验模型即为空间误差模型。
当进行空间自相关和空间异质性为目的的识别后,如果得到的拉格朗日乘数检验值均不显著,且White检验值并不能拒绝同质性的原假设,那么就意味着被识别的空间区域组内不存在空间趋同俱乐部;反之,则意味着可能存在空间趋同俱乐部,转而进入下一步的识别程序,即采用下述合适的空间计量模型来检验空间趋同俱乐部的存在性。
(1)空间滞后模型(The Spatial Auto-regressive Model)
在空间滞后模型(式1-5)中,观测对象的空间相关性是由内生的空间滞后变量来反映的。
式中,上标j=1,2,…,n分别代表本研究得到的n个空间区域组。代表的是属于第j个区域组的每一区域的人均GDP从初始时点0到终止时点T这一时段内的增长率向量,是属于第j个区域组的各个区域在初始时期的人均GDP向量,μ为服从正态分布的随机误差项,S是总向量,ρ为空间滞后系数,用来测度由外生引入的标准化权重矩阵所确定的空间模式所反映的各空间区域之间的相互作用强度。空间滞后变量W是受空间权重矩阵影响的增长率向量。
由于随机回归向量存在,而且该回归向量常常与μ联系在一起,因此,这个模型若用OLS估计将会产生不一致的估计量,所以必须通过最大似然法ML或者工具变量法IV进行估计。
(2)空间横截面模型(The Spatial Cross-regressive Model)
空间横截面模型(式1-6)的优势在于将空间效应与每一个对象的邻居结合起来,而且还保持了与空间溢出理论的强烈联系。在该模型中,空间滞后变量为外生的。
式中,包含在(n×h)阶矩阵Z中的h个外生空间滞后变量的影响是通过参数向量γ反映的。利用这个公式可以处理显著的空间溢出效应,可解释为条件趋同模型与可能影响增长率的空间环境变量的结合。矩阵Z有可能包括,也有可能不包括。当矩阵Z仅包括时,式(1-6)就变成了式(1-7)形式。
在模型(式1-7)里只有空间滞后的初始人均GDP水平这一变量影响增长率,它同时估计了初始人均GDP水平对增长率的直接影响和空间滞后影响。
López-Bazo等(1999)提出的空间截面模型的形式为:
式中,τ和ρ是初始收入和增长率的待估空间滞后参数,εi是随机误差项,该模型的结构形式包含了两个变量,前者是模型化了的全局性溢出效应,后者是模型化了的局部性溢出效应(S.Alexiadis, 2004)。该模型具有三个优点:一是当空间效应被控制,它通过参数β服从趋同的基本条件;二是它能够证实区域溢出效应在区域经济增长过程中的存在及大小;三是由于模型的结构形式包含有空间自回归模型和空间截面回归模型,前者是模型化了的整体溢出效益,而后者则是模型化了的局部溢出效应(S.Alexiadis, 2004)。因此,可以在式(1-8)的结构里将由Anselin(2003)引入的全局性溢出和局部性溢出联系在一起。
(3)空间误差模型(The spatial error model)
当空间依赖被认为是通过忽略的空间变量而产生的效应时,空间误差模型是合适的,当其服从一个一阶过程时,空间误差模型形式为式(1-9):
式中,λj为第j个空间区域组的规模参数,由它测度回归残差之间的空间相关程度,由于变量参数的有偏估计,用OLS的推断可能产生误导。因此,这个模型应由ML或GMM来估计。
这个模型(式1-9)还可以被改写成为式(1-10):
或者式(1-11)两种形式:
式中,γ=-λβ,式(1-11)称为空间宾德模型,该模型可用ML方法进行估计。
(4)绝对β趋同模型(Anselin, 1988a)
在空间俱乐部趋同检验时,是选择空间滞后模型还是空间误差模型,需要借助绝对β趋同模型中的OLS回归结果,根据回归的结果,确定是用空间滞后模型还是应用空间误差模型进行趋同检验。绝对β趋同模型的表达式为式(1-12):
其中,代表第j个区域组内的任一区域i在T年份的人均产出,代表第j个区域组内的任一区域i在初始年份的人均产出,αj、βj为待估参数,其中,,可以根据此式计算趋同速度λj,为随机扰动误差项。当回归得到的βj在统计上显著为负时,那么该区域组内各区域之间就存在截面型俱乐部趋同,这些区域就构成了一个截面型趋同俱乐部。
3. 空间趋同俱乐部影响因子筛选方法
根据空间趋同俱乐部形成的初始条件和结构特征,以及空间趋同俱乐部不具有遍在性的特点,本书把空间趋同俱乐部的影响因子分成了地方因子和具有地方效应的全局因子,按照这两种影响因子来构建中国空间俱乐部趋同的影响因子分析框架,然后将这些经过分类的影响因子一并引入空间俱乐部趋同影响因子筛选模型中进行处理,根据处理的结果,把显著的影响因子逐个筛选出来,即完成了空间趋同俱乐部影响因子的筛选。
以往的研究文献对俱乐部影响因子的筛选与检验大多采用截面回归模型,由于这类模型受到自由度的制约,可以引入的控制变量有限,而又无法引入影响稳态水平的那些难以观测的背景变量,当这些背景变量与解释变量相关时,若遗漏了就可能使估计值偏离,导致得出错误的结论。空间面板数据模型在一定程度上提供了控制背景变量的方法,这一方法对于区域趋同研究以及俱乐部趋同影响因子的筛选应该是更为合适模型(Islam, 1995)。尽管已有一些学者对我国区域经济的增长差异进行了经验性研究,使用了空间面板数据方法,但均没有考虑到研究区域的空间相关性问题。实际上,知识扩散、国内贸易、要素流动、技术以及其他意义上的空间溢出,使得区域经济增长存在空间相互作用,由于分析中使用的是基于行政区划的空间数据,但是行政区划边界与实际功能区边界在事实上往往表现为不一致,使得相邻行政区的测量误差发生联系(Anselin, 2000)。因此,利用面板数据模型做空间俱乐部趋同影响因子的筛选仍然还有不完善的地方,仍然可能造成影响因子的遗漏。
事实上,研究区域的经济增长及其趋同的因素是复杂的。因此,在研究其影响因子时,应把时间因素和空间因素纳入到统一的框架中去,不仅要研究区域经济增长的空间和时间的异质性,同时还要引入空间相关性。满足上述条件的影响因子筛选模型,只有最近发展的空间面板数据模型。Elhorst在传统的面板数据模型中引入了空间滞后误差项或空间滞后被解释变量,全面地考虑了空间相关性,引入空间滞后项的传统面板模型称为固定效应的空间滞后模型,引入空间误差项的传统面板数据模型称为固定效应的空间误差模型。模型中控制了两类非观测效应即空间固定效应和时间固定效应,空间固定效应反映了随区位变化,但不随时间变化的背景变量(如自然资源禀赋、自然环境等)对空间俱乐部趋同的影响;时间固定效应代表随时间变化,但不随区位条件变化的背景变化(如暂时性冲击、商业周期等)对空间俱乐部趋同的影响。下面是模型的矩阵表述:
设研究区域共有N个地区,T个时期,K个解释变量,第t期的观测值如下:
式中,yt为第t期N个地区的人均GDP增长率列向量、Xt为第t期k个测度影响因子的解释变量的观测值矩阵,第一个解释变量X1为初期人均收入,εt为第t期的误差项,假设εt服从经典线性回归模型的假设。则不同时期的数据叠加后形式如下:
对应于每一个观测值的空间和时间固定效应列向量如下:
α=iT⊗sF δ=tF⊗iN
上式中,iT和iN为T维和N维元素全为1的列向量,设矩阵C如下:
C=IT⊗W
上式中,C为NT×NT的方块对角矩阵,IT为T×T的单位矩阵,W是N×N的空间权重矩阵。在传统的固定效应模型中,分别引入空间滞后被解释变量及空间滞后误差项,即可以得到以下两种空间固定效应模型。
上式中,模型(式1-13)为固定的效应的空间滞后模型,模型(式1-14)为固定效应的空间误差模型。β为解释变量系数的k维列向量,λ和ρ为空间滞后项的系数,μ为误差项,服从空间一阶自回归过程。这两个模型所反映的空间相关性均是全局性的,研究区域内任何两个区域之间都存在相关性,并且其相关强度服从距离衰减规律,固定效应的空间滞后模型意味着研究区域内任何一个区域经济增长的所有解释变量都会通过空间传导机制作用于其他区域;而固定效应的空间误差模型则反映了区域外溢是随机冲击作用的结果。因此,模型(式1-13)和模型(式1-14)不仅考虑了区域经济增长的时间和空间的异质性,而且还把空间相关性明确引入了趋同模型中,这在很大程度上纠正了模型的误设问题,而且还很好地考察了研究区域的空间外溢情况。
空间相关性检验是空间计量经济分析的一个重要组成部分,Moran’s I、(Moran, 1948)、LMlag(Anselin, 1988b)、LMerr(Burridge, 1980)、Robust LMlag和Robust LMerr(Anselin, 1988b)等空间相关性检验(1),均不能直接用于空间面板数据模型,都是针对空间截面数据模型提出的。本研究应用方块对角矩阵C代替Moran’s I等统计公式中的空间权重矩阵,这样就可以很方便地把这些检验扩展到面板数据分析中。最小二乘法不适合用来估计空间计量经济模型,因为在模型包含空间滞后误差项的情况下,尽管OLS估计量是无偏的,但是,其估计值已不再有效;当模型在包含空间滞后的被解释变量的情况下,OLS估计量不仅是有偏的而且是非一致的。
LMerr和LMlag及其稳健形式的空间相关性检验,既可以用来检验空间相关性,还可以为模型的选定提供线索(Anselin & Rey, 1997;Anselin & Florax, 1995),帮助笔者在模型(式1-13)和模型(式1-14)之间进行选择。目前通常的做法是首先进行OLS方法估计,不考虑空间相关性的受约束模型,而后进行空间相关性检验。若LMlag(或LMerr)比LMerr(或LMlag)的统计值更为显著,那么,用来做影响因子筛选的模型就是固定效应的空间滞后模型(式1-13),否则就为固定效应的空间误差模型(式1-14)。Rey和Montouri(1999)利用蒙特卡罗试验方法证明,此方法能够为空间计量经济模型的选择提供有益的启示。
依据上述检验出的存在空间趋同现象的区域组(空间趋同俱乐部)为对象,将各空间趋同俱乐部影响因子的解释变量,视情况引入固定效应的空间滞后模型(式1-13)或固定效应的空间误差模型(式1-14),检验各解释变量对空间俱乐部趋同的影响是否显著,把效果显著解释变量所测度的影响因子挑选出来,即完成了空间趋同俱乐部影响因子的筛选。
4. 空间俱乐部趋同影响因子检验方法
将固定效应的空间滞后模型和固定效应的空间误差模型筛选出的影响因子,借助β趋同回归模型,采取逐步引入变量的方法,分析上述筛选出的影响因子对空间趋同俱乐部影响的显著程度,用于验证所提出的关于空间俱乐部趋同影响因子的假设。
β趋同回归模型为式(1-15):
式中,是研究时段内i区的GDP增长率,是i区域人均GDP的初始水平,是i区域人均GDP的期末水平,Χji是i区域在初期的第j个指标,j=1,2,…,m(是经过筛选的影响因子),γj为回归系数。Dk(k=1,2,…,n-1,n表示区域组的个数)为区域组的归属虚拟变量,属于第k个区域组的区域有Dk=1,其他区域为0,εi是随机误差项。
利用模型(式1-15),采取逐一引入由固定效应的空间滞后模型和固定效应的空间误差模型筛选出的影响因子办法,进行回归分析,依据回归检验结果,将显著的影响因子挑选出来,同时剔除不显著的影响因子,顺利通过检验的影响因子就是该空间趋同俱乐部的影响因子。
依据改进后的β趋同回归模型对筛选出的影响因子进行的初步检验,还无法判定已经顺利通过检验的影响因子对各空间俱乐部趋同作用程度的大小,以及在这些已经通过检验的影响因子中,哪些是导致空间俱乐部趋同的重要影响因子、比较重要的影响因子和一般影响因子,为此,本研究还须借助固定效应的空间滞后模型(式1-13)对经过筛选的影响因子做主成分分析。
通过对空间趋同俱乐部影响因子的双重检验,就会得到各空间趋同俱乐部的重要影响因子、比较重要的影响因子和一般影响因子,以及这些影响因子对空间俱乐部趋同的作用程度。根据不同空间趋同俱乐部的重要影响因子、比较重要的影响因子和一般影响因子,就可为政府部门促进区域经济协调发展,缩小区域经济发展差距,提出具体实施的依据。
5. 空间俱乐部趋同形成机制研究方法
对于空间区域组的划分,是研究空间俱乐部趋同形成和研究机制的基础,本书采用了具有将区域间的联系纳入区域分组过程特点的探索性空间数据方法,经过两个步骤,即构建空间权重矩阵和测度空间自相关后,根据Moran’s I散点图得到了4个空间区域组(HH组、HL组、LH组及LL组),其划分的主要依据就是各区域的空间依赖模式。那么,空间依赖模式为什么会出现不同呢?这要归因于经济行为的空间异质性和增长的局部地理溢出效应。具体而言,由于经济行为在地理空间上分布的不均衡性,再加上区域经济增长存在局部的地理溢出效应,使得定位于某一区域企业的生产过程仅仅得益于该区域的知识积累,进而形成了增长的不均衡空间分布,也就是不同的空间依赖模式。实际上,区域分组方法(探索性空间数据方法)及其趋同检验方法,均意味着将空间相互作用因素视为影响空间区域组划分及其空间俱乐部趋同形成的相当重要的影响因素。
现有关于空间相互作用因素对俱乐部趋同形成影响的文献,按其使用的方法可以划分为两类:一类是以Baumont等为代表的空间计量方法,而另一类就是以Quah(1993a, 1996a, 1996b, 1996c, 1997)等为代表的增长分布演进法。增长分布演进法最大的缺陷在于考察的指标通常是单一的(通常为人均收入),因此,得到的俱乐部趋同也仅仅是单一指标的俱乐部趋同(通常为人均收入的俱乐部趋同),这就不一定符合俱乐部趋同所要求的区域条件。基于此,本研究在空间俱乐部趋同的检验及空间俱乐部趋同的形成和演进机制中,将不采用增长分布演进方法,因为增长分布演进法考虑的因素较为单一,不能全面地反映空间趋同俱乐部的形成机制。为了能够更好地反映空间趋同俱乐部的成员变化及其趋同的渐进过程,本书将采用更为理想的空间计量方法,空间计量模型对空间俱乐部趋同形成机制的解释是围绕着局部的地理溢出和空间依赖而进行的,那么如何测度地理溢出及空间依赖呢?实际上,对空间趋同俱乐部测度的空间依赖模式以及空间溢出效应,主要反映在空间计量模型的设计上,只须将空间计量模型进行改进处理,即可用来测度各空间趋同俱乐部的空间依赖形式和空间溢出效应。
(1) LMerr和LMlag是两个拉格朗日乘数检验,主要用于检验空间误差自相关和空间滞后自相关。