2.1 DEM插值原理
DEM插值是根据已知采样点的高程值估计未知插值点的高程值的过程(卢华兴,2008),其主要目的是缺值估计、等值线内插和离散点数据的格网化(李新等,2000)。DEM插值可以根据已知采样点估计未知插值点的理论基础在于研究对象——“地形”的特殊性。地形具有空间相关性和空间异质性的基本特征,这使利用空间位置合理的采样点获得对地形表面相对精确的描述成为可能。
2.1.1 空间相关性
1970年,美国地理学家Waldo Tobler提出了“地理学第一定律”,即地球表面的事物或现象之间存在某种联系,并且以相似或差异的方式表现出来。简单地说,就是所有事物或现象在空间上都是有联系的,但是距离相近的事物或现象之间的联系一般较距离较远的事物或现象之间的联系更加紧密。地理学第一定律也被称为空间相关性定律,它为空间相关的普遍性提供了原理性基础。在经典统计学中,空间相关性的影响程度可以用一系列空间自相关的统计量进行度量,如Moran's I、Geary's C、Getis、Join Count等(刘湘南等,2005)。更为重要的是,在地统计学(Geo-Statistics)学科中,其从表达空间自相关如何随距离的增加而降低的函数角度描述了空间变异的特性。
地形是地球表面各种起伏形态(地貌)和所有固定性物体(地物)的总称。从微观尺度看,任何区域都可以划分为一系列内部具有极大相似性的更微小区域,在每个微小区域内部总是存在某种属性的相似性。从宏观尺度看,地形表面的相邻点之间的属性并不是独立和随机的,而是表现出显著的相互依赖性。当然也存在例外,高程可能在短距离内发生快速变化。例如,在平原和山脉之间,或者在沿海悬崖与相邻海洋之间,高程都发生了显著变化。但是,总体而言,地形表面表现出显著的空间相关性。
地理学第一定律的意义极其重大:如果它不成立,那么从理论上讲,地形表面的任何地方的所有情况都可能在任何一个小区域中被发现,显然就不存在对事物近似均匀描述的现象,进而地形表面将变得非常混乱无序,任何地方的坡度都可能无限大,等高线也变得无限稠密和弯曲。在这种情况下,进行空间插值和空间分析本身就变得没有任何意义(de Smith et al.,2007)。
2.1.2 空间异质性
1986年,美国地理学家Michael Goodchild提出了地理学第二定律,即空间的隔离可以造成地形之间的差异。因此,地理学第二定律又称为空间异质性定律(Law of Spatial Heterogeneity)。空间异质性可以分为空间局域异质性(Spatial Local Heterogeneity)和空间分层异质性(Spatial Stratified Heterogeneity)。前者是指某个点的属性值与其周围点的属性值不同,如热点或冷点;后者是指多个区域之间互不相同,如分类和生态分区。
对于地形而言,如果不考虑地物对地球表面形态的影响,地球表面就表现出令人难以置信的多样性:从华北平原到黄土高原,从江南丘陵到青藏高原,没有任何一个地方可以合理地描述为一个均匀区域。因此,在这种情况下,试图将地球表面任意一个子集作为整体的代表性样本是不现实的,任何一个在有限区域上的分析结果都可能因为这个有限区域的位置变化而发生变化(de Smith et al.,2007)。
空间异质性决定了地形表面的多样性,也决定了空间插值范围的有限性,即空间插值在局部范围内才有意义,在超出一定范围之后,空间插值将变得没有任何意义。
总之,空间相关性从属性相关的角度、空间异质性从空间范围的角度为DEM插值提供了理论基础,使利用一些空间位置合理的采样点获得对地形表面相对精确的描述,以及根据这些空间位置合理的采样点进行未知点的估计成为可能。
2.1.3 DEM插值机理
DEM插值的理论基础是地形的空间相关性和空间异质性,特别是空间相关性。DEM插值算法都是建立在“地理学第一定律”基础之上的,并调节着已知采样点对未知插值点的权重影响,其地理意义间接或直接地表达了相邻两个空间对象的空间相关关系(卢华兴,2008)。
对于反距离加权插值算法而言,其权函数如式(2.1)所示。
式中,λi为第i点的权重,di为第i点和插值点之间的距离,u为权指数。很明显,λ i是以距离为自变量的衰减函数,表达了插值点和采样点之间的空间相关关系,权重随着采样点和插值点之间距离的增加而减弱(见图2-1)。距离插值点越近的采样点的权重越大;反之越小,甚至可以忽略不计。
图2-1 距离衰减函数权重衰减示意
对于多项式插值算法而言,虽然它不是显式的距离衰减函数,但其空间相关关系却可以推导得到。例如,线性插值算法的相关函数如式(2.2)所示。
式中,s为已知采样点之间的距离,d为未知插值点与已知采样点之间的距离,C(d)为权重值。
类似地,对于高阶的多项式插值算法而言,已知采样点和插值点之间同样存在特定的空间相关关系;不同的是,它的空间相关关系是非线性函数关系(卢华兴,2008)。
对于径向基函数插值算法而言,不同的径向基函数具有不同的表达式,各径向基函数都是以距离为自变量的函数。虽然不一定是衰减函数,却是解析意义上的普通距离函数(见图2-2),同样直接表达了已知采样点和插值点之间的空间相关关系。
图2-2 径向基函数插值算法的核函数图解(光滑因子为10)
对于克里格插值算法而言,其研究对象是区域化变量。区域化变量的空间相关关系通过半变异函数模型表达,是空间变量相关性的定量化描述模型(张仁铎,2005;张景雄,2008),它直接表达了地形起伏在空间上的变异特性(见图2-3)。
图2-3 低山地貌的实验半变异函数的拟合效果