2.2.2 基于非监督学习的阴影检测方法
基于非监督学习的阴影检测方法主要分为基于光谱差异、基于几何特征和基于不变颜色空间下的阴影特征3类。
首先,基于光谱差异的方法是指在已知光照条件、场景等基础上,利用多光谱遥感图像的光谱特性和地表反射波谱特征构建光学模型,从而实现对阴影的检测。例如,从光谱特性入手,Nakajima首先利用机载激光扫描仪提供的ALS高度数据及IKONOS图像数据恢复了阴影区域的光谱信息;然后将恢复后的光谱信息与IKONOS图像进行融合处理,从而提取出实际阴影区域。Finlayson从非阴影区域内的光谱特性入手,提出了一种光照检测算法,即对正常拍摄的图像和通过彩色滤波器拍摄的图像,利用过滤前与过滤后图像的关系来区分光照变化。该算法可检测图像中的像素是否被光照亮进而得到阴影区域。另外,对于光谱特性的研究,还可以将光学传输设备作为切入点,Makarau(2011)结合照明光源的物理特性,采用辐射模型对典型多光谱传感器进行改进,利用多光谱检测的温度、色度差异等参数进行阴影检测。Lee等(2017)通过智能视频监控系统收集的夜间视频序列对前景区域进行划分,利用阴影区域朝向光源区域的方向对阴影对象进行区分。但是这些方法对光照条件、传感器性能等有严苛的要求,很难获得相对精确的实验参数,不具有普适性。
而基于几何特征的方法需要对特定几何场景、图谱模型进行数学建模,经过严密的数学推导,具有更强的理论价值。Salvador(2004)将阴影边界分为阴影射线、阴影线、被遮挡的阴影线及隐藏的阴影线4类,利用阴影的光谱和几何特性提出了一个图像解析系统,可以自动识别静态图像和视频序列中的阴影。Yao和Zhang(2008)进一步把图论知识和阴影的几何特征进行结合,将彩色航空图像分成了像素级和区域级。他们首先将图像建模为可靠图,并通过节点可靠性和链路可靠性定义其图形可靠性,证明阴影检测可以通过找到最大可靠图来实现;其次,在区域级别上,可通过最小化贝叶斯误差消除最有可能错误检测的阴影区域。
近年来,利用高光谱图像和DSM数据,将光谱与几何特征结合也是研究的一个热门方向。Tolt等(2011)结合高光谱和激光雷达数据,先在DSM上通过视线分析找出初步的阴影区域,再通过训练监督分类器筛选出阴影区域。Wang等(2017)在DSM基础上结合太阳位置捕获太阳和地表之间的几何关系,从而描绘图像中的阴影区域。Kang等(2017)有效结合高光谱图像的空间信息,联合相邻像素的几何位置信息,提出了一种基于扩展随机步行器的阴影检测算法。这些方法虽然有着严谨的理论推导,但是往往缺乏先验知识且需要特殊场景,在背景复杂的条件下效果不佳,难以满足实际工程的要求。
基于不变颜色空间下的阴影特征的方法主要分析阴影在不同空间下的亮度、色度、饱和度、纹理信息等方面的特征,具有普遍性。
例如,赵忠明和杨俊(2007)利用阴影区域蓝色通道分量偏高的特性对RGB图像进行归一化处理,结合归一化后的蓝色通道分量及原始蓝色通道分量得到较为精确的阴影区域。虽然该方法易于实现,但是对场景的光照条件有着一定的要求。Tsai考虑到RGB颜色空间难以区分颜色相似性的特点,选择了HSI颜色空间,依据阴影区域低亮度和高色度方面的特性,采用Otsu阈值法,对色度与亮度的比值图像进行检测,得到阴影区域;但这种方法易将色度高(暗蓝色、暗绿色等)的地物误检为阴影区域。而鲍海英等(2010)在此基础上将RGB与HSI颜色空间结合,利用RGB图像中的G通道和HIS图像中的亮度通道进行直方图阈值检测,从而得到阴影区域;但是该方法仅仅将表现基本颜色特征的亮度通道与G通道结合,未考虑色度及饱和度其他特征,检测效果不佳。Sarabandi等(2004)提出阴影检测的最佳非线性变化C1C2C3空间。Arevalo等(2008)进一步将RGB空间通过非线性变换定义C1、C2、C3通道,利用阴影区域在C3通道中灰度下降最少的特点,结合饱和度及亮度对其边缘区域进行限制,采用阈值检测的方法得到阴影区域;但是C3通道对某些颜色(如绿色、红色)不敏感,这就导致一些非阴影区域被误检为阴影。虽然该类方法易于实现,对光照条件、几何场景的要求不高,但是没有充分考虑阴影在区域内的特征,往往会存在偏暗色物体因亮度过低而被错检为阴影、亮阴影区域被漏检等问题,检测精度有待提高。
另外,关于阈值选取方法,可以分为全局阈值方法与局部阈值方法。20世纪60年代,Prewitt提出单幅图像全局阈值法——直方图双峰法,当图像在灰度直方图中呈现出两峰一谷的特性时,选取谷底的灰度值作为图像分割的阈值;当图像的灰度直方图呈现出多峰多谷的特性而涉及多阈值处理时,该方法很难求解,无法自适应地选择最佳阈值。另外。波峰间的间隔、光源的均匀性、图像噪声内容等很多因素都会对波谷特性产生影响。1979年,Otsu阈值法利用统计分析中的著名测度公式——类间方差公式来寻找阈值,当类间方差最大时,给出的阈值即整幅图像分割最优阈值,前景与背景分离程度最好。但是在遥感图像中,部分区域的地物颜色多样,仅通过全局阈值方法进行分割,效果不好。随着信息熵理论的发展,Kapur提出了最大熵阈值方法。最大熵分割基于信息熵理论中的熵增原理,利用贝叶斯函数分别计算前景与背景图像的信息熵,当前景与背景图像的信息熵的和最大时,通过拉格朗日乘子法将最大熵模型转化为无约束的最优化问题,进而求得目标函数最大值,对应的阈值即单幅图像的最优阈值。虽然最大熵阈值方法将阈值求解问题转变为目标函数的最优化问题,但是利用最大熵求解阈值的过程计算量巨大,使得算法运行效率较低。
而在局部阈值选取方法上,区域生长法(RSG)也是一种常见的阈值选取方法。RSG就是事先选取一组“种子点”,通过把与种子具有相同属性的相邻像素点合并到每个种子上,从而组合成更大的增长区域的过程。虽然RSG不需要先验知识且通常可以把具有相同特征的连通区域分割出来,但是在区域生长中需要考虑初始化种子的选择、区域连通性及停止规则制定等问题。针对遥感图像,由于其阴影区域内地物特征复杂,使得阴影区域的检测效果较差。Shi和Malik(2000)提出的最小图割算法首先利用数学图论知识,将图像中的像素点看作无向图的节点,首先将分割图像表示为加权无向图;然后根据最大留、最小割原理,重新定义归一化分割的测度;最后求取归一化分割的最优解,进而得到分割图像。虽然最小图割算法考虑像素点的空间特性,其效果优于基于单一像素点属性的方法,但是大大提高了实现的复杂性,降低了算法执行的效率。这些方法对复杂遥感图像的处理速度较慢,并且从局部区域特征入手很容易陷入局部最优,面对多通道检测处理往往会出现异常情况,不具有全局性和动态自适应性。
综上所述,基于监督学习的阴影检测方法需要大量的先验知识,对数据样本的要求过高。而基于非监督学习的阴影检测方法对场景的光照条件、几何特征有特定的要求,不具有普适性。基于阴影属性的方法缺乏对阴影区域特征的综合考虑,对于某些颜色的特征不敏感,存在误检的情况,检测精度有待提高。在阈值选取方法上,全局阈值方法只考虑了单幅图像的单一阈值,不能适应遥感图像中复杂地物的特征,面对多阈值检测的情况,其分割效果不好,缺乏自适应性。而局部阈值方法从局部特征入手,极易陷入局部最优,不具有全局性。本节方法从基于非监督学习入手,简化了复杂的数据样本预处理阶段。使用HSI颜色空间,根据阴影区域的高色度、低亮度的特性,在I(亮度)-H(色度)通道分离出阴影区域。但是非阴影区域高色度(绿色、红色)的地物由于与亮度差别较小,所以会混入阴影区域,继续将上述得到阴影区域放入H-I通道,筛选出高色度地物。同时,考虑到非阴影区域内深色地物的高饱和度、高亮度的特性,采用饱和度通道和亮度通道进行双阈值阴影检测,进而得出阴影区域。本节方法充分考虑了遥感图像复杂地物属性特征,满足各个场景的需求,具有普适性。在阈值选取方法上,本章考虑全局粒子寻优算法与局部区域的信息,引入动态惯性权重,提出了动态局部自适应粒子群算法。该算法可以自动并准确地得到阴影分割的最佳阈值,并且计算效率高。