2.1.2 变分贝叶斯非负矩阵分解
1.GPR数据的PNMF处理
使用拉格朗日乘子法进行非负矩阵求解时通常具有简单快速的特点,这种非概率的方法容易导致过拟合,不具有稳定性。而贝叶斯方法通过定义满足非负约束的先验分布,再结合实际观察的数据进行后验推理,能大大减少过拟合的现象,提高非负矩阵分解算法的性能。在概率模型下的NMF中,将待分解的潜在基矩阵和系数矩阵看作两个随机变量,数据中的值来自于和的乘积,以及一些高斯白噪声,表示如下:
(2-7)
式中,为基矩阵,为系数矩阵,是GPR图像中的高斯白噪声,假设服从数学期望为0、方差为的高斯分布。
设的似然函数服从高斯分布:
(2-8)
利用贝叶斯定理可通过观测数据F推理出相关参数的后验分布:
(2-9)
式中,待求解的参数为,是数据F在参数下的条件概率,服从式(2-8)的高斯分布,为参数的先验分布,在进行变分贝叶斯推理之前,对变量的先验分布进行假设,由于PNMF的非负性约束,设和的先验服从指数分布:
(2-10)
式中,,,为单位阶跃函数。
噪声方差的先验设为逆伽马分布:
(2-11)
在PNMF中,参数的后验分布使用变分贝叶斯进行推理,通过求解一个近似的后验分布去逼近真实的概率分布。在复杂的多变量参数情况下,变分贝叶斯将其分解为一组相互独立的变量,表示如下:
(2-12)
式中,对应于参数的分布。根据文献[8],得到后验分布:
(2-13)
式(2-13)中,为伽马分布,为截断高斯分布:
(2-14)
式中,是服从分布的累积分布函数。
当获得W和H以及相关参数的后验分布后,将前项作为高频杂波对应的分量并进行如下分量表示:
(2-15)
式中,值代表矩阵的秩,通过该值可以得到杂波对应的低秩矩阵。对于高频杂波,前项成分分量对杂波的贡献最大。值的选择将在接下来的小节进行具体讨论。
2.杂波成分的去除
原始数据矩阵分解得到个基本特征,越大,则分解得到的基本特征越多。通过对基本特征进行线性组合,从而所能表示的图像就越丰富,也越能体现出样本之间的差异性,通过对模拟数据进行实验获得值。
现实应用中,地面结构中往往存在湿度差异,然而湿度在很大程度上影响了土壤的有效介电常数和电磁波的衰减,所以数据模拟过程中,将铝制管线作为埋藏物,然后分别放置于三种不同特性的土壤环境(干性土壤、潮湿土壤、湿润土壤)下进行模拟。埋藏物和三种土壤的介质参数来自文献[10],其介电常数和导电率详见表2-1。
表2-1 材料的电磁特性
gprMax是应用在探地雷达的正演模拟工具,原理是对时域有限差分方法(Finite Difference Time Domain method,FDTD)对探地雷达数据进行数值模拟[9],其仿真速度快且操作便捷,得到了越来越广泛的应用。FDTD是将麦克斯韦方程组中的时空域离散化得到的逼近解,所以对空间轴的、和时间轴的离散化取值非常必要。为使结果更加逼近真实,需要选取尽量小的取样间隔。探地雷达的正演模拟能够简洁高效地模拟电磁波在地底的传播过程,随后生成直观的数学模型。
当使用gprMax工具进行模拟数据时,首先将通道参数和介质的介电常数配置出来,接着依据探地雷达的原理调制与环境匹配的工作参数,再编写程序将文件保存为.in格式,随后进行仿真,最后获取到仿真结果。把铝制管线作为埋藏物的模拟环境见图2-2(a),铝制管线在干性土壤、潮湿土壤、湿润土壤三种环境下的反射剖面图分别如图2-2(b~d)所示。
图2-2 gprMax模拟图像
在GPR图像杂波处理中,杂波成分一般存在于矩阵分解后的前个主分量中,由此分别选取=1,2,3,4,5进行处理后PSNR(峰值信噪比)的比较,结果如表2-2所示。数据结果显示,干土壤中铝制管线反射的GPR图像在取2的时候去杂波后的PSNR值较高,而在潮湿和湿润的土壤环境反射下,取1时NMF的峰值信噪比较高。结合子空间技术中GPR图像杂波去除的经验,选取第一主分量作为杂波成分,即=1。
(2-16)
式中,为杂波去除后的分量,进行重构后为杂波抑制的结果图像。
表2-2 不同K值下PNMF算法的PSNR(dB)