探地雷达双曲波智能提取与可视化
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1.2 变分贝叶斯非负矩阵分解

1.GPR数据的PNMF处理

使用拉格朗日乘子法进行非负矩阵求解时通常具有简单快速的特点,这种非概率的方法容易导致过拟合,不具有稳定性。而贝叶斯方法通过定义满足非负约束的先验分布,再结合实际观察的数据进行后验推理,能大大减少过拟合的现象,提高非负矩阵分解算法的性能。在概率模型下的NMF中,将待分解的潜在基矩阵img和系数矩阵img看作两个随机变量,数据img中的值来自于imgimg的乘积,以及一些高斯白噪声img,表示如下:

(2-7)

式中,img为基矩阵,img为系数矩阵,img是GPR图像中的高斯白噪声,假设img服从数学期望为0、方差为img的高斯分布img

img的似然函数服从高斯分布:

(2-8)

利用贝叶斯定理可通过观测数据F推理出相关参数img的后验分布:

(2-9)

式中,待求解的参数imgimgimg是数据F在参数img下的条件概率,服从式(2-8)的高斯分布,img为参数的先验分布,在进行变分贝叶斯推理之前,对变量的先验分布img进行假设,由于PNMF的非负性约束,设imgimg的先验服从指数分布:

(2-10)

式中,imgimgimg为单位阶跃函数。

噪声方差的先验设为逆伽马分布:

(2-11)

在PNMF中,参数的后验分布使用变分贝叶斯进行推理,通过求解一个近似的后验分布去逼近真实的概率分布。在复杂的多变量参数img情况下,变分贝叶斯将其分解为一组相互独立的变量img,表示如下:

(2-12)

式中,img对应于参数img的分布。根据文献[8],得到后验分布:

(2-13)

式(2-13)中,img为伽马分布,img为截断高斯分布:

(2-14)

式中,img是服从img分布的累积分布函数。

当获得WH以及相关参数的后验分布后,将前img项作为高频杂波对应的分量并进行如下分量表示:

(2-15)

式中,img值代表矩阵的秩,通过该值可以得到杂波对应的低秩矩阵。对于高频杂波,前img项成分分量对杂波的贡献最大。img值的选择将在接下来的小节进行具体讨论。

2.杂波成分的去除

原始数据矩阵分解得到img个基本特征,img越大,则分解得到的基本特征越多。通过对基本特征进行线性组合,从而所能表示的图像就越丰富,也越能体现出样本之间的差异性,通过对模拟数据进行实验获得img值。

现实应用中,地面结构中往往存在湿度差异,然而湿度在很大程度上影响了土壤的有效介电常数和电磁波的衰减,所以数据模拟过程中,将铝制管线作为埋藏物,然后分别放置于三种不同特性的土壤环境(干性土壤、潮湿土壤、湿润土壤)下进行模拟。埋藏物和三种土壤的介质参数来自文献[10],其介电常数和导电率详见表2-1。

表2-1 材料的电磁特性

gprMax是应用在探地雷达的正演模拟工具,原理是对时域有限差分方法(Finite Difference Time Domain method,FDTD)对探地雷达数据进行数值模拟[9],其仿真速度快且操作便捷,得到了越来越广泛的应用。FDTD是将麦克斯韦方程组中的时空域离散化得到的逼近解,所以对空间轴的imgimg和时间轴的img离散化取值非常必要。为使结果更加逼近真实,需要选取尽量小的取样间隔。探地雷达的正演模拟能够简洁高效地模拟电磁波在地底的传播过程,随后生成直观的数学模型。

当使用gprMax工具进行模拟数据时,首先将通道参数和介质的介电常数配置出来,接着依据探地雷达的原理调制与环境匹配的工作参数,再编写程序将文件保存为.in格式,随后进行仿真,最后获取到仿真结果。把铝制管线作为埋藏物的模拟环境见图2-2(a),铝制管线在干性土壤、潮湿土壤、湿润土壤三种环境下的反射剖面图分别如图2-2(b~d)所示。

图2-2 gprMax模拟图像

在GPR图像杂波处理中,杂波成分一般存在于矩阵分解后的前img个主分量中,由此分别选取img=1,2,3,4,5进行处理后PSNR(峰值信噪比)的比较,结果如表2-2所示。数据结果显示,干土壤中铝制管线反射的GPR图像在img取2的时候去杂波后的PSNR值较高,而在潮湿和湿润的土壤环境反射下,img取1时NMF的峰值信噪比较高。结合子空间技术中GPR图像杂波去除的经验,选取第一主分量作为杂波成分,即img=1。

(2-16)

式中,img为杂波去除后的分量,进行重构后为杂波抑制的结果图像。

表2-2 不同K值下PNMF算法的PSNR(dB)