滤波器设计理论及应用:非线性非高斯系统状态估计
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 国内外研究现状

1806年,Legendre基于最小化误差平方和提出最小二乘法,从而使得所求参数与实际参数的误差平方和最小[10]。状态估计方法即滤波方法由此诞生。然而,滤波过程是利用已经得到的数据信息对当前状态进行估计,是一个动态过程,而最小二乘法是基于已经得到的所有数据来计算误差平方和,不具有实时性,无法满足动态系统的变化需求[11]。1942年,Norbert Wiener基于最小均方误差准则提出了维纳滤波(Wiener Filtering,WF)[12]。WF又被称为最佳线性滤波,WF只适用于平稳随机过程且无法进行递归,这限制了WF的适用范围,在非平稳随机过程中WF去噪效果不好,滤波结果较差。同时,WF的设计需要明确信号和干扰噪声的具体统计特性及分布情况,而这往往是很难直接获取到的。1960年,Kalman基于线性动态系统提出了由系统输入及输出来求解状态最优估计的卡尔曼滤波(Kalman Filtering,KF)[13]。KF有很多优点,如实时性、递归性和最优性等。然而,它只适用于系统噪声为高斯白噪声的线性系统[14]。这在实际复杂的动态系统中难以满足,在复杂的大环境下,系统大多数呈非线性,且无法保证噪声干扰一定是满足均值和方差均为零的高斯白噪声。1961年,Bucy基于泰勒展开的思想提出了扩展卡尔曼滤波(Extended Kalman Filtering,EKF)[15]。这种方法将模型的非线性部分在状态估计点处进行泰勒展开,只保留其一阶项来实现近似线性化,从而将其模型转换为符合标准KF形式的模型[16]。然而,随着系统非线性特性变强,EKF将不再能表现出良好的滤波性能。1995年,Julier基于无迹变换(Unscented Transform,UT)提出了无迹卡尔曼滤波(Unscented Kalman Filtering,UKF)[17]。UT是对采样点进行非线性映射后的分布进行近似[18]。相比于EKF,UKF不需要求导,计算复杂度低。2009年,Arasaratnam基于容积规则提出了容积卡尔曼滤波(Cubature KalmanFiltering,CKF)[19]。UKF和CKF都通过sigma插值的方法将非线性模型设计成类似于KF形式的模型来进行滤波,以改善截断误差带来的影响[20]。但目前UKF和CKF最多只能达到二阶逼近,同时受sigma系数的影响,当系统维度较低时,sigma采样点无法代表状态的统计特性,系数选择会造成失效、不可逆[21-23]。然而,无论EKF、UKF还是CKF,在强非线性系统中仍无法表现出更好的性能。

以上所提到的多种滤波方法都要求系统噪声的统计特性满足高斯分布,但在实际系统中,真正的高斯白噪声是难以获得的[24]。1993年,Gordon和Salmond基于概率密度函数提出了粒子滤波(Particle Filtering,PF)[25]。PF适用于建模误差由密度函数描述的系统,以误差的密度函数作为目标函数,用粒子均值代替积分运算来求解状态最小方差估计[26]。PF不要求系统噪声的均值和方差都为零,因而可以解决一般的非高斯问题[27]。然而,由于PF是基于密度函数的,PF的实现依赖于大量的粒子采样,会增加算法复杂度,且重采样过程中会出现粒子的退化,这也会影响滤波的速度和精度[28]。后来发展起来的集合卡尔曼滤波(Ensemble Kalman Filtering,EnKF)和最大相关熵卡尔曼滤波(Maximum Correntropy Kalman Filtering,MCKF)取消了对白噪声的限制,同时改善了高维空间中的计算复杂度问题[29-30]。EnKF增加了大量满足系统分布的采样,但如何得到这些采样点目前并没有明确的理论支撑。

PF因其在非线性非高斯系统中的良好特性而受到专家学者们的青睐,然而对PF算法复杂度及粒子多样性匮乏的优化研究,目前仍然没有取得突破性进展。为了提高KF方法在非线性非高斯系统中的适用性,针对一类具有线性状态和非线性测量的动态系统,2017年,Zhou用特征函数代替概率密度函数,提出了特征函数滤波(Characteristic Function Filtering,CFF)[31]。由于CFF不需要对模型做出类似于泰勒展开、无迹变换之类的改变,因此避免了由于EKF、UKF及CKF等测量方程的改变而引起的较大截断误差及建模误差。然而,因CFF中滤波器性能指标参数的限制,Zhou提出的CFF的适用模型仅限于一维模型。2018年,Cheng将CFF推广到二维空间[32]。由于在CFF求解过程中难以获取解析解,且之前使用CFF方法求解滤波增益矩阵都是基于梯度下降法的,因此该方法求解效率低且算法收敛性较差。后来,Chen又提出了利用不动点原理求解滤波增益矩阵,在很大程度上改善了算法复杂度及收敛性能[33-35]

CFF的提出及发展仅针对线性状态和非线性测量的系统。对于如何将CFF应用到状态为非线性甚至强非线性的系统中,以及CFF在测量方程为超非线性的模型中是否仍然具有很好的性能,目前仍然没有取得突破性进展,主要是因为模型的线性化过程会造成巨大的信息损失。例如,对于典型的空间目标跟踪系统,状态模型基于笛卡儿坐标系建立,测量模型基于极坐标系建立,由其模型的表达形式能分析出状态与测量之间的关系是呈现超非线性的。又如,在网络参数求解模型中,如果将待识别的模型参数看作随机游走的线性状态模型,而将作为测量值的神经网络模型看作一个以待确定参数为变量的超非线性函数,那么可以考虑将此类模型的求解与CFF结合起来,以充分发挥CFF在非线性系统中的性能。同时,在多维空间中,目标常常具有多个属性,如何对其进行更精确的状态估计也值得研究。除此之外,在仿真实验中,一般假设噪声是随机产生的,这也与真实情况之间存在偏差,如何获取更真实的系统噪声也是亟待解决的问题。

针对现有主流卡尔曼滤波器不能有效应用于非高斯系统,而粒子滤波器不仅过度依赖难以获得的系统被估计状态的密度函数,而且会因过多粒子采样而造成计算复杂度高,并进一步会因粒子退化而引发粒子滤波器对系统状态估计不准等瓶颈难题,本书作者经过十余年的努力,构建了以状态建模误差特征函数为基础的特征函数滤波器,这种新型特征函数滤波器不仅具有卡尔曼滤波器实时递归的优点,而且避免了对强非线性观测模型进行泰勒展开线性化带来的截断误差,特别是有效地克服了卡尔曼滤波器建模误差对高斯白噪声的依赖性,极大地方便了针对非线性非高斯系统的状态估计与参数辨识。

本书主要汇集了作者近年来在特征函数建模、目标函数构建、特征函数滤波器设计、分布式多传感器集中式融合滤波器、并行式融合滤波器、序贯式融合滤波器、极坐标系与直角坐标系混合环境下的目标跟踪、深度神经网络模型参数自适应辨识、超非线性输入输出系统参数在线辨识、非线性参数与状态联合估计、设备寿命预测等方面的研究成果。本书可作为信息科学和控制科学与工程等专业研究生的教学参考书,同时对从事多源信息融合技术研究、开发和应用的广大科技工作者具有重要的参考价值。

2008年由科学出版社出版的专著《多尺度动态建模理论及其应用》汇集了作者与合作者在2002—2008年期间的研究成果。本书以非线性非高斯系统状态估计理论和方法为主导,汇集了作者及所领导研究小组自2008年至今取得的新成果。到目前为止,国内还没有一本非线性非高斯系统状态估计与参数辨识方面的专著。本书的出版对推动非线性非高斯系统状态估计和参数辨识理论的研究和应用将产生积极的影响,具有较高的学术价值和广阔的工程应用前景。

本书在系统状态模型为线性或弱非线性、观测模型为强非线性的环境下,在建立状态建模误差特征函数的条件下,建立了用于解决强非线性观测系统状态估计与参数辨识的一般性滤波器框架。由于该滤波器不需要对强非线性观测模型采取任何变换措施,所以特别适合解决围绕深度学习强非线性模型参数收敛性训练、随机复杂对象工况变化自适应更新的模型参数辨识、联邦学习框架中各客户端模型自适应个性化设计、强输入输出动态系统模型参数自适应更新、工业装备和设备寿命预测等强非线性模型中的参数辨识问题。

非线性系统广泛存在于理论研究与应用实践中,能为强非线性系统设计出相应的状态估计器和控制器,不仅是理论研究人员长期追逐的梦想,也是广大实际应用领域的技术人员的迫切需要。

本书所建立的非线性非高斯系统特征函数滤波器设计框架,既借鉴了基于被估计随机状态的密度函数建立的粒子滤波器适合处理非线性非高斯系统的优点(缺点是密度函数难以获得、大量粒子采样带来计算复杂度高、粒子退化现象严重),也借鉴了卡尔曼滤波器实时递归的优点(不适用于非高斯系统,且受限于弱非线性系统)。