1.4 国内外研究现状及发展趋势分析
目前,关于报警系统的研究文献主要包括工业标准与指南(如本章参考文献[4-10])、(如本章参考文献专著[12,16])、(如本章参考文献研究报告[15])、(如本章参考文献综述性论文[17-22])及发表在国内外各期刊上的学术论文。本节将针对报警变量配置、报警阈值设计、干扰报警识别与处理、报警根源分析和报警预测分析五方面,归纳与分析国内外的研究现状。
在报警变量的配置方面,关注的问题是哪些过程变量需要配置报警,且这些需要配置的报警变量如何划分优先等级。相关的主要研究结果主要分成两类:第一类研究结果主要是基于历史数据分析相关或相应的报警变量,以删除冗余报警变量或重新设计报警变量。其中本章参考文献[23-27]采用模糊聚类方法、物元分析方法对过程变量进行分组,对同一组变量的报警优先等级进行排列。本章参考文献[29-39]采用相关分析方法、报警泛滥近似度分析方法寻找具有关联关系的过程变量/报警变量。本章参考文献[24,25]将报警变量分为不同的簇,并通过模糊聚类排序算法对每簇中的报警变量的优先级进行了排序。本章参考文献[28]基于ECA规则和实际工况,降低了报警泛滥中无关紧要的报警出现的次数。本章参考文献[29]通过使用报警发生时刻和报警消除时刻之间的时间间隔,找到了相关的报警变量集。本章参考文献[31]基于从二进制报警数据生成的伪连续时间序列的相关系数,对相关报警变量进行了聚类。本章参考文献[32]利用二值报警变量的Sorgenfrei相似系数,以及相关延迟的分布,来检测相关报警变量。本章参考文献[40]基于Jaccard相似度为二进制的报警变量构建了报警相似度图。本章参考文献[41]基于符号有向图实现了过程变量之间的因果关系可视化,对相关的报警变量进行了分类。本章参考文献[42,43]基于相关性延迟和格兰杰因果关系测度来检测相关报警。本章参考文献[44]基于混合整数线性规划优化了报警系统的设计,延长了操作人员对故障做出反应的时间,同时将触发的报警数量保持在最低水平。第二类研究结果的主要特点是基于工艺知识来建立过程变量/报警变量与异常状况之间的关系。其中本章参考文献[45]建立了异常状况的传播图,从传播路径中选取合适的过程变量为其配置报警,但仅给出了指导性的原则,缺乏必要的具体研究结果作为支撑。本章参考文献[46,47]给出了基于风险的报警策略,据此确定报警优先级,但在风险定量计算方面很不完善,特别是缺少统计计量手段和模型方面的支撑。
在报警阈值设计方面,相关的主要研究结果如下:本章参考文献[48]给出了改进报警系统的多项指导性建议,其中包括随着工作点变化的动态报警阈值设计,本章参考文献[49]介绍了一种基于几何过程控制方法的多变量报警系统,可实现动态的报警阈值设计。本章参考文献[50]指出了在生产过程的启停和工作点转换过程中对报警阈值进行动态设计的重要性。但这些文献都没有给出实现动态报警阈值的具体技术方法。本章参考文献[51]依据生产过程工作点变化次序,采用贝叶斯估计方法设计随着工作点变化的动态报警阈值,但动态报警阈值是随着工作点变化的,没有与相关过程变量进行协同关联。本章参考文献[52]根据多个过程变量的联合概率密度,通过最小化错报率(FAR)和漏报率(MAR)来优化报警阈值。本章参考文献[53]依据在过程监控中生成的残差数据,设计了在不同假设条件下的报警阈值。本章参考文献[54]通过蚁群优化算法对FAR、MAR和平均检测延时(AAD)进行优化,得到多变量报警的阈值。本章参考文献[55]结合误报警概率(FAP)、漏报警概率(MAP)和相关分析以优化工业过程中的多变量报警阈值。本章参考文献[56]提出了基于相关一致性的多变量报警阈值优化方法。本章参考文献[57]提出了用于多变量过程监控的最优误报警控制的支持向量数据描述。本章参考文献[58]为光伏阵列设计了动态报警阈值调整方法。本章参考文献[59]利用广义极值理论和数据质量评估技术对异常数据进行了筛选,并根据筛选出的数据设置了报警阈值。本章参考文献[60]从历史数据中估计出报警概率图各个统计量的数值,再通过最优化决策函数的值来优化单变量工业报警系统的报警阈值。本章参考文献[61]通过从历史数据中提取出多个过程变量的相关方向,实现了对多个过程变量的异常数据检测。本章参考文献[62,63]对工业过程的正常工作区域进行建模,并利用投影方法设计各个过程变量的动态报警阈值,实现了对多个过程变量原始正常工作范围的监控。
关于干扰报警,关注的问题是如何发现干扰报警,并对生成报警的报警器进行更新设计,以减少干扰报警在未来发生的次数。在识别干扰报警方面,现有的研究结果是判断历史数据中是否存在干扰报警,并对干扰报警出现的程度进行衡量,主要的研究结果如下:本章参考文献[64]通过观察报警事件与操作员动作之间的事件是否存在平衡关系来寻找干扰报警。本章参考文献[40,65-67]提出抖动报警的量化指标,用于找出抖动报警过于频繁的过程变量。在对单个报警变量的报警器更新设计方面,现有的研究结果是在最基本的越限报警基础上(见图1.1),研究报警延迟器、死区环节、滑动平均滤波器等报警器的设计问题,主要的研究成果如下:本章参考文献[68-70]对过程变量及其报警变量进行特征分类,然后根据类别来设计报警阈值,用于减少抖动报警的出现次数。本章参考文献[71-75]研究误报率、漏报率和平均报警延迟这三个性能指标与报警延迟器等参数的理论关系式,给出基于这三个性能指标的报警延迟器设计方法。本章参考文献[76-82]设计基于证据理论的报警器与滑动平均滤波器等,以获得更低的误报率和漏报率。本章参考文献[83]设计了一种基于主成分分析法的异常工况检测方法,已获得更低的误报率和漏报率。本章参考文献[70,84]基于统计过程控制技术,临时更改报警阈值或将报警变量设为搁置状态来减少抖动报警。本章参考文献[12,16,65,71,85,86]设计了自适应报警死区,以减少抖动报警的数量。本章参考文献[67,87,88]提出了一种通过调整报警阈值或使用报警延时器来消除抖动和重复报警的在线方法。本章参考文献[89,90]利用可视化系统从历史报警泛滥中计算各个报警事件的权重,减少了报警泛滥中干扰报警的影响。本章参考文献[91,92]通过基于关联规则挖掘建立报警推理机制,解析由可扩展标记语言表示的报警拓扑图,进而去除无效报警。本章参考文献[93]提出了一种基于数据驱动的状态报警配置方法,通过修改报警属性或抑制状态来最小化主动报价的数量。本章参考文献[94-96]设计了一种减少化工厂误报警数的分布式并行报警管理策略。本章参考文献[97]提出了3种技术来检测和消除发电厂报警泛滥中的无效报警。本章参考文献[98]使用中值滤波器消除抖动报警。本章参考文献[99]通过数据挖掘对报警数据进行了预处理,减少了误报警并重建部分丢失报警。已有的研究成果大幅度减少了工业报警系统中抖动报警的数目。
在报警根源分析方面,国内外现有的方法主要包括“基于关联关系模型的根源分析”和“基于时间序列的根源分析”两类。基于关联关系模型的根源分析方法是利用现有的过程知识和专家经验,建立描述监控变量关联关系的数学模型,用于分析事故的根源。应用最为广泛的定性模型为符号有向图(SDG)[100]。本章参考文献[101]提出了基于SDG的分层建模方法,分析大规模工业系统中的异常状况传播路径。本章参考文献[102]提出了基于多级流模型的报警分析方法,找到了引发工业异常状况的根本原因。本章参考文献[103,104]利用计算机辅助工程交换(CAEX)模型分析器,解析由可扩展标记语言表示的厂级拓扑图,并联合扰动检测报告,判断引发厂级扰动的根本原因。本章参考文献[105]提出了基于空间解释结构模型的报警分析方法,识别引发报警的根本原因及可视化故障的传播路径。这些定性模型通常不包含任何定量信息,无法识别各个因素的重要性。基于时间序列的根源分析方法是通过分析不同时间序列间的相关性、条件性、时间顺序等特征,挖掘监控变量之间的因果关系。常见因果分析方法有互相关分析、Granger因果分析、传递熵、贝叶斯网络等方法。本章参考文献[106]利用时滞相关性分析,生成因果矩阵和系数矩阵,依据拓扑假设和一致性检验结果生成因果网络。本章参考文献[107]建立了基于互相关函数的多尺度报警根源分析模型,用于分馏塔的冲塔风险分析。本章参考文献[108]采用一种基于异常状况传播与因果关系的报警溯源方法,确定了异常状况类型与位置;本章参考文献[109-112]采用传递熵作为统计量,描述了异常状况在过程变量之间的因果传递关系。本章参考文献[113,114]利用贝叶斯网络建立概率图模型,通过计算节点的条件概率及后验概率来定位报警根源。本章参考文献[115-117]基于定性趋势进行工业报警系统的设计,将先验知识与数据驱动建模相结合,辅助工厂操作人员理解系统运行规律并进行了根源分析。本章参考文献[118]将频域分析方法应用于化工过程,检测过程变量间的因果关系。基于连接关系模型和因果分析的混合方法近年来获得了较多关注,这类方法可充分利用已知信息,使得变量之间的因果关系更为可靠。
在报警预测分析方面,国内外现有的方法主要包括“基于模型的预测”和“数据驱动的预测”两类。基于模型的预测方法主要是建立生产事故与监控变量之间的关系模型。对于可以获得系统模型的工业过程,基于模型的预测方法利用可测信号估计系统状态或残差进行监控,包括参数估计方法、观测器方法、对偶关系方法等。本章参考文献[119]基于物质和能量平衡建立动态过程模型,实现短时间窗口内的过程状态预测和预警。然而,复杂工业过程存在参数不确定、干扰变化和非线性等特性,导致监控或预测模型难以辨识。本章参考文献[120]提出了一种新的报警泛滥检测标准,并基于新标准设计了一个报警泛滥检测方法,为报警泛滥的预测提供了数据基础。本章参考文献[121]基于过程变量的历史报警数据,建立置信规则库模型,预测未来一段时间内报警状态的变化趋势。本章参考文献[122]基于历史报警数据计算报警发生概率,实现对关键报警的动态预测。本章参考文献[123,124]采用基于序列相似性分析的预测方法,预测报警泛滥的出现。基于人工神经网络和深度学习等的预测方法也获得了广泛关注。本章参考文献[125]提出了一种基于词嵌入和递归神经网络的报警预测方法,利用报警日志信息进行报警预测。本章参考文献[126]采用序列挖掘和深度学习算法,从历史事件数据中学习报警事件和响应时间的出现规律,从而对未来报警事件进行预测。数据驱动的预测从历史数据中建立预测性分析,不需要建立精确的预测模型,具有更好的通用性,但其预测效果依赖数据样本的数量和质量,对过程机理的解释性较差。