1.1.2 机械监测大数据的领域特点
机械监测大数据不仅具有一般大数据的4V特性[6],即规模性(Volume)、多样性(Variety)、价值性(Value)、高速性(Velocity),还具有以下领域特点[7]。
1.体量庞大
随着机械装备的监测规模不断扩大,数据种类日益增多,采样频率越来越高,采样历时逐渐延长,获得的监测数据体量越来越庞大,数据规模达到PB级以上。例如,所有的劳斯莱斯引擎,不论是飞机引擎、直升机引擎还是舰艇引擎,都配备了大量传感器,用来采集引擎的各部件、各系统、各子系统的数据,这些数据通过特定算法,进入引擎健康管理模块的数据采集与分析系统。在一台引擎中,约有100个传感器,每年利用卫星传送PB级的数据量,并产生约5亿份诊断报告。
2.多源异构
机械监测大数据来源广泛且分散,类型多样且异构,涵盖了多种机械装备在不同工况下的多物理源所辐射出的大量监测信息,分别从多个角度反映了机械装备的各种健康状态,为全面分析机械装备健康状态提供了可能。例如,北京北科亿力科技有限公司建立的炼铁大数据平台,主要存储物联网机器数据与内部核心业务数据。物联网机器数据涉及炼铁PLC生产操作数据、工业传感器产生的检测数据、现场的各类仪表数据等;内部核心业务数据涉及生产计划数据、过程控制数据、成本装备数据、用户交互需求数据、模型计算及分析结果形成的知识库数据、以及现场实际生产过程中的经验数据信息等。
3.低价值密度
装备在服役过程中长期处于正常状态,即使发生故障,其故障类型也具有不确定性与欠完备性,使监测数据中蕴含大量重复性的碎片化信息,难以准确和全面地描述机械装备在周期性服役过程中的健康状态。此外,机械装备运行环境多变,随机因素干扰较多,如恶劣服役环境下的强背景噪声,传感器未校准或突发故障,数据传输中的信道异常中断、拥堵、遗漏等,使机械监测大数据中混杂了漂移、失真、残缺的“脏数据”,导致数据质量良莠不齐。
4.高速数据流
机械监测大数据贯穿机械装备运行的全寿命周期,往往呈现为随时间高速变化的流式数据序列,为实时追踪机械装备从前期设计、制造、装配到后期服役、监测、维护各时期的状态提供了动态变化信息。快速处理高速监测数据流,并及时对机械装备的故障进行预报警,能够避免因微小故障快速恶化而导致的机械装备受损。例如,昆仑智汇数据科技(北京)有限公司与金风科技协作建立的风电装备大数据平台,数据回传频率从秒级提高到每秒50组的高频,峰值状态下2万台风机每秒会产生上千万条传感器数据和机组运行日志数据。