1.2 工业数据的趋势及特征
1.2.1 工业数据的趋势
无论是工业自动化、工业智能化(工业4.0),还是工业互联网,其基础都是工业数据。随着行业发展,工业企业收集的数据维度不断扩大,主要体现在以下三个方面。
(1)时间维度不断延长。经过多年的生产经营,积累了历年来的产品数据、工业数据、原材料数据和生产设备数据。
(2)数据范围不断扩大。企业信息化的建设,一方面积累了企业的财务、供应商数据,即通过CRM系统积累了客户数据,通过CAD等积累了研发过程数据,通过摄像头积累了生产安全数据,等等;另一方面越来越多的外部数据被收集回来,包括市场数据、社交网络数据、企业舆情数据等。
(3)数据粒度不断细化。从一款产品到多款、多系列产品,使产品数据不断细化,从单机机床到联网机床,使数据交互频率大大增强。加工精度从1mm提升到0.2mm,从每次5min的统计到每次5s的全程监测,使采集到的数据精细度不断提升。
以上三个维度最终导致企业所积累的数据量以加速度的方式增加,构成了工业大数据的集合。不管企业是否承认,这些数据都堆砌在工厂的各个角落,而且在不断增加。
1.2.2 工业数据的特征
工业数据作为对工业相关要素的数字化描述和在网络空间的映像,相对于其他类型数据,具有反映工业逻辑的新特征。这些特征可以归纳为数据容量大、类型多样、工业数据处理速度快、连续实时、动态关联、真实准确、闭环性和特性隐匿等。
(1)数据容量大。数据的大小决定所考虑数据的价值和潜在信息。工业数据体量比较大,大量机器设备的高频数据和互联网数据持续涌入,大型工业企业的数据集将达到PB级,甚至达到EB级。
(2)类型多样。工业数据类型多样、来源广泛,既包括设备运行状况、操作行为、环境参数等生产过程数据,也包括销售订单、设计方案、库存供货、售后服务等运营服务数据。工业数据结构复杂,既有结构化传感数据、半结构化传感数据,也有非结构化数据,以字符、文字、报表、记录、图形、图像、音频、视频等多种形式存在。
(3)工业数据处理速度快。工业数据的获得和处理迅速。工业数据处理速度要求快速且多样,生产现场级要求分析时限达到毫秒级,管理与决策应用需要支持交互式或批量数据分析。
(4)连续实时。工业生产的连续性使工业数据的产生和应用具有明显的连续性。同时,在工业生产制造和运维管理过程中,生产线、设备仪器、工业产品等均为高速运转,从数据采集、处理、分析到数据使用均呈现出实时性特征。
(5)动态关联。在工业产品全生命周期的横向过程中,数据链条呈现出典型的封闭性和关联性。同时,在智能制造过程中,从计划到执行的纵向数据采集和处理需要持续进行动态调整和优化,以支撑感知、分析、反馈、控制等场景。一方面,产品全生命周期同一阶段的数据具有强关联性,如产品零部件组成、工况、设备状态、维修情况、零部件补充采购等。另一方面,产品全生命周期的研发设计、生产、服务等不同环节的数据之间需要进行关联。
(6)真实准确。工业数据真实性、完整性和可靠性高,工业领域更加关注数据质量,以及处理、分析技术和方法的可靠性。对数据分析的置信度要求较高,仅依靠统计相关性分析不足以支撑故障诊断、预测预警等工业应用,需要将物理模型与数据模型相结合,挖掘因果关系。
(7)闭环性。在工业产品全生命周期的横向过程中,数据链条需要封闭和关联;在智能制造纵向数据采集和处理过程中,需要支撑状态感知、分析、反馈、控制等在闭环场景下的动态持续调整和优化。
(8)特性隐匿。工业是强机理的技术领域,很多监测运行数据仅是在精心设计下系统运行的部分表征,其本身所蕴含的问题定义、数据筛选、特征加工、模型调优等常常是隐性的,要求在数据分析管理中关注数据背后的机理逻辑。