设备状态监测数据通常包括在线数据与离线数据两种类型。在线数据指通过传感器技术收集到的设备运行状态的监测数据。此类数据具有动态、实时、采样成本低的特点,能够实现设备状态的远程监测。例如,国家电网公司对其油浸式变压器设备大量装备了油色谱在线监测装置,用于实时测量变压器油中溶解气体浓度。设备维护人员可以通过变压器油中溶解气体浓度的变化情况,结合领域专家的知识经验,对变压器是否存在故障以及对应的故障类型进行判断。其中,我国相关电网公司已在多地完成了针对变压器故障问题的在线监测系统建设,实现了部分地区高电压等级变压器油中溶解气体在线监测装置全覆盖。一方面,这些监测装置产生了海量的设备状态在线监测数据,为设备状态的在线监测、故障诊断及相关大数据分析工作提供了数据基础。另一方面,设备的在线数据也存在其与设备真实状态可能不一致,不同供应商提供的传感器可靠性不可比等问题。受设备运行环境、传感器误差、远距离传输噪声等多种因素的影响,设备在线监测装置(即传感器)往往无法准确地测量设备运行状态,其测量精度将对后续运维策略的调整产生直接影响。如何评价设备在线监测数据可靠性,提高在线数据的可用性,已成为当前设备状态远程监测领域的重要研究问题。
离线数据指依靠人工采集等传统设备数据采集方式,定期前往设备现场获取的设备状态数据,又叫现场测量数据(相对于远程监测数据)。此类数据具有测量精度高的优点,但采样成本较高,数据比较稀疏。例如,在传统变压器故障诊断中,设备维护人员往往需要定期前往设备现场,在不对变压器进行停电实验的情况下采集油中溶解气体浓度数据,分析变压器运行状态。所获取的气体浓度数据称为带电检测数据。现行带电检测指导原则中,数据采样周期主要由相关专家根据经验确定:当设备油中溶解气体浓度远低于三比值法的经验阈值,故障风险较小时,设备维护人员将延长数据采集周期(半年至一年);当气体浓度接近阈值,故障风险偏大时,数据采集周期将大幅缩短(一周)。此种数据采集策略在实践中耗费大量人力成本,且在长采样周期阶段存在漏报设备故障风险的问题,无法实现设备状态实时动态监测。针对电设备在线数据成本低、误差高,离线数据成本高、误差低的特点,有必要开展设备在线-离线数据融合与误差矫正工作,获取高质量、低成本的设备实时监测数据,为进一步改善设备状态奠定基础。