简介:摘要:能源管理系统作为采集能源数据、构建企业能耗分析基础数据的重要来源,而在数据采集过程中因系统故障、外界环境变化、线路检修等随机因素影响,容易产生能源数据失真异常、缺失的情况。为解决上述问题中产生的异常、缺失数据本文利用改进K-Means聚类识别方法,通过失真、缺失类的数据与在其出现的相邻时间段能源数据比对,识别出异常能源数据,并将无效数据划分为缺失能源数据和超出指标正常变化范围的数据。本文通过对缺失原始数据值的能源数据使用数据组合插补方式进行数据补齐修正,并结合与临近能耗数据的误差值调整数据偏差恢复能管系统内的能源数据值,而对超出指标正常变化范围的能源数据,利用DB指标选取聚类数K,并通过改进K-Means聚类方法识别数据后,再使用误差反馈的组合式插补方法修正能源数据。最后以用电数据作为研究对象进行实证分析,选取40组能源数据为总样本数据,共分为样本数据集(前20组数据)和验证数据集(后20组数据),先通过样本数据集计算确定的插补权重,再经过验证数据集的试验结果进行验证比对,验证结果表明本文使用组合式数据插补方法具有良好的可靠性和稳定性。