广西电网有限责任公司南宁供电局 , 广西南宁, 530029
摘要:由于目前违约用电、窃电等现象严重,使正常供用电秩序受到干扰,为了提高超容用电检测效果,研究基于模糊聚类的公变台区超容用电检测方法。基于模糊聚类提取异常用电特性,区分用电量的异常类型。公变台区用电量数据采集与处理,填充数据缺失值,修改数据噪声。建立超容用电检测模型,对比新的分类标签和原始数据标签,计算检测准确率,完成超容用电检测。经实验论证分析,本文方法能够对各类违约用户做出较为精准的判断,与传统方法相比,本文方法具有较高的检测准确性和高效的运行时间,证明本文方法具有可行性。
关键词:模糊聚类;公变台区;超容用电;用电检测;用电特性;用电数据;
中图分类号:TM714文献标识码:A
近年来,智能电网建设不断增加,用电量急速上升,用电数据也在日益增多,由于当前的用电数据结构较为复杂,海量的数据流也使大量异常信息无法得到有效检测。传统的超容用电检测的识别能力较低,灵敏性有待提高,同时,传统的用电检测算法已不再适应目前的电力发展。近年来,随着供电企业的线损问题越来越多,电力企业的正常运行也受到了严重影响,频繁的超容用电是造成该现象的主要原因。超容是指用户的违规用电行为,客户在某些时段的用电量超过运行容量则会扰乱用电秩序,频繁的用电消耗给电力企业带来了重大的经济损失,因此,需要对变电台区的超容用电进行检测[1]。我国电力企业一般通过人工排查的方法对变电台区的超容用电进行检测,但该方法在智能电网不断发展的今天存在着适用性不高的问题,为了保障正常的供电秩序,安全的进行超容用电的检测,本文基于模糊聚类算法,对公变台区的超容用电进行检测,分析公变台区超容用电检测的功能需求,对用户的违约超容类别进行分类,总结违约超容用电用户分类规则集,并对违约超容用电分类进行测试,为提高超容用电检测水平、实现超容用电检测工作的信息化提供了重要的参考依据,对规范用户安全合理用电行为具有现实意义。
本文基于模糊聚类算法,对公变台区超容用电用户进行识别,提取用电数据的异常用电特性,计算用户用电行为变化曲线,本文以隶属度分析为基础,分析用电规律进而提取典型用电行为。选择公变台区内 个同类别用户组成数据集,获取
个用电特征量,在用户用电行为的特征量获取后,得到典型用户用电特性[2]。具体目标函数表达式为:
(1)
式中 为隶属度分析矩阵,
为进行分类的聚类数量,
为加权指数,
为负荷曲线
和
的相似度,求得两条电力负荷曲线
和
欧氏距离的相似度,进行负荷的聚类分析,对比本文得到的用电负荷曲线和实际用电曲线的变化趋势,由此判定该用电用户的用电量及用电行为是否存在异常[3]。由于能够参考的用户用电特性具有
种,因此将识别的用电量数据和用电特性之间进行相似度表达,具体为
,测得总相似度表达式。选择某公变台区的负荷用户进行研究,对各用户单位开展一天内的电力数据比较,以1h为数据统计的时间间隔,总24个数据点,在经过模糊聚类处理后得到用电特征曲线。为了更好挖掘不同用户的异常电量种类,我们提取出了19维特征代表电力数据消耗的特征,为了区分这些异常类型,我们将相同条件下的不同用电量异常情况进行区分,为了区分用电量的异常类型,还将补偿相关性电量特征,从根本上区分具有相似条件下却具有不同类型异常的情况。
本文采用公变台区的用户真实用电量数据,经过上文对异常用电量数据的提取,对异常用电数据进行标记,由于数据集中常存在遗漏和错误数值,推断可能是由于智能电表存在故障或数据传输中的不可控因素所导致的,由于用电数据的缺失存在多种情况,完全随机缺失的现象发生具有较小的概率,完全非随机缺失的现象在实际中时有发生,且缺失数据与完整数据之间具有错综复杂的联系,在很大程度上受本身数据影响[4]。随机缺失的数据与其他数据均无关联,在实际情况中较为常见,因此本文默认该数据集的数据为该缺失情况,本文利用插值的方法对获取的用电量数据集中存在的大量缺失值进行计算,具体公式为:
(2)
式中 为用电量数据,
为表示
使空字符或非数字的字符的集合,其次根据恢复用电数据集中的异常值,抑制用电量数据中异常值的存在,在对用电量数据中的缺失值和异常值处理完成后,需要将用电量数据进行规范化处理,并将数据规范在
之间,归一化处理其用电量数据,具体公式为:
(3)
式中 和
分别为数据集中的最大值和最小值。在电量数据分析时分析中设置阈值,当用电量超出变电分区容量时,会提示数据噪声,需要进一步对数据噪声进行修改,从而保证数据质量,避免对后续模型的建立造成影响。
本文对历史用电量数据进行初步分析,将一维数据转换为二维数据后,发现按一周转换的用电量数据中正常用户的数据具有明显的周期性,而异常用户的数据具有较少的周期性。因此,本文根据周期性特点设计相应的超容用电检测模型,从而更好地对用电数据进行检测。根据某地区电力公司采集到的公变台区超容用户数据进行数量统计和分类,将超容用电用户数据分为非违约超容用户和违约超容用户,非违约超容用户是由于供电部门内部业务违规所造成的超容,应及时将此类用户的异常数据提交至相关部门进行整改,对于违约超容用户则应及时进行检测后纠正其用电行为[5]。其新的分类标签计算公式为:
(4)
式中 和
分别为隐藏层输出矩阵和隐藏层输出的向量,
为条件阈值,
为正则化参数,
为特征选择阶段获得的特征子集,将特征子集输入,初始化紧邻个数和迭代次数,根据训练数据的模糊熵和相似度得到的特征权重求得最近的邻居点
个,计算权重得到特征子集,初始化输入层和隐含层的连接权值,及隐含层阈值找到最佳输出权重矩阵,使隐含层前向神经网络输出最大化逼近目标值,从而得到新的超容用电分类标签,根据新的分类标签和原始数据标签计算本文超容用电异常检测的准确率,误报率和漏报率,完成对于研究区域公变台区的超容用电检测。
为了验证本文方法的有效性,通过随机方式选择研究区域内公变台区中的50个用户产生的用电数据,测试集包括2021年9月1日至2021年12月30日的数据,将前60天的数据作为训练集,后60天的数据作为测试集。通过本文模糊聚类算法计算得到超容用电的检测结果,对违约超容用户和非违约超容用户的检测结果,将两种检测结果进行分类汇总,并对照供电系统中的实际用电数据,检验本文方法检测结果的准确性,具体如表1所示。
非违约超容用电用户 | 类型 | 检测结果 | 实际 |
1 | 业扩新装用户未实施例行抄表 | 7 | 8 |
2 | 更换CT后变比未在系统内更新 | 25 | 28 |
3 | 漏抄需量值 | 33 | 35 |
4 | 算费记录中有电量补追 | 298 | 303 |
5 | 未按计划及时抄表 | 574 | 581 |
违约超容用电用户 | 类型 | 检测结果 | 实际 |
1 | 擅自引入电源或备用电源或其他电源私自并网 | 21 | 24 |
2 | 私自改变用电类别 | 185 | 189 |
3 | 私自启用封停设备 | 284 | 289 |
4 | 私自增容 | 302 | 312 |
表2 不同方法的检测运行时间
| 本文方法运行时间/s | 传统方法运行时间/s |
训练数据 | 0.05 | 0.16 |
测试数据 | 0.03 | 0.08 |
由表2 可知,两种方法的运行时间存在一定的区别,但本文方法的检测运行时间均明显优于传统方法,这是由于本文方法能够在堆积情况下直接进行权值和阈值的获取,在一定程度上提高了对公变台区超容用电检测的效率,更适用于用户数据量较大时的超容用电检测。对不同方法对训练数据和测试数据的检测准确率进行对比,具体结果如表3所示。
表3 不同方法的检测准确率
| 本文方法检测准确率/% | 传统方法检测准确率/% |
训练数据 | 98.2 | 82.3 |
测试数据 | 99.1 | 80.5 |
由表3可知,本文方法进行超容用电检测中对训练数据和测试数据的准确率分别为98.2%和99.1%,本文方法的检测准确率分别比传统方法高5.9%和8.6%,超容用电检测准确率明显高于传统方法的检测,说明本文方法具有更好的检测性能,由此可见本文方法在超容用电的检测中能够取得较高的检测准确性和高效的运行时间,证明本文方法具有可行性。
本文基于模糊聚类提取异常用电特性,采集与处理公变台区用电量数据,建立超容用电检测模型,完成了对公变台区的超容用电检测,取得了一定的研究成果。同时,由于时间和条件的限制,本文研究化存在着诸多不足,有待于在今后的研究中深入探讨,如对于更多场景下的异常用电检测还未涉及,对于数据采集和预警的内容涉及较少,因此还将在今后的研究中不断提高本文方法的实际应用价值,在进行异常用电的特征提取中,更好地进行数据处理,从而获得更具有代表性的特征子集,提高本文模糊聚类算法在公变台区的检测的效果。随着智能电网的不断发展,今后还将不断优化检测算法,从而实现对用电数据的科学有效管理。
[1]徐冰涵,孙云莲,易仕敏,等.考虑分时电价的居民用户短期用电量分类预测及修正方法[J].电力系统保护与控制,2020,48(06):144-151.
[2]谢宏伟,魏伟,郭崇慧,等.基于连续用电量和缴费时间差的客户信用动态评价模型[J].运筹与管理,2020,29(01):141-147.
[3]杨德州,魏勇,李万伟,等.基于多层分解-累加原理的城市综合体月度用电量预测方法[J].电力建设,2021,42(02):27-34.
[4]靳盘龙,宫建锋,党东升,等.基于模糊聚类的电力用电负荷用户识别分析[J].微型电脑应用,2020,36(03):117-119.
[5]沙志成,朱春萍,王艳.基于约束模糊聚类的电力系统扰动信号识别方法[J].自动化与仪器仪表,2020(02):163-166.