一种基于大数据分析的窃电嫌疑用户精准定位方法

(整期优先)网络出版时间:2020-12-28
/ 2

一种基于大数据分析的窃电嫌疑用户精准定位方法

王卫东

国网浙江省电力有限公司苍南县供电公司 浙江龙港 325802


摘要:为了提高反窃电的效率,对基于耗电信息采集系统的大数据用户疑似窃电算法进行了研究。提出了基于电力波动的异常值算法和聚类算法怀疑模型、基于负荷数据的支持向量机算法可疑度模型和窃电行为分析模型等窃电模型。通过对窃电嫌疑程度的计算和输出,可以实现目前较为准确的窃电行为,提高窃电用户的窃电调查效率和管理水平。

关键词:用电信息;采集系统;大数据

近年来,偷电现象时有发生,使电力企业遭受了巨大的直接经济损失。同时,容易危及电网安全运行,严重损害正常用户利益。打击窃电行为,有利于建立良好的用电秩序,维护电网正常运行,具有重要的现实意义。长期以来,在防窃电方面,以人工调查为主,有效的防窃电技术措施不足,防范措施落后。即使发现窃电用户,也很难获得其窃电时间的证据,这就使得准确计算窃电量变得困难。现有的防窃电手段实时监控能力往往不足,难以对窃电行为做出及时反应。因此,迫切需要更全面、系统、完善的预防窃电措施。如何运用先进的技术手段和科学的管理方法,开展防窃电工作,一直是供电企业关注的焦点。

 随着智能电表和用电信息采集系统的大幅度推广,实现了用户电表海量数据的远程集中读取,为反窃电工作提供了强有力的技术基础。用电信息采集系统是在原有用电现场管理系统的基础上开发的电力营销支持系统。对用户的功耗进行实时监控。可按一定周期采集用户计量点的各种电力数据,实现数据采集的准确性、完整性、及时性和可靠性,为电力管理提供丰富完整的统计分析数据,如总有功无功电能、三相电压电流、功率因数等,等在大数据时代背景下,基于采集系统的大量电力数据,分析用户统计数据,定位计量和用电异常,将大大提高反窃电效率。目前,对基于电能信息采集系统的防窃电技术的研究大多选择功率或有功功率作为窃电判据中的电气参考值,但对窃电引起的电气参数变化规律分析不足。因此,研究基于用电信息采集系统的智能防窃电技术具有重要的理论意义和应用价值。在电力信息采集系统数据支持的基础上,我们建立了几种疑似窃电分析模型,对疑似窃电行为进行了分析,从而准确定位窃电用户,提高窃电调查的效率和管理水平。

 1 基于电量波动的离群点和聚类算法窃电模型

对用户用电数据进行预处理,消除异常值的影响,计算出相应的用电波动率,采用基于距离优化的离群点算法或聚类算法从海量数据中过滤出疑似窃电数据进行分析处理,并设置适当的窃电报警条件。对样品进行必要的前处理后,由于有电量异常高、正常、异常低的情况,因此在算法的初期状态下,将样品分为3种,考虑到样品聚类中心过于接近,有可能导致怀疑等级的判别错误,分析聚类结果,挑选怀疑等级。在算法的初期状态下,将样品分为3种,在算法的初期状态下,将样品分为3种,在算法的初期状态下,将样品聚类中心过于接近,有可能导致怀疑等级的判别错误,在算法的初期状态下,将样品聚类中心过于接近,将样品聚类中心过于接近,将样品聚类中心过于接近,将样品聚类中心过于接近,将样品聚类中心过于接近。 通过大量的样品分析,当集群中心都很小(电量在6kWh以下),集群中心的最大等级和最小等级的差接近(电量在5kWh以下)时,用户整体的电力使用量低基本上是由于偷电造成的,因此设定了模拟度Sd=0.7; 另一方面,当某一种类的个数不到全体的5%时,为了避免因偶然的情况导致可疑种类的判别不正确,应该排除该种类,当样本簇中心较近且一般较高时(电力值远远大于6kWh时),由于偷电的可能性较低,因此直接设定了模拟度Sd=0.2。

2 基于负荷数据的支持向量机算法窃电模型

作为模型基础的支持向量机算法,通过分析处理高压用户的负荷数据,识别正规用户和偷电用户。 分析研究的结果表明,三相电流数据可以很好地表现出偷电使用者和正常使用者不同的电力使用特征。 因此,以三相电流数据为研究对象。 支持向量机算法模型的步骤大致可分为数据收集、数据前处理、样本选择、支持向量机分类、决定判断4个步骤。

3 基于用户用电特征的窃电行为分析模型

根据已知的盗电举动的电力特性类型基础制作专家模型,用于盗电举动(举动)分析。 对于嫌疑度高的偷电用户,通过将过去的电力使用量数据,特别是根据最近的测量异常信息得到的电力使用量特性与类型库进行对照,来判别进行了怎样的偷电(行动)。 通过分析电量测量装置的原理,针对4种不同的测量方式,制作了4种盗电行为解析模型。 偷电行为解析模型是基于偷电模拟算法模型构筑的,在利用该算法模型判断偷电发生时间后,利用寻道表从对应的电压电流变化参数中提取对应的偷电行为,进而利用电力使用量(电力)等状态计算来判定偷电行为。 分析原理主要是根据实际用电量和理论用电量是否一致来判断发生了哪种偷电行为。 在流程图中,可以简化与实际消费电力变化相对应的理论性消费电力变化是否一致的判断。

4 模型应用

利用离群点和聚类算法对浙江省22个高压窃电用户进行了测试,15个疑似Sd超过0.5,可以得出这15户家庭在窃电,窃电识别的准确性为Q=15/18/100=83.3。 其他三个识别错误的原因可能是在三个月的数据样本中,窃电数据比例较小导致怀疑程度低或不能满足算法模型中的报警条件而不报警。利用基于负载数据的支持向量机(S SVM)算法,对浙江省2200名高压用户进行了随机测试,但在算法分析中不确定是否盗电用户),约有6%的疑似用户(0.5%的疑似SD>),而实际疑似程度Sd>0.7(即用户有重大窃电嫌疑),只需要10个用户进行现场窃电检查,需要检查用户比例0.27。 这大大减少了现场调查的工作量。

两个算法的分析结果,结合两种算法和怀疑度高的检测均92户,相互验证的用户可以左右两个算法相结合的时候,加入进一步缩小范围,提高算法的整体效率。从92户用户窃电高怀疑度中选拔和怀疑度排名前10的家庭进行了分析,3户所提及的属于22户中,实际窃电用户验证,证明算法具有一定的准确性。左右,比较分析了两个算法的模型,模型的精度,可以增加防窃电的工作效率的提高。

  5 结束语

  基于正文窃电现状和一些反窃电的研究成果,目前信息系统用于采集的数据处理分析不足的情况下,基于电量波动的离群点算法开始制作了聚类算法和疑似度模型、基于负荷数据的支持向量机算法疑似度模型、低压台区线损分析模型、窃电行为分析模型等窃电模型。怀疑疑似窃电用户清单,能更精准地发现偷走电力的用户,为防止窃电工作提供了一种新的想法,提升了窃电查处效率和管理水平。

参考文献:

 陆新华. 利用大数据分析精准定位窃电行为的探索[J]. 建筑工程技术与设计, 2018, 000(022):4949.

 张沂, 潘志伟, 顾挺. 基于大数据分析比对的精准反窃电方法研究[J]. 数字化用户, 2019, 25(017):259.

 赵俊鹏, 吕孟玉, 张洋瑞,等. 基于用电信息采集系统的反窃电风险评估研究与应用[J]. 河北电力技术, 2019, 38(01):28-29+33.





