基于数据挖掘的用户用电行为分析研究

(整期优先)网络出版时间:2022-09-27
/ 2

基于数据挖掘的用户用电行为分析研究

王琦斐1刘伟2

国网山西省电力公司泽州县供电公司

摘要:随着大数据时代的到来,智能电网应运而生其中,用电信息采集系统、客户服务信息系统积累了海量用电数据,这些数据隐藏了很多用电信息。而工业负荷作为用电大户,电能使用的合理性、有序高效性将直接影响节能环保企业盈利。因此,未来的智能电网在保证安全、可靠用电的同时,应该面向不同的用户提供更加优质且具有针对性的服务及科学用电建议。因此分析用户用电量的增长规律和用电特性对用户本身及供电公司有着重要的意义。以下对基于数据挖掘的用户用电行为分析进行了探讨,以供参考。

关键词:数据挖掘;用户用电行为;分析研究

引言

近年来,智能配电网一词在电力领域越来越流行,这是一个旨在实现智能精细电网管理的网络。由于其优势,近年来中国大力推进了智能配电网的建设。对于近年来也变得越来越热的智能电网来说,智能配电是其发展不可或缺的一部分。通过分析用户的功耗行为,可以智能优化用户端,从而提高供电端的电能质量和可靠性,使供电端和电能使用端双赢。智能网络的大小和结构非常复杂,而用户位于智能网络的末端,是整个网络的基本构成,所以对其分析尤为重要。

1数据挖掘技术

1)数据准备。数据准备是为了对后续的数据进行筛选进行的基础阶段,根据实际情况的需求按照一定的规则在原始数据内选取一组数据。2)数据信息的挖掘。明确已选数据的目的及信息类型,确定相适应的挖掘算法,在数据库中获取最有用的信息。3)解释评价。通过挖掘算法后得到的信息中仍存在着大量的没有用或者是不相关的数据信息,为了保证数据的有效性和精准性,需要再将数据进行评估滤除,保证最后获得的信息既满足使用者的使用要求,又能够满足精确性。将抽象的数据信息再进行转化,转化后的数据信息能够让用户直观地明白数据信息。

2基于数据挖掘的用户用电行为分析研究

2.1系统软件设计

在大数据环境下,深度挖掘技术需要在海量的数据中进行复杂的数据量化处理,将海量的原始数据经过一定的数据处理,挑选出有价值的信息数据,筛选出异常用电数据。通过对异常用电数据的深度挖掘,进一步筛选出异常用电用户,提取窃电用户的窃电数据。首先,在数据层分析电力用户用电的原始数据,并传输至数据处理层。数据层存储着大量的电力用户用电的原始数据,包括正常用电数据和异常用电数据,通过深度挖掘技术分析、处理数据层的原始数据,通过自动检测系统筛选出异常用电数据,采用相应的数据算法筛选出异常用电用户数据,并将其传输到数据处理层,由数据处理层处理异常用电用户数据。然后,在应用层分析异常用电用户数据,进而得出用户窃电情况。在数据处理层处理完异常用电用户数据,在应用层作进一步的分析工作,分析异常用电情况,评估电网中存在的窃电风险大小,实时监测电力用户用电情况,并将其显示在自动检测系统中,利用供电企业设计的稽查系统,上传稽查系统中出现的异常用电现象。最后,在展示层显示异常用电用户、异常用电情况、异常用电手段和次数。在应用层得到窃电用户的具体情况后,将其记录并通过设备展示异常用电用户、异常用电使用的手段、窃电行为发生的次数和频率等情况,提前对即将发生的窃电行为发出预警,计算异常用电发生的概率。

2.2高损台区数据挖掘技术在用电检查过程中的应用效果

通过对系统在某台区内进行实际检测发现,该地区某月的供电量为24654kWh,售电量为15020kWh,线损量高达9854kWh,该月的线损率高达39.9%,超过了系统设定的10%的限定值。经过现场的调查发现,该台区内的一家用户表计黑屏,该用户为一家宾馆用电,用户私自将电压表两侧的加压片开路,导致了电能表无法计量电压值,明显属于偷电行为。针对用户从出现异常时期开始,对其范围内的所有电能设施进行统计,并按照相关规定对其进行电能的追补。采用该管理系统能够很明显地发现线损率出现异常的情况,并且能够确定该台区内的范围,减少了工作人员的工作量,提高了用电检查工作的质量,提高了供电企业的管理水平。

2.3控制器

该文设计的电力用户异常用电行为自动检测系统的控制器包括几大模块:时钟设置模块、接口模块、数据计数模块。控制器在对自动检测系统进行控制时,通常需要设置模块:串行接口模块、数据控制模块以及同步工作时钟,这3种时钟具有不同的工作频率,一般串行接口模块的工作频率最高,达到382MHz,同步工作模块的工作频率最低为126MHz,3种模块的工作由时钟设置模块统一管理。数据控制模块负责写入和读出电力用户异常用电行为数据,它也是控制器的核心时钟,串行接口模块和同步工作时钟的相位相同,可以使用锁相环对数据控制时钟进行锁相。

2.4用户用电行为分析

以大数据勘探为前提,电力行为分析的主要研究内容包括:用户负荷、用户分类、故障率预测等。根据数据收集和分析平台执行功耗行为分析,将数据信息保存到数据库中,并根据分析目标选择特定的数据类型以分析功耗行为。在具体的分析过程中,首先要对特定类型用户的总体数据信息进行综合分析。第二,排除全球数据中有影响因素的数据,例如排除春节和周末等节日数据,并分析和研究其余数据。排除影响因素数据后,将剩余数据划分为月、季度和年,以便分析和比较不同阶段用户数据的具体特征。为进一步提高电气行为分析的完整性,企业可以合理运用负荷分析方法、负荷预算方法、聚类算法、回归方法等。在实际数据分析过程中检测数据信息的隐藏规律和相关性,通过用户模型构建的形式提高行为分析的完整性和有效性。作为电力分析的主要方法之一,类分析方法在当前电力企业数据分析中的应用较为常见,该方法中的K-means算法是解决类问题的常用算法。K-means算法的应用具有效率和方便性特点,适用于大型电气数据,进一步提高数据处理效率。但是,请注意K-means算法对初始值更敏感,并且初始值的差异可能导致最终计算的结果不同。应用模糊c均值算法比较广泛,每个采样点通过优化目标函数得到所有类中心的依赖度,并根据采样点通用的精确科学判断实现样本数据的自动分类。但是,在实际分析中,由于模糊c均值算法只是一组离散数据点的处理计算,因此无法直接处理特殊类型的数据,并且高度依赖初始值。此外,一些研究人员建议,可通过云计算解决分组问题,从而有效地解决这些问题,进一步提高数据处理的速度和效率。

2.5模型实现

对于用户的电气行为分析,模型的整个功能的实现分为五个主要阶段:第一步是,导入必要的模块,从数据库文件读取历史电气负荷数据;第二步是清除数据,即在当前数据中查找空缺值并删除空缺值;第三步是筛选特殊时段用电量数据,例如:周末用电量数据,并按时间分列,以避免不同的用电量行为导致的错误分析;第四步是使用数据分析分组模型构建可视化类;第五步是调用模型以获得最终结果。

结束语

通过分析加权组合的聚类有效性评价指标,确定最佳聚类次数,达到最佳聚类效果在此基础上进一步分析电力负荷聚类,。筛选怀疑异常耗电的用户,通过设置阈值判断用户是否异常用电,依据诊断分析流程完成用电异常行为诊断。使用该方法解决了时间序列数据特征分析与样本类型分布不平衡的问题,并将混沌时间序列分析与单一分类相结合,进一步提高了异常点检测的准确性和检测效率。

参考文献

[1]边海源,刘晓焜,张东平,寿杰.基于数据挖掘的异常用电行为诊断方法研究[J].电子设计工程,2021,29(22):139-143.

[2]郭思涵.基于用电特征的窃电行为挖掘策略研究[D].三峡大学,2021.

[3]董爱迪,潘建宏,杨爽.基于大数据挖掘的用电行为分析[J].无线互联科技,2020,17(08):128-129.

[4]徐凯.基于数据挖掘的异常用电行为诊断方法研究[D].东华大学,2018.

[5]徐磊,杨秀,张美霞.基于数据挖掘的工业用户用电行为分析[J].电测与仪表,2017,54(16):68-74.