基于聚类的电网监控信息辨识方法研究

(整期优先)网络出版时间:2018-03-13
/ 2

基于聚类的电网监控信息辨识方法研究

罗建宇

1引言

随着我国电力行业的发展,变电和输电设备的自动化改造不断深入,以往有人值守的运维模式逐渐在向无人值守、集中监控的模式进行转化。目前全国绝大部分110kV及以上电压等级的变电站都采用集中监控的模式进行管理,现场电力设备的异常和告警信号都通过通信设施直接传输到调控中心已文本的形式展示给电网监控人员。

目前,我国关于电网异常信号的监视主要采用人工监屏的方式,设正值一人、副职两人进行监屏。然而人工监屏受到外部影响因素较多,当电网正常操作和电网设备异常时都会发出大量的电气量信号、物理信号,这些异常信号的筛选和辨识会消耗监控人员大量时间,若不能及时判断故障发生情况则会影响事故处理的及时性。而一旦发生信号漏看或辨识错误的现象,则会对电网设备造成不可估量的损失。因此,研究一种适用于电网监控的文本自动辨识方法,独立于人工辨识以外提供辅助功能,是当前亟需解决的热点问题。可以有效减轻监控人员的负担、加快电网事故处理的流程、避免信号漏看导致的电网事故。

鉴于此,本文提出一种基于聚类的电网运行监控信息智能辨识分类方法,以调度监控收到的告警信号为样本,通过聚类分析的方法形成典型告警信号的特征向量,从而实现对告警信号的自动核对和辨识。最终达到提高电网设备告警信号的辨识效率,防止信号的漏看和错误辨识,保障电网安全稳定运行的目的。

2数据样本的预处理

2.1建立电网监控的信息熵模型

按时段搜集监控信息。电网设备的告警信息是典型的触发式告警信息,即当有设备出现异常时发出告警信息。传递到电网监控后台机上的信息都是带有时间标签的离散信息,例如:2015-10-3021:56:21110kV某某线某某开关断开。为此本方法以时间尺度为标准搜集监控信息,并整理成可以计算信息熵的数据样本,其具体方法为:每隔3秒统计一次最近3秒内发出的监控信

时总是伴随着大量的一次设备的电气、物理信号和二次设备的动作信号;与之相对应单一出现的告警信号往往是电网辅助设备发出的告警信号,不能作为设备故障(或异常)的判断依据。因此,对应时段的监控信息熵越大,则该时段告警信号发出不会是规律的,其熵越大出现设备故障(或异常)的几率越高。为此,本方法以30秒为时间跨度,每隔10秒进行一次采样,计算对应的监控信息文档S的熵。将信息熵的监控信息文档筛选掉,即排除监控告警信号发出特别规律的时段。

步骤2:基于信息有效性的文本筛选。通过步骤1可以筛选掉大部分监控信息集合加快辨识速度。剩余的监控信息文档都涵盖有30秒内的告警信息,而电网故障发生后相关联的监控信息一般在10秒以内传达到监控系统,即有效信息的时间跨度远没有30秒,因此需要对得到的监控信息文档S内的文本进行二次筛选。为此本方法给出文本的筛选方法:1)逐项删除文档S中的数据项,即,并计算删除时间段后的信息熵;2)将删除前后监控信息熵变化最大的数据项作为中心,从边缘起逐步删除数据项,直至

“了”的平凡词。该类汉字对于文本描述的内容无贡献,因此将这类词排除在外,最终形成文本的特征项集合:,其中为筛选后得到的关键词。

3.2计算特征项权重建立文本特征向量

度。Zk为第k个簇中含有的元素个数,K为所有簇的个数。

重复步骤2、步骤3直至评价函数维持不变为止。此时得到的K个簇则基本处于正交形态,其特征向量可以代表不同的典型告警信号模板。

人工干预,对分类完成的簇进行识别。通过查看不同簇中的文本文档人工识别该簇代表的告警信号的现实意义。

综上所述,通过以上所有步骤可以对任意时间长度的告警信号进行聚类分析,将其转化为对应的k个典型特征向量(即k个典型故障告警文本模板)。

3.4基于聚类挖掘的告警信号辨识

1.告警信号的智能辨识

步骤1:每隔10秒统计一次最近30秒的告警信号,形成新增文档S。

步骤2:根据聚类分析得到的特征词条为依据,采用TF-IDF公式计算权重,形成空间特征向量:。

步骤3:计算新增文档S与各个簇中心特征向量的相似度,对其进行分类。

从上述方法可以发现,本文提出的一种基于聚类的电网运行监控信息智能辨识分类方法。该方法将聚类分析引入到电网监控的研究中,在对历史存档的电网监控告警信号进行预处理的前提下,将其转化为有效的告警信号文档集合。并采用聚类分析的方法建立对应的空间特征向量,结合K-means算法计算得出典型的告警信号空间特征向量。有新的告警信息出现时可通过计算新增告警信息与典型告警信号空间特征向量的相似度对新增告警信号进行分类。从而实现电网监控信息自动分类,达到提高电网设备告警信号的辨识效率,防止信号的漏看和错误辨识的现象,保障电网安全稳定运行的目的。

4具体实施方式

下面将结合本文实施例中的附图,对本文实施例中的技术方案进行清楚、完整地描述。

本文提出了一种基于聚类的电网运行监控信息智能辨识分类方法。其实施步骤为:

S11、按时段划分告警信号,并以信息项的方式将告警信息组织成文本文档,采用公式(2)、(3)建立文本的信息熵模型。并将信息熵低于0.3的告警信息文本剔除掉。

S12、针对剩下的有效告警信息文本,逐项删除文本中的数据项,确定对文本文档信息熵贡献度最大的数据项,并将其作为文本文档的中心。

S13、以文本文档信息熵贡献度最大的数据项作为中心,从文档的边缘(即时间尺度的边缘)开始逐渐删除数据项,直至文本的信息熵降低为止。

参见图2,形成告警信息文档的空间特征向量,其具体步骤包括:

S21、统计所有告警信息文档中汉字的出现频率,并计算不同汉字组合的互现系数M。

S22、将互现系数大于0的两个汉字作为关键词保留,形成关键词集合。而后删除关键词集合中的频繁词,将剩余的关键词作为文本的特征项予以保留。

S23、采用TF-IDF公式计算不同文本中特征项(即关键词)的特异系数,并将其作为权重为特征项进行赋值。所得到的二维向量集合,,可以看做是以特征项为坐标轴的空间特征向量。

参见图3,基于K-means算法的聚类分析,具体内容包括:

S31、从文本集合中随机抽取K个特征向量作为K个初始簇的中心特征向量。

S32、从文本集合中逐个抽取文本,计算新文本和不同簇的中心特征向量的相似度。并将新文本归入最相似的簇中,按照式(9)更新簇的中心特征向量。

S33、采用式(10)所示的评价函数对更新后的簇进行评价,若评价函数不收敛或更新前后簇的评价函数有变化,则重复S32步骤,直至评价函数不变为止。此时训练得到的K个簇则基本处于正交形态,其空间特征向量可以代表不同的典型告警信号模板。

S34、通过查看不同簇中的文本文档人工识别该簇代表的告警信号的现实意义。

参见图4,基于聚类分析的告警信号辨识:

S41、通过对历史告警信号的聚类分析已经得出电网告警信息的特征项。对于新增告警信息文本则根据已有的特征项计算其对应的权重系数,形成该新增告警信息文本的空间特征向量。

S42、将新增告警信息文本的特征向量,与训练得到的簇的中心特征向量进行相似度计算。将新增告警信息文本归入最相似的簇中,实现告警信息文本的分类。

S43、根据该簇代表的现实意义,辨识新增告警信息文本代表的现实意义。

5总结

综上可以看出,本文利用电网监控系统中的历史告警信息为数据样本,采用聚类的方法分析电网监控信息的聚类规则,得到电网告警信息的典型模板及其对应的空间特征向量。在电网发出新的告警信号时,通过相似度计算对其辨识和分类,实现电网监控告警信号的智能辨识和分类。该方法可以大幅降低电网调度监控人员的负担,辅助监控人员及时发现电网设备发出的告警信号,保持电网的安全稳定运行。

参考文献

[1]王晶晶,刘巍,张勇平,李群炬,刘平,李平,王丰,刘鸿斌.华北电网无人值班站和集控中心管理模式的探讨[J].华东电力,2009(10):24-27.

[2]黄炜,张杰明,綦孝文,李存义.调度集控一体化系统责任区管理和告警解决方案[J].电网技术,2007(12):264-267.

[3]TakehikoTakahashi,TaroKawase.Calculationofearthresistanceforadeep-drivenrodinamulti-layerearthstructure[J].IEEETransactionsonPowerDelivery,1991,6(2):608-614.

[4]李碧君,薛禹胜,顾锦汶,韩祯祥.电力系统状态估计问题的研究现状和展望[J].电力系统自动化,1998,(11).

[5]黄彦全.电力系统状态估计若干问题的研究[D].西南交通大学