数据挖掘技术在电力设备状态检修中的应用

(整期优先)网络出版时间:2018-11-21
/ 2

数据挖掘技术在电力设备状态检修中的应用

张阴全

张阴全

山东省德州市夏津县夏津县热电有限公司山东德州253200

摘要:状态检修是一种新的检修模式,它利用状态监视和诊断技术获取设备的状态和故障信息,判断设备异常,预测故障发展趋势,在故障发生前,根据设备状态决定对其检修。本文在探究了数据挖掘现状的基础上分析了数据挖掘的过程及主要方法,并研究了基于数据挖掘的电力设备状态评估系统,以供参考。

关键词:状态检修;数据挖掘技术;电力设备状态

一、前言

随着状态检修的不断发展,电力设备监测系统中数据规模的增大,推动了数据挖掘技术在电力设备状态检修中的研究和应用.但我国数据挖掘在电力设备状态检修中的应用还处于初级阶段,仍然存在许多问题,还需作进一步的深入研究.

二、数据挖掘现状

数据挖掘就是从大量的数据中挖掘出有用的信息,即从大量的、不完全的、有噪音的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的,但又是潜在有用的并且最终可理解的信息和知识的非平凡过程.近年来,数据挖掘技术的研究和应用发展迅猛,在商业和银行领域已有广泛的应用.随着相关学科的发展出现了各种数据挖掘算法。

1、国外研究现状

国际知识发现(knowledgediscoveryindatabases,KDD)组织委员会于1995年在加拿大蒙特利尔市召开了第一届KDD国际学术会议。近年来,KDD在研究和应用方面发展很快,尤其是在商业和银行领域的应用速度更是迅速。目前,国外数据挖掘的研究方向及趋势主要是对数据挖掘方法研究的进一步发展,如Bayes方法以及Boosting方法的研究和提高;传统的统计学回归法在KDD中的应用;KDD与数据库的紧密结合等。

2、国内研究现状

与国外相比,国内对数据挖掘的研究起步稍晚且不成熟。最新发展的有:在分类技术研究中,试图建立其集合理论体系,实现海量数据处理;以粗糙集和模糊集理论为基础,将二者融合用于KDD,构造模糊系统知识模型与模糊系统辨识方法,构造智能专家系统;研究中文文本挖掘的理论模型与实现技术;利用概念格式进行文本挖掘。目前,国内的数据挖掘技术主要应用在农业、金融及Web等领域,而在作为现代化生产主力的工业部门应用却不多,只在电力部门火力发电方面有一些系统的应用,其他领域只有少数零散的应用。可以说数据挖掘技术在我国还有很大的发展潜力。

三、数据挖掘的过程及主要方法

数据挖掘又称为知识发现(knowledgediscovery)、商业智能(businessintelligence)、预测建模(predictivemodeling)以及预测分析(predictiveanalytics)等等。这里使用的数据挖掘定义,数据挖掘是一项探测大量数据以发现有意义的模式(pattern)和规则(rule)的业务流程(businessprocess)。从狭义上讲,数据挖掘是工具和技术的集合。它是用来支持以客户为中心的企业的几种必要技术之一。从广义上讲,数据挖掘是一种态度,即业务行动应该基于学习、知情的决定比不知情的决定要好,以及度量结果对业务有益等。数据挖掘也是一个应用分析工具和技术的过程和方法论(methodology)。

1、数据挖掘的一般过程包括以下5个方面:

(一)、数据选择指与要解决的问题有关的数据的选取,当前,数据可以很方便地通过互联网进行采集;

(二)、数据预处理即通过滤噪进行信息处理的过程;

(三)、数据转换将定性的数据转换成定量的数据,在某种意义上也叫特征提取;

(四)、数据挖掘寻找数据库中隐藏的重要模式,该步骤在知识发现的过程中起着关键的作用;

(五)、数据解释用来评价和解释通过数据挖掘获得的结果,即知识.

2、数据挖掘的主要方法

(一)、关联分析

关联分析是指如果两个或多个事物之间存在一定的关联,那么其中一个事物就能通过其他事物进行预测,它的目的是为了挖掘隐藏在数据间的相互关系。在数据挖掘的基本任务中关联(association)和顺序贯模型(sequencing)关联分析是指搜索事务数据库(transactionaldatabases)中的所有细节或事务,从中寻找重复出现概率很高的模式或规则。其属于灰色理论中的一种分析方法。

(二)、时间序列分析

时间序列分析(Timeseriesanalysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。

(三)、聚类分析

聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。

(四)、分类分析

主要是研究对有关信息进行分类的方法,分类模型以分析数据集中的某些数据得到另外的数据结果,主要分为预测离散变量的分类,预测的连续变量的回归(Regression),数据挖掘中广泛使用的分类方法有决策树,神经网络、径向基础函数等。

(五)、异常分析

一条信息在一定条件下可能是垃圾的信息,而在另一条件下可能是非常重要的数据。异常或孤点是事件过程的各种不正行为的反映,通常用“距离”的恒量,孤点就是离正常状态下的大量状态点较远的点,电力机关在盗电选案的过程中,选取从电力数据仓库中根据用电客户的状况,把客户常年用电量进行收集数据,将这些数据再用数据挖掘查找用电量明显偏离常规用量的客户,可以将这些客户作为有盗电的企业进行稽查。

四、基于数据挖掘的电力设备状态评估系统

状态检修实质上就是建立一套设备的运行状态分析系统来判断设备的健康状况,以决定是否对其进行检修。

对电力设备状态进行评估,首先要收集设备的相关信息,包括设备的基础信息、历史运行数据及设备缺陷信息等.通过对设备历史运行数据和缺陷信息进行挖掘,得出设备缺陷情况下的特征值和设备关联参数值,方便用户对设备的历史情况进行查询和使用;设备当前监测值从实时数据库或试验中获得,是被分析的对象;设备健康状况分析就是以数据挖掘的结果为依据,对设备当前监测值进行对比分析,判断当前设备运行状态是否正常.关联规则是数据挖掘方法中的一个重要分支,通过分析数据库中不同数据属性之间存在的潜在关系,找出满足给定支持度和置信度的关系规则,对设备进行在线故障诊断。

五、结束语

综上所述,数据挖掘技术可以从海量的数据中挖掘出有用的信息,用于电力行业的决策支持,这是传统的方法无法达到的,因此大力推广数据挖掘的应用,能有效提高信息系统的效能,同时我们也发现数所挖掘也存在许多不足,如何解决这些问题,是开发电力行业信息系统潜能的关键。

参考文献

[1]陈超金.基于数据挖掘的电力设备状态检修技术研究综述[J].广东电力,2009,22(9):21-24.

[2]张云涛,龚玲.数据挖掘原理技术[M].北京:电子工业出版社,2004:1-2.