大数据环境下的配网数据质量评价模型的构建

(整期优先)网络出版时间:2018-12-22
/ 2

大数据环境下的配网数据质量评价模型的构建

杨成鹏任勇李亚国王凯程旭

(山西省电力公司山西省太原市030000)

摘要:在互联网技术的发展下,大数据技术逐渐被应用到各行各业,尤其是对于电力企业来说,配电网正向智能化、自动化、信息化的方向发展,与互联网的关系越来越密切,在电力企业内部体系积累了大量的数据,例如配网设备台账数据、配网设备地理信息数据、用户的用电量、调度管理数据、设备运行数据、系统检测数据以及故障维修数据等。但是目前配网数据质量对业务应用支撑方面存在诸多问题,如故障研判、停电到户通知等,高服务要求的趋势下就显得力不从心,为了解决这一问题,本文主要分析和讨论了大数据环境下配网数据质量评价模型构建的目的和应用。

关键词:大数据;配网数据;质量评价模型

配网处于电力系统的末端,分布地域广泛,具有很大的规模,涉及到的设备种类也很多,其运行方式和网络连接方式各有不同。随着山西城镇化建设的加快,对用电量有了更多的需求,电力公司一直在进行配电网的改造和扩建工作。对于具有5700余条馈线的配电系统,大量异构、多态的数据在配电网中呈现出指数级的增长趋势,数据总量甚至达到了大数据级别。配电网具有以下几个特征:第一,可采集大量数据,在同一采集点收集固定类型的数据,分布于所有电压等级,如用电信息采集系统,自动抄表实现对配电变压器和终端用户的用电数据的采集;第二,对于不同采集点采用不同的采样尺度,数据断面有差异;第三,数据采集不健全,存在偏差和漏传现象;第四,数据分布在不同系统之中,如配网设备的运行信息在PMS、OMS等系统中都有体现。

一、配网数据中存在的问题

(一)数据量大,关系复杂

配电网处于电力系统的末端,具有地域分布广、电网规模大、设备种类多、网络连接多样、运行方式多变等鲜明特点。配网基础数据包含设备台账数据与设备图形数据,台账数据包含线路、杆塔、电缆、柱上变压器、柱上断路器、柱上隔离开关、配电室、箱式变电站、配电变压器、开关柜、站内断路器、站内隔离开关、站内负荷开关等设备台账数据;图形数据包含设备地理坐标、设备与设备拓扑关系等数据。配目前通过核查工具检查条目54类,仅太原全部数据按检查条目检查一次涉及设备次数1600万余次。随着城镇化建设和用电需求的增长,配电网一直在不断地改造和扩建,其规模也不断扩大,对于5700余条馈线的配网,会产生大量的新增异动的数据。

(二)数据质量差

伴随着PMS2.0系统的推广和应用,数据质量逐渐产生各种各样的问题。PMS2.0系统对历史数据迁移出现缺失设备,设备不对应等情况,不能完整准确的记录设备的运行参数,在图数不关联以及图数关联不准确上存在严重的问题,致使系统中积存很多垃圾数据和错误数据。同时因配网系统数据量大,且与其他系统有着密切的联系,各系统对配网的数据有很大的依赖性,所以配网数据质量的好坏对营配贯通和线路线损、以及配网可视化系统有很大的影响,而运检部的实用化对数据质量也有着很高的要求,所以,提高配网数据质量是配网数据治理的核心内容。

(三)数据查询效率低

配网数据问题的多样化对地市人员的治理质量和效率造成很大的阻碍,系统普遍应用的核查工具已经不能满足实际工作条件,而只靠人力在系统中审查庞大的数据量会浪费大量时间成本,使工作效率大大降低,严重阻碍地市人员治理进度和效率。为了贯彻落实国网十三五发展规划,完善生产管理模式和创新信息化建设,提高配网系统整体的实用水平,解决配网数据质量的问题,构建配网数据质量评价模型至关重要[1]。

二、构建配网数据质量评价模型的思路

(一)指标提升“一二三”

一套指标体系:设备台账准确性、中压图数一致率、拓扑连通率等15类考核指标;二种核查方法:自查和他查;三个管理库:业务规则库、问题清单库、治理经验库。自查工作可通过接入PMS2.0/GIS1.6系统数据来实现,他查工作可通过接入同期线损、SG186等系统数据来实现。

(二)应用支撑

基于配网的电力快速抢修平台的核心系统是配网,须要清楚发生故障的线路和设备的相关信息,这些信息需要从配网中获得。配电GIS系统储存线路及设备的全部信息,对事故抢修人员及时查询线路的设备型号信息提供有效地支持。配电GIS系统的电子地图为驾驶员、事故抢修值班人员提供故障设备位置的导航提示和地理信息提示,为事故抢修顺利开展起到了事半功倍的效果。通过对配网运维管控指标的提升,提高数据的质量,进而实现配网的可视化以及供电服务指挥平台等系统的实用化[2]。

三、配网数据质量评价模型的构建

在构建配网数据质量评价模型之前,要仔细研究大数据技术下影响数据质量的因素,根据一致性、准确性、完整性和及时性四个维度构建评价体系,计算数据的质量指标,分析统计数据状况,实现综合评价的实时、自动化处理。影响配网数据质量的主要因素有工作人员的专业技术水平、数据的分析算法和管理机制以及后期数据的维护等。所以,在构建配网数据质量评价模型时要按照数据的实用性原则、可比性原则以及定性与定量相结合的原则,可以划分以下四个数据质量评价维度:

(一)数量性维度。主要核查配网数据的应接入量、实际接入量和指标历史数据。用数据采集率来衡量数据接入量,用指标历史数据接入率衡量指标历史数据等方面进行指标核查。

(二)时间性维度。主要核查各源业务配网数据接入的及时性和上报及时性等,数据及时性指的是数据在特定时间和频度周期内接入系统的比例,主要由每月、每周、每日的配网指标数据的及时率构成。

(三)完整性维度。主要核查配网数据业务组合的完整性、单位维度的完整性以及指标值完整性。由每月、每周和每日的指标数据完整率构成。

(四)准确性维度。主要核查配网数据间业务逻辑准确度,数据维度、字段和频度的逻辑准确度,还有数据精度的准确度。主要由每月、每周和每日的指标数据准确度构成。

完善的数据治理体系需要高质量的配网数据,对所有信息系统的指标定义和数据采集流程统一化,防止造成“信息孤岛”的现象,所以,要建立全面、准确、完整的公司运转状况的数据视图,保障数据治理体系的完整性。

四、配网数据质量评价模型在数据治理中的应用

该模型准确找出数据质量薄弱部分,有针对性的制定科学合理的整改方案[3]。主要从四个方面对数据管控:基础数据收集、指标数据分析管控、台账数据管控、图形数据管控。

(一)基础数据收集

1、以配网台账、配网图形、线-变拓扑关系做为切入点,该模型根据配网数据应接入量、实际接入量、接入及时性等对数据比对,及时通知基层人员数据录入,保证配网数据的实时行、可靠性、准确性以及有效性。收集数据包含运检部、营销部2个专业61项数据。详细见下图。

(二)指标数据分析管控

1、根据指标问题清单,该模型通过分析问题原因、提供解决建议,为数据治理提供高效核查、快速治理方法,加快数据整改进度。

2、在数据治理过程中,该模型跟踪整改进度,及时提醒落后单位整改,保证数据治理成果。

3、根据数据整改结果,该模型总结归纳数据问题,完善数据治理经验库,形成《典型经验解决方案》手册,便于基层人员数据治理工作,提升实用化水平。

(三)台账数据治理

1、根据核查工具台账问题清单,该模型按照站房类设备、站内一次设备、间隔单元、配电线路和低压设备等设备参数间逻辑规则、约束条件和属性完整性等规则,指出问题信息,便于数据治理。

2、在数据治理上,该模型对问题数据进行分类,对数据量大、需要重复操作的问题,可进行批量处理,加快数据治理进度。比如设备型号与铭牌参数不一致、设备相别相数不对应、线路长度失真等类别。

3、对于增量数据,该模型建立数据维护机制,提高数据录入质量。

(四)图形数据治理

1、根据核查工具图形问题清单,该模型针对图形拓扑不连通、孤立变压器、线变关系错误等问题,定位问题出错点,便于在电网GIS系统中精确定位治理图形数据。

2、针对国网实用化考核、山西省公司实用化考核通报的问题清单,该模型在数据治理工作中,总结归纳出现的问题,举一反三,全面核查治理系统中的同类型问题,提高10kV同期线损,配网可视化平台指标。

3、针对存量数据,该模型形成问题分析方式与对应的解决流程,加快数值治理效率;针对增量数据,该模型建立数据维护机制,完善数据管理规范,提升数据质量[4]。

结束语:综上所述,构建配网数据质量评价模型对数据的质量有着很大的提升,加快了对存量数据的治理进度,保证了新增数据的质量,有效的减少了大数据环境下配网系统中出现的数据问题。为山西配网发展,电力行业的可持续发展,提供了强有力的技术支撑。

参考文献:

[1]崔立真,史玉良,刘磊,等.面向智能电网的电力大数据存储与分析应用[J].大数据,2017,(6):42-54.

[2]罗弦,冯浩,王逸兮,等.Web环境下大数据动态不良信息安全过滤系统设计[J].电子设计工程,2017,(24):15-19.

[3]徐祥征,王师奇,吴百洪.基于大数据分析的配电网主动检修业务应用研究与实现[J].科技通报,2017,(6):105-108.

[4]王馨苑,周绍光,胡屹群.基于GPS车辆数据和图像配准的道路中心线提取[J].地理空间信息,2018,(1):48-50,64.