(深圳供电局有限公司深圳518000)
摘要:针对DAS系统基础模型人工校核的人力成本和时间成本过高问题,设计了配电网基础模型校核逻辑、校核方法及校核算法,形成了应用于DAS系统的基础模型校核体系,在此基础上开发了基于C/S架构的DAS数据质量校核专家系统。使用该系统对DAS系统存量数据进行校核,校核结果证明专家系统是有效且高效的。
关键词:配电自动化系统;基础模型;数据质量校核
ApplicationofDataQualityCheckingExpertSysteminDistributionAutomationSystem
HeShanYuLiwu
(Shenzhenpowersupplybureauco.,LTDShenzhen518000China)
AbstractToreducingthecostofdataqualitycheckingfordistributionautomationsystem,adataqualitycheckingsystemisestablished,includingcheckinglogic,checkingmethodandcheckingalgorithm.Onthisbasis,adataqualitycheckingexpertsystemwithC/SarchitectureforDASbasicmodelisdeveloped.ThisexpertsystemisprovedeffectiveandhighactivebycheckingthebasicmodelofaDAS.
Keywords:DAS,basicmodel,dataqualitychecking
1引言
配电自动化系统(简称DAS系统)是配电网生产运行监控的重要系统,作为配电网运行实时数据的数据源,其数据质量将影响配电网的安全运行和供电可靠性。运行数据的载体是系统基础模型,故确保基础模型的准确性极为重要[1]。
与调度自动化系统不同,配电网节点数量较输电网多,基建、技改等工程多,DAS系统基础模型涉及厂站和终端数量较大,模型变动也更为频繁[2]。
DAS系统基础模型通常由人工维护。由于配电网基础模型的上述特点,人工维护的工作量较大,容易出现录库错误、更新不及时等问题,因此需定期开展数据核查。以人工方式进行核查的人力成本高,全面核查周期长,难以适应配电网基础模型变动频繁的特点。所以有必要将基础模型数据质量自动校核技术引入DAS系统,利用计算机软件实现对配电网基础模型的快速、全面校核[3]。
2配电网基础模型校核体系
为实现对配电网基础模型数据的自动校核,需要明确校核对象,分析数据特征,理清校核逻辑,并设计校核方法。
2.1数据字典
配电自动化系统基础数据通常存放于关系型数据库中,以多个数据表及表间关系的形式来表示。数据表以元组(行)和域(列)的二元形式组织数据,某一元组的某个域即为数据存储的基本单位,称为元数据,这也是数据校核的最小单元。元数据及其组织具有以下特点:
(1)数据表具有一定独立性,不同层次的对象在不同数据表中描述,如厂站表描述厂站信息、开关表描述开关信息。
(2)不同数据表之间可能存在关联关系,如厂站表和开关表通过厂站ID和开关ID构成一对多关系。
(3)不同域之间可能存在依赖关系,如终端描述表拥有通信类型域和IP地址域,通信类型分别为光纤和无线的两种终端通常不在同一IP网段内。
(4)同一个域的元数据具有相同的数据类型,其物理意义决定其取值范围。
根据元数据的上述特点,定义待校核数据表和域,梳理各元数据之间的关系,确定元数据取值规则,建立起数据字典,为校核逻辑和校核方法的提出提供分析工具。
2.2校核逻辑
DAS系统的元数据类型繁多,但均有其明确的物理意义,不会脱离实际对象的具体属性及对象间的逻辑关系而独立存在。
(一)确保唯一性
对于同一类对象之间,数据表必须保证某些关键域是唯一的,尽管该域不一定被设计为数据表的主键。例如终端表通常以终端ID为主键,但正常情况下其“IP地址”域同样不应有重复值,否则会产生通信错误。
(二)确保关联性
对于单个对象,描述其同一功能的不同域之间域值存在关联,即使这些域不在同一数据表中。例如对于具备遥控功能的开关,其开关表的“可控标志”域应为“是”,以在单线图中显示可控标志;其遥控表的“是否可控”域同样应为“是”,以开放遥控命令的下发权限,二者若不一致,则开关的遥控功能将无法正常使用。
(三)确保一致性
对于某些由厂站现场情况所决定的域,域值应当与厂站提供的相应记录保持一致。例如系统中某一信号的信息体地址应当与厂站提供的信息表记录的地址相一致。
2.3校核方法
根据数据字典所描述的各类元数据特征,将校核逻辑应用于元数据的不同组织形式,可以得出数据校核的若干方法。
(一)单域唯一性校核
根据数据字典筛选出具有明确物理意义且具备数值唯一性的域,以域为单位对其元数据的唯一性进行校核,实现单域唯一性校核。
(二)多域关联性校核
以完整实现某一功能为线索,梳理出相关各域在逻辑上的关联规则,以承载功能的某一设备为单位对其各域中元数据间的关联性进行校核,实现多域关联性校核。
(三)厂站数据一致性校核
以规范化的厂站信息记录为基准,根据信息体地址对信号的名称、定值等信息进行校核,实现系统与厂站的数据一致性校核。
2.4校核算法
元数据具有多种数据类型,常见的有数值型和字符型。针对不同数据类型应当采用相应的校核算法对元数据进行校验。
数值型元数据具有精度高的特点,应采用与基准数据精确比对的方法进行校核,基准数据由源设备信息维护者以规范化格式提供。
字符类元数据表达同一语义的方式较多,精确校核的结果准确度不高且影响校核效率。本系统选用基于KMP的改进模糊算法[6],在提取关键字符精确比对的基础上模糊比对剩余的字符,既保证系统能筛选出确定性错误,又排除了干扰信息,提高校核效率。
本系统结合DAS基础模型数据的结构特点和深层次的物理意义,提出了针对不同类型元数据的校核方法与校核算法,能够对DAS基础模型进行全面、深入的数据质量校核。
3DAS数据质量校核专家系统
3.1校核流程
DAS数据质量校核专家系统的校核流程分为数据采集、校核关系建模、数据校核和结果分析四个阶段。
在数据采集阶段,校核专家系统从DAS系统数据库读取基础模型,从文件系统读取规范化的厂站基础信息记录,筛除所获取数据中的坏数据,并统一数据格式,从而形成可供专家系统使用的熟数据。
在校核关系建模阶段,建立待校核数据、基准数据和校核逻辑间的对应关系,并从不同校核方法的角度出发,合理地组织数据。
在数据校核阶段,针对不同类别的待校核对象,选取适用的校核方法和校核算法对数据进行校核,对错误数据予以标注并提示正确值。
图1校核流程图
Fig.1Processofchecking
在结果分析阶段,根据校核结果生成格式固定的分析报告,实现自动化数据质量情况的自动报送。
3.2系统实现
数据质量校核专家系统部署于DAS系统的安全Ⅲ区,系统自底向上分为四层,分别为:数据源层、数据接口层、系统平台层和系统应用层。
数据源层包括DAS系统和文件系统,DAS系统主要提供待校核数据,文件系统提供基准数据和校核需要的业务规则。
数据接口层采集数据校核所需的各类数据,对数据进行清洗、加工,并转化为统一的数据格式,存入系统数据库。
系统平台层分为数据中心、业务中心和规则库,数据中心用于存储待校核数据和基准数据;业务中心存储数据校核结果和分析报表;规则库存储校核规则。
系统应用层包括数据校核、智能纠错、报表分析等功能模块,通过各模块的相互配合实现数据质量校核的完整流程。
3.3系统应用
系统使用C#开发,采用C/S架构,已应用于某电力调控中心。利用该系统完成了DAS系统基础模型数据质量的校核和整改,并在DAS系统数据维护工作中得到常态化使用。
截至目前已使用该系统完成对1482台三遥终端“IP地址”、“链路地址”等域的唯一性校核,对14741台开关“可控标志”、“是否可控”等域的关联性校核,对29532条遥信信号、26423条遥测信号和7511条遥控信号的一致性校核,保证了DAS系统基础模型数据的高准确性,有效降低数据质量问题导致的电网运行风险。
4结论
本文设计了配电网基础模型校核逻辑、校核方法及校核算法,形成了应用于DAS系统的基础模型校核体系,在此基础上开发了基于C/S架构的DAS数据质量校核专家系统。使用该系统对DAS系统存量数据进行校核,校核结果证明专家系统是有效且高效的。目前该系统已应用于某电力调控中心的日常数据运维工作。
参考文献:
[1]刘健,赵树仁,张晓庆.中国配电自动化的进展及若干建议[J].电力系统自动化,2012,36(19):6-10,21.
[2]徐玮韡,刘东,陆佳南,等.多数据源配电网不良数据的辨识与校核[J].华东电力,2009(7):1133-1136.
[3]郭胜辉,孙玉芳.基于数据字典库的信息系统的设计[J].计算机学报,2000,23(4):414-418.
作者简介:
何山男,1989年生,硕士研究生,助理工程师,从事配电自动化系统运行维护管理工作。
余立武男,1985年生,硕士研究生,工程师,从事调度自动化系统运行维护管理及应用研究工作。