基于OCR技术的电网设备台账标签采集功能设计研究

(整期优先)网络出版时间:2022-06-13
/ 2

基于 OCR技术的电网设备台账标签采集功能设计研究

塔宗 , 次久

国网西藏电力有限公司那曲供电公司 西藏那曲 852000

摘要:电网账户的标签采集功能的出现对电网设备的管理和检查具有重要意义。收集功能大大节省了电网设备检查和管理所需的人力和材料资源,提高了工作效率。本文以OCR技术为基础,设计了网格设备分类账标签的采集功能,解决了以前采集功能中存在的问题,应用OCR技术提高了网格设备分类账标签的采集功能的兼容性。本文主要基于OCR技术,分析了网格设备分类账中标签采集功能的设计与研究。

关键词:OCR技术;电网设备;台账标签;采集功能

引言

电网的运行维护是电力行业的基本环节。电力的正常运行和维护主要包括设备的日常检查、设备的缺陷管理和大修、设备分类账的维护和设备的隐患管理。操作和维护工作需要处理许多枯燥和费时的事情。为了提高工作效率,创新地使用了网格设备分类账的输入方法。过去,院长的输入主要依靠手工,创新地使用电力设备院长的输入自动化,节省了很多人力。电力设备分类账录入的自动化主要通过电网设备分类账的标签收集功能实现,电力电网设备分类账的信息通过标签收集功能自动获得。过去,电网设备院长的标签收集功能大部分受平台限制,存在兼容性差的问题。因此,为了基于OCR技术设计电网设备分类账的标签采集功能,采用了OCR技术。该技术适用于电网设备分类账的标签采集功能,可减少人工输入人员的时间,大大提高工作效率,解决电网设备分类账先前标签采集功能中存在的兼容性不良问题。

1OCR识别技术

OCR(OPTICAL CHaracter RECOGNITION)是光学字符识别的缩写。光学字符识别技术属于图像数据的分析和处理,也是字符和数据的获取过程。而OCR识别技术可应用于书写、复印、档案、财务账目、身份证、驾驶执照、名片等的录入和处理领域。传统的OCR由图像预处理和输入组成。预处理方法包括灰度和二值化、图像均衡和噪声去除。图像输入对于不同的压缩方法有不同的存储方法等。企业OCR识别信息系统的性能指标分析主要包括产品稳定性、使用方便性、可行性、误码率和识别率等。栋并且使用适当的辅助数据来提高识别精度是非常重要的。简而言之,是将单词转换成图像数据,然后使用字符识别将图像数据转换成相应的输入技术。并在分析OCR识别结果后合理纠正错误结果。随着中国科技的发展,OCR识别信息技术也得到广泛应用。由于不同的发票类型有不同的尺寸和颜色,本文要做的第一件事就是对发票类型进行分类和定义。因此,具有固定符号和像素的发票,如铁路客票,可以使用固定模板拦截待识别信息的图像,同时降低后续识别的难度。其次,对于打印字符和像素因打印机而异的增值税发票,将使用第二种基于图像增强的分割方法来拦截和校正倾斜。这不仅降低了识别难度,而且提高了OCR识别的准确性。

2OCR识别技术的功能

OCR技术中的语音识别技术可以使机器通过识别和理解来理解人类语言,这是OCR技术中的一项重要技术,它逐渐被广泛用于语音识别功能领域。通过语音识别,可以检测用户的语音。在这个过程中,可以通过信号处理来实现效果,并且可以通过识别来满足语言挖掘和处理的要求。有前端和后端的语音处理。在前端语音处理过程中,可以实现端点检测和智能中断。Front-end指的是语音处理过程,它扩展和分析接收到的声音,以确保自始至终对用户的语音进行处理。在back-end处理中,必须识别说话者的声音,最后得到合适的结果。包括识别和置信输出,接口可以识别系统中的各种单词,满足语音识别处理的更高要求。此外,它在不同的用户年龄、区域、环境等因素下具有良好的适应性,其局限性相对较小。Back-end指通过反映识别结果来识别语音置信度,也可以通过识别结果进行详细分析,以有效处理语音信息。近年来,由于人工智能技术的快速发展及其与传统产业的快速融合,数字转型带来的产业转型蓬勃发展。这是一个共同的时间声音,为每个人和每个项目提供OCR字符识别,并构建一个与所有相关的智能世界。它可以应用于涵盖生活和工作的各种技术核心,如证书识别、银行卡识别、车牌识别、表单识别、账户识别、护照识别、商务卡识别、人脸识别、证件识别、人脸与证书集成栋目前,它包括银行、保险、金融、税收、海关、公共安全、边境检查、物流、电信业务管理、图书馆等。OCR技术使人们能够减少硬件配置,降低人工成本,提高工作效率。

3OCR技术可应用的审计业务场景

由于图像系统中存储了许多类型的图像数据,并且包括承销、理赔和财务等多种业务关系,因此在技术情报阶段,财务报销系统被视为一个突破点,并且增值税发票、铁路客票等的标准化和高度标准化图像被选择用于格式识别,并试图应用于以下审计场景。

3.1对高频交易及异常采购的核查

检查同一业务单位向同一供应商连续采购的情况。在保险业的混乱中,对基层公司进行监督管理的重点是灵活计提销售费用和虚假发票,以争夺业务。根据过去的审计经验,这种情况主要涉及同一商品销售单位的连续和多次购买。利用OCR技术,我们可以提取增值税发票的开具方、商品名称和开具日期等信息,重点关注连续多次出现的发票单位,并将购买的商品、放行日期和报销管理人员联系起来,分析商品采购的合理性例如,2018年9月至12月,该公司连续八次从一家技术公司购买大量办公用品,如复印纸和碳粉盒,这与该组织和分公司人员的规模不相称,采购的数量远远超过实际需求。锁定相关信息后,审计师可以结合现场面谈进一步检查资金的实际使用情况。更接近未来的进货检验。OCR技术提取增值税发票的出具人、商品名称和开具日期等信息,并重点对在不同地区购买的非特定商品进行报销项目,以剔除相距甚远的购买,进一步排除购买项目和费用是否不真实。例如,2018年11月,中央省的一家公司报销了45份宣传材料,600元,发票由深圳的一家设计公司开具,金属产品和杯壶套件的商品名;2018年12月,同一位经理再次报销了51,355元的广告费,发票是由深圳的一家礼品公司开具的,公司的销售名称是汽车香水持有人等。结合现场跟踪审计,了解基层业务单位采购的原因,并进一步验证费用的真实性。

3.2对税局代开发票的核查

在日常工作中,有些费用发票是由税务局开具的,但所涉费用在金额上一般不高,在人工和清洁费用等问题上微不足道,而要由税务局开具的销售单位一般都是小型个体工商户,管理不规范有此类发票是合理的,但如果业务单位有大量此类发票,这是不正常的情况。使用OCR技术,收集和计算发票开具处方的费用,包括税金,并检查占发票比例相对较高的业务单位以及报销金额较大的费用进行检查。例如,2016年,该公司有一定数额的费用偿还给当地税务局开具发票。通过OCR技术对发票面部信息进行识别后,通过抽查发现存在不合理的情况。例如,2016年12月,其他费用报销了4,200元,发票是由税务局开具的,销售商品是洗衣机袋。进一步检查后发现,货物的实际销售单位是一家技术公司。

结束语

本文采用OCR技术实现了电网设备的标签扫描。通过扫描设备标签,设备核算信息的收集可以快速实现,设备标签数据的输入可以一次完成,无需人工编辑。可以从设备采集源保证数据的准确性,配电网主数据的更新和维护工作效率可以提高,数据质量可以提高,人工维护成本可以降低,并且可以实现简单、高效、适用和易于使用的设备标识信息采集工具。在广州供电局实施过程中,基于OCR技术的电网设备注册表标签采集功能取得了良好的效果,体现在:提高了设备注册表数据采集效率,减轻了操作人员的工作量;实施OCR识别技术,协助采集设备型号参数,确保注册表数据的准确性;实现了无纸化办公,所有纸质数据以电子方式存储在智能终端中,从而实现环境保护和减少浪费。

参考文献:

  1. 郭晨鋆,舒越,马显龙,等.台帐数据高级核查处理技术研究与应用[J].电网与清洁能源,2019,35(3):43-48,57.

  2. 叶康,冷喜武,肖飞,等.基于大数据标签技术的电网监控智能分析方法[J].电测与仪表,2019,56(4):75-79.

  3. 和敬涵,李长城,张沛,等.基于改进标签传播算法的电力系统并行恢复分区方法[J].电网技术,2018,42(6):1776-1782.

  4. 王凯亮,陆俊,徐志强,等.基于先验知识与DBM采样的类不平衡用电数据分类方法[J].电力系统自动化,2019,43(20):57-64,104.

[5]何怡刚,汪涛,施天成,等.基于RFID传感器标签与深度学习的变压器状态监测方法研究[J].电子测量与仪器学报,2018,32(9):72-79.