设备铭牌字符识别系统开发与实现

(整期优先)网络出版时间:2022-07-06
/ 2

设备铭牌字符识别系统开发与实现

关健

广东电网有限责任公司阳江供电局 广东阳江 529500

摘要:为实现铭牌字符的有效识别,本文特对其识别系统的开发及其实现进行分析,包括该系统的总体设计以及其中的各个功能模块设计。希望通过本次的研究与分析,可以为此类系统的良好设计开发及其在铭牌字符识别中的有效应用提供科学参考,以此来实现设备铭牌识别工作质量的进一步提升。

关键词设备铭牌;铭牌字符;识别系统


前言:在对设备铭牌字符识别系统进行设计与开发的过程中,首先需要对其样品模板库进行建立,将需要识别的铭牌字符作为依据,对相应的字符识别图像库加以建立。按照不同的厂家以及类型来进行铭牌类别划分,然后以此为依据来进行类别样品库建立,以此来达到良好的分类管理效果,将样品库中的各种铭牌类别作为依据,对模板信息库进行建立,再对其中的样本进行倾斜校正、轮廓处理以及分辨率调整等操作,这样便可实现标准铭牌样板的获得。其次需要做好铭牌类别判定及其字符识别,借助于人机交互或自动识别的方式,对铭牌类别加以识别,再按照具体类别对其字符特殊性进行识别,比如组合特征、间距以及清晰度等,并通过字符分割、图像增强、精确定位、铭牌匹配以及图像预处理等的方式来提升铭牌识别精度。最后需要将识别出的铭牌信息自动修正,并将其输出。为确保识别效果,需要对用户判定以及手动类别选择功能进行设置;并将识别出的正确结果向模板库反馈和保存,以此来实现铭牌识别准确性的进一步提升。

  1. 总体系统设计

在对铭牌字符识别系统进行设计的过程中,为满足其实际的功能需求,设计者需要按照五个主要的功能模块来进行总体设计,包括图像预处理、铭牌匹配、字符精准定位、图像增强以及字符分割。具体应用中,用户可控制铭牌识别软件将摄像头启动,以此来实现铭牌摄像信息的获取,再通过铭牌识别软件对获取到的摄像信息进行处理,使其实现图像到字符的转换,并将识别出的铭牌信息输出到用户端,以便用户对铭牌信息进行获取[1]

二、各个功能模块设计

(一)图像预处理模块设计

在该模块中,主要借助于摄像头来实现每一帧图像的输入,在预处理之后便可实现图像数据获取,然后再通过分辨率调整、轮廓处理和倾斜校准的方式对铭牌图像进行处理,以此来确保后续处理工作的高效性和准确性。

  1. 分辨率调整

将双三次插值算法加以合理利用,对于图像中需要求解的像素点,应先将其像素值影响因子找出,然后以此为依据,对与目标图像相对应的像素值进行获取,采用源代码编程处理的方式来实现图像缩放。假设每一个需要求解的像素点都是x,则可以通过其左右相邻两个像素点加权的方式来实现其像素值获取:

62c4f513a33f9_html_d30188d5a7ac4e3b.gif

其中,62c4f513a33f9_html_ebcf4647c0068c27.gif 为像素值;62c4f513a33f9_html_914106308e4312eb.gif 为与之相邻的像素值;62c4f513a33f9_html_57fd5889cf5162ab.gif 为三次插值。假设一个窗口为4*4形式,将一个像素点x和其左右两个像素点(分别是x0和x1)之间的距离用作一个权重,且令62c4f513a33f9_html_8bb5b2bf2d7f46c4.gif ,以此来实现不同s值的获取,然后再通过BiCubic基函数来进行三次插值计算:

62c4f513a33f9_html_a1f238390e7f9165.gif

具体计算中,首先通过上述两个公式对各个4*4形式的窗口纵列进行临时插值像素点的求解,然后再以相同的原理对四个临时像素点加以应用,最后对需要求解的像素点进行像素求解[2]。通过这样的方式,便可达到良好的像素缩放效果。

  1. 轮廓处理

对于调整好分辨率的铭牌图片,需对其铭牌区域局部进行二值化处理,以此来达到良好的图像细化作用。假设参数空间中每一个像素点所对应的曲线焦点为(x,y)且在同一个点相交的曲线数量超出了阈值范围,则可以认定这个图像空间中,这个交点(ρ,θ)与一条直线相对应,其细化公式为:

Ρ=xcosθ+ysinθ

对于细化处理之后的图像,可通过Hough直线来进行检测,借助于Laplacian边缘检测法结果,可对图像进行多边形轮廓的检测,并按照其具体的纹理特征、几何关系、面积尺寸以及长宽比等的约束来将干扰区域剔除[3]。最后再借助于Hongh变换直线对拟合获得的铭牌区域进行四边形轮廓检测,以此来实现铭牌区域的初步定位。

  1. 倾斜校正

因为安装方式与拍摄角度等各方面因素都会导致拍摄的平面图像倾斜变形情况,从而为后续的铭牌字符分割及其识别造成较大难度。基于此,在进行字符风儿之前,首先需要对铭牌区域中的图像做好倾斜校正处理,按照拟合获得的铭牌区域直线,对其四边形定点坐标进行自动选择,并将其用作图像全局透视变换中的参数,让铭牌图像得到良好的倾斜校正。

  1. 名牌匹配模块设计

将模板库里的各种类型铭牌作为依据,首先通过自动识别法进行铭牌类型的匹配是识别,按照样本数量来合理选择识别方式,包括模板匹配和机器学习。其中,模板匹配主要是通过判别分析以及对比的形式,对铭牌的颜色及其纹理特征进行提取,其中的颜色特征主要为颜色均值以及颜色直方图;纹理特征主要为梯度直方图。对比法是对两个图像进行距离函数的建立,采用阈值设定的方式来判定其类型。对于达不到大数据层次的样本量,在设计中,通常会采用传统形式的机器学习法来进行处理,比如神经网络算法以及迭代算法等。

  1. 字符精准定位模块设计

在通过图像预处理以及铭牌匹配之后,便可对铭牌中的文本区域或各个部分字符做出定位,去除其表格线,然后将其中所有的字符区域输出,以此来实现精准定位。在铭牌模板库的构建中,对于每一类标准形式的模板铭牌,都需要进行其版面布局检测,对需要识别的区域进行物理含义的自定义。将连通域分析、形态学滤噪、横向与纵向跳变检测、横向与纵向表格去除、自适应局部二值化、边缘监测、平滑滤噪、灰度化等预处理方式加以合理应用,便可达到良好的字符精确定位效果[4]。图1为字符精确定位流程示意图:

62c4f513a33f9_html_41d72a3f88045134.png

图1-字符精确定位流程示意图

  1. 图像增强模块设计

通过中值滤波法来进行去噪处理,再借助于CLAHE(限制对比度自适应直方图均衡化)的方式进行各个区域中的图像增强处理,接下来再借助于Ostu二值化方法对阈值进行分割处理。通过这样的方式,便可让铭牌字符区域中的局部对比度得以进一步增强,使其局部的细节更具可视性,并达到良好的噪声抑制效果,从而为后续的字符分割识别提供足够便利。

  1. 字符分割识别模块设计

对增强处理之后的精确定位区域字符进行切分识别,将模板信息作为依据对其做进一步的校正处理,再在原图上相应的位置做好字符信息索引。如果字符中带有文字、数字、字母以及其他的特殊符号,应先通过检验知识法使其精度得到进一步提升,然后再将字符宽度及其间距阈值作为依据,通过投影法进行字符分割,最后再对分割之后的各个字符进行归一化处理,让每一张图片中的字符大小及其效果都保持一致。

结束语

综上所述,在对铭牌字符识别系统进行设计与开发的过程中,设计者需要将图像识别技术加以合理应用,通过图像预处理、铭牌匹配、字符精准定位、图像增强以及字符分割识别等各个模块的设立设计来确保其应用效果。这样才可以实现铭牌字符的准确识别,为铭牌记录及其管理工作提供重要的技术支撑。

参考文献

[1]张驯,赵金雄,白万荣,赵红,崔昊杨.基于边界约束图像融合的光学字符识别算法研究[J].红外与激光工程:1-8.

[2]段恩悦.基于深度学习的铭牌文字检测与识别方法研究[D].导师:周洪超.山东大学,2021.

[3]石煌雄,胡洋,蒋作,潘文林,杨凡,张瑞祥.基于深度学习的电气铭牌可变区域识别方法的研究[J].云南民族大学学报(自然科学版),2020(04):350-355.

[4]曹倩倩.电力铭牌图像中的文本检测与识别方法研究[D].导师:茅耀斌.南京理工大学,2020.