基于深度学习的图像识别与分类算法研究

(整期优先)网络出版时间:2023-11-15
/ 2

基于深度学习的图像识别与分类算法研究

揣瑞

(中国铁路乌鲁木齐局集团公司信息技术所,新疆 乌鲁木齐 830023)

摘要:在深度学习技术迅速发展的背景下,各方对图像识别效率及准确率的需求也有所提升。所以,为更好地使用深度学习图像识别算法与分类算法,可运用多层神经网络,对图像信息进行理解及分类,以满足文字识别、人脸识别、物体识别以及车牌识别等场景要求。基于此,本文结合实际思考,首先简要分析了基于深度学习的图像识别与分类算法相关机理,其次阐述了基于深度学习的图像识别与分类算法分析。

关键词:深度学习;图像识别;分类算法

引言:随着高新技术的不断发展,日常生活中的语音、文字等信息载体逐渐被视频、图像等超媒体信息形式所替代,使神经网络的图像识别与分类算法应用于人们的生活当中。同时,深度学习的图像识别与分类算法也有了新的突破,使图像识别领域迅速拓展,进而依靠深度学习的方式,完成对图像特征的分层提取,实现对海量数据的分类,以得到人们想要的准确数据结果,解决很多实际问题。

一、基于深度学习的图像识别与分类算法相关原理

(一)深度学习

深度学习作为机器学习领域中一个新方向,其中涵盖了机器学习的内容,更接近于人工智能。它以学习样本数据内容为基础,研究其表示层次及内在规律,在学习阶段检索信息内容,如图像、文字以及声音等,并且依靠数据解释,给人们在工作领域一定的帮助。它最终的工作目标是使机器能够具备和人一样的思维,让其具有识别图像、文字、声音的学习能力。

通过深度学习的方式,在图像以及语音识别等多领域取得良好效果,甚至在数据挖掘、信息搜索、机械翻译、机器学习以及多媒体学习等领域内取得优秀成绩。

(二)图像识别及分类算法

图像识别及分类需运用计算机技术完成对图像内容的解析,同时对其进行分类。在人工智能领域,图像识别更可作为基础性的技术,其不仅可应用于工业、交通、医学以及军事等领域内,还可以应用于实际生活当中,使它可以取得良好的前景[1]

深度学习图像识别算法依靠循环神经网络(RNN)和卷积神经网络(CNN)模型实现工作,前者更倾向于序列化的动态图像领域,而后者则可应用于静态图像领域。如:RNN会从时间序列出发,通过神经网络结构的创建,在动态图像场景中执行图像识别工作。RNN将上一阶段的时间信息传递到如今时间范畴内,可以实现对此刻数据及历史数据的处理。而CNN需增加在局部信息、全局信息方面的考虑,整合池化层、卷积层、全连接层的内容。在训练时运用卷积核执行对图像的抽取操作,让池化层中的特征图能够变小,从而依靠全连接层,在标签空间中进行映射[2]

深度学习分类算法,则需要通过深度学习技术的应用,建立分类器,运用学习训练数据实现对新数据标签的预测,神经网络分类算法中包含了深度神经网络(DNN)、卷积神经网络以及循环神经网络这三项内容。

二、基于深度学习的图像识别与分类算法分析

(一)深度学习的图像识别与分类程序设计

深度学习图像识别与分类算法,重点在于通过深度学习的方式,实现对图像内容的精准识别与分类,所以,为满足深度学习框架的要求,可生成图像识别与分类的模型,采用以下流程,实现对程序的设计。

1.数据信息的预处理

通过数据内容的整合,形成标注图像的数据集合,凭借电脑端完成预处理操作,使已经完成与处理的图像内容,可进行灰度化、缩放、裁剪等操作,以实现对图像内容的归一化处理[3]

2.模型的构建

深度学习模型的建立,是依靠卷积神经网络,掌握具体的分类及识别需求,以设计结构模型,在模型中增加池化层、卷积层、全连接层的应用,使其可以合理地进行排序。

如:基于神经网络掌握输入层、输出层及隐藏层的情况,我们采用神经网络计算的方式,确认神经网络中的基本单元,确认它所接受的信号,让各方信息能够顺利传递到其他神经元中,公式如下:

其中a为神经元输出;g为激活函数;为第i个信号输入权重;为第i个输入信号;b为偏置。同时,若模型中接收到了多个输入信号,则非线性变化图如下。

图一神经网络非线性变化图

3.模型训练

将已经完成预处理的图像数据内容,应用于图像输入模型当中,以凭借精准的计算方式,得到准确的输出结果,让其与标注结果相互比较,以得出反向传播算法的模型参数。同时,在训练的过程中,应增加对优化器以及损失函数的了解,以保证识别与分类工作的准确性有所提高。

4.模型调整及评估

结合模型中数据内容的使用情况,形成交叉验证集,让工作人员可以对模型进行评估及分析,以保证计算识别以及分类工作的准确性。同时,也应设置召回率等指标内容,运用结果评估的方式,实现对模型的优化以及调整。这样,则可提高训练数据的利用率,实现对模型参数的调整。

5.模型的使用

在模型经过优化及训练后,才能结合系统汇总的要求,了解模型所具备的分类任务及识别功能。用户在电脑端增加待识别图像的应用,使得模型能够输出对应的识别结果。

(二)基于深度学习的图像识别的主要研究对象

  1. 人脸识别

运用深度学习图像识别算法,实现对人脸图片的处理,让工作人员凭借系统整合人脸特征等多方信息,以实现快速的匹配识别。这样,则可让图像识别技术能够广泛应用于零售、安检、公安、金融等领域内。同时,可采用带有训练的数据内容,整合图片、视频以及照片,让神经网络完成所需数据集的获取操作,以增加外观感知性。如:运用深度学习图像识别模型,检测人体姿势,进行人脸识别工作。

  1. 物体识别

基于人工智能的角度进行思考,让物体识别技术能够应用于人机交互、自动驾驶、图像搜索等工作当中,利用深度学习图像识别算法,使其可以在物体识别领域内取得良好的成果,使图像识别的准确率可提升至90%以上。例如:通过深度学习图像识别的方式,运用算法将好与坏的样本数据进行整合,保证在模型创建环节能够增加隐藏层,使深度学习阶段能够增加机械学习工具的应用,让工作人员在执行自动驾驶等环节,自动标记数据以完成好坏样本的注释。

  1. 车牌识别

采用深度学习图像识别算法,将其顺利在车牌识别工作中进行应用,可精准地识别到车牌字符,完成高精准度的识别操作。而在高速公路收费、路面监控、城市智能交通等领域内,此技术已经得到了广泛地应用。

(三)基于深度学习的分类算法

  1. 循环网络

在连接图内定向进行循环,方便相关人员了解图像检索环节的初始位置,利用循环网络实现对序列数据的处理。如此,增加前面输出序列与当期序列之间的关联,使网络根据记忆完成对当前输出信号的计算。

  1. 前馈神经网络

其中第一层为输入,而最后一层为输出,若存在的隐藏层较多,则可改变样本的相似性,让神经元活动为前一层的非线性函数。

  1. 对称连接网络

对称连接网络和循环网络相似,其中各个单元之间是具有关联的,呈现出对称的关系。若将其与循环网络相比较,对称连接网络更容易进行分析,但其中限制性因素较多,其必须根据能量函数定律中的要求,实现网络的对称连接。

(四)基于深度学习的图像识别和算法在铁路防洪中的应用

1.采集现场数据。通过RTSP取流和视频分帧预处理方法对各工务段、基础设施段共152处摄像头的图像进行了采集,收集了约3万张现场图像数据。

2.建立科学算法模型。通过对现场约3万张图像运用Labelme进行训练数据集标注、json文件转换,利用加雾、调整亮度等数据增强方式完成了图像数据集构建,运用Mask R-CNN基于以上数据集进行模型训练、优化和调试,最终形成防洪视频分析与检测数据模型。

3.数据模型验证。为了检测模型准确性,建成了沙盘模拟环境,先后20余次对模型进行模拟水、异物等遮挡测试,期间模型准确率达到99%。经现场搭建环境,多次进行实地人物遮挡测试和模型优化,准确率达到99%。经过实验室和现场场景反复验证后,选出最优模型部署至防洪智能分析平台,投入到各工务段进行现场防洪预警。

结论:综上所述,深度学习的图像识别与分类算法运用多层神经网络的组合,使图像内容自行分类及处理并在各行业顺利应用。同时,随着技术的不断进步,算法模型更加完整,必将越来越普及和实用。

参考文献:

[1]杨丽君. 基于深度学习的机场飞行区活动目标图像识别与分类研究[D].中国民用航空飞行学院,2022.

[2]段傲,李莉,杨旭. 基于AlexNet的图像识别与分类算法[J]. 天津职业技术师范大学学报,2022,32(01):63-66.

[3]李培松. 基于CNN的高光谱遥感图像识别与分类研究[D].西安石油大学,2021.