基于图像识别对残障领域应用研究

(整期优先)网络出版时间:2022-07-28
/ 2

基于图像识别对残障领域应用研究

仇浩然

宿州学院

 摘要:随着图像处理技术的高速发展,计算机数字图像处理技术在各个领域得到了广泛的应用,推动了图像识别技术的产生和发展,并逐渐成为人工智能领域中重要组成部分,并广泛地运用于面部识别、医疗诊断等等领域中发挥重要作用。目前,基于神经网络的图像识别是一种比较新型的技术,是以传统图像识别方式为基础,有效融合神经网络算法。在此,主要是指采用人工模拟动物神经网络方式的一种神经网络。视觉AI通过让机器学会“看”,代替人眼对图像进行特征提取和分析,并由此训练模型对新的图像数据进行检测、识别等任务,建立能够从图像或者多模态数据中获取“信息”的人工智能系统。

关键词:图像识别;神经网络;人工智能;

引言

 随着人工智能在各个应用层面的深入,残障人士也会成为技术革新的受益者障碍群体的互联网需求呈爆发式增长,企业重视无障碍建设,借助科技的力量最大限度地降低残障所造成的不便。过去,残疾人很难融入公共社会,技术的进步正在改变这种现象。人工智能的发展恰恰可以为这些问题的解决提供新思路,人工智能技术对弱势群体有较强的赋能作用,可以弥补人们的种种缺陷

  1. 图像预处理步骤

图像大小-更高质量的图像为模型提供了更多信息,但需要更多的神经网络节点和更多的计算能力来处理。图像数量-你向模型提供的数据越多,它将越精确,但要确保训练集代表实际人口。通道数-灰度图像具有2个通道(黑白),彩色图像通常具有3个颜色通道(红色,绿色,蓝色/ RGB),其颜色表示为[0,255]。高宽比-确保图像具有相同的高宽比和尺寸。通常,神经网络模型采用正方形输入图像。图像缩放-一旦所有图像都经过平方处理,就可以缩放每个图像。有许多放大和缩小技术,它们可以作为深度学习库中的函数使用。输入数据的均值,标准差-在所有训练示例中,你可以通过计算每个像素的平均值来查看“均值图像”,以获得有关图像中基础结构的信息。

  1. 使用神经网络预测模型

神经网络是称为神经元或感知器的节点的互连集合。每个神经元都会获取一份输入数据,通常是图像的一个像素,然后应用称为激活函数的简单计算来生成结果。每个神经元都有影响其结果的数值权重。该结果将被馈送到其他神经层,直到该过程结束时,神经网络为每个输入或每个像素生成一个预测。多层感知器此过程针对大量图像重复进行,并且网络在称为反向传播的过程中为每个神经元学习最合适的权重,从而提供准确的预测。训练模型后,将其应用于未参与训练的一组新图像以测试其准确性。进行一些调整后,该模型可用于对真实世界的图像进行分类。

  1. 图像理解

给定一幅图像,图象理解程序不仅描述图象本身,而且描述和解释图象所代表的景物,以便对图像代表的内容作出决定。

首先进行信息的搜集和处理,再将这些信息进行分析和加工,最后控制到输出设备中。并由此训练模型对新的图像数据进行检测、识别等任务,建立能够从图像或者多模态数据中获取“信息”的人工智能系统,当这些AI智能设备看懂、理解了这个世界,就能给帮助人类在生产和生活中,提升处理信息的效率。通过扫描的位置和地图数据,在找到最佳路线之后,会利用语音和触觉技术引导至目的地。残障人士在行走的过程中,还能通过视频和其他传感器获得的周围人的行为、障碍物等信息,给出行动指令。

3.1图像分析的基本过程:图像理解是一门交叉学科,作为图像理解的低层数据的是视觉信息,理论出发点是计算机视觉,作为图像理解的高层数据是知识信息,理论依据出发点是人工智能。从研究的广泛性看,图像理解的处理信息分为视觉数据信息和人类知识信息两部分,前者侧重原始获取的数据信息以何种结构存储在计算机中,后者侧重知识的表述如何指导计算机的理解过程,两部分表示相辅相成。图像理解中对视觉信息和知识信息的研究过程就是进行信息表示、处理和分析的过程,图像理解中包含了一泛的信息流,从视觉硬件采集设备获取到的二维阵列仅是信号描述,进行取样采集形成面向计算机的数据信息,形成像素点集,完成了场景图像的获取再通过图像处理技术在原始像素的基础上提取出视觉特征并存储入计算机,基于学习算法和相应理论进行机器学习,进行图像理解中的日标识别、场景分类等了任务,形成知识并存入计算机。

4.拟解决的关键问题:

4.1.图像采集:前期需要大量地采集图像,然后需要将图像进行预处理,比便获得更好的分割效果,包括去噪、锐化、灰度化。其中对图像的边缘提取与图像分割,有利于提取出的轮廓和动作特征等。接下来是特征提取,通过大量的图片让计算机统计学习,使其可以将采集到的图像转化为汉字输出。同时,对于采集的图像进行去噪也十分的重要,因为通常情况下采集到的图片会受到相机镜头、周围环境的干扰的影响,且通过摄像头采集到的的图像,由于光线不均匀等因素,会使得采集到背景区分度不高,造成之后的难以提取和信息丢失。因此,在图像被使用之前需要用滤波器除去噪声。

4.2图像的调整处理.

其次,在图像生成与传递过程中会使视频图像变得模糊,轮廓也会变得很模糊,为了增补图像的轮廓,加强边缘部分,改善图像的视觉效果,就需要使用图像增强的方法,即锐化的处理方法。接下来通过色彩空间转换,将RGB的彩色图像转化为灰度图像。可以按照图像的灰度特性,将其分为背景和目标两部分从而进行分割。为了可以达到对图像精准的分割,前期的除噪、预处理和锐化工作十分的重要.

结束语基于数字图像处理的手势识别可以被广泛的应用在许多公众场合,例如医院餐厅银行等场所针对严重低视力或全盲者,可提供非视觉信息替代方式,用其他感官功能获取信息,以弥补视觉信息障碍。例如消除信息环境障碍涉及网络无障碍、应用软件和操作系统无障碍、公共信息设施无障碍等方面具有重大意义。

参考文献:

 [1]王强,张小溪,韩一红.基于神经网络的图像识别[J].电子设计工程,2012.20(9)
[2]王丽.基于生物特征的机器人图像理解思维过程基础研究[D].中国优秀博硕士学位论文全文数据库,2007.
[3]杨彬蔚,张怡芳.基于图像视觉特征与LDA模型的取景图像识别[J].计算机与现代化,:,2011.189(5)
[4]彭淑敏,王军宁.基于神经网络的图像识别方法[J].电子科技,2005.(184)       
[5]张弛.基于机器视觉的智能控制与图像识别问题研究[D].中国学位论文全文数据库,2009.