视觉目标识别技术在固定翼无人机中的运用

(整期优先)网络出版时间:2021-04-14
/ 2

视觉目标识别技术在固定翼无人机中的运用

付鹏 郭田田 熊力涛

河北工程大学 河北邯郸 056000

【摘要】近年来固定翼无人机市场快速发展,视觉目标识别技术作为增加无人机安全飞行的保障也随着技术的发展日新月异。固定翼无人机在飞行过程中,通过其识别设备收集周边环境的信息,从而引导做出相对应的动作指令以达到相应功能。本文针对固定翼无人机的识别设备内部技术框架进行相关算法模拟,分析其运行流程并提出相关建议,以期可以更好的帮助固定翼无人机实现自我调节。

关键词】无人机 视觉目标识别 算法模拟

引言

随着技术的快速发展,需求的日益增长,无人机已经成为专业和个人使用的日常工具。但大量的无人机投入,带给了市场安全和隐私问题。因此越来越多的人希望确保他们能够确定无人机在非敏感地点附近或以不引起严重关注的方式飞行,而这就需要提高无人机其在其他运营环境中的视觉目标识别性能。目前我们的视觉目标检测主要是基于编程软件搭建的深度学习的网络实现的。除了编程外,目标检测还可以使用一些其他的深度学习的框架或者模型。对于一些目标检测的大体框架其实基本都是相同的,都是希望以此来提高固定翼无人机精确的识别技术,降低社会的问责需求。

1研究固定翼无人机视觉目标识别技术的意义

对于人们来说,无人机的快速应用是人们追求美好生活发展的补充,而视觉目标识别技术的发展对于人们来说影响着人们的生活质量和生活水平,所以,视觉目标识别技术的发展与国民生活方式的发展有着十分重要的联系。无人机的快速发展,无论是用于军事来可以保卫国家领土主权安全;还是用于民生工程使人民安居乐业,作用自不多言。不管是用于娱乐和生活,还是应用到更专业的领域,无人机这个工具都发挥了巨大都空间。可以说无人机在警用、城市管理、农业、地质、气象、电力、抢险救灾、视频拍摄等行业用途广泛。而目标识别技术就相当于无人机的眼睛,是无人机快速发展和安全运行的基础,只有精准的目标识别技术,人们才能在物流,工作,信息交流等等所有的系统的组成方面建立完整的框架基础,可以说研究固定翼无人机视觉目标识别技术是促进国民经济发展,生态自然等发展的重要条件,是人类的提高信息化发展的重要体现,也是提高人们的生活水平的关键要素,所以研究固定翼无人机视觉目标识别技术是非常重要的。对于无人机来说,评判一个无人机的优良,其中重要的判断标准就是其视觉目标识别技术水平的高低。视觉目标识别技术的水平也体现出了当前社会的技术发展的高低,是技术前进的指导方向,是体现人们在信息化社会建设方面的重要方向。

2对固定翼无人机视觉目标识别流程的样本模拟

2.1样本模拟条件准备

我们的视觉目标检测主要是基于pytorch搭建的深度学习的网络实现的。除了pytorch外,目标检测还可以使用一些其他的深度学习的框架或者opencv。对于一些目标检测的大体框架其实基本都是相同的。在搭建框架之前,首先是要寻找自己所需要检测物体的训练样本,比如人脸,交通牌等等。大部分的数据集可以在网上找到,如果没有,也可以自己搜集图片做训练集,用某些软件更换成相应的格式。训练集上的数据格式、尺寸要保持一致,其次,寻找的数据尽量要全面。例如:检测一个物体是否是网球,这时训练集要尽量包含各个角度、状态的网球图片。防止过度拟合。我们以手写数字识别为例,使用的网上的MNIST数据集。

2.2搭建训练样本模型

我们实验室使用的深度学习框架是Pytorch。通过torchvision的datasets函数下载数据集,使用torchvision里面的transforms函数,将数据转化为tensor。并将数据集打乱。

训练集处理完成后,开始定义模型,我们采用的是全连接层,由于MNIST数据集并不大,参数并不庞大,一般的设备都可以进行训练,其中包含了3个隐含层,数据输入特征数为28*28,三个隐含层的输出分别为:500,300,200。在每层之间添加一个激活函数,我们这里使用的使ReLU函数,通过继承torch.nn.Module类来定义模型。

其中forward函数实现的就是正向传播,正向传播的计算图如下:




60764159dcbc6_html_8603aa3ce52dffcb.png






图1 forward函数的正向传播

查看网络参数,并创建一个(1,28*28)的tensor进行输出测试:可见输出的tensor的shape为(1,10)。

定义好模型后,开始定义损失函数L(y_hat,y),我们假设模型预测的结果为y_hat,真实的标签为y,损失函数就是用来衡量预测和真实值之间的差距。理想状态下,L值为0,即预测值就是真实值,但是这是无法实现的,所以我们在训练过程中要尽量使L尽可能的小,所以让L对各个参数的导数为零,求得此时的参数值就是我们所要训练的参数。通常使用的损失函数为平方误差(MSE)或者交叉熵(CrossEntropy),并用过torch.nn.optim来创建学习器,我们使用的小批量,所以创建的SGD:

其中的lr是学习率,momentum是动量,weight_decay是权重衰减,我们要做的就是调节这些超参数和学习参数,这些参数也是为了减少模型在训练样本上出现的过拟合现象。

2.3进行样本数据处理和检验

我们开始训练和验证模型。其中optimizer.step是没训练完一次就更新权重并且清零权重的梯度,我们可以通过反向传播(链式求导法则)来更新权重,也就是我们所谓的复合函数求导,通过当前样本的值来确定当前参数的梯度。我们每训练一次,不仅要清零梯度,还要进行测试,

防止出现过拟合。测试结果如下:

60764159dcbc6_html_b4d27261d041740a.png

最后三次的训练结果可见,这个模型的准确率为93%,损失函数最后的结果为0.0015,模型训练完成后,可以保存训练完的参数,便于以后使用,模型可以结和一些硬件,进行算法的落地。

结束语

固定翼无人机具有小体积,轻质量,无污染等优点。无论是在军事用途还是在民事用途上,都得到广泛的应用。而这些的大量发展又离不开视觉目标识别技术的发展,而且基于视觉目标识别技术的目标定位与追踪也是很多固定翼无人机应用领域的关键技术。本文以固定翼无人机的识别技术为实验模拟,对视觉目标识别技术的运行模块方面进行了全面的研究与分析。针对识别技术开发过程中的理论算法进行了阐述与研究。

综上所述,通过对视觉目标识别技术的研究,可以使固定翼无人机的应用可以获得更多有效的环境信息,使得固定翼无人机的自身优势得以发挥,可以实现机动化、快速拍摄的优点,但在使用的过程中,必须要对一些技术性的问题不断进行探讨,这对于提高固定翼无人机的功能拓展具有重要的作用,同时也可以为视觉目标识别技术深入研究提供更好的保障。

参考文献

[1]张志飞. 小型无人直升机视觉定位与跟踪系统的设计与研究[D].浙江大学,2013.

[2]吴显亮,石宗英,钟宜生.无人机视觉导航研究综述[J].系统仿真学报,2010,22(S1):62-65.

[3]王林,彭辉,朱华勇,沈林成.应用无人机跟踪地面目标——最新研究进展[J].系统仿真学报,2010,22(S1):172-177.

[4]张珍. 无人机自主着陆的视觉识别与定位算法设计及仿真研究[D].南京航空航天大学,2008.