目标监测与跟踪技术的监测及实现

(整期优先)网络出版时间:2022-07-28
/ 2

  目标监测与跟踪技术的监测及实现

李雪,刘同涌,崔世恒,张博钧,毕铭毅,王若成

山东协和学院,山东济南 250109

摘要:随着模式识别和人工智能的高速发展,多目标图像检测技术得到国内外社会各界的广泛的关注和深入研究。检测率的高低和实时性的好坏是图像检测识别技术的最主要的两个性能指标,也是该技术目前所要研究突破的方向。本文介绍了目标跟踪系统,四类目标跟踪算法,与智能视频监控场景下的人体多目标跟踪技术研究,

关键词:多目标跟踪、人体实时监测、关键点检测

一、引言

由于图像检测技术一直受限于目标形态的多样性,目标的遮挡问题以及背景复杂度或外部环境等诸多影响,从而对降低了检测速度和精度。实验表明本文通过检测多场景人体跟踪算法具有很好的鲁棒性与跟踪效果。

二、目标跟踪系统

  视觉目标(单目标)跟踪任务是在给定某视频序列初始帧的目标大小与位置的情况下测后续帧中该目标的大小与位置利用遮挡前n帧图像二次拟合的位置作为观测值跟踪流程:

    输入初始化的目标框,用于框出初始帧中的目标,在下一帧的图像中产生尽可能多的候选框(Motion Model)提取这些候选框的特征(Feature Extractor Model),然后对这些候选框评分(Observation Model)选择得分最高的候选框作为这一帧图像预测的目标框,或者对多个预测值进行融合(如取平均值),得到更优的预测目标框。

将出现在视频里的每个候选框上单独评估卷积网络过滤筛选已生成的目标候选框调整并输出结果。将Cascade-RCNN的输出结果进行目标分类选择两个全连接层。选择IOU最大N(出现在视频中的目标数)个候选区域进行非极大值抑制处理。

卷积神经网络的引入提高了行人检测算法的性能,但遮挡问题仍然是行人检测的一大难点。有文献【Deep learning strong parts for pedestrian detection】使用联合学习方法对不同的行人遮挡模式进行建模,但其检测框架复杂且无法穷尽所有情况。【Repulsion Loss: Detecting Pedestrians in a Crowd】设计了一种新的损失函数,使预测帧与目标真实帧保持接近,同时远离其他真实帧。这种方法处理遮挡更灵活,更容易实现。【Occlusion-aware R-CNN: Detecting Pedestrians in a Crowd】结合了上述两种思想,提出了一个组件遮挡感知单元和一个聚合损失函数来处理行人遮挡问题。【Bi-box Regression for Pedestrian Detection and Occlusion Estimation】通过引入新的监督信息(行人可见区域的边界框)来处理遮挡,思路是用两个分支网络分别返回行人的全身框架和可见区域的边界框,最后合并两个分支的结果,提高检测性能。

三、目标跟踪算法可分为四类

基于主动轮廓的跟踪,基于特征的跟踪,基于区域的跟踪,基于模型的跟踪。

(一)基于主动轮廓的跟踪

使用Snake模型,首先将分割得到的目标物体边界作为跟踪的初始模板(初始帧目标轮廓),然后确定表示物体真实边界的目标函数,通过降低目标函数值使初始轮廓逐渐向目标物体真实边界移动。其特点是不需要考虑来自图片的灰度信息,考虑整体轮廓信息,可靠性强,但是寻优过程计算量大,而且不适合形变交大的运动物体。

(二)基于特征的跟踪

不考虑整体特征,只根据目标图像的一些显著特征进行跟踪,可以是单一的特征也可以是多个特征的融合。特征提取时选择具有直观意义,有较好分类能力,计算简单,不随突图像漂移改变而改变的特征如纹理,颜色,质心,角点等。特征提取的目的时特征匹配,根据提取方法选择对应的匹配方法。该方法能够有效应对尺度变化,形变,部分遮挡等现象。

  (三)基于区域的跟踪

其目的时得到包含有目标的区域,方法时先定义包含有目标的区域模板,可以是略大于目标的矩形,也可以是不规则的形状,该模板可通过图像分割获得或预先人为确定,然后通过相关算法进行目标跟踪。当目标未被遮挡时精度较高,若目标发生形变或被遮挡则精度下降甚至造成目标丢失。

(四)基于模型的跟踪

先用一定的先验知识,对要跟踪的目标建立模型,然后通过匹配跟踪目标对模型进行实时更新。这种方法观测视角的影响,具有较强的鲁棒性,模型匹配跟踪精度高,适合于机动目标的各种运动变化,抗干扰能力强,但由于计算分析复杂、运算速度慢,模型的更新较为复杂,实时性较差。

(1)目标尺寸不一

实际场景下需要检测的物体大小不相同,尤其是小目标的检测,一直都是目标检测技术中的难题之一。

(2)目标的多变性

在计算机视觉的应用中,目标的形态多变不一,同时也会出现一些形变、遮挡或模糊等其他问题,这对目标检测器而言无一不是一个巨大的挑战,不仅需要大量的训练样本,而且需要提取优异的特征。

(3)精度与帧率的权衡

有一些目标检测算法具有很高的精确率与召回率,但是实时性较差。在实际应用时又必须满足一定的实时性,因此对算法改进使得算力受限的嵌入式端实现准确快速的检测是重要研究的问题,也是一个难题。

四、智能视频监控场景下的人体多目标跟踪技术研究

本文针对智能视频监控场景下跟踪目标数量众多、特征不够明显等问题,提出了一种基于结构约束的多目标匹配跟踪算法,即根据上一帧中成功跟踪的目标的相互位置关系,在当前帧的检测结果中来寻找与跟踪目标最相似的目标框,同时也通过一定的权重来考虑目标之间的外观相似度、深度神经网络特征相似度、颜色直方图相似度和尺寸相似度等。实验结果表明,结构位置约束是这几种相似度中最有效的一种衡量尺度。另一方面,通过对跟踪目标的历史信息进行记录和预测,实现在一定的丢失范围内可以对目标进行找回,比如目标被短暂遮挡又重新出现的情况。实验结果表明,本文提出的基于结构约束的多人体目标跟踪

本文还针对监控场景下跟踪目标多、特征不明显等问题提出了一种基于结构约束的多目标跟踪算法。由于监控场景下,目标分辨率低,特征提取较困难,难以得到稳定可靠的特征表示,所以本文提出了根据跟踪目标之间的相对位置关系,即结构约束,来进行数据关联匹配,而把颜色、尺寸等外观特征放到了次要的位置。另一方面,通过跟踪目标的管理,根据目标运动模型对丢失目标进行短暂地预测,在目标再次出现时能够及时地将目标跟原本的跟踪轨迹连接起来,提高了对于短暂遮挡情况的鲁棒性。最后通过和另外两种算法的对比实验,证明了我们的算法在目标特征改变时具有更好的稳定性。

五、总结

目前,在来自各方面各领域各行业的需求的积极推动促进下,特征检测识别技术正在不断的深入改进发展、推陈出新、蓬勃发展。可以预计,在不久的以后,各种特征检测识别技术,将密切应用到人类的日常生活上、工作上,对人类社会将产生革命性的巨大影响。通过以上方法能够很好的进行运动目标的检测与跟踪。

参考文献

[1]李慧霞,李临生,闫庆森,周景文.基于MeanShift算法的目标跟踪
综述[J].计算机与现代化,2017(01):65-70。

[2]王海,徐岩松,蔡英凤,等.基于多传感器融合的智能汽车多目标检测技术综述[J].汽车安全与节能学报,2021,12(4):16.

[3]郑淋萍,王斌,刘华巍,等.复杂背景下结合颜色和分形特征的多目标检测[J].上海师范大学学报:自然科学版,2020,49(1):7.

作者简介:

李雪(2002.4-)山东德州人,专科,计算机应用技术

刘同涌(2002.12-)山东枣庄人,本科,计算机科学与技术

王若成(1973.3-)指导教师,山东金乡人,硕士研究生,副教授,主要研究计算机应用技术