基于仿射变换的多姿态人脸识别技术

(整期优先)网络出版时间:2023-11-09
/ 2

基于仿射变换的多姿态人脸识别技术

文戎

  长沙金洲新城投资控股集团有限公司 湖南省长沙市 410600

摘要:随着近些年各种新型智能技术的不断创新,人脸识别技术得到普及应用,为了提高人脸识别精准度,本文立足一种仿射变换的多姿态人脸识别技术,从透视远离与仿射变换出发,实现不同姿态、视角的人脸图像完成归一化处理,变换人脸面部特征关键,与人脸旋转角度结合调整人脸姿态,随后获得虚拟的人脸正面图像,进行变换后对比数据库,这样的技术过程极大的提高了多姿态人脸识别的准确率,希望本文能够为仿真变换人脸识别技术的进一步研究奠定基础。

关键词:仿射变换;多姿态;人脸识别

人脸识别作为计算机图像处理领域的重要研究方向之一,如今已被广泛用于智能安检、移动支付、身份鉴定等领域。将人脸识别用于身份鉴定,与虹膜、指纹这两种识别方式相较之下,人脸识别的人体姿态配合要求不高,具备非侵入式、快速检测、支持远距离识别的优势。但是人脸识别技术难度相对较大,这主要因为人脸特征有着相对较高的复杂度,再加上图像特征极易所受人脸的面部表情、光线敏感以及成像角度和交叉遮挡等多因素影响,因此多姿态人脸识别技术成为各界关注的热门话题[1]。接下来将引入仿射变换对多姿态人脸识别技术展开研究分析,希望能够提高人脸识别精准度,为类似研究提供参考借鉴。

1多姿态人脸矫正

1.1仿射变换

在摄像机和拍摄目标之间的间距,已经远超拍摄物本身大小的情况下,仿射变换可以理解为透视变换过程,常用的二维仿射变换一般是平移、反射、比例、错切、旋转等可变换的组合,二维仿射变换见下列公式(1)。

                                                   (1)

式中:是仿射变换所获结果。

从几何层面定义为两个向量空间所发生的仿射变换、仿射映射,从一个限性变换接上一个平移所组成,包括旋转变换、缩放变换、平移变换三种[2],分别对应变换矩阵公式见下列(2、3、4)。

旋转变换矩阵:                                      (2)

缩放变换矩阵:                                               (3)

平移变换矩阵:                                                (4)

1.2透视原理

三维图形显示的机理是变换图形,需要做到转换几何对象在三维空间的坐标,最终可以呈现于二维屏幕的坐标变换过程,包括几何变换、投影变换、裁剪变换等。透视投影就是从观察点出发,视线之间并不平行,透视投影的几何模型(见图1)。在一些简单的透视投影变换中,由于投影视平面能够取坐标系中一个坐标平面,因此可以使用一个坐标系代表仿射投影变换。那么标记透视投影中心点用表示,平面用XOY表示,假设物体其中一点对应投影点用表示,那么投影线的方程见下列式(5)[3]。

                                                 (5)

式中:t代表参数。

图1 透视投影的几何模型图

2人脸姿态矫正算法原理

2.1旋转变换矩阵

对透视投影远离研究基础上,抽象处理人体姿态旋转投影变换获得几何模型,即可通过几何模型准确分析人脸图像变化,利用仿射变换理论分析人脸旋转投影平面图像,成功矫正多姿态人脸图像。在围绕人脸图像中心发生旋转变换过程中,假设变换角度,那么仿射变换中出现的旋转变化现象,即可通过旋转变换矩阵来调整倾斜人脸图像,以左倾斜情况为例旋转变换矩阵调整公式如下。

                                      (6)

在人脸图像发生水平旋转时,可以以人脸图像鼻尖所在直线作为界线,取左边列坐标数值为负值,右边列坐标数值为正值,之后以列坐标数值正负旋转不同角度,从而压缩一边扩张另一边完成姿态矫正。矫正前期需要分析人脸旋转投影图像,通常可以理解头部为近似圆柱体,面部可以近似视为圆柱体切面,那么面部就可近似视为圆柱体切面。人的面部旋转实则头部旋转,所以可以通过头部旋转横切面模型观察,假设原始图像用S表示,整个图像为m×n大小,平面网格点分别为。将仿射变换结合透视原理,可以推导得出水平旋转人脸图像的矫正方法。

2.2改进SURF多姿态人脸识别算法

通过前期研究SURF能够发现此算法存在一些缺陷问题,主要表现在描述矢量的生成,匹配兴趣点,所以需要针对这两点作出改进。

(1)兴趣点检测

对于平滑处理后所获图像,在所有尺度空间计算此像素点在此处的Hessian矩阵,对矩阵行列值计算后检测兴趣点。令图像内像素值(α,β),那么可得Hessian矩阵作为尺度上的Hessian矩阵,公式表达如下:

                                   (7)

式中:(α,β)处二阶偏导与图像I卷积分别用

表示。

(2)定位特征点与确定主方向

改进特征点匹配,是为了可以有效解决耗时、匹配错误等情况,可以聚类人脸全部特征点,使用SURF算法提取人脸图像的明显聚类,并把对应类之间匹配各兴趣点,此思想能够有效避免模板图形及搜索图像兴趣点描述符矢量之间的间距值计算过程,缩减兴趣点匹配耗时,提高匹配效果。

(3)改进描述符矢量

需要在获取描述矢量过程中,应用特征点周围信息量缺陷,充分利用每一个子块的所有周围信息,改进描述符矢量,对每一个子块均使用3×3模板掩膜,对不同子块对应模板覆盖区域值分别为,将模板掩膜过程中重叠部分去除,即所得新的描述符矢量[4],公式表达如下:

                                     (8)

式中:四维向量用D表示;水平、垂直方向响应分别用dx、dy表示。归一化处理64维特征向量,可得特征点描述符。

(4)最近邻匹配改进

通过SURF自身识别挑选,根据最近邻匹配思想进行寻优,经测试图像、模版图像之间的特征点匹配对数得出结论。此过程的推导公式如下:

                                          (9)

假设实时图像的一点为SA,模版图像的一点位SB,它们的描述子向量为DA,DB,那么DAi,DBi分别作为它们第i个分量,那么PA与PB之间欧氏距离可以定义公式如下:

                                           (10)

将最近邻欧式距离与次近邻欧式距离对比,假若比值在一定阈值范围内,认为匹配正确,否则错误,最优阈值为[0.5,0.6]。

                              (11)

通过对测试图像与不同模版图像的关键点匹配对数完成比较,最终判定匹配点数最多的,即为最终匹配结果。

3基于仿射变换的多姿态人脸识别效果

3.1识别耗时与精度  

在实验前期通过常用FERET人脸库实验,对比本文提出的改进SURF算法,分别进行多姿态人脸识别。(见表1)根据本次实验对比结果,发现本文提出的人脸识别技术提高7%的精准率,证明了改进描述符矢量的作用。并将未改进SURF算法与改进特征点匹配后的算法识别耗时与识别精准率相较,发现本文改进算法的人脸识别精准率明显提升。

表1 多姿态人脸识别耗时与精度

方法

样本总数

识别样本数

识别精准率

原SURF

本文方法

300

300

243

267

81.00%

89.00%

3.2多姿态人脸矫正

本次实验中通过对不同旋转方式、角度所获的人脸图像,使用本文所提方法矫正处理,发现本文方法可以有效矫正不同倾斜角度人脸图像为正面图像。从小角度左右旋转的图像,可以有效调整为近似正面的人脸图像,而旋转角度的不断增加,在矫正之后的人脸图像相比于正面图像,也存在略微偏差。这种现象主要源自于图像矫正过程中,需要压缩所扩张的一边人脸,而旋转角度的不断增加,那么就会相应增大压缩程度,于是就造成了一边人脸变形现象。通过多次实验后发现,本文方法可以控制左右旋转±45°的人脸图像最终矫正效果(见图2)。

(a)正面人脸图像   (b)旋转人脸图像

图2 旋转矫正人脸图像效果

结语

    总之,本文提出基于仿射变换的多姿态人脸识别技术,可以很好的小角度矫正人脸图像,并且有效减少人脸识别耗时,提高人脸识别精准率,降低大约23%的匹配用时。未来可以针对如何使用此方法实现大角度范围的人脸图像矫正进行深入研究。

参考文献

[1] 杨龙,邱雪松,侯雨雷,et al.基于三维亚仿射变换的数字图像置乱技术[J].农业机械学报, 2015, 46(3):366-371.

[2] 马雪梅,刘淼晶.基于仿射变换的分镜头动画图像合成技术研究[J].电子设计工程, 2020, 28(24):5.

[3] 张平梅,金立左,李久贤.基于仿射变换的图像分块拼接方法[J].信息技术与信息化, 2020(1):5.

[4] 彭正赟,李元洁,刘跃遥.基于人脸特征仿射变换的安全性保护[J].信息通信, 2014(12):2.