Print

发布时间: 2017-11-16
摘要点击次数:
全文下载次数:
DOI: 10.11834/jig.170304
2017 | Volume 22 | Number 11




    图像分析和识别    




  <<上一篇 




  下一篇>> 





双空间局部方向模式的人脸识别
expand article info 杨恢先1, 刘建1, 张孟娟1, 周彤彤2
1. 湘潭大学物理与光电工程学院, 湘潭 411105;
2. 湖南应用技术学院机电工程学院, 常德 415000

摘要

目的 针对传统局部方向模式(LDP)在特征提取的充分性、对光照和噪声等的鲁棒性以及识别时间长短这3方面不能同时取得一个很好的平衡效果,提出了一种双空间局部方向模式(DSLDP)的人脸识别方法。方法 首先,将图像3×3邻域像素灰度值与8个Kirsch模板算子卷积,得到8个方向的边缘响应值,然后,将近邻边缘响应值之间相应作差,对应8个方向的边缘响应差值,将两组值取绝对值,取各自最大值的方向编码成一个二位八进制数,产生DSLDP码。最后,在人脸描述阶段将人脸图像进行分块并把每块转换成DSLDP图,再对DSLDP图进行直方图统计,并利用信息熵对每块进行加权,将所有子块的直方图连接生成人脸特征,再通过PCA进行降维,用最近邻分类器分类识别。结果 在剑桥大学Olivetti实验室(ORL)、Aleix Martinez and Robert Benavente(AR)和中国科学院(CAS-PEAL)的人脸图像数据库进行实验,相比局部方向模式(LDP)、显著型局部方向模式(SLDP)、增强型局部方向模式(ELDP)、局部方向数字模式(LDN)、差值型局部方向模式(DLDP)、中心对称局部方向模式(CSLDP)和梯度中心对称局部方向模式(GCSLDP),DSLDP具有更好的识别性能。5幅测试样本时,在ORL库上取得了97.82%的平均识别率,在AR光照、表情、遮挡A和遮挡B库分别取得了98.00%、98.33%、99.33%、87.67%的平均识别率,在CAS-PEAL光照、表情和饰物库分别取得了99.33%、95.33%、90.00%的平均识别率。结论 1)该方法既考虑了近邻边缘响应值的外在变化,也考虑了近邻边缘响应值之间的内在变化,通过将强度空间和梯度空间人脸特征信息结合使人脸特征得到更加充分的提取。2)DSLDP只考虑邻边缘响应值和边缘响应差值的最大值情况,突出了主要边缘梯度信息,同时又避免了不重要信息的干扰,相比同类基于局部方向模式的单一人脸识别算法,对光照、表情、噪声、遮挡等情况表现出更强的鲁棒性。3)DSLDP码是由二位八进制数构成,特征模式数降低到64,识别时间明显降低。因此,DSLDP算法能同时在识别效果,稳定性和识别时间上取得一个较好的平衡效果。

关键词

局部方向模式; 双空间局部方向模式; Kirsch算子; 信息熵; PCA; 最近邻分类器; 人脸识别

Face recognition based on double-space local directional pattern
expand article info Yang Huixian1, Liu Jian1, Zhang Mengjuan1, Zhou Tongtong2
1. Physics and Optoelectronic Engineering College, Xiangtan University, Xiangtan 411105, China;
2. Mechanical and Electrical Engineering College, Hunan Institute of Applied Technology, Changde 415000, China

Abstract

Objective The rapid development of face recognition has made obtaining face feature information a major research area.Local feature representation can depict the local feature information of the face in much detail.Therefore, local feature representation is widely applied in facial feature extraction.At present, the local binary pattern algorithm is the most widely used.However, LBP still exhibits some defects that are insensitive to illumination changes and noise.The local directional pattern algorithm obtains the edge gradient value by convolving the local neighborhood, which is more stable than pixel value of LBP.LDP has more advantages than those of LBP.Therefore, LDP is developing rapidly in recent years.However, the traditional LDP algorithm cannot exert a good equilibrium effect on three aspects, i.e., sufficient feature extraction, robustness to noise and illumination, and short recognition time, at the same time.This study presents a novel approach based on double-space local directional pattern (DSLDP) algorithm for face recognition to solve the previously mentioned problems.The DSLDP algorithm can exert a good balance effect on three aspects, i.e., feature extraction, stability, and recognition time. Method First, each 3×3 neighborhood pixel of the facial image gains eight edge response values by convolving the local neighborhood with eight Kirsch template operators.Eight Kirsch masks represent the eight directions of the eight sides, i.e., east, west, south, and north corresponding to the linear edge and northeast, northwest, southwest, and southeast corresponding to the line edge.Then, the difference of each pair of neighboring edge response values is calculated to form eight new difference directions.DSLDP utilizes the direction of the largest absolute value edge gradient value of each sub-neighborhood.The two directions are encoded into a double-digit octal number to produce the DSLDP code.Finally, the face descriptor is represented using the global concatenated histogram based on the DSLDP map extracted from the face image, which is divided into several sub-blocks.Sub-blocks are weighted by information entropy.The face dimensions are reduced by principal component analysis.The nearest neighbor classifier is used to classify the faces.Then, the identification results are obtained. Result The face representation method is compared with recently developed algorithms, such as LDP, significance local directional patterns, enhanced local directional patterns, local directional number patterns, difference local directional patterns, center of symmetry local directional patterns, and gradient center of symmetry local directional patterns.The experimental results of the ORL, AR, and CAS-PEAL face databases show that the DSLDP algorithm exhibits better recognition performance than that of the other algorithms.The average recognition rate of the DSLDP algorithm is 97.82% on the ORL database with five test samples.The average recognition rate of the DSLDP algorithm on the AR illumination, expression, shelter A, and shelter B databases are 98.00%, 98.33%, 99.33%, and 98.33%, respectively.The average recognition rate of the DSLDP algorithm on the CAS-PEAL illumination, expression, shelter databases are 99.33%, 95.33%, and 90.00%, respectively. Conclusion 1) In the aspect of face feature extraction, the method considers not only the change in the inner edge response values but also the change in the outer edge response values.The method also fully utilizes face information extracted in the strength and the gradient spaces.2) In terms of stability, compared with other single face recognition algorithms based on LDP, the DSLDP algorithm only considers the maximum of edge response and difference edge response values.The DSLDP algorithm highlights the main edge gradient information and avoids the interference of unimportant information.Therefore, the algorithm shows strong robustness to the variations in posture, illumination, noise, and facial expression.3) In terms of recognition time, the DSLDP code is made up of a double-digit octal number; thus, the feature model number is reduced to 64 and the recognition time is obviously decreased.Therefore, the LDP algorithm can exert a good balance effect on three aspects, i.e., face feature extraction, stability/robustness, and recognition time, at the same time.The algorithm is proved to be effective.

Key words

local directional pattern; double space local directional pattern; kirsch operator; information entropy; principal components analysis; nearest neighbor classifier; face recognition

0 引言

近年来,人脸识别已经成为生物识别领域的研究热点,由于人脸识别其自然性和不被被测个体察觉特点,已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域[1]。人脸识别技术主要包括特征提取、特征变换和分类器设计等方面,提取有效特征是人脸识别算法关键。因此,如何有效获取人脸特征信息是人脸识别研究重点[2]

根据人脸表示数据的空域特性,可将人脸描述方法分为基于全局特征[3-5]和基于局部外观特征两大类。全局表示方法对光照、姿态、表情以及遮挡等复杂变化比较敏感。局部表示方法由于刻画了局部更细节的纹理信息,对光照、姿态、表情复杂变化往往表现得更为鲁棒。其中局部二值模式(LBP)[6]的特征提取方法在纹理分析和人脸识别应用中取得了显著的成果,并涌现出很多新的改进方法[7-9],但对光照变化和噪声比较敏感。为了克服LBP算子的缺陷,Jabid等人[10]提出一种基于局部方向模式(LDP)的人脸特征表示方法,但存在识别效果不佳和识别时间长等缺点。为了提高识别效果,钟福金等人[11]提出的采用两个3×3子邻域的井型邻域的局部方向模式和朱明旱等人[12]提出的一种采用16邻域和24邻域两种边缘模板的局部方向模式,但多尺度多半径特征提取增加了识别时间。吴迪等人[13]提出一种显著型局部方向模式(SLDP)和深度学习的人脸识别方法,首先显著型局部方向模式算法对两组梯度值取平均,区分度会降低;其次结合深度学习会使识别效果增加,但识别率增加不明显,并且识别时间会很长。李照奎等人[14]提出一种基于差值局部方向模式的算法(DLDP),不仅模式数高,而且只是单一的考虑近邻边缘响应值之间的强度变化,造成识别时间长和识别效果不佳。为了降低识别时间,Zhong等人[15]提出一种基于增强型局部方向模式(ELDP)的算法,由于只考虑最大和次最大边缘响应值情况,忽略了负值情况下人脸信息。Rivera等人[16]提出一种基于局部方向数字模式(LDN)的算法,只考虑最大与最小边缘值情况,在人脸信息的提取上能力有限。为了同时降低识别时间和增加识别效果,作者课题组[17]曾提出一种基于中心对称局部方向模式的算法(CSLDP),由于考虑了原始数据空间人脸信息,人脸特征虽然更加完善,但对噪声和光照情况的稳定性降低。王晓华等人[18]提出的一种梯度中心对称局部方向模式(GCS-LDP)的算法,在强度空间编码时,采取中心对称模式方法,提取的是方向信息,存在提取信息不完全和稳定性差等问题。

为了解决传统LDP算法在识别效果、稳定性和识别时间难以取得平衡的问题,本文提出的一种双空间局部方向模式(DSLDP)人脸表示方法。首先,将图像3×3邻域像素灰度值与8个Kirsch模板算子卷积,得到8个方向的边缘响应值,然后,将近邻边缘响应值之间相应作差,对应8个方向的边缘响应差值,将两组值取绝对值,取各自最大值的方向编码成一个二位八进制数,产生DSLDP码。最后,在人脸描述阶段将人脸图像进行分块并把每块转换成DSLDP图,再对DSLDP图进行直方图统计,并利用信息熵对每块进行加权,将所有子块的直方图连接生成人脸特征,再通过PCA进行降维,用最近邻分类器分类识别。

1 DSLDP

1.1 DSLDP分析

传统的LDP算法在特征提取的充分性、对光照和噪声的鲁棒性以及识别时间长短上不能同时取得一个很好的平衡效果。正是基于这3个方面,提出了DSLDP算法。1) 在特征提取方面:将图像3×3邻域像素灰度值与8个Kirsch模板算子卷积,再将近邻边缘响应值之间相应作差,该方法既考虑了近邻边缘响应值的外在变化,也考虑了近邻边缘响应值之间的内在变化,通过将强度空间和梯度空间人脸特征信息结合使人脸特征得到更加充完整的提取。2) 在稳定性方面:将邻边缘响应值和边缘响应差值取绝对值,取各自最大值的方向,只考虑两组最大值的情况,突出了主要边缘梯度信息,同时又避免了不重要信息的干扰,并且取绝对值可以将卷积后和作差后负值情况也考虑到,使人脸信息不遗漏。3) 在识别时间上:DSLDP码是一个二位八进制数,模式数为64,相比已有同类算法,特征维度基本相当。

DSLDP算法具体步骤如下:首先,将图像3×3邻域像素灰度值I与8个Kirsch模板算子[10]卷积$ M_a $($ a $=0,1,2,3,4,5,6,7),得到相应8个方向的边缘响应$ M_a $($ a $=0,1,2,3,4,5,6,7),对$ M_a $取绝对值,再确定最大值对应的位置编号。具体计算公式为

$ {m_a} = I * {M_a} $ (1)

$ a = \arg \;\min \left\{ {\left| {{m_a}} \right|} \right\}, 0 \le a \le 7 $ (2)

式中,I表示输入图像,$ M_a $表示第$ a $个Kirsch模板算子。其次,将近邻边缘响应值$ M_a $之间按照一定顺序相应作差,得到相应8个差值$ n_b $($ b $=0,1,2,3,4,5,6,7),同样也相应的对应到8个方向,取最大差值的绝对值对应$ b $值大小进行编码。计算方法为

$ {n_b} = \left\{ {\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} {\left| {{m_{a + 1}}-{m_a}} \right|}\\ {}\\ {\left| {{m_0}-{m_7}} \right|} \end{array}}&{\begin{array}{*{20}{c}} {a = 0, 1, 2, 3, 4, 5, 6;}\\ {b = 0, 1, 2, 3, 4, 5, 6}\\ {c = 7\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;} \end{array}} \end{array}} \right. $ (3)

$ b = \arg \;\min \left\{ {\left| {{n_b}} \right|} \right\}, 0 \le b \le 7 $ (4)

式中,$ M_a $表示第$ a $个边缘响应值。$ n_b $表示第$ b $个边缘响应差值。最后,分别将$ a $$ b $两个八进制数值串接成一个两位八进制数,即像素点$ x $的DSLDP编码值。这个两位八进制数转换成十进制数,即

$ D\left( x \right) = a \times {8^1} + b \times {8^0} $ (5)

式中,D($ x $)是DSLDP编码值,$ a $是最大边缘响应值$ \rm{m_a} $的索引下标,$ b $是最大边缘响应差值$ n_b $的索引下标。可知,DSLDP共有64种模式。如图 1所示通过例子具体的展示了DSLDP的编码过程。

图 1 DSLDP的编码过程
Fig. 1 DSLDP encoding process

1.2 DSLDP编码的稳定性

LDP算法是将3×3邻域图像子块与8个Kirsch算子卷积后取绝对值取前3个最大值;LDN算法是将3×3邻域图像子块与8个Kirsch算子卷积后不取绝对值直接取最大边缘响应和最小边缘响应对应的位置方向;ELDP算法将3×3邻域图像子块与8个Kirsch算子卷积后不取绝对值直接取最大边缘响应和次边缘响应的位置方向;DLDP算法是将3×3邻域图像子块与8个Kirsch算子卷积得到边缘响应值,再将近邻边缘响应值之间按照一定顺序相应作差取绝对值取前3个最大值;都可以看出在一个空间上,编码都要考虑比最大值的情况,但是DSLDP直接取最大值,所以当噪声、遮挡、光照、表情影响最大值对应的位置时,其他值一定已经发生变化,但是其他值位置发生变化时,最大值对应位置不一定变化。也就是LDP、ELDP、LDN、DLDP算法编码变化时,DSLDP不一定变化,但是DSLDP编码变化时,其他算法一定也发生了变化。CSLDP是将人脸图像3×3子邻域与8个Kirsch算子卷积得到8个边缘响应,比较邻域内以中心像素点为中心对称的边缘响应大小,GCSLDP算法也采用同样方式,都存在:1) 当对应的两个卷积值很接近时,CSLDP的编码是很不稳定的,差值在正与负之间徘徊,编码是波动的。2) 边缘响应值反应图像的纹理信息,当最大的两个边缘响应值都是正值时,其差值不一定大于其他正边缘响应与负边缘响应的差值;当最大的两个边缘响应值都是负值时,差值不一定大于其他负边缘响应和正边缘响应的差值,所以很难将人脸特征通过编码反应出来。所以CSLDP和GCSLDP算法会存在提取信息不充分,稳定性差等问题。

通过图 2例子来验证DSLDP的稳定性。图 2中将原始图像块第3行数据都增加5表示光照变化,分别将第1行和第1列设置为近似相等的像素表示遮挡1和遮挡2。

图 2 各种算法的稳定性
Fig. 2 the stability of all kinds of algorithm((a)original encoding; (b) noise encoding; (c)illumination encoding; (d)shelter 1 encoding; (e)shelter 2 encoding)

图 2可得,与原始图像块编码数据对比,在噪声情况下,LDN编码值发生变化;在光照情况下,LDP编码值发生变化;在遮挡1条件下,LDN、ELDP、CSLDP、GCSLDP编码值发生变化;在遮挡2条件下,ELDP、CSLDP、DLDP编码值发生变化。在所有情况中,只有DSLDP保持编码的不变型,体现了DSLDP对光照、噪声、遮挡的鲁棒性。

1.3 DSLDP的特征提取图

在AR库上选择一个人的表情、光照、遮挡A和遮挡B原始图像,分别用DSLDP算法特征提取。图 3(a)对应表情的原始图和DSLDP特征提取图、同样图 3(b)对应光照情况、图 3(c)对应遮挡A情况、图 3(d)对应遮挡B情况。从图 3可以看出,在光照、表情、遮挡人脸图对应DSLDP特征提取图,纹理清晰,轮廓突出,特征提取信息充分,甚至在遮挡情况下,该算法提取特征图纹理依旧突出。

图 3 AR数据库实例
Fig. 3 Extraction result of AR((a) original images; (b)DSLDP feature extraction)

2 DSLDP人脸识别算法的流程

人脸识别算法流程图见图 4,具体流程描述为:

图 4 人脸识别流程图
Fig. 4 The flow chart of face recognition

1) 对人脸库进行预处理,最主要是以眼睛为中心对人脸图像进行裁剪;

2) 利用DSLDP码对人脸进行特征提取;

3) 对每一张图像进行分块处理,根据每一块图像信息熵[19]大小,进行加权;

4) 将每个统计直方图串接成一维的直方图特征向量;

5) 通过PCA[3]进行降维处理;

6) 最后通过chi平方统计[20]分类识别,求得识别率。

3 实验结果与分析

在ORL人脸库、AR人脸库和CAS-PEAL人脸库上进行相关实验。ORL人脸库包含40个人的400幅人脸图像,包含表情、姿态等变化,分辨率为112×92像素。AR人脸库共包含超过4 000幅来自126个人的人脸图像,该人脸库包含表情、光照、遮挡A(戴眼镜)和遮挡B(带围巾)等变化,所选图像均以眼部为中心裁剪为120×165像素大小;CAS-PEAL人脸库共包含1 040名中国人共99 450幅图像,该人脸库主要包含表情、背景、饰物等变化,实验中每组选取其中3幅和1幅原型正脸图作为测试集。所有图像均以眼部为中心剪裁为100×100像素大小。仿真实验环境为Matlab R2014a,笔记本电脑配置为:64位Windows7系统,Intel(R)Core(TM) i5-3230 2.6 GHz,4 GB内存;人脸库部分人脸图像如图 5所示。

图 5 人脸库部分人脸
Fig. 5 Face library part images((a)ORL; (b)AR; (c) CAS-PEAL)

3.1 分块数的选择

由于不同人脸库,不同的分块有不同的识别效果,所以对图像进行处理后,为了选择出最佳识别率,对人脸图像进行从块行大小1 13、块列大小1 13的循环分块。ORL人脸库上随机选取每个人的3幅图像作为训练集,其余作为测试集,AR和CAS-PEAL人脸库上选择第1幅人脸作为训练集,其余作为测试集。重复实验50次的均值作为最终识别率,选择最佳分块方式,如图 6所示。

图 6 人脸库不同分块识别率
Fig. 6 Face library different block recognition rate((a) ORL face library; (b) AR light face library; (c) AR expression face library; (d) AR block A face library; (e) AR block B face library; (f) CAS-PEAL light face library; (g) CAS-PEAL expression face library; (h) CAS-PEAL block face library)

图 6可知,ORL人脸库上获得最高识别率的最小分块为10×2(水平方向分块数目10,垂方向分块数目2);AR光照集获得最高识别率的最小分块为6×11,AR表情集获得最高识别率的最小分块为3×11,AR遮挡集A获得最高识别率的最小分块为5×7,AR遮挡集B获得最高识别率的最小分块为13×8。CAS-PEAL光照集获得最高识别率的最小分块为9×13,CAS-PEAL表情集获得最高识别率的最小分块为6×9,CAS-PEAL饰物集获得最高识别率的最小分块为4×12。

3.2 实验结果和分析

为了验证算法的有效性,选择最近几年的同类单一人脸识别算法进行对比:LDP[10]、SLDP[13]、DLDP[14]、ELDP[15]、LDN[16]、CSLDP[17]、GCSLDP[18]。其中,LDP和DLDP是取K为3时的最佳识别率,取最佳分块对应的最佳识别率并取重复实验50次的均值作为最终识别率,ORL人脸库训练样本数为2~6,实验结果见表 1,AR库实验结果见表 2,CAS-PEAL人脸库实验结果见表 3

表 1 各种算法在ORL库识别率
Table 1 Contrast in ORL library identification algorithm

下载CSV
/ %
算法 每类随机选取样本数
2 3 4 5 6
LDP 82.98 89.76 92.99 93.85 95.28
SLDP 86.85 91.79 95.26 96.38 97.90
ELDP 86.70 91.70 95.31 96.40 97.88
LDN 86.50 91.32 94.52 96.20 97.59
CSLDP 87.06 92.74 95.44 97.20 98.16
DLDP 87.72 93.02 95.50 96.35 97.78
GCSLDP 84.67 90.36 93.98 94.62 95.55
DSLDP 88.02 93.23 96.37 97.82 98.58

表 2 各种算法在AR库识别率
Table 2 Contrast in AR library identification algorithm

下载CSV
/ %
算法 表情集 光照集 遮挡A 遮挡B
LDP 96.33 93.00 90.00 71.67
SLDP 97.33 96.00 94.00 74.67
ELDP 97.00 97.33 89.67 71.00
LDN 96.67 96.67 91.33 66.67
CSLDP 96.67 98.00 98.33 75.33
DLDP 97.00 95.00 91.33 78.00
GCSLDP 97.67 97.33 99.00 78.00
DSLDP 98.00 98.33 99.33 87.67

表 3 各种算法对比在CAS-PEAL库识别率
Table 3 Contrast in CAS-PEAL library identification algorithm

下载CSV
/ %
算法 光照集 表情集 饰物集
LDP 96.33 90.00 78.67
SLDP 97.67 92.67 86.00
ELDP 97.33 92.00 82.00
LDN 97.33 92.33 82.33
CSLDP 98.67 93.00 82.33
DLDP 97.00 92.00 84.00
GCSLDP 99.00 95.00 83.67
DSLDP 99.33 95..33 90.00

表 1可得,在ORL库上,随着训练样本的增加,所有算法识别率不断增加,但DSLDP算法相比其他算法,识别效果最为突出。

表 2表 3可以看出,DSLDP算法在光照、表情和遮挡情况下,识别效果一直比其他算法要好,尤其在AR遮挡库和CAS-PEAL饰物集,本文算法识别效果更加明显。从1.2节的编码稳定推导可以看出,只有DSLDP算法在遮挡1和遮挡2的情况,编码始终保持不变,体现了对遮挡情况的鲁棒性。

DLDP、SLDP、ELDP、LDN和CSLDP算法是将图像3×3邻域像素灰度值与8个Kirsch算子卷积,得到8个方向的边缘响应值,再分别采用不同的编码方式进行特征提取,本质上是在强度空间提取人脸特征信息;DLDP算法是将8个方向的近邻边缘响应值之间相应作差,对应8个方向的边缘响应差值,再取最大3个绝对边缘差值的方向下标进行编码,本质上是在梯度空间提取人脸特征信息。上述这些算法提取人脸特征都是在单一的人脸信息空间进行采样,特征提取手段比较单一,采样还不够充分。GCSLDP虽然是在强度空间提取了人脸强度信息和在梯度空间提取了人脸方向信息,但方向信息采用中心对称编码方式取最大值方向,可能会造成信息的错误,比如当两个值都是正的最大边缘响应值作差后值不一定大于其他正边缘响应和负边缘响应差值;当两个值都是负的最大边缘响应值作差后值不一定大于其他负边缘响应和正边缘响应差,所以很难通过方向信息情况反应出边缘梯度信息。而本文算法是在强度空间和梯度空间提取了人脸的强度信息,充分提取人脸特征信息,而且突出了主要边缘梯度信息,同时又避免了不重要信息的干扰,从而表现出对光照、表情和遮挡等情况表现出更强的鲁棒性

3.3 噪声实验

在ORL人脸库进行加入噪声实验,噪声模型选择高斯白噪声,均值为0,归一化方差分别为0.000 1、0.000 2、0.000 3、0.000 4、0.000 5。每个人随机取3幅训练样本图像,其余图像为测试样本,取重复实验50次的均值作为最终识别率。实验结果如表 4所示。为了体现算法对噪声的鲁棒性,算法识别率下降速度表示为

表 4 各种算法在ORL库的对比
Table 4 Contrast in the ORL library identification algorithm

下载CSV
/ %
算法 高斯白噪声归一化方差
0 0.000 1 0.000 2 0.000 3 0.000 4 0.000 5 δ
LDP 89.76 85.36 83.96 79.54 74.88 71.95 19.84
SLDP 91.79 90.52 89.33 88.79 88.12 87.78 4.37
ELDP 91.70 90.29 89.12 88.69 87.26 86.37 5.81
LDN 91.32 89.43 88.37 88.03 87.16 86.23 5.57
CSLDP 92.74 91.28 90.60 90.19 89.81 88.31 4.83
DLDP 93.02 86.91 84.97 80.04 79.24 76.41 17.86
GCSLDP 90.36 88.38 87.99 88.19 87.32 86.02 4.80
DSLDP 93.38 93.16 92.98 92.12 91.74 91.26 2.27

$ \delta = \frac{{e-f}}{e} \times 100\% $ (6)

式中,$ e $表示没有加噪声时的识别率,$ f $表示加噪声后的识别率,δ表示加入噪声后,识别率下降速度。δ越小,表示抗噪能力越强,反之,δ越大,表示抗噪能力越弱加噪声后,各算法识别率结果如表 4所示。

表 4可得,在噪声实验中,随着高斯白噪声归一化方差逐渐增大,当高斯白噪声归一化方差增大到0.000 5时,DSLDP算法的δ值为2.27,明显低于其他算法,体现文章算法对噪声更强鲁棒性。由于LDP和DLDP算法在编码方式上考虑的是前3个最大绝对值,除最大值情况,剩下两个值容易受到噪声的干扰,稳定性较差;ELDP取最大值和次最大值情况,LDN取最大值和最小值情况,次最大值和最小值受噪声影响比较大;SLDP采用多尺度特征提取,有一定的抗噪性,但在编码上方式采用ELDP方式同样的编码方式,对噪声的稳定性降低;CSLDP利用中心对称作差虽然在一些情况下减少了噪声不稳定的干扰,但也存在中心对称的两个值相近时,噪声的影响使其编码情况不稳定性较大;GCSLDP在方向信息上同样采用中心对称方式取最大值方向,容易受到噪声的影响,因此抗噪性还是不理想。DSLDP只考虑邻边缘响应值和边缘响应差值的最大值情况,突出了主要边缘梯度信息,同时又避免了不重要信息的干扰,相比其他算法,对噪声表现出更强的鲁棒性。

4 结论

本文提出一种双空间局部方向模式(DSLDP)的人脸识别方法。实验结果表明:1) DSLDP是在强度空间与梯度空间取最大值进行编码,既考虑了近邻边缘响应值的变化,也考虑了近邻边缘响应值之间的变化,充分利用了强度空间和梯度空间的人脸特征信息,在光照、表情和遮挡情况下,DSLDP识别效果明显优于其他同类单一人脸识别算法。2) DSLDP算法仅考虑邻边缘响应值和边缘响应差值的最大值情况,突出了最主要边缘梯度信息,同时又避免了受不重要信息干扰的影响,从ORL噪声实验结果和1.2节编码的稳定推导结果可以得出:DSLDP算法对噪声具有更好的鲁棒性。3) DSLDP码是由二位八进制数构成,特征模式数降低到64,识别时间明显降低。因此,DSLDP算法能在识别效果,稳定性和识别时间上同时取得一个很好的平衡效果。

由于本文算法考虑的是固定半径领域的梯度空间人脸信息,接下工作重心将是研究不同半径领域之间的梯度空间人脸信息。

参考文献

  • [1] Lang L Y, Hong Y.The application of face recognition in network security[C]//Proceedings of 2008 IEEE International Conference on Computational Intelligence and Security.Suzhou, China:IEEE Press, 2008:395-398.[DOI:10.1109/CIS.2008.25]
  • [2] Bowyer K W. Face recognition technology:security versus privacy[J]. IEEE Technology and Society Magazine, 2004, 23(1): 9–19. [DOI:10.1109/MTAS.2004.1273467]
  • [3] Abdi H, Williams L J. Principal component analysis[J]. Wiley Interdisciplinary Reviews:Computational Statistics, 2010, 2(4): 433–459. [DOI:10.1002/wics.101]
  • [4] Thapngam T, Yu S, Zhou W L.DDoS discrimination by Linear Discriminant Analysis (LDA)[C]//Proceedings of 2012 IEEE International Conference on Computing, Networking and Communications.Maui, Hawaii, USA:IEEE Press, 2012:532-536.[DOI:10.1109/ICCNC.2012.6167480]
  • [5] Zheng Z L, Yang F, Tan W N, et al. Gabor feature-based face recognition using supervised locality preserving projection[J]. Signal Processing, 2007, 87(10): 2473–2483. [DOI:10.1016/j.sigpro.2007.03.006]
  • [6] Heikkilä M, Pietikäinen M, Schmid C. Description of interest regions with local binary patterns[J]. Pattern Recognition, 2009, 42(3): 425–436. [DOI:10.1016/j.patcog.2008.08.014]
  • [7] Xue G J, Sun J, Song L.Dynamic background subtraction based on spatial extended center-symmetric local binary pattern[C]//Proceedings of 2010 IEEE International Conference on Multimedia and Expo.Suntec City, Singapore:IEEE Press, 2010:1050-1054.[DOI:10.1109/ICME.2010.5582601]
  • [8] Liao W H.Region description using extended local ternary patterns[C]//Proceedings of the 201020th International Conference on Pattern Recognition.Istanbul, Turkey:ICPR Press, 2010:1003-1006.[DOI:10.1109/ICPR.2010.251]
  • [9] Guo Z H, Zhang L, Zhang D. A completed modeling of local binary pattern operator for texture classification[J]. IEEE Transactions on Image Processing, 2010, 19(6): 1657–1663. [DOI:10.1109/TIP.2010.2044957]
  • [10] Jabid T, Kabir M H, Chae O.Local directional pattern (LDP) for face recognition[C]//Proceedings of 2010 Digest of Technical Papers International Conference on Consumer Electronics.Las Vegas, Nevada, USA:IEEE Press, 2010:329-330.[DOI:10.1109/ICCE.2010.5418801]
  • [11] Zhong F J, Zhang J S. Noise-robust face recognition algorithm based on improved local directional pattern[J]. Journal of Optoelectronics Laser, 2012, 23(8): 1570–1575. [钟福金, 张家树. 基于ILDP的噪声鲁棒人脸识别[J]. 光电子·激光, 2012, 23(8): 1570–1575. ]
  • [12] Zhu M H, Chen R X. Improvement of the local directional number pattern operator[J]. Journal of Optoelectronics Laser, 2015, 26(6): 1179–1185. [朱明旱, 陈日新. 局部方向数字模式算子的改进[J]. 光电子·激光, 2015, 26(6): 1179–1185. ]
  • [13] Wu D, Tang Y Q, Lin G H, et al. Robust face recognition based on significance local directional pattern and deep learning[J]. Journal of Optoelectronics Lasers, 2016, 27(6): 655–661. [吴迪, 唐勇奇, 林国汉, 等. 基于显著性局部定向模式和深度学习的鲁棒人脸识别[J]. 光电子·激光, 2016, 27(6): 655–661. ] [DOI:10.16136/j.joel.2016.06.0811]
  • [14] Li Z K, Ding L X, Wang Y, et al. Face feature representation based on difference local directional pattern[J]. Journal of Software, 2015, 26(11): 2912–2929. [李照奎, 丁立新, 王岩, 等. 基于差值局部方向模式的人脸特征表示[J]. 软件学报, 2015, 26(11): 2912–2929. ] [DOI:10.13328/j.cnki.jos.004896]
  • [15] Zhong F J, Zhang J S. Face recognition with enhanced local directional patterns[J]. Neurocomputing, 2013, 119: 375–384. [DOI:10.1016/j.neucom.2013.03.020]
  • [16] Rivera A R, Castillo J R, Chae O O. Local directional number pattern for face analysis:face and expression recognition[J]. IEEE Transactions on Image Processing, 2013, 22(5): 1740–1752. [DOI:10.1109/TIP.2012.2235848]
  • [17] Yang H X, Zhai Y L, Cai Y Y, et al. Face recognition based on center-symmetric gradient magnitude and phase pattern[J]. Journal of Optoelectronics Laser, 2015, 26(5): 969–977. [杨恢先, 翟云龙, 蔡勇勇, 等. 基于中心对称梯度幅值相位模式的单样本人脸识别[J]. 光电子·激光, 2015, 26(5): 969–977. ]
  • [18] Wang X H, Li R J, Hu M, et al. Occluded facial expression recognition based on the fusion of local features[J]. Journal of Image and Graphics, 2016, 21(11): 1473–1482. [王晓华, 李瑞静, 胡敏, 等. 融合局部特征的面部遮挡表情识别[J]. 中国图象图形学报, 2016, 21(11): 1473–1482. ] [DOI:10.11834/jig.20161107]
  • [19] Liang J Y, Shi Z Z. The information entropy, rough entropy and knowledge granulation in rough set theory[J]. International Journal of Uncertaintys, Fuzziness and Knowledge-Based Systems, 2004, 12(1): 37–46. [DOI:10.1142/S0218488504002631]
  • [20] Dhurandhar A, Dobra A. Probabilistic characterization of nearest neighbor classifier[J]. International Journal of Machine Learning and Cybernetics, 2013, 4(4): 259–272. [DOI:10.1007/s13042-012-0091-y]