基于Gabor特征與字典學(xué)習(xí)的人臉姿態(tài)識(shí)別方法

文檔序號(hào)：9787760閱讀：811來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于Gabor特征與字典學(xué)習(xí)的人臉姿態(tài)識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理、模式識(shí)別、計(jì)算機(jī)視覺和人機(jī)交互技術(shù)領(lǐng)域，涉及一種人臉姿態(tài)識(shí)別方法，具體涉及一種基于字典學(xué)習(xí)與稀疏表示的人臉姿態(tài)識(shí)別方法。
【背景技術(shù)】
[0002] 人臉姿態(tài)估計(jì)在智能視頻監(jiān)控、人臉識(shí)別、人機(jī)交互和虛擬現(xiàn)實(shí)領(lǐng)域具有巨大的應(yīng)用前景。例如，在智能視頻監(jiān)控方面，人臉姿態(tài)估計(jì)可以應(yīng)用于駕駛監(jiān)控系統(tǒng)，通過監(jiān)控司機(jī)的人臉姿態(tài)變化來識(shí)別司機(jī)是否集中注意力開車，避免撞車情況的發(fā)生。此外，人臉姿態(tài)估計(jì)對(duì)人臉識(shí)別的準(zhǔn)確度有很大的影響，許多人臉識(shí)別算法對(duì)正面人臉圖像能夠達(dá)到很好的識(shí)別率，但對(duì)于多姿態(tài)的非正面人臉圖像，它的識(shí)別準(zhǔn)確率會(huì)嚴(yán)重下降，而通過人臉姿態(tài)預(yù)估計(jì)是解決多人臉姿態(tài)識(shí)別的一種重要途徑。
[0003] 目前現(xiàn)有的人臉姿態(tài)檢測方法大體上可以分為三類:紋理子空間方法，3D方法，其它類方法。第一類方法通過基于2D人臉外觀的學(xué)習(xí)方法實(shí)現(xiàn)姿態(tài)的檢測與估計(jì)。其中比較典型的有主成份分析(PCA)和線性判別(LDA)等。由于PCA是一種線性降維方法，而人臉姿態(tài) 3D旋轉(zhuǎn)變化很大程度上是一種非線性變化。因此學(xué)者們使用核主成份分析(KPCA)，流型學(xué) 習(xí)方法解決這種非線性變化問題。但是，核方法和流型學(xué)習(xí)方法有一個(gè)缺陷：隨著人臉訓(xùn)練樣本增加，它很難分離出身份和姿態(tài)。這就意味著，當(dāng)人臉訓(xùn)練庫足夠大時(shí)，姿態(tài)估計(jì)的準(zhǔn) 確率會(huì)根據(jù)人的不同而變化。第一類方法最大的特點(diǎn)是處理速度快，容易實(shí)現(xiàn)，但是需要通過大量樣本的訓(xùn)練，對(duì)人臉的光照、表情等變化較為敏感，特別是對(duì)光照極差的視頻人臉圖像其準(zhǔn)確率下降明顯。
[0004] 第二類方法認(rèn)為人臉姿態(tài)檢測本身就是一個(gè)3D問題，只有通過3D信息才能表征人臉姿態(tài)的本質(zhì)特征。因此這類方法往往通過抽取3D特征來表征不同姿態(tài)，或者利用不同視角下的多幅圖像，在三維空間中重建人臉的3D模型實(shí)現(xiàn)姿態(tài)的檢測。這類方法往往對(duì)圖像的大小和質(zhì)量要求很高，并且會(huì)花費(fèi)大量的運(yùn)算時(shí)間。第二類方法通過3D方法能夠得到很高準(zhǔn)確率，但是實(shí)時(shí)性不高，同時(shí)對(duì)視頻監(jiān)控中的超低分辨率和遮擋人臉圖像效果不是很好。
[0005] 第三類方法是一些非主流方法，只能解決人臉姿態(tài)估計(jì)中部分問題或只能應(yīng)用于某些特定場合。例如，Rafael Μιι?οζ-Salinas等人提出多相機(jī)的人臉姿態(tài)估計(jì)方法。為了正確估計(jì)人臉姿態(tài)，他們方法中需要利用前后左右6個(gè)相機(jī)拍照的6幅圖像進(jìn)行融合判別。 J.Nuevo等人提出塊聚類的方法進(jìn)行人臉姿態(tài)估計(jì)，取得了不錯(cuò)的效果，但是他們的方法估計(jì)的姿態(tài)范圍有限（只能識(shí)別45度范圍的姿態(tài)變化）。山東大學(xué)的陳振學(xué)等人提出三角形的人臉姿態(tài)估計(jì)方法，得到了 91%左右的準(zhǔn)確率，但是他們的方法只能對(duì)人臉繞Y和Z軸偏轉(zhuǎn) 有效，而對(duì)于繞X軸旋轉(zhuǎn)人臉姿態(tài)無效，即對(duì)人臉上下旋轉(zhuǎn)情況失效。
[0006] 目前想要計(jì)算機(jī)具備和人類一樣的姿態(tài)識(shí)別能力還很難，主要原因是光照、噪聲、遮擋、分辨率、身份、表情等因素的變化都會(huì)對(duì)姿態(tài)估計(jì)的準(zhǔn)確性產(chǎn)生巨大的影響，如何消除這些因素的影響是目前亟需解決的問題。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明的目的在于克服以上方法的不足，提出一種基于Gabor特征與字典學(xué)習(xí)的人臉姿態(tài)識(shí)別方法，解決人臉姿態(tài)識(shí)別中的光照、噪聲和遮擋等問題，魯棒性的識(shí)別出正面、抬頭、點(diǎn)頭、左偏轉(zhuǎn)、左側(cè)臉、右偏轉(zhuǎn)和右側(cè)臉。
[0008] 本發(fā)明的目的通過下述技術(shù)方案實(shí)現(xiàn)：
[0009] 一種基于Gabor特征與字典學(xué)習(xí)的人臉姿態(tài)識(shí)別方法，包括下列步驟：
[0010] 對(duì)在線輸入的待識(shí)別人臉姿態(tài)圖像進(jìn)行Gabor特征提取，構(gòu)建Gabor特征向量y;
[0011] 對(duì)所述Gabor特征向量7使用姿態(tài)完備字典進(jìn)行線性組合表示，建立稀疏表示模型并求解系數(shù)向量，其中Gabor特征向量e ，m為Gabor特征向量維數(shù)；
[0012] 根據(jù)上述求解的線性組合的系數(shù)向量進(jìn)行人臉姿態(tài)分類識(shí)別。
[0013] 進(jìn)一步地，所述人臉姿態(tài)劃分為7個(gè)不同姿態(tài)類別，分別定義為左偏轉(zhuǎn)、左側(cè)臉、右偏轉(zhuǎn)、右側(cè)臉、正面、抬頭和點(diǎn)頭，其各對(duì)應(yīng)不同的子空間。
[0014] 進(jìn)一步地，對(duì)所述Gabor特征向量y使用姿態(tài)完備字典進(jìn)行線性組合表示之前，還包括所述姿態(tài)完備字典的訓(xùn)練步驟，其中所述姿態(tài)完備字典包括對(duì)應(yīng)無遮擋的人臉姿態(tài)的第一姿態(tài)完備字典D和對(duì)應(yīng)有遮擋的人臉姿態(tài)第二姿態(tài)完備字典D e，所述第一姿態(tài)完備字典D和所述第二姿態(tài)完備字典的訓(xùn)練分別獨(dú)立完成。
[0015] 進(jìn)一步地，所述第一姿態(tài)完備字典D的訓(xùn)練過程具體如下：
[0016] 分別收集各姿態(tài)類別的人臉姿態(tài)圖像樣本，并對(duì)所述人臉姿態(tài)圖像樣本進(jìn)行 Gabor濾波處理以及特征提取并向量化組成各姿態(tài)類別的人臉姿態(tài)Gabor特征訓(xùn)練集；
[0017] 對(duì)每類姿態(tài)類別的人臉姿態(tài)Gabor特征訓(xùn)練集使用K-SVD進(jìn)行訓(xùn)練優(yōu)化分別得出最佳子字典Di，i = l，2，~，7;
[0018] 將各類最佳子字典Di組成第一姿態(tài)完備字典
[0019] 進(jìn)一步地，所述人臉姿態(tài)圖像的Gabor特征提取為：
[0021]其中，是通過對(duì)Gabor濾波系數(shù)的模進(jìn)行p次采樣而得到的列向量，μ，ν為 Gabor濾波器的方向與尺度，采用方向與尺度不變的Gabor濾波器描述人臉姿態(tài)圖像的特征，A·/匕>為人臉姿態(tài)圖像與Gabor核φμ, v的卷積，Gabor核定義為：
[0023] 其中，z(x，y)表示像素;^"，ν= 為小波項(xiàng)，kv = kmax/fv，Φμ = πμ/8，σ = 1·5π控制著高斯窗口寬度與波長的比例。
[0024] 進(jìn)一步地，所述在線輸入的待識(shí)別人臉姿態(tài)圖像為無遮擋的人臉姿態(tài)圖像時(shí)，提取所述待估計(jì)人臉姿態(tài)圖像的Gabor特征向量，m為Gabor特征向量維數(shù)，將y看成所述第一姿態(tài)完備字典e 的線性組合表示:J = & e ，其中N為字典原子總個(gè)數(shù)，所述稀疏表示模型即為J = M e 。
[0025] 進(jìn)一步地，所述稀疏表示模型J =伙e
[0026]通過帶稀疏約束的最小二乘法進(jìn)行求解：
[0028] 其中，λ為平衡因子，起到平衡重建誤差與稀疏性的作用。
[0029] 進(jìn)一步地，所述在線輸入的待識(shí)別人臉姿態(tài)圖像為有遮擋的人臉姿態(tài)圖像時(shí)，提取所述待估計(jì)人臉姿態(tài)圖像的Gabor特征向量J e ，m為Gabor特征向量維數(shù)，將y看成由所述的第一完備字典D和第二姿態(tài)完備字典A e 的線性組合表示：
[0031] 其中召^從/^^沢-^十無遮擋圖像抑與遮擋誤差圖像創(chuàng)分別可由第一姿態(tài)完備字典D和第二姿態(tài)完備字典A 稀疏表示，為正交單位矩陣，所述稀疏表示模型即 = Βω e 〇
[0032] 進(jìn)一步地，所述稀疏表示模型將有遮擋的人臉姿態(tài)圖像識(shí)別問題轉(zhuǎn)化成如下的優(yōu)化問題：
[0034] 該問題可以通過標(biāo)準(zhǔn)的線性規(guī)范方法進(jìn)行求解。
[0035] 進(jìn)一步地，所述根據(jù)上述求解的線性組合的系數(shù)向量進(jìn)行人臉姿態(tài)分類識(shí)別具體為通過對(duì)所述求解的線性組合的系數(shù)向量進(jìn)行有效性累計(jì)，以累計(jì)值最大作為判定分類的依據(jù)，即
[0037] 其中，f( ·)是特殊函數(shù)，用于將稀疏表示模型的表示系數(shù)的負(fù)因子置0， 6?, :%~->9Τ是選取函數(shù)，用于僅選擇稀疏表示模型的表示系數(shù)&中第i類子空間矩陣所對(duì) 應(yīng)的表示系數(shù)，并且將其它表示系數(shù)置〇， Pl(y)是訓(xùn)練樣本集合中第i類姿態(tài)類別對(duì)應(yīng)的子空間與其對(duì)應(yīng)的稀疏表示模型的表示系數(shù)的有效性累計(jì)因子。
[0038] 本發(fā)明相對(duì)于現(xiàn)有技術(shù)具有如下的優(yōu)點(diǎn)及效果：
[0039] 1)目前大多數(shù)人臉姿態(tài)識(shí)別方法只對(duì)人臉左右偏轉(zhuǎn)進(jìn)行了分類，本發(fā)明不僅可以對(duì)人臉左右偏轉(zhuǎn)進(jìn)行分類，同還可以進(jìn)行上下姿態(tài)分類。本發(fā)明可以在0.3秒左右識(shí)別出人臉圖像的大致左右上下偏轉(zhuǎn)狀態(tài)，識(shí)別精度在95%以上，可以較好地應(yīng)用于安全駕駛和人機(jī)交互等領(lǐng)域。
[0040] 2)由于本發(fā)明基于字典學(xué)習(xí)與稀疏表示原理，所以可以同時(shí)解決人臉姿態(tài)識(shí)別中的光照、噪聲、表情和遮擋等難題；
[0041] 3)由于Gabor濾波器能從多尺度多方向提取圖像的局部特征。因此，本發(fā)明采用人臉圖像的Gabor特征作為超完備字典的原子向量。此方法提高了人臉姿態(tài)識(shí)別的穩(wěn)定性。
【附圖說明】
[0042] 為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案，下面將對(duì)實(shí)施例或者現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳友斌;廖海斌;
技術(shù)所有人：廣東微模式軟件股份有限公司;
我是此專利的發(fā)明人

上一篇：人臉檢測方法及裝置的制造方法
上一篇：區(qū)域識(shí)別方法及裝置的制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于Gabor特征與字典學(xué)習(xí)的人臉姿態(tài)識(shí)別方法