亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于Gabor特征與字典學(xué)習(xí)的人臉姿態(tài)識(shí)別方法

文檔序號(hào):9787760閱讀:811來源:國知局
基于Gabor特征與字典學(xué)習(xí)的人臉姿態(tài)識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理、模式識(shí)別、計(jì)算機(jī)視覺和人機(jī)交互技術(shù)領(lǐng)域,涉及一種人臉 姿態(tài)識(shí)別方法,具體涉及一種基于字典學(xué)習(xí)與稀疏表示的人臉姿態(tài)識(shí)別方法。
【背景技術(shù)】
[0002] 人臉姿態(tài)估計(jì)在智能視頻監(jiān)控、人臉識(shí)別、人機(jī)交互和虛擬現(xiàn)實(shí)領(lǐng)域具有巨大的 應(yīng)用前景。例如,在智能視頻監(jiān)控方面,人臉姿態(tài)估計(jì)可以應(yīng)用于駕駛監(jiān)控系統(tǒng),通過監(jiān)控 司機(jī)的人臉姿態(tài)變化來識(shí)別司機(jī)是否集中注意力開車,避免撞車情況的發(fā)生。此外,人臉姿 態(tài)估計(jì)對(duì)人臉識(shí)別的準(zhǔn)確度有很大的影響,許多人臉識(shí)別算法對(duì)正面人臉圖像能夠達(dá)到很 好的識(shí)別率,但對(duì)于多姿態(tài)的非正面人臉圖像,它的識(shí)別準(zhǔn)確率會(huì)嚴(yán)重下降,而通過人臉姿 態(tài)預(yù)估計(jì)是解決多人臉姿態(tài)識(shí)別的一種重要途徑。
[0003] 目前現(xiàn)有的人臉姿態(tài)檢測方法大體上可以分為三類:紋理子空間方法,3D方法,其 它類方法。第一類方法通過基于2D人臉外觀的學(xué)習(xí)方法實(shí)現(xiàn)姿態(tài)的檢測與估計(jì)。其中比較 典型的有主成份分析(PCA)和線性判別(LDA)等。由于PCA是一種線性降維方法,而人臉姿態(tài) 3D旋轉(zhuǎn)變化很大程度上是一種非線性變化。因此學(xué)者們使用核主成份分析(KPCA),流型學(xué) 習(xí)方法解決這種非線性變化問題。但是,核方法和流型學(xué)習(xí)方法有一個(gè)缺陷:隨著人臉訓(xùn)練 樣本增加,它很難分離出身份和姿態(tài)。這就意味著,當(dāng)人臉訓(xùn)練庫足夠大時(shí),姿態(tài)估計(jì)的準(zhǔn) 確率會(huì)根據(jù)人的不同而變化。第一類方法最大的特點(diǎn)是處理速度快,容易實(shí)現(xiàn),但是需要通 過大量樣本的訓(xùn)練,對(duì)人臉的光照、表情等變化較為敏感,特別是對(duì)光照極差的視頻人臉圖 像其準(zhǔn)確率下降明顯。
[0004] 第二類方法認(rèn)為人臉姿態(tài)檢測本身就是一個(gè)3D問題,只有通過3D信息才能表征人 臉姿態(tài)的本質(zhì)特征。因此這類方法往往通過抽取3D特征來表征不同姿態(tài),或者利用不同視 角下的多幅圖像,在三維空間中重建人臉的3D模型實(shí)現(xiàn)姿態(tài)的檢測。這類方法往往對(duì)圖像 的大小和質(zhì)量要求很高,并且會(huì)花費(fèi)大量的運(yùn)算時(shí)間。第二類方法通過3D方法能夠得到很 高準(zhǔn)確率,但是實(shí)時(shí)性不高,同時(shí)對(duì)視頻監(jiān)控中的超低分辨率和遮擋人臉圖像效果不是很 好。
[0005] 第三類方法是一些非主流方法,只能解決人臉姿態(tài)估計(jì)中部分問題或只能應(yīng)用于 某些特定場合。例如,Rafael Μιι?οζ-Salinas等人提出多相機(jī)的人臉姿態(tài)估計(jì)方法。為了正 確估計(jì)人臉姿態(tài),他們方法中需要利用前后左右6個(gè)相機(jī)拍照的6幅圖像進(jìn)行融合判別。 J.Nuevo等人提出塊聚類的方法進(jìn)行人臉姿態(tài)估計(jì),取得了不錯(cuò)的效果,但是他們的方法估 計(jì)的姿態(tài)范圍有限(只能識(shí)別45度范圍的姿態(tài)變化)。山東大學(xué)的陳振學(xué)等人提出三角形的 人臉姿態(tài)估計(jì)方法,得到了 91%左右的準(zhǔn)確率,但是他們的方法只能對(duì)人臉繞Y和Z軸偏轉(zhuǎn) 有效,而對(duì)于繞X軸旋轉(zhuǎn)人臉姿態(tài)無效,即對(duì)人臉上下旋轉(zhuǎn)情況失效。
[0006] 目前想要計(jì)算機(jī)具備和人類一樣的姿態(tài)識(shí)別能力還很難,主要原因是光照、噪聲、 遮擋、分辨率、身份、表情等因素的變化都會(huì)對(duì)姿態(tài)估計(jì)的準(zhǔn)確性產(chǎn)生巨大的影響,如何消 除這些因素的影響是目前亟需解決的問題。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明的目的在于克服以上方法的不足,提出一種基于Gabor特征與字典學(xué)習(xí)的 人臉姿態(tài)識(shí)別方法,解決人臉姿態(tài)識(shí)別中的光照、噪聲和遮擋等問題,魯棒性的識(shí)別出正 面、抬頭、點(diǎn)頭、左偏轉(zhuǎn)、左側(cè)臉、右偏轉(zhuǎn)和右側(cè)臉。
[0008] 本發(fā)明的目的通過下述技術(shù)方案實(shí)現(xiàn):
[0009] 一種基于Gabor特征與字典學(xué)習(xí)的人臉姿態(tài)識(shí)別方法,包括下列步驟:
[0010] 對(duì)在線輸入的待識(shí)別人臉姿態(tài)圖像進(jìn)行Gabor特征提取,構(gòu)建Gabor特征向量y;
[0011] 對(duì)所述Gabor特征向量7使用姿態(tài)完備字典進(jìn)行線性組合表示,建立稀疏表示模型 并求解系數(shù)向量,其中Gabor特征向量e ,m為Gabor特征向量維數(shù);
[0012] 根據(jù)上述求解的線性組合的系數(shù)向量進(jìn)行人臉姿態(tài)分類識(shí)別。
[0013] 進(jìn)一步地,所述人臉姿態(tài)劃分為7個(gè)不同姿態(tài)類別,分別定義為左偏轉(zhuǎn)、左側(cè)臉、右 偏轉(zhuǎn)、右側(cè)臉、正面、抬頭和點(diǎn)頭,其各對(duì)應(yīng)不同的子空間。
[0014] 進(jìn)一步地,對(duì)所述Gabor特征向量y使用姿態(tài)完備字典進(jìn)行線性組合表示之前,還 包括所述姿態(tài)完備字典的訓(xùn)練步驟,其中所述姿態(tài)完備字典包括對(duì)應(yīng)無遮擋的人臉姿態(tài)的 第一姿態(tài)完備字典D和對(duì)應(yīng)有遮擋的人臉姿態(tài)第二姿態(tài)完備字典D e,所述第一姿態(tài)完備字 典D和所述第二姿態(tài)完備字典的訓(xùn)練分別獨(dú)立完成。
[0015] 進(jìn)一步地,所述第一姿態(tài)完備字典D的訓(xùn)練過程具體如下:
[0016] 分別收集各姿態(tài)類別的人臉姿態(tài)圖像樣本,并對(duì)所述人臉姿態(tài)圖像樣本進(jìn)行 Gabor濾波處理以及特征提取并向量化組成各姿態(tài)類別的人臉姿態(tài)Gabor特征訓(xùn)練集;
[0017] 對(duì)每類姿態(tài)類別的人臉姿態(tài)Gabor特征訓(xùn)練集使用K-SVD進(jìn)行訓(xùn)練優(yōu)化分別得出 最佳子字典Di,i = l,2,~,7;
[0018] 將各類最佳子字典Di組成第一姿態(tài)完備字典
[0019] 進(jìn)一步地,所述人臉姿態(tài)圖像的Gabor特征提取為:
[0021]其中,是通過對(duì)Gabor濾波系數(shù)的模進(jìn)行p次采樣而得到的列向量,μ,ν為 Gabor濾波器的方向與尺度,采用方向與尺度不變的Gabor濾波器描述人臉姿態(tài)圖像的特 征,A·/匕>為人臉姿態(tài)圖像與Gabor核φμ, v的卷積,Gabor核定義為:
[0023] 其中,z(x,y)表示像素;^",ν= 為小波項(xiàng),kv = kmax/fv,Φμ = πμ/8,σ = 1·5π控制 著高斯窗口寬度與波長的比例。
[0024] 進(jìn)一步地,所述在線輸入的待識(shí)別人臉姿態(tài)圖像為無遮擋的人臉姿態(tài)圖像時(shí),提 取所述待估計(jì)人臉姿態(tài)圖像的Gabor特征向量,m為Gabor特征向量維數(shù),將y看成所 述第一姿態(tài)完備字典e 的線性組合表示:J = & e ,其中N為字典原子總個(gè)數(shù),所述 稀疏表示模型即為J = M e 。
[0025] 進(jìn)一步地,所述稀疏表示模型J =伙e
[0026]通過帶稀疏約束的最小二乘法進(jìn)行求解:
[0028] 其中,λ為平衡因子,起到平衡重建誤差與稀疏性的作用。
[0029] 進(jìn)一步地,所述在線輸入的待識(shí)別人臉姿態(tài)圖像為有遮擋的人臉姿態(tài)圖像時(shí),提 取所述待估計(jì)人臉姿態(tài)圖像的Gabor特征向量J e ,m為Gabor特征向量維數(shù),將y看成由 所述的第一完備字典D和第二姿態(tài)完備字典A e 的線性組合表示:
[0031] 其中召^從/^^沢-^十無遮擋圖像抑與遮擋誤差圖像創(chuàng)分別可由第一姿態(tài)完 備字典D和第二姿態(tài)完備字典A 稀疏表示,為正交單位矩陣,所述稀疏表示模型即 = Βω e 〇
[0032] 進(jìn)一步地,所述稀疏表示模型將有遮擋的人臉姿態(tài)圖像識(shí)別問題轉(zhuǎn)化 成如下的優(yōu)化問題:
[0034] 該問題可以通過標(biāo)準(zhǔn)的線性規(guī)范方法進(jìn)行求解。
[0035] 進(jìn)一步地,所述根據(jù)上述求解的線性組合的系數(shù)向量進(jìn)行人臉姿態(tài)分類識(shí)別具體 為通過對(duì)所述求解的線性組合的系數(shù)向量進(jìn)行有效性累計(jì),以累計(jì)值最大作為判定分類的 依據(jù),即
[0037] 其中,f( ·)是特殊函數(shù),用于將稀疏表示模型的表示系數(shù)的負(fù)因子置0, 6?, :%~->9Τ是選取函數(shù),用于僅選擇稀疏表示模型的表示系數(shù)&中第i類子空間矩陣所對(duì) 應(yīng)的表示系數(shù),并且將其它表示系數(shù)置〇, Pl(y)是訓(xùn)練樣本集合中第i類姿態(tài)類別對(duì)應(yīng)的子 空間與其對(duì)應(yīng)的稀疏表示模型的表示系數(shù)的有效性累計(jì)因子。
[0038] 本發(fā)明相對(duì)于現(xiàn)有技術(shù)具有如下的優(yōu)點(diǎn)及效果:
[0039] 1)目前大多數(shù)人臉姿態(tài)識(shí)別方法只對(duì)人臉左右偏轉(zhuǎn)進(jìn)行了分類,本發(fā)明不僅可以 對(duì)人臉左右偏轉(zhuǎn)進(jìn)行分類,同還可以進(jìn)行上下姿態(tài)分類。本發(fā)明可以在0.3秒左右識(shí)別出人 臉圖像的大致左右上下偏轉(zhuǎn)狀態(tài),識(shí)別精度在95%以上,可以較好地應(yīng)用于安全駕駛和人 機(jī)交互等領(lǐng)域。
[0040] 2)由于本發(fā)明基于字典學(xué)習(xí)與稀疏表示原理,所以可以同時(shí)解決人臉姿態(tài)識(shí)別中 的光照、噪聲、表情和遮擋等難題;
[0041] 3)由于Gabor濾波器能從多尺度多方向提取圖像的局部特征。因此,本發(fā)明采用人 臉圖像的Gabor特征作為超完備字典的原子向量。此方法提高了人臉姿態(tài)識(shí)別的穩(wěn)定性。
【附圖說明】
[0042] 為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或者現(xiàn)有技術(shù)描 述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1