亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于字典分解和稀疏表示的魯棒人臉識別方法與流程

文檔序號:12601405閱讀:444來源:國知局
一種基于字典分解和稀疏表示的魯棒人臉識別方法與流程

本發(fā)明屬于模式識別領(lǐng)域,特別涉及一種基于字典分解和稀疏表示的魯棒人臉識別方法。



背景技術(shù):

人臉識別技術(shù)是指對輸入的視頻流或靜態(tài)的圖像,在判斷存在人臉并進一步標(biāo)出人臉的位置后,提取人臉的特征信息,將其與預(yù)先存儲的圖像數(shù)據(jù)庫進行對比,最終驗證或者識別一個或者多個人身份的技術(shù)。人臉識別憑借其廣泛的實際應(yīng)用在近些年來已經(jīng)成為計算機視覺和模式識別領(lǐng)域很熱的一個課題。早期的人臉識別算法先對人臉圖像進行降維(實質(zhì)上就是人臉特征提取),然后簡單地應(yīng)用最近鄰分類器(nearest neighborhood classifier)分類。

1991年,Turk和Pentland提出了“特征臉”(Eigenfaces)算法,其算法的思想是把人臉圖像從像素空間變換到另一個空間,在另一個空間進行分類?!疤卣髂槨彼惴ㄌ岢鲋?,迅速成為人臉識別的經(jīng)典算法。2009年,Wright等人提出稀疏表示分類器算法(Sparse Representation based Classification,SRC),將用于訓(xùn)練的人臉圖像進行線性稀疏表示,利用求解優(yōu)化問題得到的稀疏系數(shù)對樣本判別歸類。但當(dāng)訓(xùn)練樣本被污染時,SRC并沒有理想的效果,2011年,Candès、Li、Ma和Wright提出的魯棒主成分分析(RPCA)提供了一種可以用來解決這種缺點的方法,RPCA把每個類的訓(xùn)練樣本分解成一個低秩矩陣和一個稀疏矩陣之和,通過重建去除污染的圖像進行識別。字典學(xué)習(xí)也被應(yīng)用到解決SRC這方面不足當(dāng)中。而通過字典學(xué)習(xí)得到了很好的表示字典,這種表示字典并不能保證有良好的分類判別能力,此后出現(xiàn)了一系列的判別力字典學(xué)習(xí)方法,通過設(shè)計字典學(xué)習(xí)算法從原始訓(xùn)練樣本中得到判別力字典,這種判別力字典學(xué)習(xí)方法在字典的表示能力和分類能力之間做了平衡。



技術(shù)實現(xiàn)要素:

本發(fā)明的目的是提供一種識別率較高的基于字典分解和稀疏表示的魯棒人臉識別方法。

為了實現(xiàn)上述目的,本發(fā)明提供了如下技術(shù)方案:

本發(fā)明提供一種基于字典分解和稀疏表示的魯棒人臉識別方法,包括如下步驟:

步驟一:根據(jù)字典分解模型得到求解模型

(1.1)根據(jù)人臉圖像信息,得到字典分解模型為:D=A+BX+E;

其中,D為訓(xùn)練數(shù)據(jù)矩陣,A稱為類特定字典,包含了人臉圖像中的類特定信息,B稱為非類特定字典,包含人臉圖像中的其他信息,X是B的系數(shù)矩陣,E是稀疏噪聲矩陣;

(1.2)根據(jù)約束條件得到字典分解模型的求解模型如下:

s.t.D=A+BX+E; (約束條件)

其中,rank(A)和rank(B)分別表示矩陣A和B的秩,表示矩陣X的F范數(shù)的平方,||E||0表示矩陣E的零范數(shù),λ、τ和η是正的懲罰項系數(shù);

(1.3)對步驟(1.2)得到的求解模型,分別利用優(yōu)化秩函數(shù)和零范數(shù)的凸松弛核范數(shù)和1范數(shù)代替,得到最終的求解模型:

s.t.D=A+BX+E; (約束條件)

其中,||A||*和||B||*分別表示矩陣A和矩陣B的核范數(shù),即矩陣的所有奇異值之和,矩陣的核范數(shù)可以用來近似替代矩陣的秩函數(shù);||E||1表示矩陣E的1范數(shù),矩陣的1范數(shù)用來替代矩陣的零范數(shù);D=A+BX+E是約束條件;

步驟二:求解類特定字典A

對于步驟一(1.3)的求解模型,采用給定初值,固定其中兩個優(yōu)化另外兩個的方法循環(huán)迭代求解:

(2.1)固定A和X,求解B和E;

(2.2)固定A和B,求解X和E;

(2.3)固定B和X,求解A和E;

步驟三:計算映射矩陣P

計算映射矩陣P來描述類特定字典A與訓(xùn)練數(shù)據(jù)矩陣D之間的關(guān)系:A=PD;求解其中是D的偽逆矩陣;

步驟四:校正測試圖像矩陣y,得到校正后的測試圖像yp

利用步驟三中得到的映射矩陣P對測試圖像矩陣y進行校正:yp=Py;

步驟五:利用PCA降維

對類特定字典A和校正后的測試圖像yp進行主成分分析PCA降維處理:

A'=F(A),y'=F(yp); (公式九)

其中,F(xiàn)(·)在公式里表示的PCA降維操作,A'=F(A)表示的是對矩陣A進行PCA降維操作得到降維后的類特定信息A',y'=F(yp)表示的是對校正后的測試圖像矩陣yp進行相同的PCA降維操作得到降維后的測試圖像y';

步驟六:利用SRC分類

利用SRC基于稀疏表示的分類器對測試圖像進行分類:

(6.1)直接把降維后的類特定信息A'和降維后的測試圖像y'代入SRC模型中:

其中βSRC是正的懲罰項系數(shù);

(6.2)求解得到稀疏表示系數(shù)α;

(6.3)計算測試圖像與每一類根據(jù)稀疏表示系數(shù)α重建結(jié)果的殘差確定測試圖像屬于哪一類:

其中,y'-Aii的2范數(shù)表示的含義是校正后的測試圖像y'與第i類根據(jù)稀疏表示系數(shù)αi重建結(jié)果的距離,表示使得y'-Aii的2范數(shù)最小的i。

所述步驟二(2.1)的具體過程如下:

X賦初值為單位矩陣X=I;

首先將每一類的訓(xùn)練數(shù)據(jù)進行奇異值分解:

Di=UiiViT; (公式三)

然后把利用最大的奇異值對應(yīng)的奇異值向量得到的對訓(xùn)練數(shù)據(jù)重建的結(jié)果賦予給A:

上述公式三中,Di表示第i類的訓(xùn)練數(shù)據(jù)矩陣,Ui、∑i和ViT分別表示對Di進行奇異值分解得到的對應(yīng)的矩陣;上述公式四中,Ui(1:m,1)表示矩陣Ui的第一列;∑i(1,1)表示∑i矩陣第一行第一列的那個元素,即Di的最大的奇異值;表示Vi矩陣的第一列的轉(zhuǎn)置;上述公式五中,A=(A1,A2,A3,...,AN)是把每一類得到的Ai組成一個大矩陣;在這里的含義是指實數(shù)域,的含義是矩陣Ai是m行Ni列的,并且矩陣Ai里的元素都是屬于實數(shù)域的。

根據(jù)上述公式三至五給定A的初值和X的初值X=I之后,同時代入步驟一(1.3)中的求解模型得到:

s.t.D-A=BX+T; (約束條件)

其中,||B||*表示矩陣B的核范數(shù),||T||1表示矩陣T的1范數(shù);λ和δ是正的懲罰項系數(shù);步驟一(1.3)中的求解模型因為現(xiàn)在固定了A和X所以可以寫成上述模型,而原始的約束條件D=A+BX+E也因此寫成了D-A=BX+T;

通過增廣拉格朗日乘子法求解上述模型可以得到B和T。

所述步驟二(2.2)的具體過程如下:

分別把A和B賦值為步驟二(2.1)中使用的A和步驟二(2.1)得到的B;代入步驟一(1.3)中的求解模型得到:

s.t.D-A=BX+T; (約束條件)

其中,表示矩陣X的F范數(shù)的平方,||T||1表示矩陣T的1范數(shù),τ和δ是正的懲罰項系數(shù);步驟一(1.3)中的求解模型因為現(xiàn)在固定了A和B所以可以寫成上述模型,原始的約束條件D=A+BX+E也因此寫成了D-A=BX+T;

利用增廣拉格朗日乘子法求解得到X和T。

所述步驟二(2.3)的具體過程如下:

分別把B和X賦值為步驟二(2.1)得到的B和步驟二(2.2)得到的X;代入步驟一(1.3)中的求解模型得到:

s.t.D-BX=A+T; (約束條件)

其中,||A||*表示矩陣A的核范數(shù),||T||1表示矩陣T的1范數(shù),η是正的懲罰項系數(shù);步驟一(1.3)中的求解模型因為現(xiàn)在固定了B和X所以可以寫成上述模型,原始的約束條件D=A+BX+E也因此寫成了D-BX=A+T;

利用魯棒主成分分析RPCA求解得到A和E。

所述步驟二中,進行四次循環(huán)迭代求解達到預(yù)設(shè)的收斂條件:

<mrow> <mo>|</mo> <mo>|</mo> <mi>D</mi> <mo>-</mo> <mi>A</mi> <mo>-</mo> <mi>B</mi> <mi>X</mi> <mo>-</mo> <mi>T</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>&lt;</mo> <mi>&epsiv;</mi> <mo>,</mo> </mrow>

其中ε=10-4;

從而求解得到最終的A和E。

所述步驟中,對類特定字典A和校正后的測試圖像yp進行主成分分析PCA降維處理的維度分別為25、50、75、100和150。

所述步驟六(6.3)中,具體判定方法如下:

對于步驟六(6.2)中得到的稀疏表示系數(shù)α,對每一類i,都有對應(yīng)于標(biāo)簽i的降維后的類特定信息Ai'和對應(yīng)于標(biāo)簽i的稀疏表示系數(shù)αi。然后計算對應(yīng)于第i類的降維后的測試圖像y'與重建結(jié)果的誤差e(i)=||y'-Aii||2。對所有的i,都計算出誤差對應(yīng)的e(i),比較誤差e(i),哪一類的誤差最小,測試圖像y'就屬于哪一類。

與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:

相比于SRC和一些基于SRC的人臉識別算法,本發(fā)明的方法的識別率較高,而且當(dāng)人臉圖像訓(xùn)練數(shù)據(jù)存在污染、缺失、遮擋時,本發(fā)明的方法通過字典分解提取訓(xùn)練數(shù)據(jù)中的類特定信息,然后通過映射矩陣校正測試圖像,識別過程幾乎不受污染、缺失和遮擋的影響。有效地解決了因訓(xùn)練數(shù)據(jù)存在污染、缺失和遮擋而產(chǎn)生的識別率低的問題。

附圖說明

圖1為AR人臉數(shù)據(jù)庫的一些人臉圖片;

圖2為字典分解的結(jié)果;

圖3為本發(fā)明基于字典分解和稀疏表示的魯棒人臉識別方法的整體流程框圖。

具體實施方式

本發(fā)明設(shè)計了大量實驗對本發(fā)明的方法進行驗證,下面結(jié)合有太陽鏡遮擋的AR人臉數(shù)據(jù)庫對本發(fā)明進行進一步說明。

AR人臉數(shù)據(jù)庫一共有100個不同的個體,其中50個女性,50個男性,每個人都有26張圖片,這26張圖片中,第1~7張和第14~20張圖片是只包含表情和光照變化的圖片,第8~10張和第21~23張圖片是帶有太陽鏡遮擋的圖片,第11~13張和第24~26張是帶有絲巾遮擋的圖片。每張圖片被裁剪成165×120像素大小,然后每張圖片都被拉成列向量組成一個19800×2600的矩陣。

本實例選取數(shù)據(jù)庫中第1~7張不帶遮擋的圖片和從第8~10張中隨機選取一張帶有太陽鏡遮擋的圖片作為訓(xùn)練數(shù)據(jù);選取第14~20張和剩下的5張?zhí)栫R遮擋的圖片作為測試數(shù)據(jù)。每一類的訓(xùn)練數(shù)據(jù)有8張圖片,測試數(shù)據(jù)有12張圖片。

請參照圖3,本發(fā)明提供一種基于字典分解和稀疏表示的魯棒人臉識別方法,包括如下步驟:

步驟一:根據(jù)字典分解模型得到求解模型

(1.1)人臉圖像中包含大量信息,可以分為包含人臉特征的類特定信息、其他信息和一些稀疏噪聲。根據(jù)這一特點,得到字典分解模型為:D=A+BX+E。

其中,D為訓(xùn)練數(shù)據(jù)矩陣,A稱為類特定字典(包含了人臉圖像中的類特定信息),B稱為非類特定字典(包含人臉圖像中的其他信息),X是B的系數(shù)矩陣,E是稀疏噪聲矩陣。

(1.2)有了字典分解模型之后,需要對各個字典進行求解。上述字典分解模型有無窮個解,需要一些約束條件優(yōu)化得出最優(yōu)解。由于人臉圖像中稀疏噪聲的存在,可以假設(shè)D為一個滿秩的矩陣,所以去除了稀疏噪聲E之后的矩陣D-E應(yīng)當(dāng)是一個低秩的矩陣,那么A和B也是低秩矩陣,根據(jù)這些約束條件得到字典分解模型的求解模型如下:

s.t.D=A+BX+E; (約束條件)

其中,rank(A)和rank(B)分別表示矩陣A和B的秩,表示矩陣X的F范數(shù)的平方,||E||0表示矩陣E的零范數(shù),λ、τ和η是正的懲罰項系數(shù)。

(1.3)由于優(yōu)化秩函數(shù)和零范數(shù)都是NP-hard問題,所以分別利用它們的凸松弛核范數(shù)和1范數(shù)代替,得到最終的求解模型,即求解過程使用的求解模型,后面部分簡稱為求解模型:

s.t.D=A+BX+E。 (約束條件)

其中,||A||*和||B||*分別表示矩陣A和矩陣B的核范數(shù)(即矩陣的所有奇異值之和),矩陣的核范數(shù)可以用來近似替代矩陣的秩函數(shù)。||E||1表示矩陣E的1范數(shù),矩陣的1范數(shù)可以用來近似替代矩陣的零范數(shù)。由于優(yōu)化矩陣的秩函數(shù)和零范數(shù)都是很難求解的,所以在求解中分別用它們的凸松弛核范數(shù)和1范數(shù)代替。D=A+BX+E是約束條件。

步驟二:求解類特定字典A

由于求解模型有四個需要優(yōu)化的未知項,采用給定初值,固定其中兩個優(yōu)化另外兩個的方法循環(huán)迭代求解,具體過程如下:

(2.1)固定A和X。

X賦初值為單位矩陣X=I。

由于A和B的約束條件是相同的,所以并不能保證分解后A包含類特定信息,而B包含其他信息,所以需要把我們能夠知道的類特定信息盡可能多地賦給A,首先將每一類的訓(xùn)練數(shù)據(jù)進行奇異值分解(SVD-Singular Value Decomposition):

Di=UiiViT; (公式三)

然后把利用最大的奇異值對應(yīng)的奇異值向量得到的對訓(xùn)練數(shù)據(jù)重建的結(jié)果賦予給A:

奇異值分解的數(shù)學(xué)原理和含義如下:

奇異值分解的描述:假設(shè)M是一個m×n階矩陣,其中的元素全部屬于復(fù)數(shù)域,則存在一個分解使得M=UΣV*,其中U是m×m階酉矩陣;Σ是半正定m×n階對角矩陣;而V*,即V的共軛轉(zhuǎn)置,是n×n階酉矩陣。這樣的分解就稱作M的奇異值分解。Σ對角線上的元素即為M的奇異值。奇異值分解是矩陣分解的一種,可以將一個比較復(fù)雜的矩陣用更小更簡單的幾個子矩陣的相乘來表示,這些小矩陣描述的是矩陣的重要的特性。

上述公式三中,Di表示第i類的訓(xùn)練數(shù)據(jù)矩陣,Ui、∑i和ViT分別表示對Di進行奇異值分解得到的對應(yīng)的矩陣。上述公式四中,Ui(1:m,1)表示矩陣Ui的第一列;∑i(1,1)表示∑i矩陣第一行第一列的那個元素,即Di的最大的奇異值;表示Vi矩陣的第一列的轉(zhuǎn)置。的含義就是利用Ai的最大奇異值對應(yīng)的奇異值向量得到的對Di重建的結(jié)果。上述公式五中,A=(A1,A2,A3,...,AN)就是把每一類得到的Ai組成一個大矩陣。在這里的含義是指實數(shù)域,的含義是矩陣Ai是m行Ni列的,并且矩陣Ai里的元素都是屬于實數(shù)域的。

根據(jù)上述公式三至五給定A的初值和X的初值X=I之后,同時代入步驟一(1.3)中的求解模型得到:

s.t.D-A=BX+T; (約束條件)

其中,||B||*表示矩陣B的核范數(shù),||T||1表示矩陣T的1范數(shù)。因為在循環(huán)求解的過程中,本應(yīng)該用來表示稀疏噪聲的矩陣E會包含除了稀疏噪聲之外的其他信息,為了將兩者進行區(qū)分,所以在求解的過程中將矩陣E用矩陣T來表示。λ和δ是正的懲罰項系數(shù)。步驟一(1.3)中的求解模型因為現(xiàn)在固定了A和X所以可以寫成上述模型,而原始的約束條件D=A+BX+E也因此寫成了D-A=BX+T。

通過增廣拉格朗日乘子法求解上述模型可以得到B和T。

(2.2)固定A和B。

分別把A和B賦值為步驟(2.1)中使用的A和步驟(2.1)得到的B。代入步驟一(1.3)中的求解模型得到:

s.t.D-A=BX+T; (約束條件)

其中,表示矩陣X的F范數(shù)的平方,||T||1表示矩陣T的1范數(shù),τ和δ是正的懲罰項系數(shù)。步驟一(1.3)中的求解模型因為現(xiàn)在固定了A和B所以可以寫成上述模型,原始的約束條件D=A+BX+E也因此寫成了D-A=BX+T。

同樣利用增廣拉格朗日乘子法求解得到X和T。

(2.3)固定B和X。

分別把B和X賦值為步驟(2.1)得到的B和步驟(2.2)得到的X。代入步驟一(1.3)中的求解模型得到:

s.t.D-BX=A+T; (約束條件)

其中,||A||*表示矩陣A的核范數(shù),||T||1表示矩陣T的1范數(shù),η是正的懲罰項系數(shù)。步驟一(1.3)中的求解模型因為現(xiàn)在固定了B和X所以可以寫成上述模型,原始的約束條件D=A+BX+E也因此寫成了D-BX=A+T。

這是個標(biāo)準(zhǔn)的低秩矩陣恢復(fù)問題,用魯棒主成分分析RPCA-Robu st Principal Component Analysis求解得到A和E。

當(dāng)這三步完成時,一次循環(huán)也就完成了。實驗過程中,大量的實驗顯示只需要四次循環(huán)可以達到預(yù)設(shè)的收斂條件其中ε=10-4,從而求解得到最終的A和E。

步驟三:計算映射矩陣P

計算映射矩陣P來描述類特定字典A與訓(xùn)練數(shù)據(jù)矩陣D之間的關(guān)系:A=PD;求解其中是D的偽逆矩陣。

步驟四:校正測試圖像矩陣y,得到校正后的測試圖像yp

因為測試圖像矩陣y也是由類特定信息和其他信息組成的,但是由于只有單張圖片,不能通過上述字典分解方法提取類特定信息,而因為類特定字典A只包含類特定信息,不能夠很好地表示測試圖像,這時如果直接對測試圖像矩陣y用基于稀疏表示的分類器SRC進行分類,勢必會得到較低的識別率。所以要先用步驟三中得到的映射矩陣P對測試圖像矩陣y進行校正:yp=Py。

校正原理:

假設(shè)步驟二得到的類特定字典A是存在于訓(xùn)練數(shù)據(jù)矩陣D的某個子空間,那么測試圖像矩陣y中的類特定信息也應(yīng)該存在于同一個子空間,步驟三計算出類特定字典A與訓(xùn)練數(shù)據(jù)矩陣D之間的映射關(guān)系矩陣P,利用該映射矩陣P對測試圖像矩陣y進行映射,就可以得到測試圖像矩陣y屬于該子空間中的類特定信息。

步驟五:利用PCA降維

因為實際操作中人臉圖像是拉成向量進行運算,維度太高運算量太大,所以分別對類特定字典A和校正后的測試圖像yp進行主成分分析PCA(Principal Component Analysis)降維:

A'=F(A),y'=F(yp); (公式九)

其中,F(xiàn)(·)在公式里表示的PCA降維操作,A'=F(A)表示的是對矩陣A進行PCA降維操作得到降維后的類特定信息A',y'=F(yp)表示的是對校正后的測試圖像矩陣yp進行相同的PCA降維操作得到降維后的測試圖像y'。

實施例中選取的維度分別為25、50、75、100和150。

步驟六:利用SRC分類

利用SRC-sparse representation-based classifier基于稀疏表示的分類器對測試圖像進行分類:

(6.1)直接把降維后的類特定信息A'和降維后的測試圖像y'代入SRC模型中:

直接套用SRC模型就可以得到上述模型,其中βSRC是正的懲罰項系數(shù);

(6.2)求解得到稀疏表示系數(shù)α;

(6.3)計算測試圖像與每一類根據(jù)稀疏表示系數(shù)α重建結(jié)果的殘差確定測試圖像屬于哪一類:

其中,||y'-Aii||2表示的含義是校正后的測試圖像y'與第i類根據(jù)稀疏表示系數(shù)αi重建結(jié)果的距離,表示使得y'-Aii的2范數(shù)最小的那個i,上述公式十一的含義是測試圖像屬于使得上述距離最小的那一類。

詳細(xì)的判定方法如下:

對于步驟六(6.2)中得到的稀疏表示系數(shù)α,對每一類i,都有對應(yīng)于標(biāo)簽i的降維后的類特定信息Ai'和對應(yīng)于標(biāo)簽i的稀疏表示系數(shù)αi。然后計算對應(yīng)于第i類的降維后的測試圖像y'與重建結(jié)果的誤差e(i)=||y'-Aii||2。對所有的i,都計算出誤差對應(yīng)的e(i),比較誤差e(i),哪一類的誤差最小,測試圖像y'就屬于哪一類。

下表是上述實例運行10次的平均結(jié)果:

表1 帶有太陽鏡遮擋的AR數(shù)據(jù)庫上的識別率

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1