亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于塊內(nèi)相關(guān)性的二維線(xiàn)性鑒別分析人臉識(shí)別方法

文檔序號(hào):6561891閱讀:404來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):一種基于塊內(nèi)相關(guān)性的二維線(xiàn)性鑒別分析人臉識(shí)別方法
技術(shù)領(lǐng)域
本發(fā)明屬模式識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于塊內(nèi)相關(guān)性的二維線(xiàn)性鑒別分析人臉識(shí)別方法。
背景技術(shù)
人臉識(shí)別屬于模式識(shí)別的范疇,作為圖像分析與理解領(lǐng)域中最成功的應(yīng)用之一,人臉識(shí)別在商業(yè)應(yīng)用和研究領(lǐng)域都受到了廣泛的重視?,F(xiàn)有的人臉識(shí)別方法包括基于統(tǒng)計(jì)分析的人臉識(shí)別方法和基于模板匹配的人臉識(shí)別方法。
一幅具體的人臉圖像可以用一個(gè)n×n的矩陣A表示,也可以用一個(gè)n×n維的向量I表示。由于數(shù)據(jù)空間維的維數(shù)很高,造成識(shí)別時(shí)的比對(duì)相當(dāng)困難,通常需要使用降維的方法來(lái)壓縮數(shù)據(jù)。在基于統(tǒng)計(jì)分析的人臉識(shí)別方法中,PCA(Principal ComponentAnalysis,主元分析)和FDA(Fisher Linear Discriminant Analysis,F(xiàn)isher線(xiàn)性鑒別分析)就是常用的兩種一維降維識(shí)別方法。設(shè)H表示人臉圖像空間,e1,e2,…,eJ為H的一組標(biāo)準(zhǔn)正交向量,span(e1,e2,…,eJ)為這組向量張成的子空間,和φ分別表示兩幅人臉圖像,和φ在span(e1,e2,…,eJ)的投影分別為 和φ′=ΣJ=1J⟨φ,eJ⟩eJ,]]>其中<·,·>表示內(nèi)積。一維降維人臉識(shí)別方法用′和φ′之間的比對(duì)代替和φ之間的比對(duì),也即使用人臉圖像在標(biāo)準(zhǔn)正交系上的傅立葉系數(shù)代替原始圖像數(shù)據(jù)作為識(shí)別特征。通常將e1,e2,…,eJ稱(chēng)為特征臉,PCA和FDA的區(qū)別在于如何選擇特征臉。
在PCA人臉識(shí)別方法中(參考文獻(xiàn)[1]M.Turk and A.Pentland,″Face RecognitionUsing Eigenfaces″,Proc.IEEE Conf.on Computer Vision and Pattern Recognition,1991),將人臉圖像看作一個(gè)隨機(jī)向量Γ,取用Γ的協(xié)方差矩陣Σ的主元作為降維識(shí)別方法的特征臉,協(xié)方差矩陣為Σ=E(Γ-E[Γ])(Γ-E[Γ]T。所謂的“主元”就是對(duì)應(yīng)于協(xié)方差矩陣較大特征值并經(jīng)過(guò)標(biāo)準(zhǔn)正交化的那些特征向量。
盡管PCA方法在最小協(xié)方差意義下給出了模式樣本的最優(yōu)表示,但這一表示與模式分類(lèi)并非直接相關(guān)。也就是說(shuō),從模式分類(lèi)的角度,PCA方法所獲得的特征并非是最有效的,而FDA人臉識(shí)別方法(參考文獻(xiàn)[2]Peter N.Belhumeur,Joao P.Hespanha,″Eigenface vs.FisherfaceRecognition Using Class Specific Linear Projection,″IEEETransactions on Pattern Analysis and Machine Intelligence,vol.19,no.7,July 1997)則可以獲得樣本的最優(yōu)鑒別特征集,該特征集更利于模式的分類(lèi)。在FDA人臉識(shí)別方法中,用隨機(jī)向量Γ1,Γ2,…,ΓM表示M個(gè)不同的人的人臉圖像,分別計(jì)算類(lèi)內(nèi)散度矩陣Gw和類(lèi)間散度矩陣Gb如下Gw=1MΣm=1MΣm,]]>Gb=1MΣm=1M(E[Γm]-E[Γ])(E[Γm]-E[Γ])T,]]>并取用矩陣Gw-1Gb的主元作為降維方法的特征臉,這里,Σm=E(Γm-E[Γm])(Γm-E[Γm])T是每一類(lèi)的協(xié)方差矩陣。
在FDA方法中,模式樣本在投影后的新空間中有最大的類(lèi)間離散度和最小的類(lèi)內(nèi)離散度,即在該空間中有最佳的可分離性。實(shí)驗(yàn)表明,在光照條件變化較大、訓(xùn)練樣本數(shù)較多的情況下,F(xiàn)DA方法要優(yōu)于基于PCA方法(參考文獻(xiàn)[2])。然而,F(xiàn)DA方法仍然有一些缺陷,其一,由于FDA方法中圖像是以向量的形式表示,即使圖像的尺寸較小,轉(zhuǎn)化為向量后的維數(shù)仍會(huì)相當(dāng)高,這使得矩陣Gw-1Gb的維數(shù)過(guò)大,造成特征臉的計(jì)算非常困難;其二,F(xiàn)DA方法中需要計(jì)算類(lèi)內(nèi)散度矩陣Gw的逆,而在實(shí)際計(jì)算的時(shí)候是使用樣本平均來(lái)代替統(tǒng)計(jì)平均,由于每一類(lèi)樣本圖像的數(shù)量往往是很少的,在矩陣維數(shù)很高的情況下,Gw的奇異性問(wèn)題就很突出,這使得FDA方法的應(yīng)用受到很大的局限。
針對(duì)FDA方法的上述缺陷,去年(2005年)出現(xiàn)了一種稱(chēng)為2DFDA的改進(jìn)方法(參考文獻(xiàn)[3]Hui Kong,Eam Khwang Teoh,Jian Gang Wang,Ronda Venkateswarlu,AFramework of 2D Fisher Discriminant AnalysisApplication to Face Recognition with SmallNumber of Training Samples.Computer Vision and Pattern Recognition,2005.CVPR 2005.IEEE Computer Society Conference on.Volume 2,20-25June2005Page(s)1083-1088 vol.2),其基本思想是直接用圖像的二維矩陣進(jìn)行類(lèi)內(nèi)和類(lèi)間散度矩陣的計(jì)算,并在此基礎(chǔ)上進(jìn)行鑒別分析。2DFDA不但避免了龐大的計(jì)算量,而且在絕大多數(shù)情況下解決了小樣本類(lèi)內(nèi)散度矩陣奇異性的問(wèn)題。
然而,通過(guò)對(duì)2DFDA的數(shù)學(xué)分析可以發(fā)現(xiàn),2DFDA僅僅利用圖像矩陣同一行象素之間的相關(guān)性來(lái)構(gòu)造類(lèi)內(nèi)散度矩陣Gw。這樣做有二個(gè)缺點(diǎn)首先,2DFDA完全拋棄了行與行之間象素的相關(guān)性信息;其次,同一行內(nèi)相距較遠(yuǎn)的象素,它們的相關(guān)性較弱,對(duì)主元的確定幫助不大,徒耗計(jì)算資源。在人臉以別中,人臉的識(shí)別特征主要表現(xiàn)在局部區(qū)域,如人臉的主要器官眼睛、鼻子、嘴巴等,都屬于人臉的局部特征,但2DFDA方法使用的區(qū)域是圖像的同一行內(nèi)的象素,割裂了人臉局部區(qū)域象素的相關(guān)性,不利于人臉的正確識(shí)別的。
為了解決2DFDA方法的缺陷,本發(fā)明提出了一種改進(jìn)的2DFDA人臉識(shí)別方法。

發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種基于塊內(nèi)相關(guān)性的二維線(xiàn)性鑒別分析人臉識(shí)別方法,根據(jù)人臉圖像所具有的局域特征,即人臉圖像一個(gè)局部塊通常表示一個(gè)完整的語(yǔ)義,如鼻子、眼睛、嘴巴等等,采用將人臉圖像劃分成非重疊小塊,然后將每一個(gè)小塊中的元素按行相接產(chǎn)生相應(yīng)的行向量,再把行向量按順序排列成新的二維圖像矩陣的方法,最后將分塊、重排之后的二維圖像矩陣當(dāng)作輸入圖像,進(jìn)行2DFDA人臉識(shí)別。這樣的做法,充分利用了人臉局部區(qū)域各個(gè)像素之間的相關(guān)性信息,使得估計(jì)出圖像的二維協(xié)方差矩陣更為精確,可以達(dá)到更高的人臉識(shí)別率。
本發(fā)明方法包含建立一個(gè)反映人臉特征的人臉數(shù)據(jù)庫(kù)和一個(gè)通過(guò)計(jì)算歐式距離比較相似度的識(shí)別算法,步驟分為建庫(kù)和識(shí)別兩個(gè)階段。下面具體介紹這兩個(gè)階段1、建庫(kù)階段本階段的主要目的是建立一個(gè)包含人臉特征的數(shù)據(jù)庫(kù)。在識(shí)別階段,把待識(shí)別人臉圖像的特征與庫(kù)中人臉圖像的特征進(jìn)行比對(duì),取相似度最大的人臉圖像作為識(shí)別結(jié)果。
(1)本階段使用的人臉圖像是標(biāo)準(zhǔn)的正面人臉圖像,由于人臉圖像的標(biāo)準(zhǔn)化對(duì)最終的識(shí)別結(jié)果有著直接的影響,所以首先對(duì)輸入圖像進(jìn)行標(biāo)準(zhǔn)化處理,該工作分為兩個(gè)部分光線(xiàn)歸一化和尺寸歸一化。
光線(xiàn)歸一化將所有輸入圖像的灰度統(tǒng)一到標(biāo)準(zhǔn)水平,然后進(jìn)行直方圖均衡。統(tǒng)一圖像灰度的過(guò)程如下首先要選取一張灰度適中的人臉圖像,作為灰度歸一化的標(biāo)準(zhǔn)圖像,計(jì)算并記下其灰度平均值W,然后對(duì)每一幅輸入圖像進(jìn)行灰度調(diào)整①計(jì)算出該幅圖像的灰度平均值w;②計(jì)算灰度調(diào)整比例Cw=W/w;③將該幅圖像所有像素的灰度值乘以Cw進(jìn)行調(diào)整。
尺寸歸一化根據(jù)第(2)步中算法的需要(即要保證每個(gè)子分塊所包含像素個(gè)數(shù)與原圖像一行的像素個(gè)數(shù)相同),將所有輸入圖像的尺寸調(diào)整為合適大小。
(2)對(duì)經(jīng)過(guò)標(biāo)準(zhǔn)化的圖像進(jìn)行分塊、重排的操作,構(gòu)造新的二維圖像矩陣。
任意一幅標(biāo)準(zhǔn)化圖像,都可以用一個(gè)m×n的二維矩陣來(lái)表示,矩陣元素表示像素的灰度值,將圖像矩陣記為A,即 將矩陣A劃分為p×q個(gè)大小相同的子矩陣,即 其中,每個(gè)分塊Akl(k=1,2,…,p;l=1,2,…,q)是m′×n′維的矩陣,即有p×m′=m,q×n′=n,并要求每個(gè)分塊的大小m′×n′=n(需要第(1)步中尺寸歸一化的配合)。
于是,每一幅圖像就被分為p×q=m個(gè)分塊,按順序記為Di,即 對(duì)每一分塊進(jìn)行逐行掃描,得到每一分塊對(duì)應(yīng)的行向量表示Vi 這里i=1,2,…,m,再將這些行向量按順序重排,構(gòu)造出新的二維圖像矩陣A′如下A′=V1V2...Vm]]>
新的二維圖像矩陣A′由m個(gè)n維(m′×n′=n)的行向量組成,尺寸與原圖像一樣,也是m×n維的,但新矩陣中每一個(gè)行向量選取的是原圖像處于同一局部塊內(nèi)的像素。
對(duì)所有的輸入圖像都進(jìn)行上面的圖像分塊、重排操作,得到對(duì)應(yīng)的二維圖像矩陣庫(kù)。
(3)計(jì)算最優(yōu)投影方向假設(shè)總共有C類(lèi)訓(xùn)練樣本,每類(lèi)樣本有Ni幅圖像,i=1,2,…,C,則訓(xùn)練樣本總數(shù)為N=Σi=1CNi.]]>進(jìn)行圖像分塊、重排的操作之后,第i類(lèi)第j個(gè)樣本Aij對(duì)應(yīng)于m×n維的二維矩陣Ai′j,根據(jù)這些二維圖像矩陣可以計(jì)算出類(lèi)內(nèi)和類(lèi)間散度矩陣,計(jì)算公式如下類(lèi)內(nèi)散度矩陣Gw=1NΣi=1CΣi=1Ni(Ai′j-Ai′‾)T(Ai′j-Ai′‾)]]>類(lèi)間散度矩陣Gb=1NΣi=1CNi(Ai′‾-A′‾)T(Ai′‾-A′‾)]]>其中, 為所有訓(xùn)練樣本的均值, 為第i類(lèi)的Ni幅訓(xùn)練樣本的均值。由定義可知,Gw和Gb都是n×n維的非負(fù)定矩陣,而且通常情況下Gw是可逆的。
由Fisher鑒別準(zhǔn)則J(X)=tr(PGb)tr(PGw)=|XTGbX||XTGwX|]]>尋找最優(yōu)投影矩陣X使J(X)最大化,可通過(guò)選取Gw-1Gb最大的前d個(gè)特征值所對(duì)應(yīng)的正交特征向量組X1,X2,…,Xd,利用這組最優(yōu)投影方向構(gòu)成Fisher最優(yōu)投影矩陣X=[X1,X2,…,Xd],X是一個(gè)n×d維的矩陣。
2DFDA的目標(biāo),就是要尋找Fisher最優(yōu)投影方向X,最大化投影后樣本的類(lèi)間離散度,同時(shí)最小化樣本的類(lèi)內(nèi)離散度。其物理意義是模式樣本在這些最優(yōu)投影方向上投影后,同一類(lèi)的模式樣本相互集中,不同類(lèi)的模式樣本相互分離。
(4)提取輸入圖像的特征矩陣建立數(shù)據(jù)庫(kù)給定的訓(xùn)練樣本Aij經(jīng)過(guò)分塊、重排后對(duì)應(yīng)于二維矩陣Ai′j,將其投影到Fisher投影矩陣X=[X1,X2,…,Xd]上,即
Yk=Ai′jXk,]]>k=1,2,…,d則可獲得一組投影特征向量Y1,Y2,…,Yd,它們構(gòu)成了訓(xùn)練樣本Aij的Fisher特征矩陣Bij=[Y1,Y2,···,Yd]=Ai′j(X1,X2,···,Xd)=Ai′jX,]]>Bij的大小為m×d(d<<n)。
將每一幅訓(xùn)練樣本Aij的Fisher特征矩陣Bij都保存在數(shù)據(jù)庫(kù)中,待識(shí)別階段使用。在上述步驟中,第(2)步是最重要的,體現(xiàn)了本發(fā)明的核心內(nèi)容。
2、識(shí)別階段對(duì)一幅待識(shí)別人臉圖像T,進(jìn)行與建庫(kù)階段第(1)、(2)步相同的圖像標(biāo)準(zhǔn)化與圖像分塊、重排操作之后,得到經(jīng)過(guò)重排的二維矩陣T′,將T′向最優(yōu)投影方向投影,得到圖像T的Fisher特征矩陣 計(jì)算Fisher特征矩陣BT與人臉庫(kù)中的每一個(gè)Fisher特征矩陣Bij(i=1,2,…C,j=1,2,…Ni)之間的歐氏距離d(BT,Bij)。歐氏距離的定義如下對(duì)任意兩幅圖像Ai和Aj,對(duì)分別對(duì)應(yīng)于Fisher特征矩陣 和 則有d(Bi,Bj)=Σk=1d||Yk(i)-Yk(j)||2]]>其中,||Yk(i)-Yk(j)||示兩個(gè)Fisher特征向量Yk(i)和Yk(j)之間的歐式距離。
判別待識(shí)別人臉圖像T所屬分類(lèi)的過(guò)程如下對(duì)人臉庫(kù)中所有圖像A1,A2,…,AN(N為訓(xùn)練圖像總數(shù)),每一幅圖像都屬于某個(gè)確定的類(lèi)別ωk(k=1,2,…,C),它們的特征矩陣分為B1,B2,…,BN。對(duì)于一幅給定的待識(shí)別人臉圖像T,其對(duì)應(yīng)的Fisher特征矩陣為BT,若有d(BT,Bl)=mindjd(BT,Bj)]]>(j=1,2,…,N),且Bl∈ωk,則分類(lèi)的結(jié)果是B∈ωk。
本發(fā)明優(yōu)點(diǎn)二維線(xiàn)性判別分析(2DFDA)人臉識(shí)別方法是去年(2005年)提出的線(xiàn)性判別分析(FDA)人臉識(shí)別方法的一種改進(jìn)方法。時(shí)間雖短,但因其性能優(yōu)良為業(yè)界廣泛接受和肯定。但是,2DFDA方法在計(jì)算人臉特征向量時(shí)僅僅利用人臉圖像同一行象素之間的相關(guān)性,沒(méi)有考慮人臉圖像不同行象素之間的相關(guān)性。在人臉識(shí)別中,人臉的局部特征(鼻子、眼睛、嘴巴、下巴、額頭等等)起著舉足輕重的作用,因此,人臉識(shí)別方法應(yīng)該充分利用人臉圖像局部區(qū)域內(nèi)各個(gè)象素之間的相關(guān)性。本發(fā)明提出的方法是2DFDA的改進(jìn)算法。本發(fā)明先把人臉圖像分塊,然后把圖像塊內(nèi)的象素按照一定順序轉(zhuǎn)化為新圖像的行元素,最后對(duì)新圖像進(jìn)行2DFDA建庫(kù)和識(shí)別。本發(fā)明在保持2DFDA優(yōu)點(diǎn)的同時(shí),以一種簡(jiǎn)單實(shí)用的方式彌補(bǔ)了2DFDA的缺點(diǎn)。


圖1、基于塊內(nèi)相關(guān)性的人臉識(shí)別方法建庫(kù)階段的算法流程2、基于塊內(nèi)相關(guān)性的人臉識(shí)別方法識(shí)別階段的算法流程3、人臉圖像分塊、重排的操作示意圖。其中,圖(a)表示對(duì)原圖像進(jìn)行分塊,每一個(gè)小方塊代表一個(gè)分塊矩陣;圖(b)表示原圖像中的一個(gè)分塊矩陣,每一個(gè)小方塊代表一個(gè)像素;圖(c)表示將分塊矩陣逐行掃描排列成的行向量,每一個(gè)小方塊代表一個(gè)像素;圖(d)表示將所有行向量按順序重排產(chǎn)生的新的二維圖像矩陣,每一行表示一個(gè)行向量。
圖4、實(shí)施案例的結(jié)果人臉識(shí)別率比較(FERET數(shù)據(jù)集)圖5、實(shí)施案例的結(jié)果最佳人臉識(shí)別率比較(FERET數(shù)據(jù)集)圖6、實(shí)施案例的結(jié)果相同識(shí)別率下Fisher特征向量數(shù)目比較(FERET數(shù)據(jù)集)具體實(shí)施方式
下面以FERET人臉庫(kù)為例,說(shuō)明本方法的實(shí)施過(guò)程。
選擇FERET庫(kù)中的60人,每人6幅圖像,共360幅圖像組成訓(xùn)練和測(cè)試人臉庫(kù),包括了在不同表情、光線(xiàn)、遮擋等情況下的人臉,圖像尺寸為112×92。
隨機(jī)選取庫(kù)中3幅圖像/人用于訓(xùn)練,余下的3幅圖像/人用于測(cè)試。隨機(jī)抽取實(shí)驗(yàn)重復(fù)30次,取識(shí)別率的平均值作為最終識(shí)別率。具體實(shí)施流程如下1、建庫(kù)階段(1)圖像標(biāo)準(zhǔn)化對(duì)圖像進(jìn)行預(yù)處理,包括光線(xiàn)歸一化和尺寸歸一化。經(jīng)過(guò)預(yù)處理之后,所有圖像的灰度統(tǒng)一到標(biāo)準(zhǔn)水平,且灰度層次比較分明(因?yàn)榻?jīng)過(guò)了直方圖均衡化)。預(yù)處理后的圖像尺寸變?yōu)?6×80。
(2)圖像的分塊、重排分塊每個(gè)塊的大小為8×10,一共包含80個(gè)像素,和標(biāo)準(zhǔn)化后圖像一行的像素個(gè)數(shù)相同。每一幅圖像被分為96塊,塊數(shù)與標(biāo)準(zhǔn)化后圖像的行數(shù)相同。
重排按行掃描每個(gè)分塊得到對(duì)應(yīng)的行向量,將一幅圖像的96個(gè)行向量按順序排列得到一個(gè)96×80的矩陣,即重排之后的二維圖像矩陣。
(3)計(jì)算最優(yōu)投影向量組為了找出最合適的主元數(shù)目,本案例中對(duì)最優(yōu)投影向量組中向量(即主元)個(gè)數(shù)為1~10的情況都做實(shí)驗(yàn),即得到10種不同的最優(yōu)投影向量組。
(4)提取圖像的特征矩陣建立數(shù)據(jù)庫(kù)將分塊、重排后的二維圖像矩陣向最優(yōu)投影向量組投影,由于所取主元數(shù)目共20種情況,因此需要重復(fù)本步驟,每次實(shí)驗(yàn)的過(guò)程類(lèi)似,但由于最優(yōu)投影向量組不相同,所以得到的特征矩陣庫(kù)也不相同,最終產(chǎn)生10組特征矩陣庫(kù)。
2、識(shí)別階段對(duì)每一幅測(cè)試圖像,依次進(jìn)行圖像標(biāo)準(zhǔn)化,圖像的分塊、重排,提取特征矩陣三個(gè)步驟,由于主元數(shù)目的不同,會(huì)產(chǎn)生10組特征矩陣。然后計(jì)算特征矩陣與對(duì)應(yīng)的特征矩陣庫(kù)中每一個(gè)特征矩陣的距離,判別距離最近的為匹配人臉,這里所說(shuō)的對(duì)應(yīng)關(guān)系是指產(chǎn)生本步驟中特征矩陣與產(chǎn)生特征矩陣庫(kù)所使用的主元數(shù)目是相同的。
統(tǒng)計(jì)匹配正確和錯(cuò)誤的人臉圖像數(shù)目,計(jì)算不同主元數(shù)目下的人臉識(shí)別率,然后重復(fù)進(jìn)行隨機(jī)實(shí)驗(yàn),取30次實(shí)驗(yàn)的人臉識(shí)別率平均值作為最終識(shí)別率。
主元構(gòu)成圖像空間的子空間,隨著主元數(shù)目的增加,主元構(gòu)成的子空間會(huì)向相鄰圖像空間擴(kuò)張,各種降維識(shí)別方法(包括2DFDA方法)的識(shí)別效果也將逐漸趨同,因此,各種降維識(shí)別方法的識(shí)別性能,主要是指在低維子空間上獲得高的判別率。由本案例的實(shí)驗(yàn)結(jié)果可以看出,在主元數(shù)目較少的時(shí)候,人臉識(shí)別率隨著主元數(shù)目的增加迅速上升,在主元數(shù)目為10的時(shí)候得到了最優(yōu)識(shí)別結(jié)果。
圖4顯示了利用了塊內(nèi)相關(guān)性的算法和沒(méi)有利用塊內(nèi)相關(guān)性的算法的在人臉識(shí)別率上的差別,上面那條曲線(xiàn)是利用了塊內(nèi)相關(guān)性的算法所得到的結(jié)果,在主元數(shù)目較少的情況下,明顯優(yōu)于沒(méi)有利用塊內(nèi)相關(guān)性的算法。實(shí)驗(yàn)條件與前述相同,使用FERET人臉庫(kù)中的部分圖像,取60×3幅為訓(xùn)練樣本,60×3幅為測(cè)試樣本。
圖5顯示了不同訓(xùn)練樣本數(shù)目的情況下,利用了塊內(nèi)相關(guān)性的算法和沒(méi)有利用塊內(nèi)相關(guān)性的算法的最佳人臉識(shí)別率的差別,上面那條曲線(xiàn)是利用了塊內(nèi)相關(guān)性的算法所得到的結(jié)果。實(shí)驗(yàn)條件是取訓(xùn)練k個(gè)訓(xùn)練樣本數(shù)/類(lèi)(2≤k≤4),即60×k幅作為訓(xùn)練樣本,60×(6-k)幅為測(cè)試樣本。
圖6顯示了在相同識(shí)別率的情況下,利用了塊內(nèi)相關(guān)性的算法和沒(méi)有利用塊內(nèi)相關(guān)性的算法的對(duì)應(yīng)的Fisher特征向量數(shù)目的比較。實(shí)驗(yàn)條件是取訓(xùn)練k個(gè)訓(xùn)練樣本數(shù)/類(lèi)(2≤k≤4),即60×k幅作為訓(xùn)練樣本,60×(6-k)幅為測(cè)試樣本。
權(quán)利要求
1.一種基于塊內(nèi)相關(guān)性的人臉識(shí)別方法,其特征在于一個(gè)將人臉圖像分塊重排的算法、一個(gè)基于二維線(xiàn)性鑒別分析(簡(jiǎn)稱(chēng)2DFDA)的最優(yōu)投影方向計(jì)算方法和一個(gè)通過(guò)計(jì)算歐式距離比較相似度的識(shí)別算法。具體步驟分建庫(kù)和識(shí)別兩個(gè)階段(1)建庫(kù)階段①對(duì)訓(xùn)練樣本圖像進(jìn)行標(biāo)準(zhǔn)化,包括光線(xiàn)歸一化和尺寸歸一化;②對(duì)經(jīng)過(guò)標(biāo)準(zhǔn)化的訓(xùn)練樣本圖像進(jìn)行分塊、重排的操作,構(gòu)造新的二維圖像矩陣;③將上一步驟得到的二維圖像矩陣作為輸入圖像,選擇一定的特征值數(shù)目,使用2DFDA方法計(jì)算出Fisher最優(yōu)投影向量組X1,X2,…,Xd;④將新構(gòu)造出的二維圖像矩陣向Fisher最優(yōu)投影方向上投影,抽取出反映人臉特征的數(shù)據(jù),即Fisher特征矩陣,并將其全部保存在數(shù)據(jù)庫(kù)中,待識(shí)別階段使用。(2)識(shí)別階段①對(duì)測(cè)試圖像進(jìn)行標(biāo)準(zhǔn)化,包括光線(xiàn)歸一化和尺寸歸一化;②對(duì)經(jīng)過(guò)標(biāo)準(zhǔn)化的測(cè)試圖像進(jìn)行分塊、重排的操作,構(gòu)造新的二維圖像矩陣;③將新構(gòu)造出的二維圖像矩陣向最優(yōu)投影方向上投影,獲得相應(yīng)的Fisher特征矩陣;④計(jì)算測(cè)試圖像的特征矩陣與數(shù)據(jù)庫(kù)中各特征矩陣之間的歐式距離,將距離最近的特征矩陣對(duì)應(yīng)的人臉圖像判別為匹配圖像,匹配圖像對(duì)應(yīng)的分類(lèi)即為識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的人臉識(shí)別方法,其特征在于所述的將人臉圖像分塊重排的算法如下任意一幅標(biāo)準(zhǔn)化圖像,都可以用一個(gè)m×n的二維矩陣來(lái)表示,矩陣元素表示像素的灰度值,將圖像矩陣記為A,即 將矩陣車(chē)A劃分為p×q個(gè)大小相同的子矩陣,即 其中,每個(gè)分塊Ak1(=1,2,…,p;l=1,2,…,q)是m′×n′維的矩陣,即有p×m′=m,q×n′=n,并要求每個(gè)分塊的大小m′×n′=n。于是,每一幅圖像就被分為,p×q=m個(gè)分塊,按順序記為Di(i=1,2,…m),即 對(duì)每一分塊進(jìn)行逐行掃描,得到每一分塊對(duì)應(yīng)的行向量表示V1(i=1,2,…m)Vi=[d11id12i···d1n'id21id22i···d2n'i···dm'1idm'2i···dm'n'i]]]>再將這些行向量按順序重排,構(gòu)造出新的二維圖像矩陣A′如下A'=V1V2...Vm]]>新的二維圖像矩陣A′由m個(gè)n維(m′×n′=n)的行向量組成,尺寸與原圖像一樣,也是m×n維的,但新矩陣中每一個(gè)行向量選取的是原圖像處于同一局部塊內(nèi)的像素。
3.根據(jù)權(quán)利要求1所述的人臉識(shí)別方法,其特征在于所述的基于二維線(xiàn)性鑒別分析(簡(jiǎn)稱(chēng)2DFDA)的最優(yōu)投影方向計(jì)算方法如下假設(shè)總共有C類(lèi)訓(xùn)練樣本,每類(lèi)樣本有Ni(i=1,2,…C)幅圖像,則訓(xùn)練樣本總數(shù)為N=Σi=1CNi]]>。進(jìn)行圖像分塊、重排的操作之后,第i類(lèi)第j個(gè)樣本Aij對(duì)應(yīng)于m×n維的二維矩陣Ai′j,根據(jù)這些二維圖像矩陣可以計(jì)算出類(lèi)內(nèi)和類(lèi)間散度矩陣,計(jì)算公式如下類(lèi)內(nèi)散度矩陣Gw=1NΣi=1CΣj=1Ni(Ai′j-Ai′‾)T(Ai′j-Ai′‾)]]>類(lèi)間散度矩陣Gb=1NΣi=1CNi(Ai'‾-A'‾)T(Ai'‾-A'‾)]]>其中, 為所有訓(xùn)練樣本的均值, 為第i類(lèi)的Ni幅訓(xùn)練樣本的均值。由定義可知,Gw和Gb都是n×n維的非負(fù)定矩陣,而且通常情況下Gw是可逆的。由Fisher鑒別準(zhǔn)則J(X)=tr(PGb)tr(PGw)=|XTGbX||XTGwX|]]>尋找最優(yōu)投影矩陣X使J(X)最大化,可通過(guò)選取Gw-1Gb最大的前d個(gè)特征值所對(duì)應(yīng)的正交特征向量組X1,X2,…,Xd,利用這組最優(yōu)投影方向構(gòu)成Fisher最優(yōu)投影矩陣X=[X1,X2,…,Xd],X是一個(gè)n×d維的矩陣。
4.根據(jù)權(quán)利要求1所述的人臉識(shí)別方法,其特征在于所述的通過(guò)計(jì)算歐式距離比較相似度的識(shí)別算法如下對(duì)任意兩幅圖像Ai和Aj,對(duì)分別對(duì)應(yīng)于Fisher特征矩陣 和Bj=[Y1(j),Y2(j),···,Yd(j)],]]>則有d(Bi,Bj)=Σk=1d||Yk(i)-Yk(j)||2]]>其中,‖Yk(i)-Yk(j)‖2示兩個(gè)Fisher特征向量Yk(i)和Yk(j)之間的歐式距離。對(duì)人臉庫(kù)中所有圖像A1,A2,…,AN(N為訓(xùn)練圖像總數(shù)),每一幅圖像都屬于某個(gè)確定的類(lèi)別ωk(k=1,2,…,C),它們的特征矩陣分為B1,B2,…,BN。對(duì)于一幅給定的待識(shí)別人臉圖像T,其對(duì)應(yīng)的Fisher特征矩陣為BT,若有d(BT,Bl)=mindj(BT,Bj)]]>(j=1,2,…,N),且Bl∈ωk,則分類(lèi)的結(jié)果是B∈ωk。
全文摘要
本發(fā)明屬模式識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于塊內(nèi)相關(guān)性的二維線(xiàn)性鑒別分析(簡(jiǎn)稱(chēng)2DFDA)人臉識(shí)別方法。本方法根據(jù)人臉圖像所具有的局域特征,將人臉圖像劃分成非重疊小塊,然后將每一個(gè)小塊中的元素按行相接產(chǎn)生相應(yīng)的行向量,再把行向量按順序排列成新的二維圖像矩陣,最后將分塊、重排之后的二維圖像矩陣當(dāng)作輸入圖像,進(jìn)行2DFDA人臉識(shí)別。本方法的優(yōu)點(diǎn)在于充分利用了局部區(qū)域里行與列像素之間的相關(guān)性信息,能夠較好地保留人臉的局域特征信息,可以達(dá)到較高的人臉識(shí)別率,而且計(jì)算復(fù)雜度較低。
文檔編號(hào)G06K9/00GK101021897SQ20061013234
公開(kāi)日2007年8月22日 申請(qǐng)日期2006年12月27日 優(yōu)先權(quán)日2006年12月27日
發(fā)明者馬爭(zhēng)鳴, 胡海峰, 李瑩, 張成言 申請(qǐng)人:中山大學(xué)
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1