專利名稱:基于全局和局部結(jié)構(gòu)融合的圖像特征提取方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于全局和局部結(jié)構(gòu)融合的圖像特征提取方法,屬于智能信息處理領(lǐng)域。
背景技術(shù):
圖像識(shí)別技術(shù)已經(jīng)成為當(dāng)今研究和應(yīng)用的熱點(diǎn)之一。該項(xiàng)技術(shù)已成功應(yīng)用于人臉識(shí)別、車牌識(shí)別、視頻監(jiān)控、目標(biāo)跟蹤識(shí)別等領(lǐng)域。
作為圖像識(shí)別關(guān)鍵環(huán)節(jié)之一的特征提取方法,就是將原始的高維圖像數(shù)據(jù)映射到一個(gè)低維的特征空間。該技術(shù)已經(jīng)成為機(jī)器學(xué)習(xí)和模式識(shí)別領(lǐng)域的一個(gè)研究熱點(diǎn)。常用的特征提取方法有線性鑒別分析方法(Linear Discriminant Analysis,簡(jiǎn)稱LDA),局部保留映射方法(Locality Preserving Projection,簡(jiǎn)稱LPP)等。
線性鑒別分析方法是模式識(shí)別中的經(jīng)典算法(K.Fukunaga.“Introduction tostatistical pattern classification”.Academic Press,San Diego,California,USA,1990.“統(tǒng)計(jì)模式識(shí)別導(dǎo)論”)。這種方法通過最大化類間散布矩陣而最小化類內(nèi)散布矩陣,獲取目標(biāo)圖像數(shù)據(jù)的全局結(jié)構(gòu)信息,使得投影后的模式樣本的類間散布最大而類內(nèi)散布最小,也就是說,投影后保證模式樣本在新的空間中有最大的類間距離和最小的類內(nèi)距離,即模式在該空間中有最佳的可分離性。
最近,局部幾何結(jié)構(gòu)在特征提取領(lǐng)域引起了廣泛的關(guān)注,而局部幾何結(jié)構(gòu)可以通過拉普拉斯矩陣獲得。局部保留映射(X.He,P.Niyogi.“Locality Preserving Projections”.In Proc.Conf.Advances in Neural Information Processing Systems,2003.“局部保留映射”)法正是根據(jù)這一思想發(fā)展起來的一種新的特征提取方法,它基于圖的拉普拉斯矩陣計(jì)算數(shù)據(jù)的低維流形,其方法是首先構(gòu)造原始數(shù)據(jù)的鄰接圖,建立圖的拉普拉斯矩陣,然后以在原始空間中距離接近的兩個(gè)數(shù)據(jù)點(diǎn),投影后在特征空間中的距離更近為準(zhǔn)則,求得變換矩陣,獲取目標(biāo)圖像數(shù)據(jù)集的局部結(jié)構(gòu)信息。
以上兩種方法用于圖像識(shí)別,都取得了令人滿意的識(shí)別結(jié)果。但是LDA、LPP分別主要提取圖像數(shù)據(jù)集的全局信息、局部信息,僅能反映數(shù)據(jù)集某方面的特征,而在現(xiàn)實(shí)世界中,目標(biāo)圖像數(shù)據(jù)集的結(jié)構(gòu)通常非常復(fù)雜,僅僅靠全局信息或僅僅靠局部結(jié)構(gòu)信息,可能不足以揭示目標(biāo)圖像數(shù)據(jù)集內(nèi)在的真實(shí)結(jié)構(gòu)。而且在圖像識(shí)別中,全局結(jié)構(gòu)特征相對(duì)更重要,還是局部結(jié)構(gòu)特征相對(duì)更重要,隨著應(yīng)用對(duì)象的不同而不同。因此尋求一種兼顧全局結(jié)構(gòu)信息和局部結(jié)構(gòu)信息的特征融合提取方法具有重要的意義。在進(jìn)一步的檢索中尚未發(fā)現(xiàn)融合這兩種特征的圖像識(shí)別方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)現(xiàn)有方法中存在的不足,提出一種融合全局結(jié)構(gòu)信息和局部結(jié)構(gòu)信息特征的提取方法,稱之為一種基于全局和局部特征融合的圖像分析方法(Global andLocal feature fusion Analysis,簡(jiǎn)稱GLA),使其達(dá)到同時(shí)兼顧全局和局部結(jié)構(gòu)信息,提取更具鑒別力的特征的目的,將該方法用于圖像識(shí)別,能夠提高識(shí)別的精度。
為了達(dá)到上述目的,本發(fā)明提供了一種基于全局和局部結(jié)構(gòu)融合的圖像特征提取方法,其技術(shù)原理是,首先是構(gòu)造訓(xùn)練圖像數(shù)據(jù)的加權(quán)鄰接圖,確定相似矩陣、度矩陣和圖的拉普拉斯矩陣;然后確定訓(xùn)練圖像數(shù)據(jù)的類內(nèi)散布矩陣和類間散布矩陣;根據(jù)全局和局部特征融合分析方法的目標(biāo)函數(shù),得到投影矩陣;最后利用該投影矩陣把訓(xùn)練圖像和測(cè)試圖像分別投影到特征空間中,采用最小距離分類器,進(jìn)行圖像識(shí)別。
具體步驟如下 步驟1、構(gòu)造訓(xùn)練數(shù)據(jù)的加權(quán)鄰接圖 步驟1.1、在現(xiàn)有的數(shù)據(jù)集的每一類數(shù)據(jù)中,選取任意個(gè)數(shù)n的數(shù)據(jù)點(diǎn)組成訓(xùn)練圖像數(shù)據(jù)集,并在剩余的數(shù)據(jù)點(diǎn)中選取任意個(gè)數(shù)的數(shù)據(jù)點(diǎn)組成測(cè)試圖像數(shù)據(jù)集,其中每一個(gè)數(shù)據(jù)點(diǎn)為一幅圖像; 步驟1.2、通過頂點(diǎn)以及每個(gè)頂點(diǎn)與其最近鄰點(diǎn)之間邊的權(quán)值構(gòu)造加權(quán)鄰接圖; 步驟1.2.1、加權(quán)鄰接圖的每個(gè)頂點(diǎn)對(duì)應(yīng)于訓(xùn)練圖像數(shù)據(jù)集中的一個(gè)數(shù)據(jù)點(diǎn); 步驟1.2.2、若頂點(diǎn)xj屬于頂點(diǎn)xi的k-最近鄰點(diǎn),k為最近鄰范圍,即xj是xi的k范圍內(nèi)的最近鄰點(diǎn),則在xi和xj之間建立一條邊e=ij,其權(quán)值通過下式求出
其中,若頂點(diǎn)xj屬于頂點(diǎn)xi的k-最近鄰點(diǎn)或頂點(diǎn)xi屬于頂點(diǎn)xj的k-最近鄰點(diǎn),則w(i,j)為通過式(1)求出,其他情況下,w(i,j)=式(2);β為任一正實(shí)數(shù);w(i,j)大于0并小于等于1,其反映了相鄰接的兩個(gè)圖像數(shù)據(jù)點(diǎn)間的相似程度,w(i,j)越大說明這兩點(diǎn)越相似; 步驟2、根據(jù)步驟1得到的加權(quán)鄰接圖確定相似矩陣W、度矩陣D和加權(quán)鄰接圖的拉普拉斯矩陣L 步驟2.1、相似矩陣W中的每個(gè)元素的值為通過步驟1.2.2求得的w(i,j),即Wij=w(i,j),其中i=1,2,3,…,n、j=1,2,3,…,n; 步驟2.2、度矩陣D=diag(d1,d2,L,dn),其中,di為頂點(diǎn)xi的度,其值通過以下公式求出 步驟2.3、加權(quán)鄰接圖的拉普拉斯矩陣L=D-W,即
相似矩陣W的每行的元素值,只考慮了該行所代表的數(shù)據(jù)點(diǎn)與其最近鄰范圍內(nèi)的k個(gè)數(shù)據(jù)點(diǎn)的相似程度,即只有k個(gè)元素值非零,其余值均為零,這樣W體現(xiàn)了數(shù)據(jù)集的局部結(jié)構(gòu),而k定義了W的局部特性,L和D都是在W的基礎(chǔ)上生成的; 步驟3、確定訓(xùn)練圖像數(shù)據(jù)集的類內(nèi)散布矩陣Sw和類間散布矩陣Sb類內(nèi)散布矩陣Sw和類間散布矩陣Sb分別通過以下公式求出 其中,數(shù)據(jù)集X包含n個(gè)訓(xùn)練圖像數(shù)據(jù)點(diǎn),有c個(gè)目標(biāo)類別,則第i類目標(biāo)的數(shù)據(jù)集為Xi(i=1,2,L,c),其數(shù)據(jù)點(diǎn)個(gè)數(shù)為ni,則X=[X1,X2,Λ,Xc];x是指n個(gè)數(shù)據(jù)點(diǎn)中屬于第i類目標(biāo)的各個(gè)數(shù)據(jù)點(diǎn);為第i類目標(biāo)的均值向量,為總體的均值向量,其中,i=1,2,…,c; Sw和Sb反映的是數(shù)據(jù)集的二階統(tǒng)計(jì)信息,它們每個(gè)元素都是由數(shù)據(jù)集的所有數(shù)據(jù)點(diǎn)綜合而成的,因此Sw和Sb都是對(duì)數(shù)據(jù)集的一種全局描述;并且可以通過公式求出Sw的跡,它度量了類的內(nèi)聚程度,其中e∈RD,且e的元素全為1,eT表示該列向量的轉(zhuǎn)置,Sw的跡是大于等于零的數(shù),越大表示類內(nèi)散布越大,越小表示類內(nèi)散布越小,亦可以通過公式求出Sb的跡,它度量了類間的分離程度,其值是大于等于零的數(shù),越大表示類間散布越大,越小表示類間散布越??; 步驟4、確定投影矩陣A 投影矩陣A通過通過以下公式求出 其中,ρ為調(diào)節(jié)因子,且0≤ρ≤1,若ρ=0,上述公式表示全局特征,若ρ=1,上述公式表示局部特征;n為訓(xùn)練圖像數(shù)據(jù)集中數(shù)據(jù)點(diǎn)的總數(shù);X為訓(xùn)練圖像數(shù)據(jù)集中所有的數(shù)據(jù)點(diǎn)構(gòu)成的矩陣; 引入n是為了消除Sw和XLXT計(jì)算上的差異;ATSwA為投影后的類內(nèi)散布矩陣,表示投影后的數(shù)據(jù)之間的全局特性;ATSbA表示投影以后的類間散布矩陣;由步驟3中對(duì)Sw的跡和Sb的跡的說明可以得知,上述公式中ATSwA的跡trace(ATSwA)可以用來度量投影后類的內(nèi)聚程度,ATSbA的跡trace(ATSbA)可以用來度量投影后類間的分離程度;矩陣XLXT的每個(gè)元素都只是對(duì)局部信息的反映,反應(yīng)了數(shù)據(jù)之間的局部特性,ATXLXTA表示投影后的數(shù)據(jù)之間的局部特性; 通過上述公式可以提取出全局結(jié)構(gòu)特征和局部結(jié)構(gòu)特征綜合后所得到的復(fù)合特征,這些特征可以更全面地表達(dá)目標(biāo)數(shù)據(jù),即可以轉(zhuǎn)化為求解如下廣義特征值問題的最小特征值對(duì)應(yīng)的特征向量 其中,調(diào)節(jié)因子ρ的最佳取值可以通過試驗(yàn)確定;λ是矩陣A的特征值;α是λ對(duì)應(yīng)的特征向量; 步驟5、識(shí)別 將訓(xùn)練圖像和測(cè)試圖像分別利用上述投影矩陣A映射到特征空間中,得到訓(xùn)練系數(shù)矩陣和測(cè)試系數(shù)矩陣,采用最小距離分類器,即可獲得識(shí)別結(jié)果。
進(jìn)一步,步驟5中所述的采用最小距離分類器是指把各類別樣本的均值向量作為各類的代表點(diǎn),根據(jù)待識(shí)樣本到各類別代表點(diǎn)的最小距離判別其類別。
圖1為本發(fā)明處理方法總體框圖; 圖2為調(diào)節(jié)因子ρ對(duì)算法識(shí)別性能的影響(Satimage庫),圖中*線GLA方法(全局局部特征融合分析方法);△線LPP方法(局部保留映射方法);○線LDA方法(線性鑒別分析方法); 圖3為Satimage數(shù)據(jù)集的部分?jǐn)?shù)據(jù)采用線性鑒別分析方法降維后的二維可視化結(jié)果,其中●紅土;*棉作物;▽灰土;×濕地;☆植被覆蓋區(qū);口重濕地 圖4為Satimage數(shù)據(jù)集的部分?jǐn)?shù)據(jù)采用局部保留映射方法降維后的二維可視化結(jié)果,其中●紅土;*棉作物;▽灰土;×濕地;☆植被覆蓋區(qū);口重濕地 圖5為Satimage數(shù)據(jù)集的部分?jǐn)?shù)據(jù)采用全局局部融合特征分析方法降維后的二維可視化結(jié)果,其中●紅土;*棉作物;▽灰土;×濕地;☆植被覆蓋區(qū);□重濕地。
具體實(shí)施例方式 以下結(jié)合實(shí)施例來具體說明本發(fā)明 Satimage數(shù)據(jù)庫實(shí)驗(yàn) Satimage是UCI提供的用于機(jī)器學(xué)習(xí)研究的數(shù)據(jù)集之一,它包含6類數(shù)據(jù),樣本的屬性特征個(gè)數(shù)為36,本實(shí)驗(yàn)使用了Satimage中的2400個(gè)數(shù)據(jù)點(diǎn),每類400個(gè),訓(xùn)練樣本數(shù)為180,測(cè)試樣本數(shù)為2220。圖1為實(shí)驗(yàn)方法總體框架,框架中的預(yù)處理主要是對(duì)數(shù)據(jù)的規(guī)范化,將數(shù)據(jù)的模規(guī)范化到0到1之間。如圖1所示,本發(fā)明的可以分為下列步驟 步驟1.構(gòu)造訓(xùn)練數(shù)據(jù)的加權(quán)鄰接圖 在6類數(shù)據(jù)每類400個(gè)數(shù)據(jù)點(diǎn)中,選取前30個(gè)數(shù)據(jù)組成訓(xùn)練庫,并用剩余的數(shù)據(jù)組成測(cè)試庫。對(duì)訓(xùn)練數(shù)據(jù)構(gòu)造鄰接圖時(shí),取最近鄰范圍為k=15。
根據(jù)公式(1)計(jì)算出鄰接圖中每條邊的權(quán)值w(i,j),也即相鄰接的兩個(gè)圖像數(shù)據(jù)點(diǎn)間的相似程度。β作為參數(shù)主要是用來控制數(shù)據(jù)空間的尺度或光滑性,β的選取尚沒有一般性的結(jié)論,在本實(shí)驗(yàn)中,選取β為所有數(shù)據(jù)間平均歐氏距離的平方根。
步驟2.確定相似矩陣W、度矩陣D和圖的拉普拉斯矩陣L 由步驟1中的鄰接圖中計(jì)算得到的權(quán)值w(i,j)可以得到相似矩陣W,W的元素Wij=w(i,j)。
鄰接圖中每個(gè)頂點(diǎn)i的度di由公式求得,其中n為訓(xùn)練圖像數(shù)據(jù)點(diǎn)的個(gè)數(shù),這里為n=180。求得度di后,則鄰接圖的度矩陣可由公式D=diag(d1,d2,L,dn)得到。
上面求出W和D后,圖的拉普拉斯矩陣可由公式L=D-W可計(jì)算得到。
步驟3.確定類內(nèi)散布矩陣Sw和類間散布矩陣Sb。
類內(nèi)散布矩陣可由公式計(jì)算得到。類間散布矩陣可由公式計(jì)算得到。其中,c為目標(biāo)類別,在Satimage數(shù)據(jù)庫里為c=6;n為訓(xùn)練圖像數(shù)據(jù)點(diǎn)的個(gè)數(shù),這里為n=180;ni表示第i類目標(biāo)Xi(i=1,2,L,c)的訓(xùn)練樣本有ni個(gè),這里為ni=30。Xi表示第i類目標(biāo),i的范圍為從1到6。為第i類目標(biāo)的均值向量。為總體的均值向量,xi為訓(xùn)練圖像數(shù)據(jù)點(diǎn),i的范圍從1到180。
步驟4.確定投影矩陣A 由步驟3求得Sw和Sb后,投影矩陣A通過解全局和局部特征融合分析方法的準(zhǔn)則函數(shù) 可以得到A。上式可以轉(zhuǎn)化為求解如下廣義特征值問題的最小特征值對(duì)應(yīng)的特征向量 其中調(diào)節(jié)因子ρ的最佳取值可以通過試驗(yàn)確定。α是A的一列,是特征向量,組合起來就構(gòu)成A,和λ是特征值,是大于等于零的實(shí)數(shù)。
由于調(diào)節(jié)因子ρ的最佳取值需要通過試驗(yàn)確定,所以在ρ從0到1的取值范圍內(nèi)以0.01為間距從0遞增到1在Satimage訓(xùn)練庫和測(cè)試庫上重復(fù)實(shí)驗(yàn),記錄識(shí)別結(jié)果,實(shí)驗(yàn)中運(yùn)用求得的前兩列特征向量構(gòu)成投影矩陣將數(shù)據(jù)降至兩維。實(shí)驗(yàn)結(jié)果如圖2所示,可以看出GLA方法比LDA和LPP方法具有更高的識(shí)別率,并且當(dāng)ρ=0.08時(shí),全局局部融合特征分析方法取得了最佳的識(shí)別性能。因此在以后的Satimage庫實(shí)驗(yàn)中,全局局部融合特征分析方法的調(diào)節(jié)因子ρ均取0.08。表1列出了在該實(shí)驗(yàn)下LDA、LPP、GLA三種方法的識(shí)別結(jié)果,實(shí)驗(yàn)中固定取每類的前30個(gè)數(shù)據(jù)作為訓(xùn)練庫,k=15。表中的1級(jí)識(shí)別率表示運(yùn)用最小距離分類器求得的與測(cè)試數(shù)據(jù)距離最小的類別均值向量的類別作為識(shí)別結(jié)果時(shí)的識(shí)別率;表中的2級(jí)識(shí)別率表示運(yùn)用最小距離分類器求得的與測(cè)試數(shù)據(jù)距離最小的類別均值向量的類別或與測(cè)試數(shù)據(jù)距離次最小的類別均值向量的類別作為識(shí)別結(jié)果時(shí)的識(shí)別率;表中的3級(jí)識(shí)別率表示運(yùn)用最小距離分類器求得的與測(cè)試數(shù)據(jù)距離最小的類別均值向量的類別或與測(cè)試數(shù)據(jù)距離次最小的類別均值向量的類別或與測(cè)試數(shù)據(jù)距離第三最小的類別均值向量的類別作為識(shí)別結(jié)果時(shí)的識(shí)別率。當(dāng)ρ=0.08時(shí),GLA取得了73.74%的識(shí)別率,比LDA、LPP分別高了6.7個(gè)、4.5個(gè)百分點(diǎn),顯示出了良好的性能。
表1 各識(shí)別算法在Satimage庫上的識(shí)別性能比較 (固定取每類的前30個(gè)數(shù)據(jù)作為訓(xùn)練庫,k=15) 步驟5.識(shí)別 由步驟4求得投影矩陣A后,將訓(xùn)練圖像180個(gè)數(shù)據(jù)和測(cè)試圖像2220個(gè)數(shù)據(jù)分別利用投影矩陣映射到特征空間中,得到訓(xùn)練系數(shù)矩陣和測(cè)試系數(shù)矩陣,采用最小距離分類器,即可獲得識(shí)別結(jié)果。
為了能進(jìn)一步比較線性鑒別分析、局部保留映射和全局局部特征融合三種方法的性能,我們進(jìn)行了100次隨機(jī)實(shí)驗(yàn)。每次實(shí)驗(yàn)從數(shù)據(jù)集中隨機(jī)選擇30個(gè)數(shù)據(jù)點(diǎn)作為訓(xùn)練庫,剩余的數(shù)據(jù)作為測(cè)試庫,三種方法均降至兩維,仍取k=15構(gòu)造最近鄰圖,記錄識(shí)別結(jié)果,最后取100次結(jié)果的平均值作為最終結(jié)果。實(shí)驗(yàn)中全局局部特征融合分析方法均取ρ=0.08。
表2列出了三種方法的最終識(shí)別結(jié)果,可以看出GLA取得了78.83%的識(shí)別率,比LDA、LPP分別高了16個(gè)、7個(gè)百分點(diǎn)。
表2 各識(shí)別算法在Satimage庫上的識(shí)別性能比較 (隨機(jī)實(shí)驗(yàn),k=15) 為了更直觀地觀察三種方法的分類性能,分別用這三種方法求取兩列特征向量構(gòu)成的投影矩陣將數(shù)據(jù)降至兩維。用每類中選取的前30個(gè)數(shù)據(jù)組成訓(xùn)練庫,剩余的數(shù)據(jù)作測(cè)試,k=15,ρ=0.08。三種方法對(duì)訓(xùn)練庫中的數(shù)據(jù)降維后的可視化結(jié)果如圖3、圖4和圖5所示。
從圖3中可以看出,LDA分離出了紅土和棉作物,灰土和植被覆蓋區(qū)的大部分也分離了出來,但是灰土、植被覆蓋區(qū)的一部分和濕地、重濕地混疊在一起。從圖4中可以看出LPP分離出了紅土、棉作物和灰土,但是紅土和灰土分開的距離不大,部分?jǐn)?shù)據(jù)陷入對(duì)方區(qū)域,其他三類混疊在一起,區(qū)分難度大。
圖5與圖3和圖4比較可以顯示GLA取得了最佳的分類結(jié)果,完全分離出了紅土、棉作物和灰土,而且這三者的區(qū)分非常明顯,尤其是紅土和灰土之間距離非常大,克服了LPP的不足,其余三類雖然也混疊在一起,但是明顯比LPP區(qū)分度大,可以將植被覆蓋區(qū)的大部分分離出來。
從圖3、圖4和圖5也可以看出,LPP能夠保留數(shù)據(jù)的流形結(jié)構(gòu),將數(shù)據(jù)分布在其流形上,而LDA可以使每類聚集地更緊湊,不同類別之間分開的距離也相對(duì)最大。而GLA兼具兩者的特性,既可以保留數(shù)據(jù)的流形結(jié)構(gòu),又能使每類數(shù)據(jù)盡可能聚集地更緊湊,通過對(duì)比可以發(fā)現(xiàn),GLA利用保流形特性,將灰土和濕地完全分開(LPP也是如此),而利用聚類特性將每一類的分布范圍明顯縮小,同時(shí)將不同類別間的距離拉開。
權(quán)利要求
1.基于全局和局部結(jié)構(gòu)融合的圖像特征提取方法,其特征在于,分為下列步驟
步驟1、構(gòu)造訓(xùn)練數(shù)據(jù)的加權(quán)鄰接圖
步驟1.1、在現(xiàn)有的數(shù)據(jù)集的每一類數(shù)據(jù)中,選取任意個(gè)數(shù)n的數(shù)據(jù)點(diǎn)組成訓(xùn)練圖像數(shù)據(jù)集,并在剩余的數(shù)據(jù)點(diǎn)中選取任意個(gè)數(shù)的數(shù)據(jù)點(diǎn)組成測(cè)試圖像數(shù)據(jù)集,其中每一個(gè)數(shù)據(jù)點(diǎn)為一幅圖像;
步驟1.2、通過頂點(diǎn)以及每個(gè)頂點(diǎn)與其最近鄰點(diǎn)之間邊的權(quán)值構(gòu)造加權(quán)鄰接步驟1.2.1、加權(quán)鄰接圖的每個(gè)頂點(diǎn)對(duì)應(yīng)于訓(xùn)練圖像數(shù)據(jù)集中的一個(gè)數(shù)據(jù)點(diǎn);
步驟1.2.2、若頂點(diǎn)xj屬于頂點(diǎn)xi的k-最近鄰點(diǎn),k為最近鄰范圍,即xj是xi的k范圍內(nèi)的最近鄰點(diǎn),則在xi和xj之間建立一條邊e=ij,其權(quán)值通過下式求出
其中,若頂點(diǎn)xj屬于頂點(diǎn)xi的k-最近鄰點(diǎn)或頂點(diǎn)xi屬于頂點(diǎn)xj的k-最近鄰點(diǎn),
則w(i,j)為通過式(1)求出,其他情況下,w(i,j)=式(2);β為任一正實(shí)數(shù);
步驟2、根據(jù)步驟1得到的加權(quán)鄰接圖確定相似矩陣W、度矩陣D和加權(quán)鄰接圖的拉拉斯矩陣L
步驟2.1、相似矩陣W中的每個(gè)元素的值為通過步驟1.2.2求得的w(i,j),即Wij=w(i,j),其中i=1,2,3,…,n、j=1,2,3,…,n;
步驟2.2、度矩陣D=diag(d1,d2,L,dn),其中,di為頂點(diǎn)xi的度,其值通過以下公式求出
步驟2.3、加權(quán)鄰接圖的拉普拉斯矩陣L=D-W,即
步驟3、確定訓(xùn)練圖像數(shù)據(jù)集的類內(nèi)散布矩陣Sw和類間散布矩陣Sb
類內(nèi)散布矩陣Sw和類間散布矩陣Sb分別通過以下公式求出
其中,數(shù)據(jù)集X包含n個(gè)訓(xùn)練圖像數(shù)據(jù)點(diǎn),有c個(gè)目標(biāo)類別,則第i類目標(biāo)的數(shù)據(jù)集為Xi(i=1,2,L,c),其數(shù)據(jù)點(diǎn)個(gè)數(shù)為ni,則X=[X1,X2,Λ,Xc];x是指n個(gè)數(shù)據(jù)點(diǎn)中屬于第i類目標(biāo)的各個(gè)數(shù)據(jù)點(diǎn);為第i類目標(biāo)的均值向量,為總體的均值向量,其中,i=1,2,…,c;
步驟4、確定投影矩陣A
投影矩陣A通過通過以下公式求出
其中,ρ為調(diào)節(jié)因子,且0≤ρ≤1,若ρ=0,上述公式表示全局特征,若ρ=1,上述公式表示局部特征;n為訓(xùn)練圖像數(shù)據(jù)集中數(shù)據(jù)點(diǎn)的總數(shù);X為訓(xùn)練圖像數(shù)據(jù)集以及測(cè)試圖像數(shù)據(jù)集中所有的數(shù)據(jù)點(diǎn)構(gòu)成的矩陣;
步驟5、識(shí)別
將訓(xùn)練圖像和測(cè)試圖像分別利用所述投影矩陣A映射到特征空間中,得到訓(xùn)練系數(shù)矩陣和測(cè)試系數(shù)矩陣,采用最小距離分類器,即可獲得識(shí)別結(jié)果。
2.如權(quán)利要求1所述的基于全局和局部結(jié)構(gòu)融合的圖像特征提取方法,其特征在于,根據(jù)步驟3中的Sw以及Sb,分別求出兩者的跡
其中,其中e∈RD,且e的元素全為1,eT表示該列向量的轉(zhuǎn)置。
3.如權(quán)利要求1所述的基于全局和局部結(jié)構(gòu)融合的圖像特征提取方法,其特征在于,根據(jù)步驟5中所述的公式提取出全局結(jié)構(gòu)特征和局部結(jié)構(gòu)特征綜合后所得到的復(fù)合特征,這些特征可以更全面地表達(dá)目標(biāo)數(shù)據(jù),即可以轉(zhuǎn)化為求解如下廣義特征值問題的最小特征值對(duì)應(yīng)的特征向量其中,調(diào)節(jié)因子ρ的取值通過試驗(yàn)確定;λ是矩陣A的特征值;α是λ對(duì)應(yīng)的特征向量。
4.如權(quán)利要求1所述的基于全局和局部結(jié)構(gòu)融合的圖像特征提取方法,其特征在于,步驟5中所述的采用最小距離分類器是指把各類別樣本的均值向量作為各類的代表點(diǎn),根據(jù)待識(shí)樣本到各類別代表點(diǎn)的最小距離判別其類別。
全文摘要
基于全局和局部結(jié)構(gòu)融合的圖像特征提取方法,其特征在于,包括以下步驟1)構(gòu)造加權(quán)鄰接圖,2)確定相似矩陣、度矩陣和圖的拉普拉斯矩陣,3)確定類內(nèi)散布矩陣和類間散布矩陣,4)確定投影矩陣,5)識(shí)別。本發(fā)明的優(yōu)點(diǎn)是提出了一種融合全局結(jié)構(gòu)信息和局部結(jié)構(gòu)信息的特征提取方法,該方法可以提取出融合全局特征和局部特征的復(fù)合特征,因而更具有鑒別力。而且該方法不但具有局部保留映射法特點(diǎn),即能夠保留數(shù)據(jù)的流形結(jié)構(gòu)的特性;而且具有線性鑒別分析方法的特點(diǎn),即能使類內(nèi)數(shù)據(jù)聚集地更緊湊而拉大類間距離。將本發(fā)明應(yīng)用在圖像識(shí)別中,可以提高識(shí)別性能。
文檔編號(hào)G06K9/46GK101369316SQ200810040378
公開日2009年2月18日 申請(qǐng)日期2008年7月9日 優(yōu)先權(quán)日2008年7月9日
發(fā)明者孫韶媛, 谷小婧, 方建安 申請(qǐng)人:東華大學(xué)