一種基于核統(tǒng)計(jì)不相關(guān)的多視圖的圖像分類方法與流程

文檔序號(hào)：11251423閱讀：980來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于屬于模式識(shí)別中的圖像識(shí)別領(lǐng)域，尤其涉及一種基于核統(tǒng)計(jì)不相關(guān)的多視圖的圖像分類方法。
背景技術(shù)：
：近年來在模式識(shí)別領(lǐng)域，對(duì)于多視圖的學(xué)習(xí)研究引起了眾多學(xué)者的廣泛關(guān)注。在許多計(jì)算機(jī)視覺應(yīng)用中，同一物體可以從不同的角度來觀察，甚至可以通過使用不同的傳感器來連接。從而產(chǎn)生多個(gè)不同的樣本，甚至完全互異的都有可能。例如，給定一張臉，照片可以從不同的視角拍，會(huì)得到多種姿態(tài)的人臉圖像；一張臉也可以通過可見光或近紅外照明分別來捕捉視覺圖像或近紅外圖像。最近，越來越多的應(yīng)用需要同時(shí)從視圖間和視圖內(nèi)來進(jìn)行分類。然而，來自不同視圖的樣本，很顯然，必定會(huì)依附于完全互異的空間。在此基礎(chǔ)上，這些來自不同視圖的樣本是不能直接相互比較的。所以視圖間和視圖內(nèi)的共同分類基本上是不能直接進(jìn)行的。因此，之前大多數(shù)處理這個(gè)問題的方法都嘗試去學(xué)習(xí)到一個(gè)多視圖能夠共享的公共空間。在獲得這個(gè)公共空間之后，在這里，上述來自多個(gè)視圖的樣本不可以直接相互比較的問題都能解決了。(1)現(xiàn)有多視圖圖像分類方法——多視圖典型相關(guān)分析方法(mcca)和多視圖鑒別分析方法(mvda)。mcca方法用來獲得多個(gè)視圖的公共空間。在這個(gè)方法中，通過最大化任意兩個(gè)視圖之間的總體相關(guān)性來獲得多個(gè)特定視圖的變換。其中，每個(gè)特定的視圖都對(duì)應(yīng)一個(gè)特征變換。其目的是找到一個(gè)線性變換的集合該線性變換的集合能夠?qū)個(gè)視圖{x1,...,xν}的樣本投影到一個(gè)公共空間，并且最大化任意兩個(gè)視圖的低維嵌入的總體相關(guān)性。其中，是第i個(gè)視圖里包含的數(shù)據(jù)矩陣，包括n個(gè)樣本，維度是pi。這個(gè)問題可以通過使用拉格朗日乘子轉(zhuǎn)化為廣義多變量特征值問題。其中是的對(duì)偶形式，ki是核矩陣，并且這個(gè)問題可以通過數(shù)值方面的交替方法解決[54]。和典型相關(guān)分析一樣，每個(gè)視圖樣本的數(shù)量應(yīng)該是一致的。mvda方法試圖去尋找ν個(gè)線性變換w1,w2...,wν，能夠?qū)ⅵ蛡€(gè)視圖中的樣本分別投影到一個(gè)公共鑒別空間。其中，需要在最小化類內(nèi)變化量的同時(shí)，使類間變化量達(dá)到最大化。為了達(dá)到以上這個(gè)極值化的目的。在形式上，我們先將第j個(gè)視圖的樣本定義為χ(j)＝{xijk|i＝1,...,c；k＝1,...,nij}，其中，xijk是第i類第j個(gè)視圖的第k個(gè)樣本。維度為dj，即c是類別數(shù)，nij是第i類第j個(gè)視圖的樣本擁有的數(shù)目。通過使用ν個(gè)線性變換能夠?qū)ⅵ蛡€(gè)視圖中的樣本投影到公共空間，記為在上述獲得的這個(gè)公共空間中，所有視圖的類間變化量按照預(yù)期可以被最大化。與此同時(shí)，類內(nèi)變化量被最小化。我們把這個(gè)目標(biāo)表示成廣義rayleigh商式：(2)現(xiàn)有方法的不足首先，已有的很多多視圖圖像分類方法，并不能夠很好得將多視圖之間的全局信息充分利用。技術(shù)實(shí)現(xiàn)要素：本發(fā)明所要解決的技術(shù)問題是針對(duì)
背景技術(shù)：
的不足，提供用于圖像分類的基于核統(tǒng)計(jì)不相關(guān)的多視圖算法。該方法基于加入的統(tǒng)計(jì)不相關(guān)約束獲得投影變換矩陣，并利用核方法，將上述計(jì)算擴(kuò)展到非線性空間。所以不僅在數(shù)據(jù)的利用性上提高了，還有效得去除了冗余信息，從而提高分類算法的效果，并且降低了計(jì)算復(fù)雜度。本發(fā)明為解決上述技術(shù)問題采用以下技術(shù)方案一種基于核統(tǒng)計(jì)不相關(guān)的多視圖的圖像分類方法，具體包含如下步驟：步驟1：根據(jù)帶有加權(quán)統(tǒng)計(jì)不相關(guān)約束條件的目標(biāo)函數(shù)，利用核方法，得到在高維特征空間中的特征方程最大特征值對(duì)應(yīng)的特征向量ω作為投影向量；步驟2：通過依次迭代的方法，求解出所有的剩余投影向量；步驟3：將解出的所有剩余投影向量組合起來，構(gòu)成投影矩陣；步驟4：通過對(duì)原始樣本進(jìn)行投影，將其投影到高維空間，進(jìn)而獲取新的高維空間中存在的樣本特征集合；步驟5：使用最近鄰分類器分類，獲得多視圖圖像分類的結(jié)果。作為本發(fā)明一種基于核統(tǒng)計(jì)不相關(guān)的多視圖的圖像分類方法的進(jìn)一步優(yōu)選方案，在步驟1中，帶有加權(quán)的統(tǒng)計(jì)不相關(guān)約束條件具體表示為：式中，st表示總體散度矩陣，v代表視圖個(gè)數(shù)，c是樣本類別數(shù)，nt表示視圖第i類樣本總數(shù)，xijk表示第j個(gè)視圖第i類的第k個(gè)樣本，表示第i類樣本的均值，t為轉(zhuǎn)置符號(hào)。作為本發(fā)明一種基于核統(tǒng)計(jì)不相關(guān)的多視圖的圖像分類方法的進(jìn)一步優(yōu)選方案，在步驟1中，目標(biāo)函數(shù)為：minjss(β,ρ,σ)＝βtnβ-cρ+μr(β),s.t.βt(mq+1-mq)≥ρ其中，β代表樣本x對(duì)投影矩陣w的貢獻(xiàn)，ρ代表約束閾值，n代表樣本的近鄰表示，c代表懲罰系數(shù)，μ表示模型中無標(biāo)簽數(shù)據(jù)對(duì)樣本特征提取貢獻(xiàn)大小相關(guān)的參數(shù)，r代表包含內(nèi)積的矩陣，mq代表q個(gè)樣本核化之后的平均值，q為正整數(shù)。作為本發(fā)明一種基于核統(tǒng)計(jì)不相關(guān)的多視圖的圖像分類方法的進(jìn)一步優(yōu)選方案，在步驟2中，剩余投影向量的具體計(jì)算公式如下：其中，目標(biāo)函數(shù)中的ρj和ωj用u和d向量形式表示，i表示單位矩陣，st表示樣本總體散度矩陣，sw表示樣本類內(nèi)散度矩陣，sb表示樣本類間散度矩陣，d＝[ω1,...,ωj]t表示投影向量的集合，ωi表示每個(gè)視圖分別對(duì)應(yīng)的投影向量，參數(shù)λ表示拉格朗日乘子。作為本發(fā)明一種基于核統(tǒng)計(jì)不相關(guān)的多視圖的圖像分類方法的進(jìn)一步優(yōu)選方案，在步驟3中，所述投影矩陣具體如下：其中，v≥1本發(fā)明采用以上技術(shù)方案與現(xiàn)有技術(shù)相比，具有以下技術(shù)效果：1、本發(fā)明對(duì)樣本經(jīng)過訓(xùn)練獲得的投影變換矩陣加入統(tǒng)計(jì)不相關(guān)約束，以獲得新的滿足統(tǒng)計(jì)不相關(guān)約束的投影矩陣，并利用核方法，將上述計(jì)算擴(kuò)展到非線性空間；2、本發(fā)明加上約束能夠使得數(shù)據(jù)的利用性提高，去除冗余信息；3、本發(fā)明加入應(yīng)用于多視圖學(xué)習(xí)中的核技巧，將樣本從低維線性不可分映射至高維的線性可分，得到加入核方法的高維特征投影空間；4、本發(fā)明在multi-pie人臉數(shù)據(jù)庫上的實(shí)驗(yàn)驗(yàn)證了所提方法的高效性：在提高分類算法的效果的同時(shí)，降低了計(jì)算復(fù)雜度，除此之外，還可以將該方法應(yīng)用到其他圖像數(shù)據(jù)庫上。附圖說明圖1是本發(fā)明所提出的用于圖像分類的基于核統(tǒng)計(jì)不相關(guān)的多視圖算法的流程示意圖。具體實(shí)施方式下面結(jié)合附圖對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)說明：如圖1所示，本發(fā)明所述的用于圖像分類的基于核統(tǒng)計(jì)不相關(guān)的多視圖算法，包括以下步驟：(1)根據(jù)加權(quán)統(tǒng)計(jì)不相關(guān)約束的目標(biāo)函數(shù)，利用核方法，得到在高維特征空間中的特征方程最大特征值對(duì)應(yīng)的特征向量ω作為投影向量。帶有加權(quán)的統(tǒng)計(jì)不相關(guān)約束條件表示為：式中，α是加權(quán)系數(shù)矩陣，可以衡量整體樣本關(guān)系。本發(fā)明將其定義成式中的σ表示總體樣本方差。(2)通過依次迭代的方法，求解出所有的剩余投影向量。將目標(biāo)函數(shù)中的ρj和ωj用u和d向量形式表示，其中u＝[ρ1,...,ρj]t,d＝[ω1,...,ωj]t。則有：2sbωi-2λswωi-stdtu＝0。將之前的條件代入其中，得到下式：移項(xiàng)化簡之后，得到：式中，i表示單位矩陣。這樣，接下來要考慮的是第i個(gè)投影向量ωi的求解。轉(zhuǎn)化為特征方程問題的求解，psbωi＝λswωi。其中，有d＝[ω1,ω2,...,ωk]t,i＝diag(1,1,...,1)。(3)將解出的所有剩余特征向量組合起來，構(gòu)成投影矩陣。表示為假設(shè)一個(gè)理想的核矩陣k*和給定的真實(shí)核矩陣k。核目標(biāo)對(duì)齊(kta)的基本思想，在本文中選擇作為內(nèi)核學(xué)習(xí)的策略，是選擇最接近理想的核矩陣k*的內(nèi)核矩陣k(在一個(gè)不同矩陣的集合中)。兩個(gè)內(nèi)核矩陣k和k*之間的kta定義為：其中<·,·>f表示frobenius內(nèi)積。當(dāng)內(nèi)核函數(shù)能夠反映用于定義理想的核矩陣的訓(xùn)練數(shù)據(jù)集屬性的時(shí)候，該內(nèi)積數(shù)量得到最大化。(4)將原始樣本利用上面求出的投影矩陣進(jìn)行投影，將其投影到高維空間，這樣能夠得到新的高維空間中存在的樣本特征集合。當(dāng)計(jì)算核目標(biāo)對(duì)齊的時(shí)候，要考慮到代價(jià)矩陣，用于對(duì)非對(duì)齊錯(cuò)誤進(jìn)行相對(duì)程度不同的懲罰。也就是說，在這種情況下定義加權(quán)矩陣w，以如下方式，使得對(duì)不同的相似性或不相似性錯(cuò)誤施加加權(quán)承諾，其中表示在矩陣a和b之間的入門內(nèi)積。對(duì)于順序分類中，常見代價(jià)矩陣的選擇就是使用絕對(duì)誤差，即：其中，r(yj)表示目標(biāo)yj和模式xj有關(guān)的排序，也就是說r(cq)＝q,q∈1,...,q，其中，cq表示樣本特征的排序，其結(jié)構(gòu)為c1＜c2＜...＜cq，表示其順序信息。(5)最后使用最近鄰分類器分類，獲得多視圖圖像最終分類的結(jié)果。以下將詳細(xì)地說明本發(fā)明的原理：1.加入統(tǒng)計(jì)不相關(guān)約束設(shè)多視圖原始數(shù)據(jù)樣本集樣本為x。經(jīng)過ωi和ωj投影后，特征用yi和yj來表示。yi和yj之間的協(xié)方差矩陣表示為：cov(yi,yj)＝e[(yi-e(yi))(yj-e(yj))](4)代入投影向量，可得到：要使得求得的鑒別特征滿足統(tǒng)計(jì)不相關(guān)，需要協(xié)方差矩陣為0，即cov(yi,yj)＝0，則上式就等價(jià)于如下的約束條件：上式中的總體協(xié)方差散度矩陣st定義如下：其中，nt表示總體的樣本數(shù)量。重新構(gòu)建整體的樣本信息，改寫上式中樣本的總體散布矩陣，讓它滿足帶有加權(quán)的統(tǒng)計(jì)不相關(guān)約束條件：式中，α是加權(quán)系數(shù)矩陣，可以衡量整體樣本關(guān)系。為：式中的σ表示總體樣本方差。將公式結(jié)合起來，可以得到最終的基于加權(quán)統(tǒng)計(jì)不相關(guān)約束的特征提取算法目標(biāo)函數(shù)。對(duì)該目標(biāo)函數(shù)利用拉格朗日乘子法進(jìn)行求解，構(gòu)造如下：其中，c表示拉格朗日的懲罰因子。2.核化過程2.1前者是與內(nèi)核矩陣kl相關(guān)聯(lián)的標(biāo)記模式，并與其對(duì)應(yīng)的理想核對(duì)齊的。這一步是用于將我們的算法初始化為對(duì)于已知信息可行的解決方案。在這種情況下，可行的解決方案將是一組適合訓(xùn)練有標(biāo)簽數(shù)據(jù)的內(nèi)核參數(shù)。這個(gè)對(duì)齊步驟是用al來表示的。2.2后者是基于使用有標(biāo)簽和無標(biāo)簽數(shù)據(jù)兩者的內(nèi)核參數(shù)的調(diào)整。此步驟稱為au，并開始使用上一步的解決方案。在這種情況下，理想內(nèi)核使用不同的方法構(gòu)造：其中，slu是在有標(biāo)簽和無標(biāo)簽?zāi)Ｊ街g的相似度矩陣，使用下式計(jì)算，圖形模型用s來表示。其元素sij反映第i個(gè)樣本和第j個(gè)樣本之間的相似性。為了簡單，表示如下：其中，nk(xi)表示xi的k最近鄰集合。suu是在無標(biāo)簽?zāi)Ｊ街g的相似度矩陣。在這種情況下，我們?cè)O(shè)置關(guān)聯(lián)到最近鄰數(shù)目的參數(shù)k為因?yàn)樗趯?shí)驗(yàn)中會(huì)產(chǎn)生相對(duì)較好的性能，其中，nq表示樣本的近鄰矩陣。將本發(fā)明所述的多視圖分類方法在multi-pie人臉數(shù)據(jù)庫上進(jìn)行實(shí)驗(yàn)，并將實(shí)驗(yàn)結(jié)果和相關(guān)多視圖分類方法mvfs、mcca和mvda進(jìn)行對(duì)比分析。multi-pie人臉數(shù)據(jù)庫中人臉圖像的像素是640×486。選出一個(gè)包含231個(gè)人的大約14,450個(gè)圖像的子集，包括7個(gè)不同姿勢(shì)(-45度，-30度，-15度，0度，15度，30度，45度)，3個(gè)不同表情(中立，微笑，反感)，來自4個(gè)不同區(qū)間的不完全照明，每個(gè)人最少被拍攝了26張照片。實(shí)驗(yàn)中選擇每類訓(xùn)練樣本數(shù)從5到13，則剩余作為測(cè)試樣本為21到13。表1為核統(tǒng)計(jì)不相關(guān)方法和相關(guān)比較方法的識(shí)別率(％)。表1方法mvfsmcca平均識(shí)別率(％)91.2291.80方法mvdamvkua平均識(shí)別率(％)92.3793.12由表1可以看出：本發(fā)明提出的核統(tǒng)計(jì)不相關(guān)方法在多視圖圖像分類方面優(yōu)于現(xiàn)有的幾種典型方法，在平均識(shí)別率的結(jié)果中一目了然。本發(fā)明的方法mvkua在識(shí)別率上比對(duì)比方法識(shí)別率最高的提高了1.90％(＝93.12-91.22％)。實(shí)驗(yàn)結(jié)果表明，本申請(qǐng)所述的方法識(shí)別率更高，提高了分類算法的效果。該方法是一種更加有效的用于多視圖圖像分類的分析方法，在multi-pie人臉數(shù)據(jù)庫上得到了有力的證明。本發(fā)明不只應(yīng)用于人臉識(shí)別領(lǐng)域。除了人臉圖像之外，對(duì)于其他維數(shù)較高的多視圖圖像樣本，例如多光譜掌紋圖像等，本方法同樣適用。當(dāng)前第1頁12

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：奚曉鈺;荊曉遠(yuǎn);岳東
技術(shù)所有人：南京郵電大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

核磁共振圖像相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于核統(tǒng)計(jì)不相關(guān)的多視圖的圖像分類方法與流程