一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果融合方法

文檔序號：6508890閱讀：537來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果融合方法
【專利摘要】本發(fā)明涉及一種基于秩最小化優(yōu)化算法的多標(biāo)簽圖像標(biāo)注結(jié)果融合方法，包括如下步驟：1)抽取訓(xùn)練集圖像的多種特征表示,訓(xùn)練集圖像帶有事先給定的語義標(biāo)注詞；2）在不同的特征表示下，訓(xùn)練各自的監(jiān)督學(xué)習(xí)圖像標(biāo)注模型；3）對于一幅新的沒有語義標(biāo)注詞的圖像，用同樣的方法抽取該圖像的多種特征，使用這些特征分別輸入到對應(yīng)的監(jiān)督學(xué)習(xí)圖像標(biāo)注模型來預(yù)測多標(biāo)簽結(jié)果；4）利用秩最小化算法將多個模型輸出的多標(biāo)簽結(jié)果融合，得到一個更準(zhǔn)確的標(biāo)注結(jié)果。本發(fā)明充分利用了不同特征表示下的圖像標(biāo)注模型的互補(bǔ)性，利用秩最小化算法減少融合的標(biāo)注結(jié)果中的預(yù)測錯誤，從而使得最終的圖像標(biāo)注結(jié)果更準(zhǔn)確。
【專利說明】一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果融合方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像標(biāo)注結(jié)果融合方法，特別涉及一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果的融合方法。
【背景技術(shù)】
[0002]隨著數(shù)碼相機(jī)和社交網(wǎng)絡(luò)應(yīng)用的普及，人們越來越習(xí)慣于將自己拍攝的圖像發(fā)布在互聯(lián)網(wǎng)上。為了更方便地管理和檢索互聯(lián)網(wǎng)上的海量圖像，自動圖像標(biāo)注是一個有效的工具。圖像標(biāo)注程序的基本任務(wù)是建模圖像底層視覺特征與高層語義標(biāo)注詞之間的關(guān)系。監(jiān)督學(xué)習(xí)圖像標(biāo)注模型是以已經(jīng)帶有語義標(biāo)注詞的圖像作為訓(xùn)練圖像，先抽取訓(xùn)練圖像的底層視覺特征，再以這些特征表示和對應(yīng)的語義標(biāo)注詞為輸入訓(xùn)練出監(jiān)督學(xué)習(xí)圖像標(biāo)注模型。當(dāng)對一幅新的沒有語義標(biāo)注詞的圖像進(jìn)行自動標(biāo)注時，首先使用與訓(xùn)練圖像特征抽取同樣的方式提取新圖像的底層視覺特征，然后將提取的新圖像的特征表示輸入到監(jiān)督學(xué)習(xí)圖像標(biāo)注模型來預(yù)測新圖像的語義標(biāo)注詞。一幅圖像通常包含有多種語義，所以監(jiān)督學(xué)習(xí)圖像標(biāo)注模型的預(yù)測結(jié)果中有多個語義標(biāo)注詞，或者說這是一個多標(biāo)簽的結(jié)果。
[0003]在圖像標(biāo)注問題中，從圖像抽取的底層視覺特征表示多種多樣，它們可以用來描述視覺特征的多個方面，例如顏色直方圖可以描述圖像顏色的統(tǒng)計信息，Gabor變換結(jié)果可以來描述灰度圖像的紋理信息，局部二元模式可以對灰度圖像中局部鄰近區(qū)域的紋理信息進(jìn)行度量。不同的特征表示有著不同的表達(dá)能力，而且對于圖像語義的區(qū)分能力也不盡相同，甚至有互補(bǔ)的特性。因此，融合多種互補(bǔ)特征有助于區(qū)分圖像的高層語義。
[0004]融合多種互補(bǔ)特征通常在兩個階段實(shí)現(xiàn):特征級融合和決策級融合。特征級融合在訓(xùn)練模型的過程中將多種特征融合在一起，然后訓(xùn)練出一個判別模型，例如多核學(xué)習(xí)算法同時學(xué)習(xí)多種特征的比例系數(shù)和模型參數(shù)。決策級融合則是分別使用不同的特征表示訓(xùn)練多個判別模型，最后把多個判別模型的決策結(jié)果融合成一個最終的決策結(jié)果。決策級融合由于其簡單有效性常常在圖像標(biāo)注問題中被采用。
[0005]傳統(tǒng)的決策級融合方法是先將多個判別模型的結(jié)果歸一化到同一個數(shù)值范圍，然后使用求和、求乘積、取最大或取最小等規(guī)則的方式融合成一個最終的結(jié)果?？紤]到不同模型的結(jié)果會在不同的數(shù)值范圍內(nèi)，因而歸一化方法對于不同模型會不同，增加了決策級融合的復(fù)雜性。再者，不同的融合規(guī)則的融合效果不盡相同，因而會產(chǎn)生哪些模型融合用何種融合規(guī)則效果最好的疑問。另外，由于單個判別模型都有自己的預(yù)測誤差，盲目地使用規(guī)則融合多個模型的結(jié)果也會同時引入它們各自的誤差。

【發(fā)明內(nèi)容】

[0006]本發(fā)明的目的在于提供一種通過利用秩最小化的優(yōu)化方法建模多個監(jiān)督學(xué)習(xí)圖像標(biāo)注模型的多標(biāo)簽結(jié)果的融合，得到一個更準(zhǔn)確更魯棒的標(biāo)注結(jié)果的方法。
[0007]本發(fā)明為解決其技術(shù)問題采用的技術(shù)方案如下:
[0008]一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果的融合方法，包括以下步驟:[0009]I)抽取訓(xùn)練集圖像的多種特征表示，訓(xùn)練集中的每幅圖像都帶有事先給定的語義標(biāo)注詞；
[0010]2)在不同的特征表示下，分別訓(xùn)練各自的監(jiān)督學(xué)習(xí)圖像標(biāo)注模型；
[0011]3)對于一幅新的沒有語義標(biāo)注詞的圖像，用同樣的方法抽取該圖像的多種特征表示，使用這些特征表示分別輸入到對應(yīng)的監(jiān)督學(xué)習(xí)圖像標(biāo)注模型來預(yù)測新圖像的多標(biāo)簽標(biāo)注結(jié)果；
[0012]4)利用秩最小化優(yōu)化算法將多個模型輸出的多標(biāo)簽結(jié)果融合:對于不同特征表示下模型預(yù)測的結(jié)果向量，先把每一個結(jié)果向量轉(zhuǎn)換為一個反對稱的秩為2的關(guān)系矩陣，然后用這些關(guān)系矩陣建模一個秩最小化優(yōu)化問題，解這個優(yōu)化問題得到一個融合的關(guān)系矩陣，再由融合的關(guān)系矩陣構(gòu)造融合的結(jié)果向量，最終由融合的結(jié)果向量得到融合的標(biāo)注結(jié)果O
[0013]優(yōu)選的，抽取訓(xùn)練集圖像的多種特征表示的步驟如下:
[0014]I)圖像分塊:使用滑動窗口的策略，按照給定步長，將圖像分成相互重疊的小塊；
[0015]2)分別計算每一個小塊內(nèi)圖像的特征向量(可以是RGB顏色直方圖、HSV顏色直方圖、LAB顏色直方圖、ΟΡΡΟΝΕΤ顏色直方圖、rg顏色直方圖、Gabor紋理特征、Haar紋理特征、局部二元模式紋理特征、詞包模型表示的SIFT形狀特征等多種特征)，整幅圖像的特征表示即由這些圖像塊的特征向量組成；設(shè)第i幅訓(xùn)練圖像Ii的語義標(biāo)注向量為Wi= (wn, wi2,...，wiT)T e {O, 1}τ,其中T是數(shù)據(jù)集的語義標(biāo)注詞的總數(shù),Wij=I表示第i幅圖像有第j個標(biāo)注詞，Wij=O表示第i幅圖像沒有第j個標(biāo)注詞；若將第i幅圖像分成M塊，每塊可計算一個特征向量Xik, k=l, 2，...，Μ,那么第i幅圖像的特征表示為Ai=Ixil, Xi2,...，XilI。
[0016]優(yōu)選的，在不同特征表示下分別訓(xùn)練各自監(jiān)督學(xué)習(xí)圖像標(biāo)注模型步驟如下:
[0017]I)對每一幅訓(xùn)練圖像，利用高斯混合模型對圖像層條件概率密度建模，然后使用期望最大化算法計算模型參數(shù)得到該圖像的條件概率密度；
[0018]2)對每一個語義標(biāo)注詞，找出訓(xùn)練圖像集合中含有該標(biāo)注詞的所有圖像，以這些圖像在圖像層的條件概率密度為基礎(chǔ)，利用高斯混合模型對語義層條件概率密度建模，然后使用層次期望最大化算法計算模型參數(shù)得到該語義標(biāo)注詞的條件概率密度。
[0019]具體步驟如下:
[0020]I)第i幅圖像的某一種特征表示為
【權(quán)利要求】
1.一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果的融合方法，其特征在于，包括以下步驟: 1)抽取訓(xùn)練集圖像的多種特征表示，訓(xùn)練集中的每幅圖像都帶有事先給定的語義標(biāo)注詞； 2)在不同的特征表示下，分別訓(xùn)練各自的監(jiān)督學(xué)習(xí)圖像標(biāo)注模型； 3)對于一幅新的沒有語義標(biāo)注詞的圖像，用同樣的方法抽取該圖像的多種特征表示，使用這些特征表示分別輸入到對應(yīng)的監(jiān)督學(xué)習(xí)圖像標(biāo)注模型來預(yù)測新圖像的多標(biāo)簽標(biāo)注結(jié)果; 4)利用秩最小化優(yōu)化算法將多個模型輸出的多標(biāo)簽結(jié)果融合:對于不同特征表示下模型預(yù)測的結(jié)果向量，先把每一個結(jié)果向量轉(zhuǎn)換為一個反對稱的秩為2的關(guān)系矩陣，然后用這些關(guān)系矩陣建模一個秩最小化優(yōu)化問題，解這個優(yōu)化問題得到一個融合的關(guān)系矩陣，再由融合的關(guān)系矩陣構(gòu)造融合的結(jié)果向量，最終由融合的結(jié)果向量得到融合的標(biāo)注結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果的融合方法，其特征在于，抽取訓(xùn)練集圖像的多種特征表示的步驟為: O圖像分塊:使用滑動窗口的策略，按照給定步長，將圖像分成相互重疊的小塊； 2)分別計算每一個小塊內(nèi)圖像的特征向量，整幅圖像的特征表示即由這些圖像塊的特征向量組成。
3.根據(jù)權(quán)利要求2所述的一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果的融合方法，其特征在于，所述特征向量是RGB顏色直方圖或HSV顏色直方圖或LAB顏色直方圖或OPPONET顏色直方圖或rg顏色直方圖或Gabor紋理特征或Haar紋理特征或局部二元模式紋理特征或詞包模型表示的SIFT形狀特征。
4.根據(jù)權(quán)利要求1或2或3所述的一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果的融合方法，其特征在于，在不同特征表示下分別訓(xùn)練各自的監(jiān)督學(xué)習(xí)圖像標(biāo)注模型的步驟為: 1)對每一幅訓(xùn)練圖像，利用高斯混合模型對圖像層條件概率密度建模，然后使用期望最大化算法計算模型參數(shù)得到該圖像的條件概率密度； 2)對每一個語義標(biāo)注詞，找出訓(xùn)練圖像集合中含有該標(biāo)注詞的所有圖像，以這些圖像在圖像層的條件概率密度為基礎(chǔ)，利用高斯混合模型對語義層條件概率密度建模，然后使用層次期望最大化算法計算模型參數(shù)得到該語義標(biāo)注詞的條件概率密度。
5.根據(jù)權(quán)利要求4所述的一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果的融合方法，其特征在于，對一幅新的沒有語義標(biāo)注詞的圖像，用同樣地方法抽取該圖像的多種特征表示，使用這些特征分別輸入到對應(yīng)的監(jiān)督學(xué)習(xí)圖像標(biāo)注模型來預(yù)測其多標(biāo)簽標(biāo)注結(jié)果，其步驟為: 1)使用與訓(xùn)練圖像同樣的特征抽取技術(shù)計算新輸入圖像的多種特征表示； 2)使用每一種特征表示對應(yīng)的監(jiān)督學(xué)習(xí)圖像標(biāo)注模型預(yù)測輸入圖像的語義標(biāo)注詞并得到一個結(jié)果向量。
6.根據(jù)權(quán)利要求5所述的一種對多個監(jiān)督學(xué)習(xí)圖像標(biāo)注模型的多標(biāo)簽結(jié)果的融合方法，其特征在于，利用秩最小化優(yōu)化算法將不同特征表示下的多個模型輸出的多標(biāo)簽結(jié)果融合的步驟為: I)將各個結(jié)果向量分別轉(zhuǎn)換為反對稱的秩為2的關(guān)系矩陣的表示形式，這些關(guān)系矩陣都分別等于融合的關(guān)系矩陣加上一個對應(yīng)誤差矩陣； 2)在I)的約束下，通過最小化融合的關(guān)系矩陣的奇異值之和使得融合的關(guān)系矩陣的秩逐漸減小到2，通過最小化所有誤差矩陣之和使得融合的關(guān)系矩陣能充分正確地結(jié)合各個模型的預(yù)測結(jié)果； 3)使用非精確的增廣拉格朗日乘子法迭代解出融合的關(guān)系矩陣的最優(yōu)解，迭代過程中使用奇異值截取的方式使得融合的關(guān)系矩陣的秩逐漸收斂到2 ； 4)使用融合的關(guān)系矩陣反向計算出的融合的結(jié)果向量，根據(jù)融合的結(jié)果向量最終確定輸入圖像的語義標(biāo) 注詞。
【文檔編號】G06T7/00GK103440651SQ201310375976
【公開日】2013年12月11日申請日期:2013年8月26日優(yōu)先權(quán)日:2013年8月26日
【發(fā)明者】郭平, 姚垚, 辛欣申請人:北京理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：郭平;姚垚;辛欣
技術(shù)所有人：北京理工大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

二值圖像貼標(biāo)簽算法相關(guān)技術(shù)

圖像標(biāo)簽相關(guān)技術(shù)

html圖像標(biāo)簽相關(guān)技術(shù)

圖像標(biāo)簽輔助功能相關(guān)技術(shù)

隨機(jī)圖像防偽標(biāo)簽相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于秩最小化的多標(biāo)簽圖像標(biāo)注結(jié)果融合方法