亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于大規(guī)模詞典遷移的詞典構(gòu)造方法與流程

文檔序號(hào):11952029閱讀:354來(lái)源:國(guó)知局
一種基于大規(guī)模詞典遷移的詞典構(gòu)造方法與流程

本發(fā)明涉及計(jì)算機(jī)多媒體技術(shù)領(lǐng)域,尤其涉及一種基于大規(guī)模詞典遷移的詞典構(gòu)造方法。



背景技術(shù):

詞典構(gòu)造技術(shù)在諸多現(xiàn)實(shí)場(chǎng)景中有著廣泛的應(yīng)用,如何構(gòu)建準(zhǔn)確、高效的詞典構(gòu)造技術(shù)是圖像檢索技術(shù)中的最重要的一步?,F(xiàn)有的詞典構(gòu)造構(gòu)建方法主要是基于詞袋(Bagof Word)架構(gòu),即利用與文本處理相類似的詞典構(gòu)造方法,進(jìn)行圖像檢索。近年來(lái),隨著場(chǎng)景的復(fù)雜化和數(shù)據(jù)的海量化,時(shí)常需要解決大規(guī)模的詞典構(gòu)造問(wèn)題。然而,按照現(xiàn)有的視覺(jué)詞袋架構(gòu),為每個(gè)圖像集訓(xùn)練百萬(wàn)級(jí)別的視覺(jué)詞典的成本非常高。例如使用常規(guī)的K-means聚類方法,訓(xùn)練一個(gè)百萬(wàn)級(jí)別的詞典需要幾個(gè)月的時(shí)間,這顯然是不實(shí)用的。所以,如何快速有效的為一個(gè)圖像集訓(xùn)練百萬(wàn)級(jí)別的視覺(jué)詞典,成為了一個(gè)重要問(wèn)題。

現(xiàn)有的視覺(jué)詞典學(xué)習(xí)方法主要分為三個(gè)類別,第一個(gè)是基于Llord方式的K-means方法,第二種是利用近似最近鄰查詢方法的k-means方法,如近似k-means(Approximate K-means)、層次k-means(Hierarchy K-means)等方法,第三種方法是將特征映射到哈??臻g,利用哈希代碼的特殊性質(zhì)進(jìn)行快速聚類,這種方法的代表是Binary K-means。從目前看來(lái),這些方法主要有兩大缺陷,1)這些方法訓(xùn)練百萬(wàn)級(jí)別視覺(jué)詞典的時(shí)間過(guò)長(zhǎng);2)這些方法主要關(guān)注單一域上的視覺(jué)詞典構(gòu)造,當(dāng)不同圖像集之間為復(fù)數(shù)域時(shí),這些方法的效果會(huì)有大幅度的降低而無(wú)法直接使用。所以,如何在復(fù)數(shù)域上快速有效的構(gòu)造視覺(jué)詞典仍需要進(jìn)一步的研究。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的之一在于提供一種基于大規(guī)模詞典遷移的詞典構(gòu)造方法,以解在圖像集之間為復(fù)數(shù)域的情況下,為目標(biāo)圖像集構(gòu)造準(zhǔn)確的視覺(jué)詞典,從而保證在海量數(shù)據(jù)集、新數(shù)據(jù)不斷出現(xiàn)的環(huán)境下,能快速、準(zhǔn)確地遷移視覺(jué)詞典,為后續(xù)的圖像存儲(chǔ)、管理和檢索等應(yīng)用提供支撐,并提升這些應(yīng)用的效果,改善用戶體驗(yàn)的問(wèn)題。

本發(fā)明解決現(xiàn)有技術(shù)問(wèn)題是通過(guò)下述技術(shù)方案來(lái)實(shí)現(xiàn)的:

一種基于大規(guī)模詞典遷移的詞典構(gòu)造方法,,包括如下步驟:

步驟S1:提取目標(biāo)數(shù)據(jù)集圖像的局部特征;

步驟S2:根據(jù)原始的視覺(jué)詞典,對(duì)所述局部特征進(jìn)行特征量化;

步驟S3:根據(jù)所述步驟S2的特征量化結(jié)果構(gòu)造目標(biāo)函數(shù);

步驟S4:優(yōu)化所述目標(biāo)函數(shù)。

進(jìn)一步的,所述步驟S1:提取目標(biāo)數(shù)據(jù)集圖像的局部特征的步驟中,具體包括如下步驟:

步驟S1.1:提取目標(biāo)數(shù)據(jù)集圖像的局部特征向量,圖像的局部特征向量表示為:

其中表示第m個(gè)局部特征向量中的第nm個(gè)分量;

步驟S1.2:對(duì)所述局部特征向量的每一個(gè)維度進(jìn)行歸一化處理。

進(jìn)一步的,在所述步驟S1中,利用Vlfeat或Inria工具提取目標(biāo)數(shù)據(jù)集圖像的局部特征向量。

進(jìn)一步的,所述步驟S2:根據(jù)原始的視覺(jué)詞典,對(duì)所述局部特征進(jìn)行特征量化的步驟中,包括如下步驟:

通過(guò)K最鄰近的方法創(chuàng)建目標(biāo)數(shù)據(jù)集的圖像特征表示,所述圖像特征表示為ac=(ac1,ac2,…,acr),其中acj(j=1,2,…,r)表示原始的視覺(jué)詞典中視覺(jué)詞匯在圖像上的分布數(shù)量。

進(jìn)一步的,所述步驟S2:根據(jù)原始的視覺(jué)詞典,對(duì)所述局部特征進(jìn)行特征量化的步驟中,具體包括如下步驟:

步驟S2.1:找到目標(biāo)數(shù)據(jù)集圖像的局部特征在特征空間中所述視覺(jué)詞典的視覺(jué)詞匯的最近鄰;

步驟S2.1:每當(dāng)尋得一個(gè)所述最近鄰,則在所述最近鄰對(duì)應(yīng)的局部特征向量位上加1或者按照預(yù)定規(guī)則計(jì)算權(quán)重,最后得到圖像特征表示。

進(jìn)一步的,所述步驟S3中的構(gòu)造的目標(biāo)函數(shù)為:

<mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mi>&Sigma;</mi> <mo>|</mo> <mo>|</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>+</mo> <mi>&Sigma;</mi> <mo>|</mo> <mo>|</mo> <msub> <mi>TA</mi> <msub> <mi>c</mi> <mi>i</mi> </msub> </msub> <mo>-</mo> <mfrac> <mn>1</mn> <mrow> <msqrt> <mrow> <mn>2</mn> <mi>&pi;</mi> </mrow> </msqrt> <mi>&sigma;</mi> </mrow> </mfrac> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mfrac> <mrow> <mo>(</mo> <msub> <mi>TA</mi> <msub> <mi>c</mi> <mi>i</mi> </msub> </msub> <mo>-</mo> <mi>&mu;</mi> <mo>)</mo> </mrow> <mrow> <mn>2</mn> <msup> <mi>&sigma;</mi> <mn>2</mn> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> </mrow>

其中xj為局部特征點(diǎn);

ci為視覺(jué)詞匯對(duì)應(yīng)的特征點(diǎn)聚類簇的聚類中心;

為ci對(duì)應(yīng)的視覺(jué)詞匯頻率,所述視覺(jué)詞匯頻率TA為一個(gè)視覺(jué)詞匯在特征量化中作為最近鄰的次數(shù);

μ和σ分別為視覺(jué)詞匯頻率分布TAF的平均值和方差,所述視覺(jué)詞匯頻率分布TAF為具有相同視覺(jué)詞匯頻率TA的視覺(jué)詞匯的數(shù)量。

進(jìn)一步的,所述步驟S4:優(yōu)化所述目標(biāo)函數(shù)的步驟中,具體包括如下步驟:

步驟S4.1:將目標(biāo)數(shù)據(jù)集圖像的局部特征點(diǎn)量化到原始的視覺(jué)詞典上,統(tǒng)計(jì)得到初始視覺(jué)詞匯頻率TA0和初始視覺(jué)詞匯頻率分布TAF0;

步驟S4.2:尋找視覺(jué)詞匯頻率TA大于預(yù)定值的干擾點(diǎn),計(jì)算視覺(jué)詞匯頻率TA大于預(yù)定值的干擾點(diǎn)的局部特征點(diǎn)到最近鄰的距離,選取距離最遠(yuǎn)的局部特征點(diǎn)為新的視覺(jué)詞匯加入到所述視覺(jué)詞典中;

步驟S4.3:排除視覺(jué)詞匯頻率TA小于預(yù)定值的干擾點(diǎn);

步驟S4.4:將目標(biāo)數(shù)據(jù)集圖像的局部特征點(diǎn)量化到優(yōu)化之后的視覺(jué)詞典中,得到優(yōu)化后的視覺(jué)詞匯頻率TAk和優(yōu)化后的視覺(jué)詞匯頻率分布TAFk

步驟S4.5:根據(jù)所述優(yōu)化之后的視覺(jué)詞典,更新視覺(jué)詞匯對(duì)應(yīng)的特征點(diǎn)聚類簇的聚類中心;

步驟S4.6:計(jì)算視覺(jué)詞匯頻率TAk與視覺(jué)詞匯頻率TAk-1的差和視覺(jué)詞匯頻率分布TAFk與視覺(jué)詞匯頻率分布TAFk-1的差是否都小于設(shè)定的閾值;是則轉(zhuǎn)步驟S4.8;否則轉(zhuǎn)下一步;

步驟S4.7:將優(yōu)化后的視覺(jué)詞匯頻率TAk和優(yōu)化后的視覺(jué)詞匯頻率分布TAFk作為下一輪迭代的初始值,重復(fù)步驟S4.2-步驟S4.5;

步驟S4.8:停止迭代,得到優(yōu)化之后的遷移詞典。

進(jìn)一步的,所述S4.5:根據(jù)所述優(yōu)化之后的視覺(jué)詞典,更新視覺(jué)詞匯對(duì)應(yīng)的特征點(diǎn)聚類簇的聚類中心的步驟,包括如下步驟:

根據(jù)所述優(yōu)化之后的視覺(jué)詞典,獲得聚類簇中的局部特征點(diǎn),計(jì)算聚類簇中局部特征點(diǎn)特征向量的平均中心點(diǎn),求得每一維的平均值,將所述平均中心點(diǎn)作為新的聚類中心,更新視覺(jué)詞匯對(duì)應(yīng)的特征點(diǎn)聚類簇的聚類中心。

進(jìn)一步的,所述步驟S4.1:將目標(biāo)數(shù)據(jù)集圖像的局部特征點(diǎn)量化到視覺(jué)詞典上,統(tǒng)計(jì)得到初始視覺(jué)詞匯頻率TA0和初始視覺(jué)詞匯頻率分布TAF0的步驟中,具體包括如下步驟:

步驟S4.1.1:在原始的視覺(jué)詞典上使用K-D Tree Forest的方式建立索引;

步驟S4.1.2:根據(jù)所述索引,使用近似最近鄰查詢方法將目標(biāo)數(shù)據(jù)集圖像的局部特征點(diǎn)量化到視覺(jué)詞典上,得到量化結(jié)果;

步驟S4.1.3:在上一步中的量化結(jié)果上利用稀疏矩陣計(jì)算方法得到初始視覺(jué)詞匯頻率TA0;

步驟S4.1.4:統(tǒng)計(jì)計(jì)算原始的視覺(jué)詞典上的初始視覺(jué)詞匯頻率分布TAF0。

本發(fā)明的有益效果:本發(fā)明提出的一種基于大規(guī)模詞典遷移的詞典構(gòu)造方法能夠在圖像集之間為復(fù)數(shù)域的情況下,為目標(biāo)圖像集構(gòu)造準(zhǔn)確的視覺(jué)詞典,從而保證在海量數(shù)據(jù)集、新數(shù)據(jù)不斷出現(xiàn)的環(huán)境下,能快速、準(zhǔn)確地遷移視覺(jué)詞典,為后續(xù)的圖像存儲(chǔ)、管理和檢索等應(yīng)用提供支撐,并提升這些應(yīng)用的效果,改善用戶體驗(yàn)。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例中基于大規(guī)模詞典遷移的詞典構(gòu)造方法的流程圖;

圖2為本發(fā)明實(shí)施例中步驟S4的方法流程圖;

圖3為本發(fā)明實(shí)施例中步驟S4.1的方法流程圖。

具體實(shí)施方式

下文將結(jié)合具體實(shí)施方式詳細(xì)描述本發(fā)明。應(yīng)當(dāng)注意的是,下述實(shí)施例中描述的技術(shù)特征或者技術(shù)特征的組合不應(yīng)當(dāng)被認(rèn)為是孤立的,它們可以被相互組合從而達(dá)到更好的技術(shù)效果。

如圖1-3所示,本發(fā)明所述的一種基于大規(guī)模詞典遷移的詞典構(gòu)造方法,包括如下步驟:

步驟S1:提取目標(biāo)數(shù)據(jù)集圖像的局部特征。

為了更好地處理圖像的信息,需要將圖像用向量的形式進(jìn)行表述,即特征提取。具體包括如下步驟:

步驟S1.1:提取目標(biāo)數(shù)據(jù)集圖像的局部特征向量,圖像的局部特征向量表示為:

其中表示第m個(gè)局部特征向量中的第nm個(gè)分量;

步驟S1.2:對(duì)局部特征向量的每一個(gè)維度進(jìn)行歸一化處理。

對(duì)所有特征向量的每一個(gè)維度進(jìn)行歸一化,能夠消除局部特征中不同向量分量的取值范圍對(duì)距離計(jì)算和重構(gòu)過(guò)程的影響,具體可以采用線性縮放的方式將每一維度的取值范圍約束到[0,1]區(qū)間內(nèi)。對(duì)此可以利用Vlfeat或Inria等工具提取目標(biāo)數(shù)據(jù)集圖像的局部特征向量。

步驟S2:根據(jù)原始的視覺(jué)詞典,對(duì)局部特征進(jìn)行特征量化。

為了將原始的視覺(jué)詞典遷移到目標(biāo)數(shù)據(jù)集上,需要檢測(cè)原始的詞典在目標(biāo)數(shù)據(jù)集上的表示能力。視覺(jué)詞典的表示能力可以通過(guò)圖像特征表示。該圖像特征表示為ac=(ac1,ac2,…,acr),其中acj(j=1,2,…,r)表示原始的視覺(jué)詞典中視覺(jué)詞匯在圖像上的分布數(shù)量。為了得到這個(gè)特征表示,可以采用K最近鄰(k-nearest neighbor,KNN)的方法,具體包括如下步驟:

步驟S2.1:找到目標(biāo)數(shù)據(jù)集圖像的局部特征在特征空間中視覺(jué)詞典的視覺(jué)詞匯的最近鄰;

步驟S2.1:每當(dāng)尋得一個(gè)最近鄰,則在最近鄰對(duì)應(yīng)的局部特征向量位上加1或者按照預(yù)定規(guī)則計(jì)算權(quán)重,最后得到圖像特征表示。

按照上述方法得到的圖像特征表示可以使得所有的圖像都可以在視覺(jué)詞典所表示空間中進(jìn)行比較。

步驟S3:根據(jù)特征量化結(jié)果構(gòu)造目標(biāo)函數(shù)。

為構(gòu)造目標(biāo)函數(shù),首先提出概念視覺(jué)詞匯頻率(Term Appearance,TA)和視覺(jué)詞匯頻率分布(Term Appearance Frequency,TAF)。TA是指一個(gè)視覺(jué)詞匯在特征量化中作為最近鄰的次數(shù),TAF是指具有相同TA的視覺(jué)詞匯的數(shù)量。對(duì)于訓(xùn)練良好的視覺(jué)詞典,每個(gè)視覺(jué)詞匯對(duì)應(yīng)特征空間中一個(gè)超球體,這個(gè)超球體是包含所有的以當(dāng)前視覺(jué)詞匯為最近鄰的局部特征點(diǎn)所組成的最小超球體。通過(guò)實(shí)驗(yàn)驗(yàn)證,這個(gè)超球體的半徑長(zhǎng)度只存在于一個(gè)很小的范圍內(nèi),所以視覺(jué)詞匯之間對(duì)應(yīng)的超球體的體積差異不大??梢约僭O(shè),在同一個(gè)域中,同一個(gè)超球體內(nèi)局部特征點(diǎn)是均勻分布的和不同超球體之間局部特征點(diǎn)分布是相似的,因此不同超球體包含的局部特征點(diǎn)數(shù)量,對(duì)應(yīng)于TA,相差很小。所以,一個(gè)視覺(jué)詞匯的TA落在正常范圍之外則可以認(rèn)為這個(gè)視覺(jué)詞匯為誤差,眾所周知,一般誤差分布服從正態(tài)分布,所以TA的分布服從正態(tài)分布。根據(jù)上面給出的結(jié)論和實(shí)驗(yàn)驗(yàn)證,訓(xùn)練良好的視覺(jué)詞典的得到的TA服從正態(tài)分布,而遷移之前的原始詞典得到的TA不服從正態(tài)分布。

訓(xùn)練良好的視覺(jué)詞典應(yīng)該滿足的三個(gè)條件:(1)視覺(jué)詞典的規(guī)模應(yīng)該足夠大,以保證視覺(jué)詞典離散性;(2)每個(gè)視覺(jué)詞匯能且僅能表示一個(gè)特征點(diǎn)聚類簇,或者稱為具有辨識(shí)性;(3)TA分布應(yīng)該為正態(tài)分布。

因此需要優(yōu)化的目標(biāo)方程可以形式化的表示為:

<mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mi>&Sigma;</mi> <mo>|</mo> <mo>|</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>+</mo> <mi>&Sigma;</mi> <mo>|</mo> <mo>|</mo> <msub> <mi>TA</mi> <msub> <mi>c</mi> <mi>i</mi> </msub> </msub> <mo>-</mo> <mfrac> <mn>1</mn> <mrow> <msqrt> <mrow> <mn>2</mn> <mi>&pi;</mi> </mrow> </msqrt> <mi>&sigma;</mi> </mrow> </mfrac> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mfrac> <mrow> <mo>(</mo> <msub> <mi>TA</mi> <msub> <mi>c</mi> <mi>i</mi> </msub> </msub> <mo>-</mo> <mi>&mu;</mi> <mo>)</mo> </mrow> <mrow> <mn>2</mn> <msup> <mi>&sigma;</mi> <mn>2</mn> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> </mrow>

其中xj為局部特征點(diǎn);

ci為視覺(jué)詞匯對(duì)應(yīng)的特征點(diǎn)聚類簇的聚類中心;

為ci對(duì)應(yīng)的視覺(jué)詞匯頻率;

μ和σ分別為視覺(jué)詞匯頻率分布TAF的平均值和方差。

目標(biāo)方程的前半部分,稱為F1,這一部分約束視覺(jué)詞典能夠準(zhǔn)確描述圖像數(shù)據(jù)集的分布,對(duì)應(yīng)上述條件(2)每個(gè)視覺(jué)詞匯能且僅能表示一個(gè)特征點(diǎn)聚類簇,或者稱為具有辨識(shí)性。后半部分,稱為F2,這一部分約束視覺(jué)詞典能夠全面描述圖像數(shù)據(jù)集的分布,對(duì)應(yīng)上述條件(1)視覺(jué)詞典的規(guī)模應(yīng)該足夠大,以保證視覺(jué)詞典離散性。目標(biāo)方程需要優(yōu)化F1和F2,使得整體的目標(biāo)方程值最優(yōu),在滿足標(biāo)準(zhǔn)K-means聚類方法的前提下,更快速的使得視覺(jué)詞典的視覺(jué)詞匯頻率分布接近正態(tài)分布,對(duì)應(yīng)上述條件(3)TA分布應(yīng)該為正態(tài)分布。

實(shí)驗(yàn)發(fā)現(xiàn),原始詞典得到的TA分布的形狀為低胖,尾部較長(zhǎng),這樣說(shuō)明原始詞典包含兩種干擾點(diǎn),第一種干擾點(diǎn)為TA過(guò)小的視覺(jué)詞匯,第二種為TA過(guò)大的視覺(jué)詞匯。第一種干擾點(diǎn)違反了上述條件(1)和條件(2),因?yàn)槠洳荒鼙硎救魏我粋€(gè)聚類簇,所以這種視覺(jué)詞典是沒(méi)有用處的,因此這就相當(dāng)于使視覺(jué)詞典的規(guī)模降低了。第二種干擾點(diǎn)違反了上述條件(2),因?yàn)榘凑罩暗姆治觯粋€(gè)視覺(jué)詞匯所能表示的局部特征點(diǎn)數(shù)量是限制于一個(gè)范圍內(nèi)的,TA過(guò)大說(shuō)明其表示了多于一個(gè)聚類簇,應(yīng)該在第二種干擾點(diǎn)附近尋找一個(gè)新的視覺(jué)詞匯。

步驟S4:優(yōu)化目標(biāo)函數(shù)。

該函數(shù)包含兩個(gè)需要優(yōu)化的部分F1和F2,分別是需要去除步驟S3中提到的兩種干擾點(diǎn)。本發(fā)明提出了一種迭代式的優(yōu)化算法來(lái)優(yōu)化目標(biāo)函數(shù),遷移詞典,具體包括如下步驟:

步驟S4.1:將目標(biāo)數(shù)據(jù)集圖像的局部特征點(diǎn)量化到原始的視覺(jué)詞典上,統(tǒng)計(jì)得到初始視覺(jué)詞匯頻率TA0和初始視覺(jué)詞匯頻率分布TAF0。

該步驟完成了目標(biāo)函數(shù)的初始化。

第二種干擾點(diǎn)表示TA過(guò)大,因此需要將其所代表的聚類簇進(jìn)行分割,使得更多的局部特征點(diǎn)可以量化到更準(zhǔn)確的視覺(jué)詞典(聚類中心)上,具體方法如下:

步驟S4.2:尋找視覺(jué)詞匯頻率TA大于預(yù)定值的干擾點(diǎn),計(jì)算視覺(jué)詞匯頻率TA大于預(yù)定值的干擾點(diǎn)的局部特征點(diǎn)到最近鄰的距離,選取距離最遠(yuǎn)的局部特征點(diǎn)為新的視覺(jué)詞匯加入到所述視覺(jué)詞典中。

上述方法能夠得到更小的聚類中心,所以得到的量化誤差更小,結(jié)果更加準(zhǔn)確。這符合Llord給出的聚類要求和本發(fā)明給出的上述條件(1)和條件(2)。

步驟S4.3:排除視覺(jué)詞匯頻率TA小于預(yù)定值的干擾點(diǎn)。

對(duì)于第一種TA過(guò)小的干擾點(diǎn),可以直接將其排除。因?yàn)槠錈o(wú)法表示目標(biāo)數(shù)據(jù)集任何部分的分布,這種干擾點(diǎn)對(duì)目標(biāo)數(shù)據(jù)集來(lái)說(shuō)是沒(méi)有用處的,因此可以直接將其排除。

步驟S4.4:將目標(biāo)數(shù)據(jù)集圖像的局部特征點(diǎn)量化到優(yōu)化之后的視覺(jué)詞典中,得到優(yōu)化后的視覺(jué)詞匯頻率TAk和優(yōu)化后的視覺(jué)詞匯頻率分布TAFk。

步驟S4.5:根據(jù)所述優(yōu)化之后的視覺(jué)詞典,更新視覺(jué)詞匯對(duì)應(yīng)的特征點(diǎn)聚類簇的聚類中心;

根據(jù)所述優(yōu)化之后的視覺(jué)詞典,獲得聚類簇中的局部特征點(diǎn),計(jì)算聚類簇中所有特征向量的平均中心點(diǎn),即求解每一維的平均值,以這個(gè)新得到的中心點(diǎn)為這個(gè)聚類簇新的聚類中心,這樣可以進(jìn)一步優(yōu)化,使用TAk和TAFk作為下一輪迭代的初始值進(jìn)入下一輪迭代。

步驟S4.6:計(jì)算視覺(jué)詞匯頻率TAk與視覺(jué)詞匯頻率TAk-1的差和視覺(jué)詞匯頻率分布TAFk與視覺(jué)詞匯頻率分布TAFk-1的差是否都小于設(shè)定的閾值;是則轉(zhuǎn)步驟S4.8;否則轉(zhuǎn)下一步;

步驟S4.7:將優(yōu)化后的視覺(jué)詞匯頻率TAk和優(yōu)化后的視覺(jué)詞匯頻率分布TAFk作為下一輪迭代的初始值,重復(fù)步驟S4.2-步驟S4.5;

步驟S4.8:停止迭代,得到優(yōu)化之后的遷移詞典。

上述初始化的步驟S4.1,具體包括如下步驟:

步驟S4.1.1:在原始的視覺(jué)詞典上使用K-D Tree Forest的方式建立索引;

步驟S4.1.2:根據(jù)所述索引,使用近似最近鄰查詢方法將目標(biāo)數(shù)據(jù)集圖像的局部特征點(diǎn)量化到視覺(jué)詞典上,得到量化結(jié)果;

步驟S4.1.3:在上一步中的量化結(jié)果上利用稀疏矩陣計(jì)算方法得到初始視覺(jué)詞匯頻率TA0;

步驟S4.1.4:統(tǒng)計(jì)計(jì)算原始的視覺(jué)詞典上的初始視覺(jué)詞匯頻率分布TAF0

本發(fā)明通過(guò)迭代式的優(yōu)化算法來(lái)優(yōu)化目標(biāo)函數(shù),可以保證訓(xùn)練不斷地優(yōu)化,從而提高了數(shù)據(jù)處理的效率。

本發(fā)明提出利用一種基于大規(guī)模詞典遷移的詞典構(gòu)造方法,通過(guò)遷移訓(xùn)練良好的視覺(jué)詞典,能夠快速得到適用于目標(biāo)數(shù)據(jù)集的視覺(jué)詞典,減少分類過(guò)程中的信息損失,提升分類模型的準(zhǔn)確性。

實(shí)施例

為驗(yàn)證本發(fā)明的有效性,在檢索領(lǐng)域的標(biāo)準(zhǔn)數(shù)據(jù)集Oxford Building、Paris和Inria Holiday上進(jìn)行實(shí)驗(yàn)。具體地,在Oxford Building數(shù)據(jù)集中,使用11個(gè)類別共55張圖片作為檢索輸入;在Paris數(shù)據(jù)集中,使用12個(gè)類別共60張圖片作為檢索輸入;在Inria Holiday數(shù)據(jù)集中,使用500張圖片作為檢索輸入。在所有實(shí)驗(yàn)中,檢索輸入與檢索圖像庫(kù)中圖像不重復(fù)。對(duì)于這三個(gè)數(shù)據(jù)集,本發(fā)明所提出的方法在取得與當(dāng)前最優(yōu)方法可比較的檢索效果的情況下,可以較少一個(gè)或兩個(gè)數(shù)量級(jí)的時(shí)間消耗,效果優(yōu)異。

綜上所述,本發(fā)明提出的一種基于大規(guī)模詞典遷移的詞典構(gòu)造方法能夠在圖像集之間為復(fù)數(shù)域的情況下,為目標(biāo)圖像集構(gòu)造準(zhǔn)確的視覺(jué)詞典,從而保證在海量數(shù)據(jù)集、新數(shù)據(jù)不斷出現(xiàn)的環(huán)境下,能快速、準(zhǔn)確地遷移視覺(jué)詞典,為后續(xù)的圖像存儲(chǔ)、管理和檢索等應(yīng)用提供支撐,并提升這些應(yīng)用的效果,改善用戶體驗(yàn)。

當(dāng)然應(yīng)意識(shí)到,雖然通過(guò)本發(fā)明的示例已經(jīng)進(jìn)行了前面的描述,但是對(duì)本發(fā)明做出的將對(duì)本領(lǐng)域的技術(shù)人員顯而易見(jiàn)的這樣和其他的改進(jìn)及改變應(yīng)認(rèn)為落入如本文提出的本發(fā)明寬廣范圍內(nèi)。因此,盡管本發(fā)明已經(jīng)參照了優(yōu)選的實(shí)施方式進(jìn)行描述,但是,其意并不是使具新穎性的設(shè)備由此而受到限制,相反,其旨在包括符合上述公開(kāi)部分、權(quán)利要求的廣闊范圍之內(nèi)的各種改進(jìn)和等同修改。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1