一種用于交互式圖像檢索的特征矢量?jī)?yōu)化方法
【專利摘要】本發(fā)明提供一種用于交互式圖像檢索的特征矢量?jī)?yōu)化方法,即通過引入圖像可分性指標(biāo)作為能量函數(shù),將用于檢索圖像的特征矢量選擇問題轉(zhuǎn)化為最小化能量函數(shù)的優(yōu)化問題,并結(jié)合模擬退火算法加以實(shí)現(xiàn)。同時(shí),在特征矢量?jī)?yōu)化過程收斂后,通過優(yōu)化特征矢量的提取和特征匹配實(shí)現(xiàn)基于內(nèi)容的交互式圖像檢索,當(dāng)用戶根據(jù)檢索結(jié)構(gòu)選擇相關(guān)圖像和不相關(guān)圖像后,根據(jù)用戶的選擇和計(jì)算實(shí)現(xiàn)相關(guān)反饋,直至尋找到最優(yōu)的特征矢量用于檢索系統(tǒng)以達(dá)到最佳的檢索效果。圖像的可分性可以用來評(píng)價(jià)特征矢量對(duì)于整個(gè)圖像數(shù)據(jù)庫(kù)中與待查詢圖像的相關(guān)圖像集合與非相關(guān)圖像集合的區(qū)分能力,使用模擬退火優(yōu)化算法在每一次相關(guān)反饋過程中作為特征矢量?jī)?yōu)化工具,以求在達(dá)到優(yōu)化目的的同時(shí)增加系統(tǒng)的普遍適用性。
【專利說明】—種用于交互式圖像檢索的特征矢量?jī)?yōu)化方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像處理方法,具體地說是一種用于交互式圖像檢索的特征矢量?jī)?yōu)化方法。
【背景技術(shù)】
[0002]基于內(nèi)容的圖像檢索,即CBIR (Content-based image retrieval),是計(jì)算機(jī)視覺領(lǐng)域中關(guān)注大規(guī)模數(shù)字圖像內(nèi)容檢索的研究分支。典型的CBIR系統(tǒng),允許用戶輸入一張圖片,以查找具有相同或相似內(nèi)容的其他圖片。而傳統(tǒng)的圖像檢索是基于文本的,即通過圖片的名稱、文字信息和索引關(guān)系來實(shí)現(xiàn)查詢功能?;趦?nèi)容的圖像檢索(CBIR)是一個(gè)已經(jīng)應(yīng)用在很多方面的很有趣并且很有挑戰(zhàn)性的問題,Arnold W.M對(duì)2002年前發(fā)表的的200多篇關(guān)于CBIR的文章進(jìn)行了總結(jié)歸納。從那以后,學(xué)者們嘗試著從不同的方面去提高CBIR系統(tǒng)的性能。
[0003]基于內(nèi)容的圖像檢索(CBIR)系統(tǒng)一般分為3個(gè)模塊,特征提取,相似性比較和相關(guān)反饋。特征提取模塊的主要作用是對(duì)圖像做預(yù)處理和特征提取,這里的特征主要包括圖像的顏色,紋理,形狀等幾個(gè)方面;相似性比較模塊主要通過匹配查詢圖像與圖像庫(kù)中圖像,找到與輸入圖像最相似的圖像;相關(guān)反饋是一個(gè)交互式查詢過程,在此過程中,用戶需要根據(jù)自身的需求對(duì)檢索結(jié)果的相關(guān)性做一個(gè)判斷,然后系統(tǒng)根據(jù)用戶的判斷動(dòng)態(tài)地學(xué)習(xí)以便得到更好的檢索結(jié)果。
[0004]在Hoi提出了一種長(zhǎng)短混合學(xué)習(xí)語義特征的方法。Barrett利用了半監(jiān)督的學(xué)習(xí)和批處理模式的主動(dòng)學(xué)習(xí)。Muneesawang應(yīng)用了 RBF方法,根據(jù)用戶的反饋信息逐步調(diào)整模型。
[0005]上述研究中,大部分的改進(jìn)都是在模擬人類的視覺效應(yīng),但是僅僅依靠用戶的反饋調(diào)整一些系數(shù)很難全面的模仿人類視覺。雖然SVM在機(jī)器學(xué)習(xí)領(lǐng)域已經(jīng)取得了很大的成功,但是它在系數(shù)的選擇方面仍舊很復(fù)雜。除此之外,數(shù)據(jù)庫(kù)中包含的冗余信息將會(huì)影響分類的正確性。為了克服這個(gè)問題,ZhongSu利用了 PCA方法在相關(guān)反饋時(shí)提取并且更新特征向量。然而PCA在數(shù)據(jù)之間有很強(qiáng)的線性關(guān)聯(lián)的時(shí)候比較適用,當(dāng)主成分之間的差異較小的時(shí)候,累積貢獻(xiàn)率就真的很小,這時(shí)我們就要考慮其他的非線性的方法。
[0006]在基于內(nèi)容的圖像檢索系統(tǒng)中,特征提取是其中的核心,在明確了特征形式的基礎(chǔ)上,該特征矢量的優(yōu)劣取決于其能否在同類圖像間體現(xiàn)矢量差異性最小化以及在不同類圖像間體現(xiàn)矢量差異性最大化。
[0007]在中國(guó)專利文獻(xiàn)CN101770578A中公開了一種圖像處理【技術(shù)領(lǐng)域】的圖像特征提取方法,包括步驟為:提取圖像中全部像素點(diǎn)的位置信息和顏色信息;對(duì)圖像進(jìn)行提取邊緣區(qū)域的處理,得到邊緣區(qū)域每個(gè)像素點(diǎn)的位置信息和顏色信息;對(duì)圖像I的邊緣區(qū)域提取顏色自相關(guān)特征,得到邊緣區(qū)域的顏色自相關(guān)圖;對(duì)圖像的全部區(qū)域提取邊緣方向自相關(guān)特征,得到全局的邊緣方向自相關(guān)圖;對(duì)圖像的全部區(qū)域內(nèi)提取顏色自相關(guān)特征,得到全局的顏色自相關(guān)圖;將三種自相關(guān)圖進(jìn)行特征前融合,得到圖像的特征。該方案中通過特征融合來提供更加全面的基于圖像結(jié)構(gòu)的內(nèi)容描述,但是當(dāng)提取的這些特征不能很好的表達(dá)或區(qū)分該圖像時(shí),無法通過優(yōu)化的方式來更好的來表征該圖像的特征。
【發(fā)明內(nèi)容】
[0008]為此,本發(fā)明所要解決的技術(shù)問題在于現(xiàn)有技術(shù)中的圖像特征提取方法無法實(shí)現(xiàn)對(duì)特征向量的優(yōu)化,從而提出一種基于圖像可分性的用于交互式檢圖像檢索的特征矢量?jī)?yōu)化方法。
[0009]為解決上述技術(shù)問題,本發(fā)明的提供一種用于交互式圖像檢索的特征矢量?jī)?yōu)化方法,包括:
[0010]提取查詢圖像以及圖像庫(kù)中的圖像的基本特征;
[0011]將所述查詢圖像與圖像庫(kù)中的圖像的特征進(jìn)行匹配,并返回匹配結(jié)果;
[0012]用戶對(duì)結(jié)果中的圖像進(jìn)行判斷,分別選擇相關(guān)圖像和不相關(guān)的圖像,
[0013]將根據(jù)用戶的選擇以及計(jì)算得到的向量作為初始解,所有返回圖像的可分性的值作為能量函數(shù),采用模擬退火算法進(jìn)行矢量?jī)?yōu)化。
[0014]所述的特征矢量?jī)?yōu)化方法,所述采用模擬退火算法進(jìn)行矢量?jī)?yōu)化的過程,包括:
[0015](I)由初始解變換為新解;
[0016](2)計(jì)算與新解所對(duì)應(yīng)的目標(biāo)函數(shù)差;
[0017](3)依據(jù)接受準(zhǔn)則判斷新解是否被接受;
[0018](4)新解被接受時(shí),用新解代替當(dāng)前解,修正目標(biāo)函數(shù)值,完成本次迭代,然后判斷此時(shí)能量函數(shù)是否達(dá)到最小值,達(dá)到最小值則將此時(shí)的新解作為最優(yōu)向量,否則轉(zhuǎn)到步驟
(2)繼續(xù)下一次迭代;當(dāng)新解被判定為舍棄時(shí),在當(dāng)前解的基礎(chǔ)上轉(zhuǎn)到步驟(2)進(jìn)行下一次迭代。
[0019]所述的特征矢量?jī)?yōu)化方法,所述能量函數(shù)為圖像可分性評(píng)價(jià)函數(shù),描述為:
[0020]SeparabiIity=PMXH(P1,M, P2|M,...,Pm|M,...)
[0021]其中,Pl|M,P2|M...Pm|M...分別為邊緣區(qū)域中各個(gè)圖像由特征匹配度決定的概率值,H ()表示熵值計(jì)算,Pm為邊緣區(qū)域的概率。
[0022]所述的特征矢量?jī)?yōu)化方法,所述由初始解變換為新解時(shí),通過對(duì)構(gòu)成新解的全部或部分元素進(jìn)行置換、互換。
[0023]所述的特征矢量?jī)?yōu)化方法,所述計(jì)算與新解所對(duì)應(yīng)的目標(biāo)函數(shù)差時(shí),目標(biāo)函數(shù)差的計(jì)算按照增量計(jì)算。
[0024]所述的特征矢量?jī)?yōu)化方法,所述接受準(zhǔn)則為設(shè)置一個(gè)判斷閾值進(jìn)行判斷。
[0025]所述的特征矢量?jī)?yōu)化方法,所述用新解代替當(dāng)前解時(shí),將當(dāng)前解中對(duì)應(yīng)于產(chǎn)生新解時(shí)的變換部分予以變換,同時(shí)修正目標(biāo)函數(shù)。
[0026]所述的特征矢量?jī)?yōu)化方法,在所述步驟(4)中,還設(shè)置有迭代次數(shù)閾值,當(dāng)達(dá)到迭代次數(shù)后,優(yōu)化完成,結(jié)束優(yōu)化。
[0027]本發(fā)明的上述技術(shù)方案相比現(xiàn)有技術(shù)具有以下優(yōu)點(diǎn),
[0028](I)本發(fā)明的提供一種用于交互式檢圖像檢索的特征矢量?jī)?yōu)化方法,通過特征提取和特征匹配實(shí)現(xiàn)基于內(nèi)容的交互式圖像檢索,當(dāng)用戶根據(jù)檢索結(jié)構(gòu)選擇相關(guān)圖像和不相關(guān)圖像后,根據(jù)用戶的選擇和計(jì)算修改查詢向量,并將其作為模擬退火算法的初始解,采用模擬退火算法進(jìn)行能量最小化搜索。圖像的可分性可以用來評(píng)價(jià)特征的表征能力,為了尋找到最優(yōu)的特征向量用于檢索系統(tǒng)以達(dá)到最佳的檢索效果,本文使用了模擬退火優(yōu)化算法,它可以在固定時(shí)間內(nèi)尋求在一個(gè)大的搜尋空間內(nèi)找到的最優(yōu)解,使用這樣的非線性方法以求在達(dá)到優(yōu)化目的的同時(shí)增加系統(tǒng)的普遍適用性。在應(yīng)用模擬退火算法的特征矢量?jī)?yōu)化過程中,本文以圖像可分性的值作為能量函數(shù),當(dāng)能量函數(shù)達(dá)到最小值時(shí),得到了最優(yōu)的特征矢量并將其作為相關(guān)反饋的輸入,最大程度上滿足了用戶的需求。
[0029](2)本發(fā)明的提供一種用于交互式檢圖像檢索的特征矢量?jī)?yōu)化方法,采用模擬退火算法進(jìn)行矢量?jī)?yōu)化的過程,模擬退火是一種通用概率算法,用來在固定時(shí)間內(nèi)尋求在一個(gè)大的搜尋空間內(nèi)找到的最優(yōu)解。模擬退火算法的基本思想是從選定的初始解開始,再借助于控制參數(shù)遞減時(shí)產(chǎn)生的一系列Markov鏈,利用一個(gè)隨機(jī)產(chǎn)生新解的方案和接受準(zhǔn)則,重復(fù)進(jìn)行”產(chǎn)生新解-計(jì)算目標(biāo)函數(shù)差-判斷是否接受新解-接受或舍棄新解”,不斷對(duì)當(dāng)前的解迭代,使能量函數(shù)達(dá)到最小化,從而使目標(biāo)函數(shù)達(dá)到最優(yōu),將此時(shí)的解作為最優(yōu)的特征矢量,從而實(shí)現(xiàn)了特征矢量的優(yōu)化。
【專利附圖】
【附圖說明】
[0030]為了使本發(fā)明的內(nèi)容更容易被清楚的理解,下面根據(jù)本發(fā)明的具體實(shí)施例并結(jié)合附圖,對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明,其中
[0031]圖1是本發(fā)明所述的特征矢量?jī)?yōu)化方法的一個(gè)實(shí)施例的框架結(jié)構(gòu)圖;
[0032]圖2是本發(fā)明所述的特征矢量?jī)?yōu)化方法的一個(gè)實(shí)施例的圖像可分性示意圖;
[0033]圖3 (a)和圖3 (b)是本發(fā)明所述的特征矢量?jī)?yōu)化方法的一個(gè)實(shí)施例的圖像可分性在基于內(nèi)容的檢索系統(tǒng)中的應(yīng)用示意圖;
[0034]圖4是本發(fā)明所述的特征矢量?jī)?yōu)化方法的一個(gè)實(shí)施例中優(yōu)化特征矢量前圖像可分性的值的示意圖;
[0035]圖5 (a)和圖5 (b)是本發(fā)明所述的特征矢量?jī)?yōu)化方法的一個(gè)實(shí)施例中特征優(yōu)化過程示意圖;
[0036]圖6 (a)和圖6 (b)是本發(fā)明所述的特征矢量?jī)?yōu)化方法的一個(gè)實(shí)施例中檢索結(jié)果對(duì)比圖;
[0037]圖7 (a)和圖7 (b)是本發(fā)明所述的特征矢量?jī)?yōu)化方法的一個(gè)實(shí)施例中與現(xiàn)有檢索方法的檢索性能比較圖。
【具體實(shí)施方式】
[0038]本實(shí)施例中提供一種用于交互式圖像檢索的特征矢量?jī)?yōu)化方法,優(yōu)化過程為:在特征提取部分獲取各個(gè)圖像的特征矢量,然后將每個(gè)圖像的特征矢量與待查詢圖像的特征矢量進(jìn)行特征匹配,根據(jù)總體的特征匹配度計(jì)算該特征矢量形式的圖像可分性,圖像可分性指標(biāo)以及該特征矢量形式下的圖像檢索結(jié)果返回給用戶端由用戶進(jìn)行相關(guān)反饋,系統(tǒng)根據(jù)反饋結(jié)果并結(jié)合模擬退火算法,以降低圖像可分性指標(biāo)為方向進(jìn)行特征矢量形式的優(yōu)化。
[0039]1、特征提取
[0040]提取查詢圖像以及圖像庫(kù)中的圖像的基本特征。圖像的特征具有復(fù)雜性和多樣性,簡(jiǎn)單的文本描述因其主觀性和二義性,無法滿足檢索的需要。圖像的底層特征,如顏色、紋理、形狀等,能夠從人眼視覺的角度較好的反映出圖像的內(nèi)在特征,將內(nèi)容豐富的圖像信息用相對(duì)簡(jiǎn)單的特征向量進(jìn)行表示,能夠在很大程度上提高匹配速度。
[0041]在對(duì)圖像的特征進(jìn)行提取后,會(huì)對(duì)這些特征進(jìn)行處理和優(yōu)化,如提取如下特征信息:
[0042]a、顏色直方圖:實(shí)際上,它是對(duì)圖像上所有像素的顏色值的一個(gè)統(tǒng)計(jì)。
[0043]
【權(quán)利要求】
1.一種用于交互式圖像檢索的特征矢量?jī)?yōu)化方法,其特征在于,包括: 提取查詢圖像以及圖像庫(kù)中的圖像的基本特征; 將所述查詢圖像與圖像庫(kù)中的圖像的特征進(jìn)行匹配,并返回匹配結(jié)果; 用戶對(duì)結(jié)果中的圖像進(jìn)行判斷,分別選擇相關(guān)圖像和不相關(guān)的圖像, 將根據(jù)用戶的選擇以及計(jì)算得到的向量作為初始解,所有返回圖像的可分性的值作為能量函數(shù),采用模擬退火算法進(jìn)行矢量?jī)?yōu)化。
2.根據(jù)權(quán)利要求1所述的特征矢量?jī)?yōu)化方法,其特征在于,所述采用模擬退火算法進(jìn)行矢量?jī)?yōu)化的過程,包括: (O由初始解變換為新解; (2)計(jì)算與新解所對(duì)應(yīng)的目標(biāo)函數(shù)差; (3)依據(jù)接受準(zhǔn)則判斷新解是否被接受; (4)新解被接受時(shí),用新解代替當(dāng)前解,修正目標(biāo)函數(shù)值,完成本次迭代,然后判斷此時(shí)能量函數(shù)是否達(dá)到最小值,達(dá)到最小值則將此時(shí)的新解作為最優(yōu)向量,否則轉(zhuǎn)到步驟(2)繼續(xù)下一次迭代;當(dāng)新解被判定為舍棄時(shí),在當(dāng)前解的基礎(chǔ)上轉(zhuǎn)到步驟(2)進(jìn)行下一次迭代。
3.根據(jù)權(quán)利要求1或2所述的特征矢量?jī)?yōu)化方法,其特征在于,所述能量函數(shù)為圖像可分性評(píng)價(jià)函數(shù),描述為:
4.根據(jù)權(quán)利要求2或3所述的特征矢量?jī)?yōu)化方法,其特征在于,所述由初始解變換為新解時(shí),通過對(duì)構(gòu)成新解的全部或部分元素進(jìn)行置換、互換。
5.根據(jù)權(quán)利要求2-4任一所述的特征矢量?jī)?yōu)化方法,其特征在于,所述計(jì)算與新解所對(duì)應(yīng)的目標(biāo)函數(shù)差時(shí),目標(biāo)函數(shù)差的計(jì)算按照增量計(jì)算。
6.根據(jù)權(quán)利要求2-5任一所述的特征矢量?jī)?yōu)化方法,其特征在于,所述接受準(zhǔn)則為設(shè)置一個(gè)判斷閾值進(jìn)行判斷。
7.根據(jù)權(quán)利要求2-6任一所述的特征矢量?jī)?yōu)化方法,其特征在于,所述用新解代替當(dāng)前解時(shí),將當(dāng)前解中對(duì)應(yīng)于產(chǎn)生新解時(shí)的變換部分予以變換,同時(shí)修正目標(biāo)函數(shù)。
8.根據(jù)權(quán)利要求2-7任一所述的特征矢量?jī)?yōu)化方法,其特征在于,在所述步驟(4)中,還設(shè)置有迭代次數(shù)閾值,當(dāng)達(dá)到迭代次數(shù)后,優(yōu)化完成,結(jié)束優(yōu)化。
【文檔編號(hào)】G06F17/30GK103838821SQ201310752711
【公開日】2014年6月4日 申請(qǐng)日期:2013年12月31日 優(yōu)先權(quán)日:2013年12月31日
【發(fā)明者】葉龍, 夏燁, 張勤 申請(qǐng)人:中國(guó)傳媒大學(xué)