一種基于多智能算法及圖像融合技術(shù)的圖像檢索方法

文檔序號(hào)：6438007閱讀：243來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種基于多智能算法及圖像融合技術(shù)的圖像檢索方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種基于內(nèi)容的圖像檢索方法，尤其涉及一種基于智能算法的主動(dòng)學(xué)習(xí)圖像檢索方法。
背景技術(shù)：
近十多年來，隨著數(shù)字技術(shù)的迅速發(fā)展和普及，多媒體數(shù)據(jù)(圖像和視頻等)已經(jīng)成為文本數(shù)據(jù)之外最重要的數(shù)據(jù)組織形式。如何對(duì)大量多媒體數(shù)據(jù)進(jìn)行有效的組織、管理，并從中檢索出用戶需要的信息已成為當(dāng)前最重要的研究課題。圖像數(shù)據(jù)是最基本、最常用的多媒體形式，同時(shí)對(duì)圖像檢索的研究也是對(duì)其它多媒體形式進(jìn)行研究的基礎(chǔ)，因此該方面的研究已成為目前信息檢索方面的熱點(diǎn)。
傳統(tǒng)的圖像檢索方式是利用人工對(duì)圖像進(jìn)行文字標(biāo)注，然后利用基于關(guān)鍵字的檢索技術(shù)對(duì)圖像進(jìn)行檢索。然而人工標(biāo)注最大缺點(diǎn)就是耗時(shí)，工作量大，同時(shí)對(duì)圖像的標(biāo)注很大程度上取決于標(biāo)注人的主觀判斷，不利于客觀描述?；趦?nèi)容的圖像檢索 (Content-Based-Image-Retrieval, CBIR)技術(shù)通過對(duì)圖像從底層到高層的自動(dòng)處理和分析來描述其內(nèi)容，并根據(jù)內(nèi)容進(jìn)行檢索。
基于內(nèi)容的圖像檢索系統(tǒng)給出的初始檢索結(jié)果往往不能很好地滿足用戶的信息需求，這主要?dú)w因于如下幾點(diǎn)首先，由于當(dāng)前圖像理解技術(shù)的局限，建立從圖像的低層特征到高層語義的映射還很困難；其次，由于用戶界面的限制以及對(duì)圖像庫的不熟悉，用戶很難給出能準(zhǔn)確反映其信息需求的查詢；另外，由于人類視覺感知的主觀性，對(duì)于同一幅圖像不同的人或同一個(gè)人在不同的時(shí)間可能有不同的認(rèn)知，因此借助于離線(off-line) 的學(xué)習(xí)不能適應(yīng)這些不同的要求。為了克服上述困難，20世紀(jì)90年代中期，在文本檢索領(lǐng)域提出的相關(guān)反饋(Relevance Feedback, RF)技術(shù)被引入到基于內(nèi)容的圖像檢索領(lǐng)域。相關(guān)反饋技術(shù)通過把人的參與引入到信息檢索過程中，從而把檢索模式從一次進(jìn)行 (one-shot-search)變成交互式的多次進(jìn)行，并成為提高檢索性能的有效方法。在相關(guān)反饋的交互過程中，只要求用戶根據(jù)他的信息需求對(duì)系統(tǒng)當(dāng)前的檢索結(jié)果給出是否相關(guān) (relevant)或者相關(guān)程度如何地判斷，然后系統(tǒng)根據(jù)用戶的反饋進(jìn)行學(xué)習(xí)來給出更好的檢索結(jié)果。然而，如何在最少的人為干預(yù)下，得到盡量好的檢索效果是當(dāng)前重點(diǎn)關(guān)注的問題。
為了全面的描述一幅圖像，往往從多個(gè)角度進(jìn)行描述，比如顏色、紋理、形狀等特征。在圖像檢索的過程，通常要綜合考慮其中兩種或者多種特征，以獲得較好的檢索效果。那么，如何有效地組織這些特征，使得到的特征向量能夠更加符合用戶的需要，以得到比較好的檢索結(jié)果是圖像檢索領(lǐng)域需要解決的主要問題之一。特別在相關(guān)反饋過程中，根據(jù)用戶不同的需求，應(yīng)該對(duì)特征組合進(jìn)行修改，使得檢索模型更加符合用戶的需求，在較少的反饋操作后得到用戶滿意的結(jié)果。
目前存在的基于內(nèi)容的圖像檢索技術(shù)基本都是基于無信息保留，然而，對(duì)于固定的用戶來說，可以通過分析以往的查詢操作及查詢領(lǐng)域，對(duì)查詢信息進(jìn)行適當(dāng)保留，構(gòu)建一個(gè)主動(dòng)學(xué)習(xí)的智能框架，以達(dá)到智能檢索的目的。發(fā)明內(nèi)容
本發(fā)明的發(fā)明目的是提供一種基于多智能算法和圖像融合技術(shù)的圖像檢索方法，以反饋技術(shù)為基礎(chǔ)，通過聚類、遺傳算法和強(qiáng)化學(xué)習(xí)來構(gòu)建一個(gè)主動(dòng)學(xué)習(xí)的智能框架。
為達(dá)到上述發(fā)明目的，本發(fā)明采用的技術(shù)方案是一種基于多智能算法及圖像融合技術(shù)的圖像檢索方法，提供一用于檢索的圖像數(shù)據(jù)庫和一聚類信息庫，所述聚類信息庫用于動(dòng)態(tài)存放具有相似特征的一類圖像的特征信息；檢索方法包括以下步驟
(1)輸入查詢圖像，并提取特征，獲得原始查詢向量Q= (D，F(xiàn)，R)，其中D表示一幅原始圖像；F = {fj表示一組特征集合，其中&表示第i個(gè)特征；R = IrijI表示特征&的 j個(gè)具體表示形式；
(2)在聚類信息庫中查找查詢圖像的特征信息，如果不存在轉(zhuǎn)入步驟(3)，如果存在轉(zhuǎn)入步驟⑷；
(3)根據(jù)遺傳算法，獲取特征組合參數(shù)，并利用強(qiáng)化學(xué)習(xí)算法，做信息采集存儲(chǔ)，轉(zhuǎn)入步驟(5)；
(4)利用強(qiáng)化學(xué)習(xí)機(jī)制得到的信息，獲取最優(yōu)搜索組合，轉(zhuǎn)入步驟(5)；
(5)在圖像數(shù)據(jù)庫中進(jìn)行檢索，返回檢索結(jié)果，如果用戶對(duì)結(jié)果滿意，則檢索結(jié)束；如果用戶對(duì)結(jié)果不滿意則轉(zhuǎn)入步驟(6)；
(6)用戶選擇檢索結(jié)果中符合用戶需要的圖像，結(jié)合用戶的選擇，利用圖像融合技術(shù)，修正查詢向量，轉(zhuǎn)入步驟(3)。
上文中，所述步驟(3)中，利用的是遺傳算法的框架，與選擇哪種具體遺傳算法無關(guān)。主要利用基于查詢表的強(qiáng)化學(xué)習(xí)框架，利用查詢表去記錄每類圖像的特征權(quán)重組合，因此，其中的信息采集存儲(chǔ)就是指對(duì)圖像的類別及權(quán)重進(jìn)行存儲(chǔ)。聚類信息庫描述的是每幅圖像所屬的類別，在利用強(qiáng)化學(xué)習(xí)所得到的查詢表中包含了類別及類別所對(duì)應(yīng)的權(quán)重組合，步驟中的“最優(yōu)搜索組合”就是指根據(jù)當(dāng)前圖像的所屬的類別，取得該類別所對(duì)應(yīng)的權(quán)重組合。
上述技術(shù)方案中，所述特征集合由圖像的顏色特征、紋理特征和形狀特征構(gòu)成，所述顏色特征由顏色矩表示，所述紋理特征由灰度共生矩陣表示，所述形狀特征由圖像矩陣信息熵表示。
當(dāng)采用圖像的上述三種特征構(gòu)成特征集合時(shí)，i = 3，i表示特征的數(shù)量；j = 3，j 為每個(gè)特征下具體用來表示特征的子特征的維數(shù)。如用顏色矩表示顏色特征，這里顏色矩由一階矩、二階矩和三階矩表示，因此這里的j也是等于3。
上述技術(shù)方案中，步驟(5)中，檢索的方法是，利用相似度模型計(jì)算，得出圖像之間的距離，按照檢索出的圖像與當(dāng)前被檢索圖像的距離從小到大排序，檢索結(jié)果是排序靠前的圖像。即，檢索出與當(dāng)前檢索圖形距離較小的圖像。
進(jìn)一步的技術(shù)方案，步驟(5)中，檢索結(jié)束時(shí)，利用ε-greedy算法選擇是否需要進(jìn)行歸并，如需要，則將圖像信息歸并或更新到聚類信息庫，聚類操作利用基于遺傳算法的 K-Means算法實(shí)現(xiàn)。
步驟(6)中，所述修正查詢向量的方法是，利用基于Haar小波變換的圖像融合算法修正查詢向量。
為降低整個(gè)操作的負(fù)荷，又能保證聚類信息庫數(shù)據(jù)的及時(shí)更新，可以設(shè)定更新頻率，對(duì)圖像數(shù)據(jù)庫進(jìn)行聚類操作，對(duì)聚類信息庫進(jìn)行更新。該操作可以由框架自動(dòng)調(diào)用，但通常不能與檢索操作并行執(zhí)行。
由于上述技術(shù)方案運(yùn)用，本發(fā)明與現(xiàn)有技術(shù)相比具有下列優(yōu)點(diǎn)
本發(fā)明所提出的一種基于多智能算法及圖像融合技術(shù)的圖像檢索方法主要涉及遺傳算法、聚類算法、強(qiáng)化學(xué)習(xí)、相關(guān)反饋技術(shù)以及圖像融合技術(shù)，由此具有下列優(yōu)點(diǎn)
1.遺傳算法主要用于調(diào)整特征權(quán)重，構(gòu)建一個(gè)更加符合用戶需求的相似度函數(shù)，與現(xiàn)有的一些人工調(diào)整權(quán)重的圖像檢索方法相比，利用遺傳算法得到的權(quán)重組合更加符合用戶的實(shí)際需求，人工調(diào)整必然具有一定的主觀性和隨意性，在特征權(quán)重的基礎(chǔ)之上，構(gòu)建更加準(zhǔn)確的相似度函數(shù)；
2.聚類算法用于在檢索過程中動(dòng)態(tài)構(gòu)建一個(gè)聚類信息庫，動(dòng)態(tài)將具有相似特征的圖像聚合成一類，然后提取一類圖像的特征信息，結(jié)合強(qiáng)化學(xué)習(xí)算法，在后續(xù)的檢索過程中，極大提高了檢索的效率和精度；
3.圖像融合技術(shù)主要用于在檢索過程中，結(jié)合用戶的反饋信息，利用融合技術(shù)，優(yōu)化查詢向量，使得查詢向量更加符合用戶的檢索需要，結(jié)合遺傳算法，從查詢向量和相似度函數(shù)兩個(gè)角度進(jìn)行調(diào)整，提高檢索的精度和效率。
4.強(qiáng)化學(xué)習(xí)算法主要針對(duì)檢索過程，結(jié)合相關(guān)反饋技術(shù)，構(gòu)建一個(gè)基于強(qiáng)化學(xué)習(xí)的學(xué)習(xí)框架，在檢索過程中，利用強(qiáng)化學(xué)習(xí)技術(shù)，保留檢索過程中的相關(guān)檢索信息，在后續(xù)檢索中，結(jié)合圖像融合技術(shù)、遺傳算法和聚類算法，優(yōu)化檢索模型，提高檢索精度和效率，同時(shí)該方法對(duì)于旋轉(zhuǎn)、平移和尺度變化具有較強(qiáng)的魯棒性。

圖1是本發(fā)明實(shí)施例的系統(tǒng)工作流程圖。
具體實(shí)施方式
下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步描述
實(shí)施例參見圖1所示，一種基于多智能算法及圖像融合技術(shù)的圖像檢索方法，包括以下步驟
步驟(1)用戶給出原始查詢向量)Q = (D，F(xiàn)，R)，其中D表示一幅原始圖像，比如一幅jpeg格式的圖像；F = {fj表示一組特征集合，A表示第i個(gè)特征；R = IrijI表示特征&的具體表示形式，測試圖像向量Q' = (D，F(xiàn)，R)及一個(gè)測試集T，指定圖像庫I和其對(duì)應(yīng)的特征庫F;
步驟O)根據(jù)系統(tǒng)提供的聚類信息庫以及圖像的特征組合，判斷該圖像是否屬于聚類信息庫中的某一類，同時(shí)在強(qiáng)化學(xué)習(xí)的先驗(yàn)知識(shí)中查詢是否有記錄。如果屬于某一類，并存在記錄，則轉(zhuǎn)入步驟(3)；否則，轉(zhuǎn)入步驟；
步驟(3)根據(jù)測試集T及測試圖像Q’，利用遺傳算法，得出一組最佳的權(quán)值—— wl, w2, w3，分別對(duì)應(yīng)圖像三個(gè)特征——顏色，紋理和形狀，轉(zhuǎn)入步驟(5)。
步驟⑷利用強(qiáng)化學(xué)習(xí)所得到的先驗(yàn)知識(shí)，獲得一組最佳權(quán)重——wl, w2, w3，轉(zhuǎn)入步驟(5)；
步驟(5)利用圖像相似度模型，計(jì)算出圖像特征庫中每幅圖像Ii與查詢向量Q 的距離D(Q，Ii)，根據(jù)距離進(jìn)行排序，給出結(jié)果集0。圖像相似度模型如下所示
D(QJ)=YjWfidfi(QJ)fi^-F
dfi(Q J)= I^drv(QJ)V rU
其中Q是查詢向量(查詢圖像)；I是被查詢圖像；F = {fj是圖像特征集合；1^ 是特征&的權(quán)值(0，/)是兩幅圖像在特征&上的距離Au (0，7)是在特征&的第j個(gè)分量上的距離；
步驟(6)利用強(qiáng)化學(xué)習(xí)方法，更新一組強(qiáng)化學(xué)習(xí)記錄，記錄是以信息對(duì)的形式保存——〈X，W>，其中X對(duì)應(yīng)一組圖像類別，W對(duì)應(yīng)一組權(quán)重組合；
步驟(7)如果用戶對(duì)查詢結(jié)果滿意，則檢索結(jié)束，同時(shí)將圖像信息有選擇地歸并或者更新到聚類信息庫，轉(zhuǎn)入步驟(9)；如果用戶不滿意檢索結(jié)果，則轉(zhuǎn)入步驟(8)；
步驟⑶結(jié)合用戶的選擇的圖像，記做0’，利用圖像融合技術(shù)，修正查詢向量Q，同時(shí)由0’及在圖像數(shù)據(jù)庫中隨機(jī)抽取的圖像更新測試集T，將測試圖像Q’更新為當(dāng)前的查詢向量Q，轉(zhuǎn)入步驟⑶；
步驟(9)以一定的概率決定是否對(duì)圖像數(shù)據(jù)庫進(jìn)行聚類，以更新聚類信息庫，或者用戶可以強(qiáng)制系統(tǒng)進(jìn)行聚類操作。
權(quán)利要求
1.一種基于多智能算法及圖像融合技術(shù)的圖像檢索方法，其特征在于，提供一用于檢索的圖像數(shù)據(jù)庫和一聚類信息庫，所述聚類信息庫用于動(dòng)態(tài)存放具有相似特征的一類圖像的特征信息；檢索方法包括以下步驟(1)輸入查詢圖像，并提取特征，獲得原始查詢向量Q=(D，F(xiàn)，R)，其中D表示一幅原始圖像；F = {fj表示一組特征集合，其中A表示第i個(gè)特征；R = IrijI表示特征&的j個(gè)具體表示形式；(2)在聚類信息庫中查找查詢圖像的特征信息，如果不存在轉(zhuǎn)入步驟(3)，如果存在轉(zhuǎn)入步驟⑷；(3)根據(jù)遺傳算法，獲取特征組合參數(shù)，并利用強(qiáng)化學(xué)習(xí)算法，做信息采集存儲(chǔ)，轉(zhuǎn)入步驟⑶；(4)利用強(qiáng)化學(xué)習(xí)機(jī)制得到的信息，獲取最優(yōu)搜索組合，轉(zhuǎn)入步驟(5)；(5)在圖像數(shù)據(jù)庫中進(jìn)行檢索，返回檢索結(jié)果，如果用戶對(duì)結(jié)果滿意，則檢索結(jié)束；如果用戶對(duì)結(jié)果不滿意則轉(zhuǎn)入步驟(6)；(6)用戶選擇檢索結(jié)果中符合用戶需要的圖像，結(jié)合用戶的選擇，利用圖像融合技術(shù)，修正查詢向量，轉(zhuǎn)入步驟(3)。
2.根據(jù)權(quán)利要求1所述的基于多智能算法及圖像融合技術(shù)的圖像檢索方法，其特征在于所述特征集合由圖像的顏色特征、紋理特征和形狀特征構(gòu)成，所述顏色特征由顏色矩表示，所述紋理特征由灰度共生矩陣表示，所述形狀特征由圖像矩陣信息熵表示。
3.根據(jù)權(quán)利要求2所述的基于多智能算法及圖像融合技術(shù)的圖像檢索方法，其特征在于i = 3，i表示特征的數(shù)量；j = 3，j為每個(gè)特征下具體用來表示特征的子特征的維數(shù)。
4.根據(jù)權(quán)利要求1所述的基于多智能算法及圖像融合技術(shù)的圖像檢索方法，其特征在于步驟(5)中，檢索的方法是，利用相似度模型計(jì)算，得出圖像之間的距離，按照檢索出的圖像與當(dāng)前被檢索圖像的距離從小到大排序，檢索結(jié)果是排序靠前的圖像。
5.根據(jù)權(quán)利要求1所述的基于多智能算法及圖像融合技術(shù)的圖像檢索方法，其特征在于步驟(5)中，檢索結(jié)束時(shí)，利用ε-greedy算法選擇是否需要進(jìn)行歸并，如需要，則將圖像信息歸并或更新到聚類信息庫，聚類操作利用基于遺傳算法的K-Means算法實(shí)現(xiàn)。
6.根據(jù)權(quán)利要求1所述的基于多智能算法及圖像融合技術(shù)的圖像檢索方法，其特征在于步驟(6)中，所述修正查詢向量的方法是，利用基于Haar小波變換的圖像融合算法修正查詢向量。
7.根據(jù)權(quán)利要求1所述的基于多智能算法及圖像融合技術(shù)的圖像檢索方法，其特征在于設(shè)定更新頻率，對(duì)圖像數(shù)據(jù)庫進(jìn)行聚類操作，對(duì)聚類信息庫進(jìn)行更新。
全文摘要
本發(fā)明公開了一種基于多智能算法及圖像融合技術(shù)的圖像檢索方法，該方法以強(qiáng)化學(xué)習(xí)、遺傳算法和聚類算法為基礎(chǔ)，構(gòu)建一個(gè)主動(dòng)學(xué)習(xí)的智能學(xué)習(xí)框架，在相關(guān)反饋過程中利用圖像融合技術(shù)和遺傳算法，修正查詢向量和相似度匹配模型，提高了查詢精度和查詢效率。本發(fā)明的優(yōu)點(diǎn)是查詢精度和查詢效率較高，對(duì)于平移、旋轉(zhuǎn)和尺度變換具有較強(qiáng)的魯棒性，同時(shí)在一定次數(shù)的查詢學(xué)習(xí)之后，可以實(shí)現(xiàn)智能檢索，更進(jìn)一步提高查詢精度和查詢效率。
文檔編號(hào)G06K9/62GK102508909SQ20111035738
公開日2012年6月20日申請日期2011年11月11日優(yōu)先權(quán)日2011年11月11日
發(fā)明者傅啟明, 劉全, 閆其粹申請人:蘇州大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉全;傅啟明;閆其粹
技術(shù)所有人：蘇州大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像融合算法相關(guān)技術(shù)

加權(quán)平均圖像融合算法相關(guān)技術(shù)

圖像融合算法有哪些相關(guān)技術(shù)

圖像拼接融合算法相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于多智能算法及圖像融合技術(shù)的圖像檢索方法