一種基于分布式網(wǎng)絡(luò)實(shí)現(xiàn)圖像按內(nèi)容快速檢索的方法【
技術(shù)領(lǐng)域:
】[0001]本發(fā)明涉及一種基于分布式網(wǎng)絡(luò)實(shí)現(xiàn)圖像按內(nèi)容快速檢索的方法,屬于信息
技術(shù)領(lǐng)域:
,特別是屬于基于因特網(wǎng)的圖像檢索
技術(shù)領(lǐng)域:
?!?br>背景技術(shù):
】[0002]移動互聯(lián)網(wǎng)的迅猛發(fā)展和移動智能產(chǎn)品的迅速推廣,使得新型應(yīng)用風(fēng)靡全球,促使互聯(lián)網(wǎng)中的圖像資源呈現(xiàn)指數(shù)級爆炸式增長,催生了以"大數(shù)據(jù)"為特色的網(wǎng)絡(luò)數(shù)據(jù)時代。大數(shù)據(jù)以及云計算技術(shù)為基于圖像檢索的應(yīng)用研宄帶來了新的機(jī)遇和挑戰(zhàn)。圖像數(shù)量的快速增長使得傳統(tǒng)的以集中式索引模式構(gòu)建的數(shù)據(jù)中心面臨低效、擴(kuò)展性差等問題。近幾年來,依據(jù)覆蓋網(wǎng)絡(luò)(Overlaynetwork)的思想,借助分布式哈希表(DistributedHashTable,DHT)技術(shù)為數(shù)據(jù)中心構(gòu)建一個純分布式架構(gòu)成為一種新型解決方案,更加適用于海量資源的檢索和管理需求。在基于DHT的結(jié)構(gòu)化分布式系統(tǒng)中,每個結(jié)點(diǎn)只負(fù)責(zé)部分資源索引和小范圍路由信息,實(shí)現(xiàn)了整個分布式網(wǎng)絡(luò)的尋址和資源快速定位。[0003]但是,基于DHT的關(guān)鍵字的索引方式導(dǎo)致資源分散在網(wǎng)絡(luò)任意位置,無法對其進(jìn)行有效的預(yù)取、瀏覽和檢索。目前很多研宄工作通過改進(jìn)資源映射策略、基于內(nèi)容特征生成鍵值等措施,在一定程度保證了媒體內(nèi)容的相似性。一種方法(參見BatkoM,F(xiàn)alchiF,LuccheseC,etal.Buildingaweb-scaleimagesimilaritysearchsystem[J].MultimediaToolsandApplications,2010,47(3):599-629.)是對內(nèi)容特征空間利用iDistance進(jìn)行聚類分割,將相似的內(nèi)容映射到DHT相近結(jié)點(diǎn),便于查詢,但是軸的選擇需要收集數(shù)據(jù)集中運(yùn)算,再分發(fā)到各個結(jié)點(diǎn)中;另一種方法(參見BatkoM,DohnalV,NovakD,etal.Mufin:Amulti-featureindexingnetwork[C].Proceedingsofthe2009SecondInternationalWorkshoponSimilaritySearchandApplications.IEEEComputerSociety,2009:158-159.)是多層覆蓋網(wǎng)圖像檢索框架,其針對圖像的顏色、紋理和形狀等內(nèi)容特征分別建立覆蓋網(wǎng),查詢在每層覆蓋網(wǎng)中執(zhí)行,對于覆蓋網(wǎng)中沒有的特征,再發(fā)送到底層網(wǎng)絡(luò)查詢,最后經(jīng)過聚合函數(shù)匯總結(jié)果。[0004]以上基于DHT的圖像檢索方法主要使用了圖像的全局特征,但是這些全局特征難以針對圖像的局部區(qū)域信息進(jìn)行描述。由于大多數(shù)局部特征對圖像的尺度縮放、目標(biāo)旋轉(zhuǎn)、仿射變換等具有不變性,所以局部特征更適合表示圖像中的物體,從而取得比全局特征更準(zhǔn)確的檢索結(jié)果。因此,如何結(jié)合DHT檢索機(jī)制,基于圖像的局部特征,實(shí)現(xiàn)基于內(nèi)容的圖像快速檢索,已成為急需要解決的技術(shù)難題?!?br/>發(fā)明內(nèi)容】[0005]有鑒于此,本發(fā)明的目的是發(fā)明一種方法,基于分布式網(wǎng)絡(luò)和圖像的局部特征,實(shí)現(xiàn)圖像的快速檢索。[0006]為了達(dá)到上述目的,本發(fā)明提出了一種基于分布式網(wǎng)絡(luò)實(shí)現(xiàn)圖像按內(nèi)容快速檢索的方法,所述方法包括下列操作步驟:[0007](1)圖像索引建立和網(wǎng)絡(luò)發(fā)布,具體包括如下子步驟:[0008](101)提取所要發(fā)布圖像的ri個興趣點(diǎn)特征,其中1^是一個大于等于1的自然數(shù);[0009](102)對所提取的所要發(fā)布圖像的興趣點(diǎn)特征進(jìn)行聚類;[0010](103)根據(jù)聚類結(jié)果,建立所要發(fā)布圖像的圖像索引信息;[0011](104)把所述的圖像索引信息發(fā)布到分布式網(wǎng)絡(luò)上,實(shí)現(xiàn)圖像的網(wǎng)絡(luò)發(fā)布;[0012](2)圖像按內(nèi)容檢索,具體包括如下子步驟:[0013](201)提取所要檢索圖像的r2個興趣點(diǎn)特征,其中1~2是一個大于等于1的自然數(shù);[0014](202)根據(jù)步驟(1)中所述的聚類結(jié)果,對所提取的所要檢索圖像的興趣點(diǎn)特征進(jìn)行分類;[0015](203)根據(jù)分類結(jié)果,建立所要檢索圖像的圖像檢索信息;[0016](204)把所述的圖像檢索信息發(fā)布到步驟(1)中所述的分布式網(wǎng)絡(luò)上,并對反饋結(jié)果進(jìn)行合并處理。[0017]所述步驟(101)和步驟(201)中圖像的興趣點(diǎn)特征是指加速魯棒特征SURF。[0018]所述步驟(102)的具體內(nèi)容包括如下操作子步驟:[0019](1021)構(gòu)造m個p-stableLSH哈希表(p穩(wěn)定局部敏感哈希表),其中m為大于1的自然數(shù);每個p-stableLSH哈希表由k個哈希籃子組成,其中k為大于1的自然數(shù);[0020](1022)對所述的所要發(fā)布圖像的每一個興趣點(diǎn)特征,分別先用所述的m個p-stableLSH哈希表進(jìn)行哈希運(yùn)算,然后再用安全哈希算法SHA-1對前面得到的結(jié)果進(jìn)行再次哈希運(yùn)算,得到所述的興趣點(diǎn)特征的視覺詞匯簽名fealD,這樣對所述的每一個興趣點(diǎn)特征,總共得到m個視覺詞匯簽名fealD;[0021](1023)根據(jù)所述的興趣點(diǎn)特征的視覺詞匯簽名fealD對所要發(fā)布的圖像進(jìn)行聚類,即把具有相同的視覺詞匯簽名fealD的圖像聚為一類。[0022]所述步驟(103)中的所要發(fā)布圖像的圖像索引信息是一個四元組{fealD,f,imgID,nodelD},該四元組中,fealD表示興趣點(diǎn)特征的視覺詞匯簽名;f表示所述的興趣點(diǎn)特征;imgID是一個隨機(jī)數(shù),代表所要發(fā)布的圖像;nodelD表示實(shí)際存貯所要發(fā)布圖像的物理網(wǎng)絡(luò)網(wǎng)元節(jié)點(diǎn)的IP地址;對于一副要發(fā)布的圖像,共要建立nXm條圖像索引信息。[0023]所述步驟(104)中的分布式網(wǎng)絡(luò)是指一種覆蓋網(wǎng)絡(luò)Overlaynetwork,具體為Chord網(wǎng)絡(luò),該網(wǎng)絡(luò)使用與所述步驟(1022)中相同的安全哈希算法SHA-1生成該網(wǎng)絡(luò)上網(wǎng)絡(luò)節(jié)點(diǎn)的Chord鍵值;[0024]所述的把圖像索引信息發(fā)布到分布式網(wǎng)絡(luò)上的具體操作如下:把所述的圖像索引信息中的fealD作為所述的Chord網(wǎng)絡(luò)的鍵值,找到該fealD的直接后繼Chord節(jié)點(diǎn),然后把該圖像索引信息發(fā)送到該直接后繼Chord節(jié)點(diǎn),該直接后繼Chord節(jié)點(diǎn)保存該圖像索引信息。[0025]所述步驟(202)的具體內(nèi)容包括如下操作子步驟:[0026](2021)從所述步驟(1021)所構(gòu)造的m個p-stableLSH哈希表中隨機(jī)選擇n個,其中n為大于1的自然數(shù);[0027](2022)對所述的所要檢索圖像的每一個興趣點(diǎn)特征,先用所述的n個p-stableLSH哈希表進(jìn)行哈希運(yùn)算,然后再用所述步驟(1022)中相同的安全哈希算法SHA-1對前面得到的結(jié)果進(jìn)行再次哈希運(yùn)算,得到所述的興趣點(diǎn)特征的視覺詞匯簽名fealD,這樣對所述的每一個興趣點(diǎn)特征,總共得到n個視覺詞匯簽名fealD,從而把所述的每一個興趣點(diǎn)特征分到n個類別里。[0028]所述步驟(203)中的所要檢索圖像的圖像檢索信息是一個三元組{fealD,f,nodelD},該三元組中,fealD表示興趣點(diǎn)特征的視覺詞匯簽名;f表示所述的興趣點(diǎn)特征;nodelD表示發(fā)出所述的圖像檢索信息的物理網(wǎng)絡(luò)查詢節(jié)點(diǎn)的IP地址;對于一副要檢索的圖像,共要建立r2Xn條圖像檢索信息。[0029]所述步驟(204)的具體內(nèi)容是:查詢節(jié)點(diǎn)采用并行檢索方法把所述的圖像檢索信息發(fā)布到所述的分布式網(wǎng)絡(luò)上,并對反饋結(jié)果進(jìn)行合并處理,具體包括如下操作步驟:[0030](20411)查詢節(jié)點(diǎn)把步驟(203)所建立的圖像檢索信息{fealD,f,nodelD}中的fealD作為所述的Chord網(wǎng)絡(luò)的鍵值,找到該fealD的直接后繼Chord節(jié)點(diǎn),然后把該圖像檢索信息發(fā)送到該直接后繼Chord節(jié)點(diǎn);[0031](20412)該直接后繼Chord節(jié)點(diǎn)找到與所收到的圖像檢索信息{fealD,f,nodelD}中的fealD相同,并且與所收到的圖像檢索信息{fealD,f,nodelD}中的f距離最近的前T1條圖像索引信息,并反饋給查詢節(jié)點(diǎn),其中T1為大于等于1的自然數(shù);[0032](20413)所述的查詢節(jié)點(diǎn)對反饋的圖像索引信息進(jìn)行處理,按照圖像索引當(dāng)前第1頁1 2 3 4