亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

獲取多幅圖像的描述信息的方法及裝置與圖像匹配方法

文檔序號(hào):6357649閱讀:255來源:國知局
專利名稱:獲取多幅圖像的描述信息的方法及裝置與圖像匹配方法
技術(shù)領(lǐng)域
本發(fā)明總體上涉及圖像處理的技術(shù)領(lǐng)域,更具體而言,涉及獲取圖像的描述信息的方法以及裝置。
背景技術(shù)
隨著信息技術(shù)的發(fā)展,大規(guī)模數(shù)據(jù)庫越來越多的出現(xiàn)在多媒體應(yīng)用領(lǐng)域,比如圖像文件管理,工業(yè)圖像/視頻監(jiān)管,醫(yī)學(xué)圖像診斷等等。針對(duì)大規(guī)模數(shù)據(jù)庫的快速圖像檢索和識(shí)別也隨之成為一個(gè)重要的研究課題。傳統(tǒng)的基于“詞袋”(Bag-of-words)的圖像描述方法在解決這一問題上有良好的表現(xiàn),并且得到普遍應(yīng)用。例如,C. Wallraven等人的“Recognition with localfeatures the kernel recipe”,In Proc. ICCV, volume I, pages 257-264, 2003 中介紹了 這種基于“詞袋”的圖像描述方法。它從大量圖像局部特征中抽取出具有代表性的“視覺單詞”(visual words),并且采用圖像中這些視覺單詞出現(xiàn)的頻率來描述該圖像。同時(shí)為了克服該特征在空間信息的描述受限,人們提出了基于圖像多層空間結(jié)構(gòu)的描述方法。例如,K. Grauman 等人的 “Pyramid matchkernels !Discriminative classification with setsof imagefeatures”,In. Proc. ICCV, 2005中公開了一種用空間金字塔形式描述圖像的方法。然而,由于這些方法對(duì)每一個(gè)特征點(diǎn)均只計(jì)算一個(gè)局部特征描述子,所以認(rèn)為生成的是靜態(tài)視覺單詞,這樣的視覺單詞不一定都適用于描述不同空間層次上的圖像特征。

發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明的一個(gè)目的是提供一種新穎的基于動(dòng)態(tài)詞袋的多層圖像描述方法,其能夠在不同空間層次上準(zhǔn)確地描述圖像。本發(fā)明的另一目的是提供一種圖像匹配方法,其能夠?qū)崿F(xiàn)圖像的靈活匹配。按照本發(fā)明的一方面,提供了一種獲取多幅圖像的描述信息的方法。該方法包括檢測(cè)步驟,針對(duì)多幅圖像中的每幅圖像進(jìn)行特征點(diǎn)檢測(cè),以得到每幅圖像的多個(gè)特征點(diǎn);用于獲取多幅圖像的0級(jí)描述信息的第一獲取步驟,針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第一局部特征描述子和基于各圖像的多個(gè)第一局部特征描述子得到的多個(gè)第一視覺單詞來生成該圖像的0級(jí)描述信息;及用于獲取多幅圖像的n-1級(jí)描述信息的第n獲取步驟,針對(duì)每幅圖像執(zhí)行以下步驟第n-1分割子步驟,對(duì)該圖像進(jìn)行第n-1次分割,以得到該圖像的多幅n-1級(jí)子圖像;以及第n獲取子步驟,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第n局部特征描述子和基于各圖像的多個(gè)第n局部特征描述子得到的多個(gè)第n視覺單詞來生成該圖像的n-1級(jí)描述信息,其中該圖像的各個(gè)第n局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的n-1級(jí)子圖像得到,
其中n = 2,3,...,K+1,以及K為正整數(shù)。按照本發(fā)明的另一方面,提供了一種圖像匹配方法。該方法包括通過把輸入的圖像與多幅圖像的各圖像分別進(jìn)行匹配來獲得多個(gè)相似度,每個(gè)相似度的獲得包括把輸入的圖像的0級(jí)描述信息直到K級(jí)描述信息分別與所述多幅圖像中的相應(yīng)圖像的0級(jí)描述信息直到K級(jí)描述信息進(jìn)行比較,以得到包括從0級(jí)匹配度直到K級(jí)匹配度的多個(gè)匹配度;以及根據(jù)所述多個(gè)匹配度的加權(quán)和來得到該相似度,其中K為正整數(shù),其中根據(jù)本發(fā)明所述的方法獲取多幅圖像的各圖像的0級(jí)描述信息直到K級(jí)描述信息,根據(jù)基于輸入的圖像中包含的多個(gè)特征點(diǎn)得到的輸入的圖像的多個(gè)0級(jí)局部特征描述子和所述多個(gè)第一視覺單詞來獲取輸入的圖像的0級(jí)描述信息,通過針對(duì)輸入的圖像執(zhí)行以下步驟來獲取輸入的圖像的n-1級(jí)描述信息,n = 2, 3,. . .,K+1 :對(duì)輸入的圖像進(jìn)行第n-1次分割,以得到多幅n-1級(jí)子圖像;及根據(jù)基于輸入的圖像的各特征點(diǎn)得到的輸入的圖像的多個(gè)n級(jí)局部特征描述子和所述多個(gè)第n視覺單詞來生成輸入的圖像的n-1級(jí)描述信息,其中各個(gè)n級(jí)局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的輸入的圖像的n-1級(jí)子圖像得到,并且僅當(dāng)所述0級(jí)匹配度大于等于預(yù)定閾值時(shí)才進(jìn)行I級(jí)描述信息的比較,以及僅當(dāng)n-1級(jí)匹配度大于等于所述預(yù)定閾值時(shí)才進(jìn)行n級(jí)描述信息的比較。按照本發(fā)明的又一方面,提供了一種獲取多幅圖像的描述信息的裝置。包括檢測(cè)單元,配置成針對(duì)多幅圖像中的每幅圖像進(jìn)行特征點(diǎn)檢測(cè),以得到每幅圖像的多個(gè)特征點(diǎn);用于獲取多幅圖像的0級(jí)描述信息的第一獲取單元,配置成針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第一局部特征描述子和基于各圖像的多個(gè)第一局部特征描述子得到的多個(gè)第一視覺單詞來生成該圖像的0級(jí)描述信息;及用于獲取多幅圖像的n-1級(jí)描述信息的第n獲取單元,包括第n_l分割子單元,配置成針對(duì)每幅圖像進(jìn)行第n-1次分割,以得到該圖像的多幅n-1級(jí)子圖像;以及第n獲取子單元,配置成針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第n局部特征描述子和基于各圖像的多個(gè)第n局部特征描述子得到的多個(gè)第n視覺單詞來生成該圖像的n-1級(jí)描述信息,其中該圖像的各個(gè)第n局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的n-1級(jí)子圖像得到,其中n = 2,3,...,K+1,以及K為正整數(shù)。按照本發(fā)明的再一方面,提供了一種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品,所述指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行如上所述的根據(jù)本發(fā)明實(shí)施例的獲取多幅圖像的描述信息的方法。按照本發(fā)明的又一方面,提供了一種承載有如上所述的程序產(chǎn)品的存儲(chǔ)介質(zhì)。與傳統(tǒng)方法對(duì)每個(gè)特征點(diǎn)僅得到一個(gè)局部特征描述子不同,本發(fā)明對(duì)每個(gè)特征點(diǎn)產(chǎn)生一系列的描述子。因此,可以實(shí)現(xiàn)在不同空間層次上準(zhǔn)確地描述圖像。此外,可以按照從粗糙層到精細(xì)層的順序進(jìn)行圖像匹配,并且僅當(dāng)m-1層上兩幅圖像的匹配度大于預(yù)定閾值時(shí),才進(jìn)行m層上的圖像匹配。因此,可以實(shí)現(xiàn)圖像的靈活匹配。


參照下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例的說明,會(huì)更加容易地理解本發(fā)明的以上和其它目的、特點(diǎn)和優(yōu)點(diǎn)。在附圖中,相同的或類似的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來表示。圖I是示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的獲取多幅圖像的描述信息的方法的流程簡(jiǎn)圖;圖2是示出了用于實(shí)現(xiàn)圖I所示第n獲取步驟的一個(gè)具體示例的流程簡(jiǎn)圖;圖3是示出了某幅圖像的兩級(jí)描述信息的示意圖;圖4是示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的進(jìn)行圖像匹配的方法的流程簡(jiǎn)圖;圖5是示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的獲取多幅圖像的描述信息的裝置的簡(jiǎn) 化框圖;以及圖6是示出可用于實(shí)施根據(jù)本發(fā)明實(shí)施例的方法和裝置的計(jì)算機(jī)的示意性框圖。
具體實(shí)施例方式下面參照附圖來說明本發(fā)明的實(shí)施例。在本發(fā)明的一個(gè)附圖或一種實(shí)施方式中描述的元素和特征可以與一個(gè)或多個(gè)其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。應(yīng)當(dāng)注意,為清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域普通技術(shù)人員已知的部件和處理的表示和描述。在本發(fā)明的實(shí)施例中,為了獲得足夠豐富的圖像特征信息,對(duì)圖像進(jìn)行多層劃分,在每一空間層上都計(jì)算局部特征描述子,針對(duì)從粗糙到精細(xì)的各個(gè)空間層分別根據(jù)相應(yīng)的局部特征描述子生成各自的視覺單詞,并且利用各個(gè)空間層上相應(yīng)的視覺單詞獲得有效的多層圖像描述。圖I是示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的獲取多幅圖像的描述信息的方法100的流程簡(jiǎn)圖。如圖I所示,首先,在檢測(cè)步驟SllO中,針對(duì)多幅圖像中的每幅圖像進(jìn)行特征點(diǎn)檢測(cè),以得到每幅圖像的多個(gè)特征點(diǎn)。特征點(diǎn)的數(shù)目取決于例如圖像的特性、使用描述信息進(jìn)行圖像檢索和識(shí)別的處理器的性能等。根據(jù)應(yīng)用的需要,可以通過菜單或者其它方法由用戶選擇特征點(diǎn)的數(shù)目?;蛘?,根據(jù)使用描述信息的處理器的性能和通過采樣測(cè)試,本領(lǐng)域技術(shù)人員可以確定一個(gè)比較合理的特征點(diǎn)的數(shù)目,使得獲取描述信息所用的時(shí)間在用戶可接受的范圍以內(nèi)。特征點(diǎn)的檢測(cè)可以采用哈里斯(Harris)角點(diǎn)檢測(cè)子、對(duì)邊緣像素進(jìn)行采樣等已知方法。接下來,在第一獲取步驟S130中獲取多幅圖像的0級(jí)描述信息。具體地,針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)局部特征描述子(第一局部特征描述子)和基于所有圖像的局部特征描述子得到的視覺單詞庫(多個(gè)第一視覺單詞)來生成該圖像的0級(jí)描述信息。在一個(gè)實(shí)施例中,計(jì)算該圖像的每個(gè)特征點(diǎn)的局部特征描述子,以得到該圖像的多個(gè)局部特征描述子。例如,可以采用尺寸不變特征(SIFT)提取方法提取SIFT特征,計(jì)算特征點(diǎn)的形狀上下文描述子,或者統(tǒng)計(jì)圖像中其他像素點(diǎn)與該特征點(diǎn)之間的相對(duì)位置和角度關(guān)系矩陣。然后,把全部圖像的局部特征描述子放在一起來產(chǎn)生視覺單詞庫??梢酝ㄟ^諸如k均值聚類的方法獲得視覺單詞庫。例如,對(duì)該圖像的所有特征點(diǎn)的局部特征描述子進(jìn)行k均值聚類,每個(gè)聚類中心的取值對(duì)應(yīng)一個(gè)視覺單詞,保存這k個(gè)聚類中心的取值和其對(duì)應(yīng)的視覺單詞編號(hào),即構(gòu)成視覺單詞庫。其中k為自然數(shù),一般取值為500-1000。接著,使該圖像的多個(gè)局部特征描述子分別與視覺單詞庫中的相應(yīng)視覺單詞對(duì)應(yīng),以便通過統(tǒng)計(jì)視覺單詞庫中每個(gè)視覺單詞在該圖像中出現(xiàn)的頻率來生成該圖像的0級(jí)描述信息??梢詫?duì)每幅圖像采用視覺單詞映射方法,以便把該圖像的各特征點(diǎn)的局部特征描述子映射到相應(yīng)的視覺單詞。例如,對(duì)于每個(gè)特征點(diǎn),分別計(jì)算該特征點(diǎn)的局部特征描述子與視覺單詞庫中各視覺單詞所對(duì)應(yīng)的各聚類中心的取值之間的歐式距離,以找出歐式距離最小的視覺單詞的編號(hào)來表示該特征點(diǎn);并且統(tǒng)計(jì)每個(gè)視覺單詞的編號(hào)在圖像中出現(xiàn)的次數(shù),以便用視覺單詞的直方圖來描述圖像。過程前進(jìn)到第n獲取步驟S150,以便獲取多幅圖像的n-1級(jí)描述信息,其中n = 2,3,. . .,K+1,以及K為正整數(shù)。具體地,針對(duì)每幅圖像執(zhí)行以下步驟第n-1分割子步驟,對(duì)該圖像進(jìn)行第n-1次分割,以得到該圖像的多幅n-1級(jí)子圖像;以及第n獲取子步驟,根據(jù) 基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第n局部特征描述子和基于各圖像的多個(gè)第n局部特征描述子得到的多個(gè)第n視覺單詞來生成該圖像的n-1級(jí)描述信息,其中該圖像的各個(gè)第n局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的n-1級(jí)子圖像得到。下面參照?qǐng)D2描述用于實(shí)現(xiàn)圖I所示第n獲取步驟S150 (n = 2,3, ,K+1)的一個(gè)具體示例S250的流程簡(jiǎn)圖。即,具體示例S250包括從第二獲取步驟至第K+1獲取步驟的K個(gè)步驟。如圖2所示,在步驟S252中,把每幅圖像重復(fù)劃分為一系列逐漸變精細(xì)的空間網(wǎng)格,直到預(yù)定的次數(shù)K,以獲得該圖像的分別位于I至K網(wǎng)格級(jí)上的K組網(wǎng)格單元(子圖像)。劃分的次數(shù)K可以由用戶設(shè)定或者根據(jù)應(yīng)用來確定??臻g網(wǎng)格可以采用諸如4X4矩形網(wǎng)格或者圓形網(wǎng)格。接下來,在步驟S254中,在每個(gè)網(wǎng)格級(jí)上,根據(jù)每個(gè)特征點(diǎn)所在的網(wǎng)格單元計(jì)算該特征點(diǎn)的相應(yīng)局部特征描述子,以獲得各圖像在該網(wǎng)格級(jí)上的局部特征描述子。例如,可以在網(wǎng)格單元內(nèi)計(jì)算該特征點(diǎn)的形狀上下文描述子,或者統(tǒng)計(jì)網(wǎng)格單元內(nèi)其他像素點(diǎn)與該特征點(diǎn)之間的相對(duì)位置和角度關(guān)系矩陣。在一個(gè)優(yōu)選實(shí)施例中,針對(duì)第二獲取步驟至第K+1獲取步驟中的某些獲取步驟,可以在步驟S252之前增加用于檢測(cè)附加特征點(diǎn)的另外的檢測(cè)步驟,以便更準(zhǔn)確地描述圖像。過程前進(jìn)到步驟S256,把所有圖像在同一網(wǎng)格級(jí)的局部特征描述子進(jìn)行聚類,例如k均值聚類,以產(chǎn)生該網(wǎng)格級(jí)的視覺單詞庫。這樣,不同網(wǎng)格級(jí)的視覺單詞庫是不一樣的。然后,在步驟S258中,針對(duì)每個(gè)圖像,利用各個(gè)網(wǎng)格級(jí)上該圖像的局部特征描述子和視覺單詞庫來生成I至K級(jí)圖像描述。具體地,在每個(gè)網(wǎng)格級(jí)上,使該圖像在該網(wǎng)格級(jí)上的局部特征描述子分別與該級(jí)視覺單詞庫中的相應(yīng)視覺單詞對(duì)應(yīng)。例如,通過視覺單詞映射方法把該圖像在該網(wǎng)格級(jí)上的局部特征描述子映射到該級(jí)視覺單詞庫中的相應(yīng)視覺單詞。接下來,針對(duì)該圖像在該網(wǎng)格級(jí)上的每個(gè)網(wǎng)格單元,通過統(tǒng)計(jì)該級(jí)視覺單詞庫中的每個(gè)視覺單詞在該網(wǎng)格單元內(nèi)的出現(xiàn)頻率,來生成該網(wǎng)格單元的描述信息,例如視覺單詞直方圖;并且把該網(wǎng)格級(jí)上所有網(wǎng)格單元的描述信息進(jìn)行組合,例如把各個(gè)視覺單詞直方圖順序連接成一個(gè)長(zhǎng)直方圖,來得到圖像在該網(wǎng)格級(jí)上的描述信息。替代地,也可以通過直接統(tǒng)計(jì)該級(jí)視覺單詞庫中的每個(gè)視覺單詞在該圖像內(nèi)的出現(xiàn)頻率,來生成圖像在該網(wǎng)格級(jí)上的描述信息。圖3是示出了某幅圖像的兩級(jí)描述信息的示意圖。圖3中,圓圈中的描述信息是一個(gè)網(wǎng)格單元(子圖像)的視覺單詞直方圖。另一方面,本發(fā)明另外的實(shí)施例還提供了一種把輸入的圖像與多幅圖像中的各幅圖像分別進(jìn)行匹配的方法。圖4示出了該方法400的簡(jiǎn)化流程。如圖4所示,在步驟S410中,獲取多幅圖像中每幅圖像以及輸入的圖像的0級(jí)至K級(jí)描述信息。可以根據(jù)圖I所示的方法獲取多幅圖像中每幅圖像的描述信息。另一方面,可以根據(jù)基于輸入的圖像中包含的多個(gè)特征點(diǎn)得到的輸入的圖像的多個(gè)0級(jí)局部特征描述子和在圖I的第一獲取步驟S130中得到的視覺單詞庫來獲取輸入的圖像的0級(jí)描述信息。在一個(gè)實(shí)施例中,計(jì)算輸入的圖像的每個(gè)特征點(diǎn)的局部特征描述子,以得到輸入的圖像的多個(gè)0級(jí)局部特征描述子。例如,可以采用尺寸不變特征(SIFT)提取方法提取SIFT特征,計(jì)算特征點(diǎn)的形狀上下文描述子,或者統(tǒng)計(jì)輸入的圖像中其他像素點(diǎn) 與該特征點(diǎn)之間的相對(duì)位置和角度關(guān)系矩陣。然后,使輸入的圖像的多個(gè)0級(jí)局部特征描述子分別與該視覺單詞庫中的相應(yīng)視覺單詞對(duì)應(yīng),以便通過統(tǒng)計(jì)視覺單詞庫中每個(gè)視覺單詞在輸入的圖像中出現(xiàn)的頻率來生成輸入的圖像的0級(jí)描述信息。再者,可以通過對(duì)輸入的圖像執(zhí)行以下步驟來獲取輸入的圖像的n-1級(jí)描述信息,n = 2,3,...,K+1 :對(duì)輸入的圖像進(jìn)行第n-1次分割,以得到多幅n_l級(jí)子圖像;及根據(jù)基于輸入的圖像的各特征點(diǎn)得到的輸入的圖像的多個(gè)n級(jí)局部特征描述子和在圖I的第n獲取步驟S150中得到的多個(gè)第n視覺單詞來生成輸入的圖像的n-1級(jí)描述信息,其中各個(gè)n級(jí)局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的輸入的圖像的n-1級(jí)子圖像得到。在一個(gè)實(shí)施例中,把輸入的圖像重復(fù)劃分為一系列逐漸變精細(xì)的空間網(wǎng)格,直到預(yù)定的次數(shù)K,以獲得輸入的圖像的分別位于I至K網(wǎng)格級(jí)上的K組網(wǎng)格單元(子圖像)。而且,在每個(gè)網(wǎng)格級(jí)上,根據(jù)網(wǎng)格單元來計(jì)算其內(nèi)所含特征點(diǎn)的局部特征描述子,以獲得輸入的圖像在該網(wǎng)格級(jí)上的局部特征描述子。接下來,在每個(gè)網(wǎng)格級(jí)上,通過諸如視覺單詞映射的方法,利用輸入的圖像在該網(wǎng)格級(jí)上的局部特征描述子和在圖I的第n獲取步驟S150中得到的相同網(wǎng)格級(jí)上的視覺單詞庫來生成輸入的圖像在該網(wǎng)格級(jí)上的描述信息。過程前進(jìn)到步驟S430,針對(duì)每幅圖像,把該圖像的0級(jí)至K級(jí)描述信息分別與輸入的圖像的0級(jí)至K級(jí)描述信息進(jìn)行比較,以得到0級(jí)至K級(jí)匹配度。然后,在步驟S450中,針對(duì)每幅圖像,計(jì)算0級(jí)至K級(jí)匹配度的加權(quán)和,以得到該圖像與輸入的圖像的相似度。各級(jí)上的加權(quán)系數(shù)可以根據(jù)本級(jí)的重要度來賦值。在方法400中,僅當(dāng)0級(jí)匹配度大于等于預(yù)定閾值時(shí)才進(jìn)行I級(jí)描述信息的比較,以及僅當(dāng)n-1級(jí)匹配度大于等于預(yù)定閾值時(shí)才進(jìn)行n級(jí)描述信息的比較。在根據(jù)本發(fā)明實(shí)施例的圖像匹配方法中,可以實(shí)現(xiàn)圖像的靈活匹配,按照從粗糙層到精細(xì)層的順序進(jìn)行圖像匹配,并且僅當(dāng)在m-1層兩幅圖像匹配度大于給定閾值時(shí),才進(jìn)行m層上的圖像匹配。圖5是示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的獲取多幅圖像的描述信息的裝置500的簡(jiǎn)化框圖。如圖5所示,該裝置500包括檢測(cè)單元510、第一獲取單元530以及第二獲取單元55(^至第K+1獲取單元550k。其中,第二獲取單元55(^至第K+1獲取單元550K各自分別包括相應(yīng)的分割子單元和獲取子單元。如圖5所示,第二獲取單元550:包括第一分割子單元5501A和第二獲取子單元5501B ;以及第K+1獲取單元550k包括第K分割子單元550M和第K+1獲取子單元550kb。在工作中,檢測(cè)單元510針對(duì)輸入的多幅圖像進(jìn)行特征點(diǎn)檢測(cè),以便為每幅圖像提取多個(gè)特征點(diǎn)。第一獲取單元530根據(jù)提取的特征點(diǎn)和輸入的多幅圖像得到每幅圖像的局部特征描述子,根據(jù)所有圖像的局部特征描述子得到多個(gè)第一視覺單詞,并且針對(duì)每幅圖像,根據(jù)該圖像的局部特征描述子和多個(gè)第一視覺單詞來生成該圖像的0級(jí)描述信息。第一分割子單元5501A直到第K分割子單元550ka均對(duì)輸入的多幅圖像進(jìn)行劃分,從而分別把每幅圖像分割成多個(gè)I級(jí)子圖像直到多個(gè)K級(jí)子圖像。第二獲取子單元5501B直到第K+1獲取子單元550^均接收通過檢測(cè)單元510提取的特征點(diǎn)。第二獲取子單元5501B接收來自第一分割子單元5501A的I級(jí)子圖像。類似地,第K+1獲取子單元550kb接收來自第K分割子單元550ka的K級(jí)子圖像。針對(duì)每幅圖像,第二獲取子單元5501B根據(jù)接收的該圖像的特征點(diǎn)和該圖像的I級(jí)子圖像得到該圖像的I級(jí)局部特征描述子。然后,第二獲取子單元55(^根據(jù)所有圖像的I級(jí)局部特征描述子得到多個(gè)第二視覺單詞,并且針對(duì)每幅圖像,根據(jù)該圖像的I級(jí)局部特征描述子和多個(gè)第二視覺單詞來生成該圖像的I級(jí)描述信息。類似地,第K+1獲取子單元550kb得到多幅圖像的K級(jí)描述信息。 上述圖5中示出的裝置500及其所包括的各個(gè)單元510-550可以被配置成執(zhí)行上面參照?qǐng)DI和圖2所描述的各種操作。關(guān)于這些操作的進(jìn)一步細(xì)節(jié),可以參考以上描述的各個(gè)實(shí)施例具體實(shí)施方式
和實(shí)例,這里不再詳細(xì)描述。上面已通過框圖、流程圖和/或?qū)嵤├M(jìn)行了詳細(xì)描述,闡明了根據(jù)本發(fā)明的實(shí)施例的裝置和/或方法的不同實(shí)施方式。當(dāng)這些框圖、流程圖和/或?qū)嵤├粋€(gè)或多個(gè)功能和/或操作時(shí),本領(lǐng)域的技術(shù)人員明白,這些框圖、流程圖和/或?qū)嵤├械母鞴δ芎?或操作可以通過各種硬件、軟件、固件或?qū)嵸|(zhì)上它們的任意組合而單獨(dú)地和/或共同地實(shí)施。在一種實(shí)施方式中,本說明書中描述的主題的幾個(gè)部分可通過特定用途集成電路(ASIC)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、數(shù)字信號(hào)處理器(DSP)或其他集成形式實(shí)現(xiàn)。然而,本領(lǐng)域的技術(shù)人員會(huì)認(rèn)識(shí)到,本說明書中描述的實(shí)施方式的一些方面能夠全部或部分地在集成電路中以在一個(gè)或多個(gè)計(jì)算機(jī)上運(yùn)行的一個(gè)或多個(gè)計(jì)算機(jī)程序的形式(例如,以在一個(gè)或多個(gè)計(jì)算機(jī)系統(tǒng)上運(yùn)行的一個(gè)或多個(gè)計(jì)算機(jī)程序的形式)、以在一個(gè)或多個(gè)處理器上運(yùn)行的一個(gè)或多個(gè)程序的形式(例如,以在一個(gè)或多個(gè)微處理器上運(yùn)行的一個(gè)或多個(gè)程序的形式)、以固件的形式、或以實(shí)質(zhì)上它們的任意組合的形式等效地實(shí)施,并且,根據(jù)本說明書中公開的內(nèi)容,設(shè)計(jì)用于本公開的電路和/或編寫用于本公開的軟件和/或固件的代碼完全是在本領(lǐng)域技術(shù)人員的能力范圍之內(nèi)。例如,上述裝置500和各個(gè)組成模塊、單元、子單元可以通過軟件、固件、硬件或其任意組合的方式進(jìn)行配置。在通過軟件或固件實(shí)現(xiàn)的情況下,可從存儲(chǔ)介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī)(例如圖6所示的通用計(jì)算機(jī)600)安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能。圖6示出了可用于實(shí)施根據(jù)本發(fā)明實(shí)施例的方法和裝置的計(jì)算機(jī)的示意性框圖。在圖6中,中央處理單元(CPU)601根據(jù)只讀存儲(chǔ)器(ROM)602中存儲(chǔ)的程序或從存儲(chǔ)部分608加載到隨機(jī)存取存儲(chǔ)器(RAM) 603的程序執(zhí)行各種處理。在RAM 603中,還根據(jù)需要存儲(chǔ)當(dāng)CPU 601執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。CPU 601、R0M602和RAM 603經(jīng)由總線604彼此連接。輸入/輸出接口 605也連接到總線604。下述部件也連接到輸入/輸出接口 605 :輸入部分606 (包括鍵盤、鼠標(biāo)等等)、輸出部分607 (包括顯示器,例如陰極射線管(CRT)、液晶顯示器(LCD)等,和揚(yáng)聲器等)、存儲(chǔ)部分608 (包括硬盤等)、通信部分609 (包括網(wǎng)絡(luò)接口卡例如LAN卡、調(diào)制解調(diào)器等)。通信部分609經(jīng)由網(wǎng)絡(luò)例如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動(dòng)器610也可連接到輸入/輸出接口 605??刹鹦督橘|(zhì)611例如磁盤、光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等可以根據(jù)需要被安裝在驅(qū)動(dòng)器610上,使得從中讀出的計(jì)算機(jī)程序根據(jù)需要被安裝到存儲(chǔ)部分608中。在通過軟件實(shí)現(xiàn)上述系列處理的情況下,可以從網(wǎng)絡(luò)例如因特網(wǎng)或從存儲(chǔ)介質(zhì)例如可拆卸介質(zhì)611安裝構(gòu)成軟件的程序。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲(chǔ)介質(zhì)不局限于圖6所示的其中存儲(chǔ)有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)611??刹鹦督橘|(zhì)611的例子包含磁盤(包含軟盤)、光盤(包含光盤只讀存儲(chǔ)器(⑶-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊(cè)商標(biāo)))和半導(dǎo)體存儲(chǔ)器?;蛘?,存儲(chǔ)介質(zhì)可以是ROM 602、存儲(chǔ)部 分608中包含的硬盤等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。因此,本發(fā)明還提出了一種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品。所述指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行上述根據(jù)本發(fā)明實(shí)施例的各種方法。相應(yīng)地,用于承載這種程序產(chǎn)品的上面列舉的各種存儲(chǔ)介質(zhì)也包括在本發(fā)明的公開中。在上面對(duì)本發(fā)明具體實(shí)施例的描述中,針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征 相組合,或替代其它實(shí)施方式中的特征。應(yīng)該強(qiáng)調(diào),術(shù)語“包括/包含”在本文使用時(shí)指特征、要素、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其它特征、要素、步驟或組件的存在或附加。此外,本發(fā)明的方法不限于按照說明書中描述的時(shí)間順序來執(zhí)行,也可以按照其他的時(shí)間順序地、并行地或獨(dú)立地執(zhí)行。因此,本說明書中描述的方法的執(zhí)行順序不對(duì)本發(fā)明的技術(shù)范圍構(gòu)成限制。盡管上面已經(jīng)通過對(duì)本發(fā)明的具體實(shí)施例的描述對(duì)本發(fā)明進(jìn)行了披露,但是,應(yīng)該理解,本領(lǐng)域的技術(shù)人員可在所附權(quán)利要求的精神和范圍內(nèi)設(shè)計(jì)對(duì)本發(fā)明的各種修改、改進(jìn)或者等同物。這些修改、改進(jìn)或者等同物也應(yīng)當(dāng)被認(rèn)為包括在本發(fā)明的保護(hù)范圍內(nèi)。通過上面對(duì)本發(fā)明的實(shí)施例的描述可知,本發(fā)明涵蓋的技術(shù)方案包括但不限于如下附記所描述的內(nèi)容附記I. 一種獲取多幅圖像的描述信息的方法,包括檢測(cè)步驟,針對(duì)多幅圖像中的每幅圖像進(jìn)行特征點(diǎn)檢測(cè),以得到每幅圖像的多個(gè)特征點(diǎn);用于獲取多幅圖像的0級(jí)描述信息的第一獲取步驟,針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第一局部特征描述子和基于各圖像的多個(gè)第一局部特征描述子得到的多個(gè)第一視覺單詞來生成該圖像的0級(jí)描述信息;及用于獲取多幅圖像的n-1級(jí)描述信息的第n獲取步驟,針對(duì)每幅圖像執(zhí)行以下步驟第n-1分割子步驟,對(duì)該圖像進(jìn)行第n-1次分割,以得到該圖像的多幅n_l級(jí)子圖像;以及第n獲取子步驟,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第n局部特征描述子和基于各圖像的多個(gè)第n局部特征描述子得到的多個(gè)第n視覺單詞來生成該圖像的n-1級(jí)描述信息,其中該圖像的各個(gè)第n局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的n-1級(jí)子圖像得到,其中n = 2,3,...,K+1,以及K為正整數(shù)。附記2.根據(jù)附記I所述的方法,其中針對(duì)每幅圖像生成該圖像的0級(jí)描述信息包括第一計(jì)算子步驟,計(jì)算該圖像的所述多個(gè)特征點(diǎn)中每個(gè)特征點(diǎn)的第一局部特征描述子,以得到該圖像的多個(gè)第一局部特征描述子 '及第一描述信息生成子步驟,使該圖像的多個(gè)第一局部特征描述子分別與所述多個(gè) 第一視覺單詞中的相應(yīng)第一視覺單詞對(duì)應(yīng),以便通過統(tǒng)計(jì)多個(gè)第一視覺單詞中的每個(gè)第一視覺單詞在該圖像中出現(xiàn)的頻率來生成該圖像的0級(jí)描述信息。附記3.根據(jù)附記I或2所述的方法,其中第n獲取子步驟包括第n計(jì)算子步驟,針對(duì)該圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn),根據(jù)該特征點(diǎn)所在的n-1級(jí)子圖像計(jì)算得到該特征點(diǎn)的第n局部特征描述子,以得到該圖像的多個(gè)第n局部特征描述子;及第n描述信息生成子步驟,包括使該圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn)的第n局部特征描述子對(duì)應(yīng)于所述多個(gè)第n視覺單詞中的相應(yīng)第n視覺單詞,以便針對(duì)該圖像的每幅n-1級(jí)子圖像,通過統(tǒng)計(jì)多個(gè)第n視覺單詞中的每個(gè)第n視覺單詞在該n_l級(jí)子圖像中出現(xiàn)的頻率來生成該n-1級(jí)子圖像的描述信息;以及把各n-1級(jí)子圖像的描述信息進(jìn)行組合,以生成該圖像的n-1級(jí)描述信息。附記4.根據(jù)附記1-3之一所述的方法,其中多個(gè)第一視覺單詞的獲得包括對(duì)各圖像的多個(gè)第一局部特征描述子進(jìn)行聚類,以及多個(gè)第n視覺單詞的獲得包括對(duì)各圖像的多個(gè)第n局部特征描述子進(jìn)行聚類。附記5.根據(jù)附記1-4之一所述的方法,其中多個(gè)第一局部特征描述子和多個(gè)第n局部特征描述子包括尺寸不變特征(SIFT)描述子、形狀上下文描述子以及相對(duì)位置和角度關(guān)系矩陣描述子中的一種。附記6. —種圖像匹配方法,包括通過把輸入的圖像與多幅圖像的各圖像分別進(jìn)行匹配來獲得多個(gè)相似度,每個(gè)相似度的獲得包括把輸入的圖像的0級(jí)描述信息直到K級(jí)描述信息分別與所述多幅圖像中的相應(yīng)圖像的0級(jí)描述信息直到K級(jí)描述信息進(jìn)行比較,以得到包括從0級(jí)匹配度直到K級(jí)匹配度的多個(gè)匹配度;以及根據(jù)所述多個(gè)匹配度的加權(quán)和來得到該相似度,其中K為正整數(shù),其中根據(jù)附記1-5中之一所述的方法獲取多幅圖像的各圖像的0級(jí)描述信息直到K級(jí)描述信息,根據(jù)基于輸入的圖像中包含的多個(gè)特征點(diǎn)得到的輸入的圖像的多個(gè)0級(jí)局部特征描述子和所述多個(gè)第一視覺單詞來獲取輸入的圖像的0級(jí)描述信息,通過針對(duì)輸入的圖像執(zhí)行以下步驟來獲取輸入的圖像的n-1級(jí)描述信息,n = 2,3, ,K+1
對(duì)輸入的圖像進(jìn)行第n-1次分割,以得到多幅n-1級(jí)子圖像;及根據(jù)基于輸入的圖像的各特征點(diǎn)得到的輸入的圖像的多個(gè)n級(jí)局部特征描述子和所述多個(gè)第n視覺單詞來生成輸入的圖像的n-1級(jí)描述信息,其中各個(gè)n級(jí)局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的輸入的圖像的n-1級(jí)子圖像得到,并且僅當(dāng)所述0級(jí)匹配度大于等于預(yù)定閾值時(shí)才進(jìn)行I級(jí)描述信息的比較,以及僅當(dāng)n-1級(jí)匹配度大于等于所述預(yù)定閾值時(shí)才進(jìn)行n級(jí)描述信息的比較。附記7.根據(jù)附記6所述的方法,其中獲取輸入的圖像的0級(jí)描述信息包括計(jì)算輸入的圖像中包含的多個(gè)特征點(diǎn)的每個(gè)特征點(diǎn)的0級(jí)局部特征描述子,以得到輸入的圖像的多個(gè)0級(jí)局部特征描述子;以及使輸入的圖像的多個(gè)0級(jí)局部特征描述子與所述多個(gè)第一視覺單詞中的相應(yīng)第一視覺單詞分別對(duì)應(yīng),以便通過統(tǒng)計(jì)多個(gè)第一視覺單詞中的每個(gè)第一視覺單詞在輸入的圖像中出現(xiàn)的頻率來生成輸入的圖像的0級(jí)描述信息,并且根據(jù)多個(gè)n級(jí)局部特征描述子和多個(gè)第n視覺單詞來生成輸入的圖像的n_l級(jí)描 述信息包括針對(duì)輸入的圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn),根據(jù)該特征點(diǎn)所在的n-1級(jí)子圖像計(jì)算得到該特征點(diǎn)的n級(jí)局部特征描述子,以得到輸入的圖像的多個(gè)n級(jí)局部特征描述子;使輸入的圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn)的n級(jí)局部特征描述子對(duì)應(yīng)于所述多個(gè)第n視覺單詞中的相應(yīng)第n視覺單詞,以便針對(duì)輸入的圖像的每幅n-1級(jí)子圖像,通過統(tǒng)計(jì)多個(gè)第n視覺單詞中的每個(gè)第n視覺單詞在該n-1級(jí)子圖像中出現(xiàn)的頻率來生成該n-1級(jí)子圖像的描述信息;以及把各n-1級(jí)子圖像的描述信息進(jìn)行組合,以生成輸入的圖像的n-1級(jí)描述信息。附記8. —種獲取多幅圖像的描述信息的裝置,包括檢測(cè)單元,配置成針對(duì)多幅圖像中的每幅圖像進(jìn)行特征點(diǎn)檢測(cè),以得到每幅圖像的多個(gè)特征點(diǎn);用于獲取多幅圖像的0級(jí)描述信息的第一獲取單元,配置成針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第一局部特征描述子和基于各圖像的多個(gè)第一局部特征描述子得到的多個(gè)第一視覺單詞來生成該圖像的0級(jí)描述信息;及用于獲取多幅圖像的n-1級(jí)描述信息的第n獲取單元,包括第n-1分割子單元,配置成針對(duì)每幅圖像進(jìn)行第n-1次分割,以得到該圖像的多幅n-1級(jí)子圖像;以及第n獲取子單元,配置成針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第n局部特征描述子和基于各圖像的多個(gè)第n局部特征描述子得到的多個(gè)第n視覺單詞來生成該圖像的n-1級(jí)描述信息,其中該圖像的各個(gè)第n局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的n-1級(jí)子圖像得到,其中n = 2,3,...,K+1,以及K為正整數(shù)。附記9.根據(jù)附記8所述的裝置,其中第一獲取單元包括第一計(jì)算子單元,配置成針對(duì)每幅圖像,計(jì)算該圖像的所述多個(gè)特征點(diǎn)中每個(gè)特征點(diǎn)的第一局部特征描述子,以得到該圖像的多個(gè)第一局部特征描述子 '及第一描述信息生成子單元,配置成針對(duì)每幅圖像,使該圖像的多個(gè)第一局部特征描述子分別與所述多個(gè)第一視覺單詞中的相應(yīng)第一視覺單詞對(duì)應(yīng),以便通過統(tǒng)計(jì)多個(gè)第一視覺單詞中的每個(gè)第一視覺單詞在該圖像中出現(xiàn)的頻率來生成該圖像的O級(jí)描述信息。附記10.根據(jù)附記8或9所述的裝置,其中第n獲取子單元包括第n計(jì)算子單元,配置成針對(duì)每幅圖像,計(jì)算該圖像的所述多個(gè)特征點(diǎn)中每個(gè)特征點(diǎn)的第n局部特征描述子,以得到該圖像的多個(gè)第n局部特征描述子,其中每個(gè)特征點(diǎn)的第n局部特征描述子是根據(jù)該特征點(diǎn)所在的n-1級(jí)子圖像計(jì)算得到的 '及第n描述信息生成子單元,配置成針對(duì)每幅圖像執(zhí)行以下操作使該圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn)的第n局部特征描述子對(duì)應(yīng)于所述多個(gè)第n視覺單詞中的相應(yīng)第n視覺單詞,以便針對(duì)該圖像的每幅n-1級(jí)子圖像,通過統(tǒng)計(jì)多個(gè)第n視覺單詞中的每個(gè)第n視覺單詞在該n-1級(jí)子圖像中出現(xiàn)的頻率來生成該n-1級(jí)子圖像的描述信息;以及把各n-1級(jí)子圖像的描述信息進(jìn)行組合,以生成該圖像的n-1級(jí)描述信息。 附記11.根據(jù)附記8-10之一所述的裝置,其中第一獲取單元配置成通過對(duì)各圖像的多個(gè)第一局部特征描述子進(jìn)行聚類來獲得多個(gè)第一視覺單詞,以及第n獲取單元配置成通過對(duì)各圖像的多個(gè)第n局部特征描述子進(jìn)行聚類來獲得多個(gè)第n視覺單詞。附記12.根據(jù)附記8-11之一所述的裝置,其中多個(gè)第一局部特征描述子和多個(gè)第n局部特征描述子包括尺寸不變特征(SIFT)描述子、形狀上下文描述子以及相對(duì)位置和角度關(guān)系矩陣描述子中的一種。附記13.根據(jù)附記8-12之一所述的裝置,還包括用于獲取輸入的圖像的0級(jí)描述信息的第一信息獲取單元,配置成根據(jù)基于輸入的圖像中包含的多個(gè)特征點(diǎn)得到的輸入的圖像的多個(gè)0級(jí)局部特征描述子和所述多個(gè)第一視覺單詞來獲取輸入的圖像的0級(jí)描述信息;用于獲取輸入的圖像的n-1級(jí)描述信息的第n信息獲取單元,n = 2,3,...,K+1,包括第n-1分割子單元,配置成對(duì)輸入的圖像進(jìn)行第n-1次分割,以得到多幅n-1級(jí)子圖像;及第n信息生成子單元,配置成根據(jù)基于輸入的圖像的各特征點(diǎn)得到的輸入的圖像的多個(gè)n級(jí)局部特征描述子和所述多個(gè)第n視覺單詞來生成輸入的圖像的n-1級(jí)描述信息,其中各個(gè)n級(jí)局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的輸入的圖像的n-1級(jí)子圖像得到;以及配置成把輸入的圖像與所述多幅圖像的各圖像分別進(jìn)行匹配來獲得多個(gè)相似度的圖像匹配單元,包括比較子單元,配置成針對(duì)所述多幅圖像中的每幅圖像,把輸入的圖像的0級(jí)描述信息直到K級(jí)描述信息分別與該圖像的0級(jí)描述信息直到K級(jí)描述信息進(jìn)行比較,以得到該圖像的包括從0級(jí)匹配度直到K級(jí)匹配度的多個(gè)匹配度;以及相似度生成單元,配置成針對(duì)每幅圖像,根據(jù)該圖像的所述多個(gè)匹配度的加權(quán)來得到該圖像的相似度,其中K為正整數(shù),其中僅當(dāng)所述0級(jí)匹配度大于等于預(yù)定閾值時(shí)才進(jìn)行I級(jí)描述信息的比較,以及僅當(dāng)n-1級(jí)匹配度大于等于所述預(yù)定閾值時(shí)才進(jìn)行n級(jí)描述信息的比較。附記14.根據(jù)附記13所述的裝置,其中第一信息獲取單元配置成執(zhí)行以下操作計(jì)算輸入的圖像中包含的多個(gè)特征點(diǎn)的每個(gè)特征點(diǎn)的O級(jí)局部特征描述子,以得到輸入的圖像的多個(gè)O級(jí)局部特征描述子;以及使輸入的圖像的多個(gè)O級(jí)局部特征描述子與所述多個(gè)第一視覺單詞中的相應(yīng)第一視覺單詞分別對(duì)應(yīng),以便通過統(tǒng)計(jì)多個(gè)第一視覺單詞中的每個(gè)第一視覺單詞在輸入的圖像中出現(xiàn)的頻率來生成輸入的圖像的O級(jí)描述信息,并且
所述第n信息生成子單元配置成執(zhí)行如下操作針對(duì)輸入的圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn),根據(jù)該特征點(diǎn)所在的n-1級(jí)子圖像計(jì)算得到該特征點(diǎn)的n級(jí)局部特征描述子,以得到輸入的圖像的多個(gè)n級(jí)局部特征描述子;使輸入的圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn)的n級(jí)局部特征描述子對(duì)應(yīng)于所述多個(gè)第n視覺單詞中的相應(yīng)第n視覺單詞,以便針對(duì)輸入的圖像的每幅n-1級(jí)子圖像,通過統(tǒng)計(jì)多個(gè)第n視覺單詞中的每個(gè)第n視覺單詞在該n-1級(jí)子圖像中出現(xiàn)的頻率來生成該n-1級(jí)子圖像的描述信息;以及把各n-1級(jí)子圖像的描述信息進(jìn)行組合,以生成輸入的圖像的n-1級(jí)描述信息。附記15. —種存儲(chǔ)有機(jī)器可讀取的指令代碼的程序產(chǎn)品,所述指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行如附記1-7中任何一項(xiàng)所述的方法。附記16. —種承載有如附記15所述的程序產(chǎn)品的存儲(chǔ)介質(zhì)。
權(quán)利要求
1.一種獲取多幅圖像的描述信息的方法,包括 檢測(cè)步驟,針對(duì)多幅圖像中的每幅圖像進(jìn)行特征點(diǎn)檢測(cè),以得到每幅圖像的多個(gè)特征占. 用于獲取多幅圖像的O級(jí)描述信息的第一獲取步驟,針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第一局部特征描述子和基于各圖像的多個(gè)第一局部特征描述子得到的多個(gè)第一視覺單詞來生成該圖像的O級(jí)描述信息;及 用于獲取多幅圖像的n-1級(jí)描述信息的第n獲取步驟,針對(duì)每幅圖像執(zhí)行以下步驟 第n-1分割子步驟,對(duì)該圖像進(jìn)行第n-1次分割,以得到該圖像的多幅n-1級(jí)子圖像;以及 第n獲取子步驟,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第n局部特征描述子和基于各圖像的多個(gè)第n局部特征描述子得到的多個(gè)第n視覺單詞來生成該圖像的n-1級(jí)描述信息,其中該圖像的各個(gè)第n局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的n-1級(jí)子圖像得到, 其中n = 2,3,...,K+1,以及K為正整數(shù)。
2.根據(jù)權(quán)利要求I所述的方法,其中針對(duì)每幅圖像生成該圖像的O級(jí)描述信息包括 第一計(jì)算子步驟,計(jì)算該圖像的所述多個(gè)特征點(diǎn)中每個(gè)特征點(diǎn)的第一局部特征描述子,以得到該圖像的多個(gè)第一局部特征描述子;及 第一描述信息生成子步驟,使該圖像的多個(gè)第一局部特征描述子分別與所述多個(gè)第一視覺單詞中的相應(yīng)第一視覺單詞對(duì)應(yīng),以便通過統(tǒng)計(jì)多個(gè)第一視覺單詞中的每個(gè)第一視覺單詞在該圖像中出現(xiàn)的頻率來生成該圖像的O級(jí)描述信息。
3.根據(jù)權(quán)利要求I或2所述的方法,其中第n獲取子步驟包括 第n計(jì)算子步驟,針對(duì)該圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn),根據(jù)該特征點(diǎn)所在的n-1級(jí)子圖像計(jì)算得到該特征點(diǎn)的第n局部特征描述子,以得到該圖像的多個(gè)第n局部特征描述子;及 第n描述信息生成子步驟,包括使該圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn)的第n局部特征描述子對(duì)應(yīng)于所述多個(gè)第n視覺單詞中的相應(yīng)第n視覺單詞,以便針對(duì)該圖像的每幅n-1級(jí)子圖像,通過統(tǒng)計(jì)多個(gè)第n視覺單詞中的每個(gè)第n視覺單詞在該n_l級(jí)子圖像中出現(xiàn)的頻率來生成該n-1級(jí)子圖像的描述信息;以及把各n-1級(jí)子圖像的描述信息進(jìn)行組合,以生成該圖像的n-1級(jí)描述信息。
4.根據(jù)權(quán)利要求1-3之一所述的方法,其中多個(gè)第一視覺單詞的獲得包括對(duì)各圖像的多個(gè)第一局部特征描述子進(jìn)行聚類,以及多個(gè)第n視覺單詞的獲得包括對(duì)各圖像的多個(gè)第n局部特征描述子進(jìn)行聚類。
5.根據(jù)權(quán)利要求1-4之一所述的方法,其中多個(gè)第一局部特征描述子和多個(gè)第n局部特征描述子包括尺寸不變特征(SIFT)描述子、形狀上下文描述子以及相對(duì)位置和角度關(guān)系矩陣描述子中的一種。
6.一種圖像匹配方法,包括通過把輸入的圖像與多幅圖像的各圖像分別進(jìn)行匹配來獲得多個(gè)相似度,每個(gè)相似度的獲得包括把輸入的圖像的O級(jí)描述信息直到K級(jí)描述信息分別與所述多幅圖像中的相應(yīng)圖像的O級(jí)描述信息直到K級(jí)描述信息進(jìn)行比較,以得到包括從O級(jí)匹配度直到K級(jí)匹配度的多個(gè)匹配度;以及根據(jù)所述多個(gè)匹配度的加權(quán)和來得到該相似度,其中K為正整數(shù), 其中根據(jù)權(quán)利要求1-5中之一所述的方法獲取多幅圖像的各圖像的O級(jí)描述信息直到K級(jí)描述信息, 根據(jù)基于輸入的圖像中包含的多個(gè)特征點(diǎn)得到的輸入的圖像的多個(gè)O級(jí)局部特征描述子和所述多個(gè)第一視覺單詞來獲取輸入的圖像的O級(jí)描述信息, 通過針對(duì)輸入的圖像執(zhí)行以下步驟來獲取輸入的圖像的n-1級(jí)描述信息,n = 2,.3, ,K+1 對(duì)輸入的圖像進(jìn)行第n-1次分割,以得到多幅n-1級(jí)子圖像;及根據(jù)基于輸入的圖像的各特征點(diǎn)得到的輸入的圖像的多個(gè)n級(jí)局部特征描述子和所述多個(gè)第n視覺單詞來生成輸入的圖像的n-1級(jí)描述信息,其中各個(gè)n級(jí)局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的輸入的圖像的n-1級(jí)子圖像得到,并且 僅當(dāng)所述O級(jí)匹配度大于等于預(yù)定閾值時(shí)才進(jìn)行I級(jí)描述信息的比較,以及僅當(dāng)n-1級(jí)匹配度大于等于所述預(yù)定閾值時(shí)才進(jìn)行n級(jí)描述信息的比較。
7.根據(jù)權(quán)利要求6所述的方法,其中獲取輸入的圖像的O級(jí)描述信息包括計(jì)算輸入的圖像中包含的多個(gè)特征點(diǎn)的每個(gè)特征點(diǎn)的O級(jí)局部特征描述子,以得到輸入的圖像的多個(gè)O級(jí)局部特征描述子;以及使輸入的圖像的多個(gè)O級(jí)局部特征描述子與所述多個(gè)第一視覺單詞中的相應(yīng)第一視覺單詞分別對(duì)應(yīng),以便通過統(tǒng)計(jì)多個(gè)第一視覺單詞中的每個(gè)第一視覺單詞在輸入的圖像中出現(xiàn)的頻率來生成輸入的圖像的O級(jí)描述信息,并且 根據(jù)多個(gè)n級(jí)局部特征描述子和多個(gè)第n視覺單詞來生成輸入的圖像的n-1級(jí)描述信息包括 針對(duì)輸入的圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn),根據(jù)該特征點(diǎn)所在的n-1級(jí)子圖像計(jì)算得到該特征點(diǎn)的n級(jí)局部特征描述子,以得到輸入的圖像的多個(gè)n級(jí)局部特征描述子; 使輸入的圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn)的n級(jí)局部特征描述子對(duì)應(yīng)于所述多個(gè)第n視覺單詞中的相應(yīng)第n視覺單詞,以便針對(duì)輸入的圖像的每幅n-1級(jí)子圖像,通過統(tǒng)計(jì)多個(gè)第n視覺單詞中的每個(gè)第n視覺單詞在該n-1級(jí)子圖像中出現(xiàn)的頻率來生成該n-1級(jí)子圖像的描述信息;以及 把各n-1級(jí)子圖像的描述信息進(jìn)行組合,以生成輸入的圖像的n-1級(jí)描述信息。
8.一種獲取多幅圖像的描述信息的裝置,包括 檢測(cè)單元,配置成針對(duì)多幅圖像中的每幅圖像進(jìn)行特征點(diǎn)檢測(cè),以得到每幅圖像的多個(gè)特征點(diǎn); 用于獲取多幅圖像的O級(jí)描述信息的第一獲取單元,配置成針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第一局部特征描述子和基于各圖像的多個(gè)第一局部特征描述子得到的多個(gè)第一視覺單詞來生成該圖像的O級(jí)描述信息;及用于獲取多幅圖像的n-1級(jí)描述信息的第n獲取單元,包括 第n-1分割子單元,配置成針對(duì)每幅圖像進(jìn)行第n-1次分割,以得到該圖像的多幅n-1級(jí)子圖像;以及 第n獲取子單元,配置成針對(duì)每幅圖像,根據(jù)基于該圖像的各特征點(diǎn)得到的該圖像的多個(gè)第n局部特征描述子和基于各圖像的多個(gè)第n局部特征描述子得到的多個(gè)第n視覺單詞來生成該圖像的n-1級(jí)描述信息,其中該圖像的各個(gè)第n局部特征描述子根據(jù)相應(yīng)特征點(diǎn)所在的n-1級(jí)子圖像得到, 其中n = 2,3,...,K+1,以及K為正整數(shù)。
9.根據(jù)權(quán)利要求8所述的裝置,其中第一獲取單元包括 第一計(jì)算子單元,配置成針對(duì)每幅圖像,計(jì)算該圖像的所述多個(gè)特征點(diǎn)中每個(gè)特征點(diǎn)的第一局部特征描述子,以得到該圖像的多個(gè)第一局部特征描述子;及 第一描述信息生成子單元,配置成針對(duì)每幅圖像,使該圖像的多個(gè)第一局部特征描述子分別與所述多個(gè)第一視覺單詞中的相應(yīng)第一視覺單詞對(duì)應(yīng),以便通過統(tǒng)計(jì)多個(gè)第一視覺單詞中的每個(gè)第一視覺單詞在該圖像中出現(xiàn)的頻率來生成該圖像的O級(jí)描述信息。
10.根據(jù)權(quán)利要求8或9所述的裝置,其中第n獲取子單元包括 第n計(jì)算子單元,配置成針對(duì)每幅圖像,計(jì)算該圖像的所述多個(gè)特征點(diǎn)中每個(gè)特征點(diǎn)的第n局部特征描述子,以得到該圖像的多個(gè)第n局部特征描述子,其中每個(gè)特征點(diǎn)的第n局部特征描述子是根據(jù)該特征點(diǎn)所在的n-1級(jí)子圖像計(jì)算得到的;及 第n描述信息生成子單元,配置成針對(duì)每幅圖像執(zhí)行以下操作使該圖像的所述多個(gè)特征點(diǎn)中的每個(gè)特征點(diǎn)的第n局部特征描述子對(duì)應(yīng)于所述多個(gè)第n視覺單詞中的相應(yīng)第n視覺單詞,以便針對(duì)該圖像的每幅n-1級(jí)子圖像,通過統(tǒng)計(jì)多個(gè)第n視覺單詞中的每個(gè)第n視覺單詞在該n-1級(jí)子圖像中出現(xiàn)的頻率來生成該n-1級(jí)子圖像的描述信息;以及把各n-1級(jí)子圖像的描述信息進(jìn)行組合,以生成該圖像的n-1級(jí)描述信息。
全文摘要
一種獲取多幅圖像的描述信息的方法及裝置與圖像匹配方法。獲取多幅圖像的描述信息的方法包括針對(duì)多幅圖像中的每幅圖像進(jìn)行特征點(diǎn)檢測(cè),以得到每幅圖像的多個(gè)特征點(diǎn);針對(duì)每幅圖像,根據(jù)基于檢測(cè)到的多個(gè)特征點(diǎn)得到的該圖像的多個(gè)第一局部特征描述子和基于各圖像的多個(gè)第一局部特征描述子得到的多個(gè)第一視覺單詞來生成該圖像的0級(jí)描述信息;以及針對(duì)每幅圖像執(zhí)行以下步驟對(duì)該圖像進(jìn)行第n-1次分割,以得到該圖像的多幅n-1級(jí)子圖像;以及根據(jù)基于相應(yīng)特征點(diǎn)所在的n-1級(jí)子圖像得到的該圖像的多個(gè)第n局部特征描述子和基于各圖像的多個(gè)第n局部特征描述子得到的多個(gè)第n視覺單詞來生成該圖像的n-1級(jí)描述信息,其中n=2,3,......,K+1,以及K為正整數(shù)。
文檔編號(hào)G06K9/46GK102737243SQ20111008570
公開日2012年10月17日 申請(qǐng)日期2011年3月31日 優(yōu)先權(quán)日2011年3月31日
發(fā)明者上原祐介, 于浩, 劉汝杰, 曹瓊, 杉村昌彥 申請(qǐng)人:富士通株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1