專利名稱:用于快速圖像相似度搜索的基于片的紋理直方圖編碼的制作方法
用于快速圖像相似度搜索的基于片的紋理直方圖編碼背景數(shù)字圖片或數(shù)字圖像像其他藝術(shù)作品一樣將版權(quán)提供給它們的所有者。授權(quán)和未 授權(quán)方容易地訪問、傳輸、下載、和操縱數(shù)字圖像。例如,只需通過訪問網(wǎng)站,各方就能夠在 沒有版權(quán)所有者的授權(quán)的情況下復(fù)制數(shù)字圖像。此外,數(shù)字圖像還可在沒有版權(quán)所有者的 同意的情況下容易地在各方之間交換。在許多情況下,未授權(quán)的復(fù)制的數(shù)字圖像可被認(rèn)為 是盜版作品或盜版圖像。在某些情況下,期望搜索是原始數(shù)字圖像的副本的數(shù)字圖像。這樣的搜索可以用 于或可以不用于確定所復(fù)制的圖像是否是盜版的??蛇M(jìn)行嘗試來從成百上萬的圖像中搜索 復(fù)制的圖像,這可實際上是相當(dāng)大的工作或任務(wù)。包括檢測復(fù)制或盜版的圖像的用于搜索復(fù)制的圖像的技術(shù)包括水印模式,然而, 當(dāng)原始圖像(即,有版權(quán)的圖像)的內(nèi)容被修改時,水印模式和某些其他搜索模式可能是低 效的。為檢測經(jīng)稍微修改的圖像或近似的圖像,需要不同的模式或技術(shù)。概述提供此概述以介紹涉及應(yīng)用程序的遠(yuǎn)程自動預(yù)配和發(fā)布的概念。這些概念將在以 下詳細(xì)描述中進(jìn)一步描述。本概述并不旨在標(biāo)識所要求保護(hù)的主題的必要特征,也不旨在 用于幫助確定所要求保護(hù)的主題的范圍。在一個實現(xiàn)中,圖像被分成多個片,并且為每一片創(chuàng)建直方圖。組合多個直方圖來 表示圖像。直方圖對于每一圖像是唯一的。因此,復(fù)制的圖像可通過分析這些圖像的直方 圖來找出。附圖簡述參考附圖來描述具體實施方式
。在附圖中,附圖標(biāo)記中最左邊的數(shù)字標(biāo)識該附圖 標(biāo)記首次出現(xiàn)的附圖。在各附圖中,使用相同的標(biāo)號來指示相同的特征和組件。
圖1是示出被分成8乘8即64片的示例性圖像的圖示。圖2是示出示例性圖像和主導(dǎo)梯度方向的圖示。圖3是示出被分割成八個紋理方向的示例性片的圖示。圖4是圖像的片的示例性紋理直方圖的圖示。圖5是示出用于對圖像進(jìn)行索引的示例性過程的流程圖。圖6是示出用于檢測圖像的副本的示例性過程的流程圖。圖7是示出示例性計算環(huán)境的框圖。詳細(xì)描述假設(shè)將原始數(shù)字圖像(即,有版權(quán)的圖像)作為查詢,重復(fù)或近似重復(fù)的圖像,或 復(fù)制的圖像可通過內(nèi)容分析來找出。為找出這樣的圖像,可實現(xiàn)基于內(nèi)容的圖像檢索或稱 CB^m模式。對于這一 CB^模式,數(shù)字圖像(S卩,原始圖像)可由特征向量來表示。圖像 之間的相似度可被定義為特征空間中的距離。給定一原始圖像,其他相似的圖像(即,復(fù)制 的圖像)可通過這一 CB^模式來檢索。相似的圖像可隨后由其他方法來判斷以便確定他 們是否是復(fù)制的圖像。
復(fù)制或近似重復(fù)檢測中的兩個問題是高效的圖像特征和相似度測量。在大規(guī)模近 似重復(fù)檢測中使用的特征可包括“平均灰度”、色彩直方圖、紋理直方圖等。對于相似度測 量,可實現(xiàn)行業(yè)內(nèi)已知的距離函數(shù),諸如Minkowski度量、直方圖余弦距離、模糊邏輯等。如以下進(jìn)一步描述的,可以實現(xiàn)大規(guī)模重復(fù)檢測算法或模式。該模式將原始圖像 劃分成片,并且可將每一片的“平均灰度”用作特征。可從由主分量分析或稱PCA挑選的大 多數(shù)差異特征維度中生成散列碼(行業(yè)內(nèi)已知的許多中的一種),以便于快速相似度比較, 其中PCA及其使用是已知的。在一個實現(xiàn)中,漢明(Hamming)距離可用于相似度測量。因為由PCA挑選的差異特征僅可表征整個數(shù)據(jù)集,因此查詢圖像的具體屬性可能 沒有被很好地利用。因此,根據(jù)查詢圖像(即,原始圖像),相似度測量可以是動態(tài)的,并且 可以實現(xiàn)面向查詢的子空間移位方法來檢測近似重復(fù)或復(fù)制的圖像。在一個實現(xiàn)中,特殊散列代碼可被用于圖像表示和快速相似度搜索兩者。原始圖 像首先被分割成8乘8(即,64)個塊或片,并且可取每一片的平均亮度作為特征維度,從而 得到64維特征向量,這可由PCA進(jìn)一步縮減為32維特征向量。每一維度可隨后根據(jù)該維 度是否在平均值之上來被量化成二進(jìn)制值。以此方式,圖像可由32位散列碼來表示。取兩 個散列碼之間漢明距離作為兩個圖像的相似度測量。基于此方法,可非常迅速地檢測相似 的圖像。在某些情況下,在特定實例中以上方案可能不能有效地檢測復(fù)制或盜版的圖像。 盜版的圖像可與原始圖像在色彩、對比度、和/或飽和度上略微不同。這些改變可能顯著地 改變圖像塊的平均亮度,并且得到不同的散列碼,從而導(dǎo)致圖像檢測失敗。如以下將進(jìn)一步詳細(xì)描述的,可以實現(xiàn)用于測量圖像之間相似度的基于片的紋理 直方圖編碼方法。如以上討論的,這一基于片的直方圖編碼方法可對色彩改變問題不敏感。圖1示出了原始圖像100。圖像100也可被認(rèn)為是查詢圖像。圖像100可以是被 標(biāo)識為有版權(quán)或受保護(hù)的圖像的原始圖像集合的一部分。圖像100可被劃分成8乘8即64 個大小相等的片102-1到102-64。圖2示出了以下描述的等式中被稱為“D”的主導(dǎo)梯度方 向200。圖3示出了被分割成八個紋理方向d0 300-1、dl 300-2、d2 300-3、d3 300-4、d4 300-5、d5 300-6、d6 300-7 和 d8 300-8 的示例片 102-129?,F(xiàn)在回頭參考圖1和圖2,在每一片102中,計算紋理梯度的主導(dǎo)梯度方向200。隨 后,根據(jù)主導(dǎo)方向200來旋轉(zhuǎn)片102。之后,如以下討論的,計算圖3中示出的八個不同方向 的紋理直方圖。在以下等式中,I表示圖像,諸如圖像100。Ii,」被定義為圖像(即,圖像100)的 i,j像素值。i,j像素的梯度大小是my。值dy表示在像素i,j處的梯度方向。紋理直 方圖的第k個維度h (k)表示其方向位于第k個方向柱dk,k = 0,. . .,7 (即,d0 300-1..., d7 300-8)上的像素梯度的總強(qiáng)度。方向柱300由相對于主導(dǎo)梯度方向200的角度來定義。這提供了從每一圖像片102中對紋理直方圖特征的提取,其中該特征對于片102 旋轉(zhuǎn)、圖像比例變化、以及色彩改變是穩(wěn)健的。執(zhí)行基于紋理直方圖特征的散列碼的生成,并且組合多個片(S卩,片102)的直方 圖(例如,400)而不是使用一個直方圖來表示圖像100。這一表示考慮圖像100的全局信 息以及圖像100的特征的空間分布,該空間分布對色彩和大小修改是穩(wěn)健的而對不同的圖 像是敏感的。片直方圖特征可以用32位散列碼來編碼,從而使得該方法高效。
對于每一片102,基于以下等式來計算8柱紋理直方圖h(k),k = 0, ... ,7C
權(quán)利要求
1.一種標(biāo)識數(shù)字圖像的方法(500),包括 將所述數(shù)字圖像劃分成大小相等的片(102); 創(chuàng)建所述片的特征(504);從所創(chuàng)建的特征中的每一個創(chuàng)建直方圖(600);以及 組合所述直方圖G00),其中所組合的直方圖表示所述數(shù)字圖像。
2.如權(quán)利要求1所述的方法,其特征在于,所述劃分是劃分成8乘8(64)個大小相等的片。
3.如權(quán)利要求1所述的方法,其特征在于,所述創(chuàng)建使用以下各項的一個或多個來作 為特征平均灰度、色彩直方圖、和紋理直方圖。
4.如權(quán)利要求1所述的方法,其特征在于,進(jìn)一步包括基于主分量分析來創(chuàng)建對所述 圖像特定的散列碼。
5.如權(quán)利要求1所述的方法,其特征在于,進(jìn)一步包括使用距離函數(shù)來測量所述圖像 與其他圖像的相似度。
6.一種標(biāo)識原始圖像的副本的方法(600),包括 創(chuàng)建構(gòu)成所述圖像的多個片的特征向量O00); 生成所述多個特征向量的直方圖(608);以及將所述直方圖編碼(610)成散列碼。
7.如權(quán)利要求6所述的方法,其特征在于,所述創(chuàng)建特征向量是創(chuàng)建64維特征向量。
8.如權(quán)利要求6所述的方法,其特征在于,進(jìn)一步將所述64維特征向量縮減到較小維 數(shù)的特征向量。
9.如權(quán)利要求6所述的方法,其特征在于,所述創(chuàng)建特征向量包括將所述特征向量的 維度量化成二進(jìn)制值,并且確定所述維度是否在均值以上。
10.如權(quán)利要求8所述的方法,其特征在于,所述生成包括確定所述圖像的主導(dǎo)梯度方向。
11.一種檢測復(fù)制的圖像的方法(600),包括 生成多個圖像的散列碼(610);將所述散列碼與查詢圖像的散列碼相比較; 對重復(fù)或近似重復(fù)圖像進(jìn)行粗略過濾(604)。
12.如權(quán)利要求11所述的方法,其特征在于,所述生成散列碼是基于劃分所述圖像的 片的紋理直方圖。
13.如權(quán)利要求11所述的方法,其特征在于,所述生成散列碼包括將圖像特征投影到 子空間。
14.如權(quán)利要求11所述的方法,其特征在于,所述生成散列碼是向量量化過程。
15.如權(quán)利要求11所述的方法,其特征在于,粗略過濾使用所述圖像的漢明距離。
全文摘要
描述了用于基于原始圖像來標(biāo)識復(fù)制的圖像的技術(shù)。標(biāo)識復(fù)制的圖像是基于創(chuàng)建唯一且可標(biāo)識的特征,這些特征進(jìn)而被用于生成多個直方圖。直方圖由圖像的片來生成,其中,通過相等地劃分圖像來創(chuàng)建片。組合的片直方圖是圖像的表示。
文檔編號G06F17/30GK102138162SQ200980134639
公開日2011年7月27日 申請日期2009年6月26日 優(yōu)先權(quán)日2008年6月27日
發(fā)明者L·吳, M·李 申請人:微軟公司