亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于矩陣不變性的數(shù)字商品表示的制作方法

文檔序號:6444033閱讀:404來源:國知局
專利名稱:基于矩陣不變性的數(shù)字商品表示的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般涉及一種信號表示技術(shù)。
背景技術(shù)
數(shù)字商品通常通過專用或公用網(wǎng)絡(luò)—如內(nèi)聯(lián)網(wǎng)和因特網(wǎng)分發(fā)到消費者。另外,這些商品通過固定的計算機可讀媒質(zhì),如光盤(CD-ROM)、數(shù)字多功能盤(DVD)、軟磁盤或硬磁盤(如,經(jīng)預(yù)加載的硬驅(qū)動器)分發(fā)到消費者。
不幸的是,人們能夠相對容易地在損害內(nèi)容所有者的利益的情況下—包括內(nèi)容作者、發(fā)行者、開發(fā)者、分發(fā)者等等,盜版這些數(shù)字商品的原始數(shù)字內(nèi)容。生產(chǎn)并分發(fā)內(nèi)容的基于內(nèi)容的行業(yè)(如,娛樂、音樂、電影、軟件等)由于數(shù)字盜版而遭受損失收入的煩惱。
本發(fā)明所使用的“數(shù)字商品”是電子地儲存或發(fā)送的內(nèi)容的一般標簽。數(shù)字商品的示例包括圖像、音頻剪輯、視頻、多媒體、軟件和數(shù)據(jù)。根據(jù)上下文,數(shù)字商品也被稱為“數(shù)字信號”、“內(nèi)容信號”、“數(shù)字比特流”、“媒體信號”、“數(shù)字對象”、“對象”、“信號”等等。
另外,數(shù)字商品通常儲存在大容量數(shù)據(jù)庫中—結(jié)構(gòu)化的或非結(jié)構(gòu)化的。隨著這些數(shù)據(jù)庫的增長,對流線化的商品分類和標識的需求也隨之增加。
散列散列技術(shù)用于許多目的。這些目的其中之一是保護內(nèi)容所有者的權(quán)限,并加快數(shù)據(jù)庫搜索/訪問。散列技術(shù)在輸入數(shù)據(jù)庫管理、查詢、密碼學(xué)以及涉及大量原始數(shù)據(jù)的許多其它鄰域等許多范圍內(nèi)使用。
一般而言,散列技術(shù)將一大塊原始數(shù)據(jù)映射到相對較小且結(jié)構(gòu)化的標識符集。這些標識符也被成為“散列值”或簡稱為“散列”。通過向原始數(shù)據(jù)中引入特定的結(jié)構(gòu)和順序,散列函數(shù)將原始數(shù)據(jù)的大小大大地縮減成一個較小(通常更便于管理)的表示。
常規(guī)散列的限制常規(guī)的散列技術(shù)用于多種數(shù)據(jù)。這些技術(shù)具有好的特征,并且是熟知的。不幸的是,具有可視和/或音頻內(nèi)容的數(shù)字商品提出了其它數(shù)字數(shù)據(jù)中不會經(jīng)歷的一組獨特的挑戰(zhàn)。這主要是由于這類商品的內(nèi)容要經(jīng)受人類觀察者的感知評估的獨特事實。通常,感知評估是視覺和/或聽覺的。
例如,假定兩個數(shù)字商品的內(nèi)容實際上是不同的,但是僅在感知上、非實質(zhì)上不同。人類觀察者可考慮這兩個數(shù)字商品的內(nèi)容是相似的。然而,即使兩個數(shù)字商品之間的內(nèi)容屬性(如,色彩、音調(diào)、強度、相位)的感知上非實質(zhì)差異也會導(dǎo)致這兩個商品在數(shù)字域中出現(xiàn)實質(zhì)性的不同。
由此,當(dāng)使用常規(guī)的散列函數(shù)時,數(shù)字商品的些許偏移的版本會生成與該原始數(shù)字商品的版本相比十分不同的散列,即使該數(shù)字商品本質(zhì)上對人類觀察者來說是相同的(即,感知上是相同的)。
人類觀察者能夠相當(dāng)程度上容許數(shù)字商品中的某些變化。例如,人類的耳朵對音頻信號的頻率分量的某些范圍中的變化比頻率分量的其范圍更不敏感。
可充分利用這里人類容許用于非法或不道德的目的。例如,盜版者可使用先進的音頻處理技術(shù)從音頻信號中移除版權(quán)注意事項或嵌入的水印,而不會在感知上改變音頻質(zhì)量。
對數(shù)字商品的這類惡意的改變被稱為“攻擊”,并導(dǎo)致在數(shù)據(jù)域中的改變。不幸的是,人類觀察者無法感知到這些變化,從而允許盜版者成功地以不合法的方式分發(fā)這些未授權(quán)的副本。
盡管人類觀察者可容許這一微小(即,不可感知)的改變,然而數(shù)字觀察者—以常規(guī)散列技術(shù)的形式—無法容許這一改變。傳統(tǒng)的散列技術(shù)幾乎無助于標識原始數(shù)字商品和這一商品的盜版副本的公共內(nèi)容,因為原始和盜版的副本散列到十分不同的散列值。即使兩者在感知上是相同的(即,對人類觀察者看似相同),這一情況也是真實的。
對散列技術(shù)的應(yīng)用對散列技術(shù)有許多不同的應(yīng)用。某些包括反盜版、內(nèi)容分類、內(nèi)容識別、加水印、基于內(nèi)容的密鑰生成以及音頻或視頻流中的同步。
散列技術(shù)可用于搜索web以查找懷疑被盜版的數(shù)字商品。另外,散列技術(shù)用于基于信號的內(nèi)容生成密鑰。替代機密密鑰或除其之外使用這些密鑰。同樣,散列函數(shù)可用于同步輸入信號。這類信號的示例包括視頻或多媒體信號。如果同步被實時地執(zhí)行,則散列技術(shù)必須是快速的。

發(fā)明內(nèi)容
本發(fā)明所描述的是在新定義的表示域中產(chǎn)生數(shù)字商品(如,圖像)的新表示的一種實現(xiàn)。特別地,該新域中的表示基于矩陣不變性。在某些實現(xiàn)中,例如,矩陣不變性可大量使用奇異值分解(SVD)。


貫穿附圖,相同的標號標識相同的元件和特征。
圖1所示是本發(fā)明所描述的方法實現(xiàn)的流程圖。
圖2是本發(fā)明所描述的實現(xiàn)的框圖。
圖3是能夠(完全或部分地)實現(xiàn)本發(fā)明所描述的至少一個實施例的計算操作環(huán)境的示例。
具體實施例方式
在以下描述中,為解釋目的,陳述了具體的數(shù)字、材料和配置,以提供對本發(fā)明的全面理解。然而,本領(lǐng)域的技術(shù)人員可以清楚,本發(fā)明可不使用特定的示例性細節(jié)來實踐。在其它實例中,眾所周知的特征被省略或簡化以清晰地闡明本發(fā)明的示例性實現(xiàn)的描述,并由此更好地解釋本發(fā)明。此外,為便于理解,某些方法步驟被描繪為單獨的步驟;然而,這些單獨描繪的步驟不應(yīng)當(dāng)被解釋為在其執(zhí)行中有依賴的必要順序。
以下詳細描述陳述了基于矩陣不變性的數(shù)字商品表示的一個或多個示例性實現(xiàn),它結(jié)合所附權(quán)利要求書中所述的元素。這些實現(xiàn)用細節(jié)來描述,以滿足法定的書面描述、授權(quán)和最佳模式的需求。然而,描述本身并不意味著局限本專利的范圍。
本發(fā)明所描述的這些示例性實現(xiàn)是示例。這些示例性實現(xiàn)不限制本發(fā)明的范圍;相反,結(jié)合其它現(xiàn)有或未來的技術(shù),本發(fā)明也可以其它方式實施或?qū)崿F(xiàn)。
基于矩陣不變性的數(shù)字商品表示的實施例的一個示例可被成為“示例性商品表示器”。
當(dāng)本發(fā)明中提及隨機化時,應(yīng)當(dāng)理解,隨機化通過偽隨機數(shù)生成器(如,RC4)來實現(xiàn),其種子是密鑰(κ),該密鑰對敵對方是未知的。
介紹此處所描述的本發(fā)明的一個或多個示例性實現(xiàn)可在如圖3所示的計算機系統(tǒng)和計算機網(wǎng)絡(luò)中(全部或部分地)實現(xiàn)。盡管實現(xiàn)可具有許多應(yīng)用,然而密碼系統(tǒng)、授權(quán)和安全是具體應(yīng)用的示例。
示例性商品表示器從通過矩陣不變性偽隨機地選擇商品的半全局(semi-global)區(qū)域中導(dǎo)出數(shù)字商品的健壯的特征矢量。這類區(qū)域可以是(但不必要是)重疊的。
與常規(guī)方法不同,示例性商品表示器的計算是基于矩陣不變性的(如基于奇異值分解(SVD))。SVD分量捕獲數(shù)字商品的本質(zhì)特性。
半全局特性半全局特性表示個別元素的組或集合的通用特征。作為示例,它們可以是“區(qū)域”(即,“分段”)的統(tǒng)計或特征。半全局特性不表示個別元素的個別局部特性;相反,它們是該組(如,分段)的感知內(nèi)容的整體表示。
半全局特性可由組的數(shù)學(xué)或統(tǒng)計表示來確定。例如,它可以是組中所有像素的色彩值的平均值。因此,這一半全局特性也可被成為“統(tǒng)計特性”。局部特性不表示健壯的統(tǒng)計特性。
命名法本發(fā)明中,大寫字母(如,A、B、C)表示矩陣,具有矢量符號的小寫字母(如,~a、~b、~c)表示列矢量,小寫字母表示標量(如,a、b、c)。密鑰用κ表示。
本發(fā)明中,使用以下數(shù)學(xué)定義·I∈Rn×n大小為n×n的數(shù)字商品的二維表示。
·Ln大小為n×n的單位矩陣。
·Ai∈Rm×m表示從數(shù)字商品中獲取的第i個偽隨機區(qū)域(如,大小為m×m的矩形)的矩陣。
·AT矩陣A的轉(zhuǎn)置。
·|A|F矩陣A的Frobenous范數(shù),被定義為|A|F=(Σk=1mΣl=1mak,l2)12,]]>其中,ak,l是A在k行和l列的元素。
·AH矩陣A的Hermitian轉(zhuǎn)置。注意,對于實矩陣,AH=AT。
·|~v|2矢量的L2范數(shù),被定義為|~v|2=(Σkvk2)12,]]>其中,vk是~v的第k個元素。
·D ∈Rm×m,對長度為m的一維信號的大小為m的DCT變換矩陣。注意,矩陣I(大小m×m)的二維DCT變換由DIDT給出。
·W∈Rm×m對長度為m的一維信號的大小為m的DWT變換矩陣。注意,矩陣I(大小m×m)的二維DWT變換由WIWT給出。
·|~a|H二進制矢量~a的Hamming加權(quán)。
·矩陣Ai∈Rm×m的SVD被定義為A=U∑VH,其中-U=[~u1~u2···~um]:{~ui}i=1m]]>是矩陣AAH的正交本征矢量(并且一般不是唯一的)。{~ui}i=1m被稱為為A的左奇異值矢量。
-V=[~v1~v2···~vm]:{~vi}i=1m]]>是矩陣AHA的正交本征矢量(并且一般不是唯一的)。{~vi}i=1m被稱為A的右奇異值矢量。
-∑大小為m×m的對角實矩陣,其中,第i個對角項σi被稱為第i個奇異值。在不丟失普遍性的情況下,可假定δ1>=σ2...>=σm。
奇異值分解(SVD)示例性商品表示器捕獲幾何信息的本質(zhì),而在維度上有所縮減。SVD具有某些可證明的最優(yōu)性質(zhì)在Frobenius范數(shù)由前K個奇異矢量以及對應(yīng)的奇異值產(chǎn)生的意義上,對矩陣(例如秩N,N>=K)的“最佳”低維(稱為K維)逼近。
數(shù)字商品(如圖像)的半全局特征和幾何信息的本質(zhì)由這類商品的SVD的重要分量來緊縮地捕獲。只要所關(guān)注的數(shù)字商品不被感知地改變得太嚴重,這類分量在有意或無意的干擾下近似不變。
采用示例性商品表示器,SVD被應(yīng)用到圖像的偽隨機選擇的半全局區(qū)域,這主要是因為安全原因。從這些區(qū)域獲取的SVD分量準確地表示數(shù)字商品的總體特征,并具有有利的健壯性性質(zhì),同時提供了合理的安全性,只要使用足夠數(shù)量和大小的區(qū)域。
常規(guī)選擇通常為DCT(離散余弦變換)和DWT(離散小波變換)。采用DCT或DWT,數(shù)字商品投影到固定的基本矢量的固定組。DCT/DWT被證明為一般對常規(guī)的商品處理應(yīng)用是有效的。
作為對DCT/DWT類型的固定基礎(chǔ)變換的替代,示例性商品表示器采用了奇異值分解(SVD)。采用SVD,示例性商品表示器選擇L2范數(shù)意義上的最優(yōu)基礎(chǔ)矢量(見下文公式(1))。此外,給定一個矩陣,其SVD是唯一的。作為模擬,如果數(shù)字商品被表示為某一高維矢量空間中的矢量,則在公式(1)的意義上,奇異矢量給予商品最優(yōu)的方向信息,而奇異值給出沿該方向的距離信息。因此,對應(yīng)于大奇異矢量的奇異矢量自然地易受標度變換攻擊和其它較小的常規(guī)信號處理修改。
通過使用SVD分解,數(shù)字商品可被認為是三維空間中的二維表面。當(dāng)向數(shù)字商品(或表面)應(yīng)用DCT之類的變換時,關(guān)于該數(shù)字商品的任何特別不同(因此是重要的)的幾何特征被分散到所有的系數(shù)。
作為示例,圖像可具有強峰值(如,暗背景中非常亮的斑痕)的表面,在DCT的情況下,這些強峰值會被分散到所有的變換。通過使用SVD示例性商品表示器保存了這些重要特征的大小(以奇異值的形式)以及其位置和奇異矢量中的幾何結(jié)構(gòu)。因此,第一個左和右奇異矢量的組合(即,對應(yīng)于最大的奇異值)捕獲L2范數(shù)意義上圖形中的重要幾何特征。
SVD的性質(zhì)下文描述了SVD的數(shù)學(xué)性質(zhì)。設(shè)A=U∑VH為A的SVD。則,1)左奇異矢量U=[~u1~u2···~um]:{~ui}i=1m]]>是A的列空間的正交基。
2)右奇異矢量V=[~v1~v2···~vm]:{~vi}i=1m]]>是A的行空間的正交基。
3)具有(σ1,~u1,~v1)=argmina,~x,~y|A-a~x~yH|F2,]]>其中,|~x|2=|~y|2=1,且k,1<k<=mσk,~uk,~v1)=argmina,-x,-y|A-Σl=1k-1σl~ul1~vlH-a~x~yH|F2,]]>其中,σ1>=σ2…>=σm是奇異值,{ui}和{~vi}是對應(yīng)的奇異矢量。
散列示例性商品表示器采用的散列函數(shù)具有兩個輸入—數(shù)字商品(如圖像)I和機密密鑰κ。這一散列函數(shù)從具有2h基數(shù)的集合{0,1}h產(chǎn)生一短矢量~h=Hκ(I)。期望感知散列以高概率對所有的類似感知的數(shù)字商品都是相等的。也期望兩個感知上不同的數(shù)字商品以高概率產(chǎn)生不相關(guān)的散列值。這一散列函數(shù)是一種多對一映射。另一方面,對于大多數(shù)應(yīng)用,以高概率對感知上相似(各自不同)的輸入具有足夠的相似(各自不同)散列值已足夠,即,散列函數(shù)會示出得體的變化。
對這一散列函數(shù)的要求給出如下1)隨機化對于任一給定的輸入,其散列值應(yīng)當(dāng)近似在所有可能的輸出之間均勻分布。概率度量由機密密鑰定義。
2)兩兩獨立對于兩個感知上不同的數(shù)字商品的散列輸出應(yīng)當(dāng)以高概率獨立,其中,概率空間由機密密鑰定義。
3)不變性對于所有可能的可接受干擾,散列函數(shù)的輸出應(yīng)當(dāng)以高概率保持近似不變,其中,概率空間由機密密鑰定義。
當(dāng)按照人類的感知,在兩個數(shù)字商品之間沒有相當(dāng)?shù)乜杀蛔⒁獾氖д?,則這兩個數(shù)字商品被認為是感知上相似的。
示例性商品表示器的方法實現(xiàn)圖1示出了示例性商品表示器的方法實現(xiàn)。該方法實現(xiàn)可以軟件、硬件或其組合來執(zhí)行。
在110,示例性商品表示器獲取輸入數(shù)字商品。為此解釋,輸入數(shù)字商品是大小為n×n的圖像,可被描述為I∈Rn×n。注意,圖像也可以是矩形的(即,大小可以不同)。這一方法可以毫無困難地被一般化成這一情況。
在120,示例性商品表示器從I偽隨機地形成多個區(qū)域。區(qū)域的數(shù)量可被稱為p,區(qū)域的形狀可以是例如矩形。區(qū)域的形狀可在各個實現(xiàn)之間不同。
盡管不必要,這些區(qū)域可彼此重疊。然而,可產(chǎn)生需要這一重疊的實現(xiàn)。相反,可產(chǎn)生不允許重疊的實現(xiàn)。
這一行動由Ai∈Rm×m,1<=i<=p來表示。Ai是表示取自數(shù)字商品的第i個偽隨機區(qū)域(如,大小為m×m的矩形)的矩陣。注意,這些區(qū)域的每一個可以是大小不同的矩陣,并且這可以毫無困難地在這一方法中使用。
在130,通過基于SVD的變換從每一區(qū)域Ai生成特征矢量(其每一個都被標記為~gi)。該特征矢量生成可被一般地描述為~gi=T1(Ai)。
這些特征矢量(~gi)在合適的量化之后可被用作散列值,或者它們可用作可從其產(chǎn)生實際散列值的中間特征?;赟VD的變換(T1(Ai))是一種采用SVD的散列函數(shù)。散列函數(shù)的示例在下文名為“基于SVD的散列函數(shù)”一節(jié)中描述。
在這一點上,示例性商品表示器已產(chǎn)生了數(shù)字商品的表示(通過~gi=T1(Ai)產(chǎn)生的特征矢量的集合)。某些實現(xiàn)可在此結(jié)束,以{~g1,...,gp}的組合形成散列矢量。
在這些實現(xiàn)中??稍O(shè)計T1(·),使得T1(Ai)從矩形Ai產(chǎn)生前q個奇異值。另一可能性是設(shè)計T1(·),使得T1(Ai)產(chǎn)生前q個奇異矢量(左、右或兩者)。這些是對應(yīng)于最大的q個值的q個奇異矢量。自然地,在兩種情況下,應(yīng)當(dāng)正確地選擇參數(shù)q例如,邏輯判決要求q<<m。
在某些實現(xiàn)中,可能選擇p=1和Ai,使得它對應(yīng)于整個圖像。注意,這一變換不具有任何隨機性;因此,它對圖像散列的非對抗性應(yīng)用更合適。
可選地,其它實現(xiàn)可執(zhí)行額外的處理以產(chǎn)生甚至更平滑的結(jié)果。框140、150、160和170示出了這些過程。
在140,示例性商品表示器通過使用特征矢量{~g1,...,gp}的偽隨機組合來構(gòu)造數(shù)字商品的次級表示J。在這一點上,作為塊130的一部分產(chǎn)生的這些矢量可被認為是“中間”特征矢量。
作為次級表示J的這一構(gòu)造的一部分,示例性商品表示器收集對應(yīng)于來自每一分組的最大奇異值的第一個左奇異矢量和右奇異矢量。
設(shè)Γ={~u1,...,~up,,~v1,...,~vp},其中,~ui(相應(yīng)的~vi)是第i個小組的第一個左(相應(yīng)的右)奇異矢量。然后,示例性商品表示器從集合Γ偽隨機地形成一平滑表示J給定偽隨機地選擇的初始奇異矢量,通過從Γ中選擇并替換隨后的矢量,使得下一個選擇的矢量在L2范數(shù)的意義上最接近前一矢量,以繼續(xù)形成J。
因此,在2p個步驟之后,Γ的所有元素都被偽隨機地重新排列,并且形成了J(大小為m×2p)。注意,L2矩陣可由以J的形式的任一其它合適的矩陣(可能被隨機化)替換,以獲得連續(xù)性和平滑性。在某些實現(xiàn)中,J的平滑特性所期望的。
也注意,作為對這一矢量的簡單偽隨機重新排列的替代,可應(yīng)用其它(可能更復(fù)雜)的操作來生成J。
在150,示例性商品表示器從J偽隨機地形成多個區(qū)域。區(qū)域的數(shù)量可被稱為r,區(qū)域的形狀可以是例如矩形。區(qū)域的形狀可在各個實現(xiàn)之間不同。與上文描述的區(qū)域一樣,這些區(qū)域可以是任何形狀,并可重疊(但不必要如此)。
這一行動由以下公式表示Bi∈Rd×d,l<=i<=r。Bi是表示取自數(shù)字商品的次級表示J的第i個偽隨機區(qū)域(如,大小為d×d的矩形)的矩陣。注意,在這一實現(xiàn)中,矩形可以是不同的大小。在其它實現(xiàn)中,矩形可以是相同的大小。
在160,通過基于SVD的變換從每一區(qū)域Bi生成一組新的特征矢量(其每一個可被標記為~fi)。這一特征矢量生成可被一般地描述為~fi=T2(Bi)。
這些特征矢量~fi是散列值?;赟VD的變換(T2(Bi))是采用SVD的散列函數(shù)。散列函數(shù)的示例在下文名為“基于SVD的散列函數(shù)”的一節(jié)中描述。這兩個基于SVD的變換(T1和T2)可以相同,也可以彼此不同。
在170,示例性商品表示器組合該新集合{~f1,...,~fp}的特征矢量以形成新的散列矢量,它產(chǎn)生包括矢量組合的輸出。
基于SVD的散列函數(shù)本部分描述了可由上文在圖1的描述中介紹的基于SVD的變換(T1和T2)采用的若干散列函數(shù)。
SVD-SVD散列函數(shù)例如,給定一個圖像,示例性商品表示器偽隨機地選擇p個子圖像Ai∈Rm×m,l<=i<=p。然后,示例性商品表示器找出每一子圖像的SVDAi=UiSiViT,]]>其中,Ui、Vi分別是m×m的實左奇異值矩陣和實右奇異值矩陣,Si是m×m的實對角矩陣,它由沿其對角線的奇異值構(gòu)成。
在塊140形成了次級表示之后,示例性商品表示器向Bi的小組重新應(yīng)用SVD。作為散列矢量,示例性商品表示器在合適的量化之后保留來自每一Bi的前r個左奇異矢量和右奇異矢量的對應(yīng)的集合。
DCT-SVD作為SVD-SVD方法的變異,示例性商品表示器使用2D-DCT變換作為塊130中的初始變換(T1)。在找出每一子圖像Ai的2D-DCT之后,
Di=DAiDT僅保留系數(shù)矩陣Di的頻率的第一個頻帶。這里,D表示DCT變換矩陣。選擇fmin和fmin確定了所選擇的頻帶。低-中帶頻率的系數(shù)對圖像起更多的描述作用,并且更有特色。選擇fmin>0避免了接近DC頻率,它對簡單的尺度變換或DC電平變化更敏感。選擇fmax的較小的值避免了使用較高頻率的系數(shù),它可通過小噪聲添加、平滑和壓縮來改變。因此,根據(jù)問題的細節(jié),可選擇合適的fmin和fmax值。這一頻帶中的系數(shù)然后被儲存為每一區(qū)域Ai的矢量~di∈Rfmax*fmax-fmin*fmin]]>。{~di}的元素的順序是取決于用戶的,并可被用于引入額外的隨機性。然后,沿同一線,通過從組Γ={~d1,...,dp)中選擇隨機矢量并偽隨機地形成平滑表示J,來形成次級表示。接下來,示例性商品表示器向J應(yīng)用SVDJ=USVT并將第一個左奇異矢量~u1和第一個右奇異矢量~v1儲存為散列矢量。
DWT-SVD這是DCT-SVD方法的一種變異,其中,用2D-DWT來替換2D-DCT。在從圖像中獲得各隨機矩形Ai之后,向每一Ai應(yīng)用DWT的l層。DC子帶被儲存為矢量~di∈Rm2/2′,]]>以在下一階段形成次級表示J。下一步,向J應(yīng)用SVDJ=USVT對應(yīng)于最大的奇異值的第一個左奇異矢量~ui和右奇異矢量~vi在合適的量化之后被儲存為散列矢量。
二進制SVD作為在原始域中工作的替代,示例性商品表示器從原始圖像形成二進制表示,從而保存了數(shù)字商品的重要區(qū)域。如果商品是圖像,則該方法可對圖像像素取閾值,其中,選擇閾值級別使得僅圖像像素的百分之t被表示為1(或0)??蛇x地,可選擇閾值級別使得在每一子圖像中,僅圖像像素的百分之t是1(或0)。
給定圖像I-二進制圖像,在取閾值之后,它可被表示為Ib,并且第一個左二進制奇異矢量和右二進制奇異矢量可被定義成對應(yīng)于最大奇異值,如下(~ub1,vb1)=argmin~x,~y|Ib⊕~x~yT|H]]>其中,~x和~y二進制矢量和是二進制異或操作。可選地,可找到其它奇異矢量,使得第(k+1)個奇異矢量對從Ib⊕Σl=1k~ubl~vbl,]]>k>1導(dǎo)出,且用于相加。
因此,在取閾值之后,可找到每一二進制子圖像的第一個二進制奇異矢量,并形成集合Γ={~ub1,...,~ubp,~vb1,...,~vbp}。在第二階段中形成次級二進制表示Jb之后,示例性商品表示器通過在r個偽隨機選擇的區(qū)域上使用二進制SVD來繼續(xù)。最終的散列值由~h={uj1,...,ujr,~vk1,...,vjr}給出。
直接SVDT1可用作單位變換,并直接使用分組。這一思想可容易地適用于可在取閾值之后形成的二進制數(shù)字商品(如,二進制圖像Ib)。從每一大小為m×m的分組Ai,直接從商品的樣值形成矢量~di∈Rm2.]]>次級表示J直接從Γ={~d1,...,~dp}生成。下一步,示例性商品表示器向J應(yīng)用SVDJ=USVT并將第一個左奇異矢量~u1和右奇異矢量~v1儲存為散列矢量。
用于生成數(shù)字商品的表示的示例性系統(tǒng)圖2示出了用于生成數(shù)字商品的表示的示例性系統(tǒng)200,它是示例性商品表示器的實施例的一個示例。
系統(tǒng)200生成數(shù)字商品的表示(如,散列值)。在本示例中,數(shù)字商品是圖像。系統(tǒng)200包括商品獲取器210、分區(qū)器220、區(qū)域統(tǒng)計量計算器230和輸出設(shè)備240。
商品獲取器210獲取數(shù)字商品205(如,音頻信號或數(shù)字圖像)。它可從幾乎任何來源獲取商品,如存儲設(shè)備或通過網(wǎng)絡(luò)通信鏈路。除獲取之外,商品獲取器410也可規(guī)范化商品的幅度。在這一情況下,它也可被稱為幅度規(guī)范化器。
分區(qū)器220將商品劃分成多個、偽隨機大小的、偽隨機劃分的區(qū)域(即,分區(qū))。這些區(qū)域可重疊(但是不必要重疊)。
例如,如果商品是圖像,它可被劃分成偽隨機大小和位置的二維多邊形(如,區(qū)域)。在另一示例中,如果商品是音頻信號,則該音頻剪輯的二維表示(使用頻率和時間)可被劃分成偽隨機大小和位置的二維多邊形(如,三角形)。
在本實現(xiàn)中,區(qū)域?qū)嶋H上可彼此重疊。
對于每一區(qū)域,區(qū)域統(tǒng)計計算器230計算分區(qū)器220生成的多個區(qū)域的統(tǒng)計量。計算每一區(qū)域的統(tǒng)計量。由計算器230計算的統(tǒng)計量可以是上文在塊130和160中描述的特征矢量。
輸出設(shè)備240可呈現(xiàn)區(qū)域統(tǒng)計量計算器230的結(jié)果(對每一區(qū)域或組合)。這些結(jié)果可被儲存或用于將來的計算。
示例性商品表示器的應(yīng)用示例示例性商品表示器對各種應(yīng)用有用。這些應(yīng)用可包括對抗性和非對抗性情形。
某些非對抗性應(yīng)用可包括信號數(shù)據(jù)庫中的搜索問題、非對抗性媒體中的信號監(jiān)控。在非對抗性應(yīng)用中,在整個圖像上應(yīng)用本方法可產(chǎn)生有利的結(jié)果。本算法的又一應(yīng)用可以是若干認證應(yīng)用為緊縮地描述人類的有區(qū)別的特征(臉部圖片、虹膜圖片、指紋等),應(yīng)用可使用其散列值,其中,散列值由示例性商品表示器產(chǎn)生。
示例性計算系統(tǒng)和環(huán)境圖3示出了可在其中實現(xiàn)(完全或部分地)本發(fā)明所描述的示例性商品表示器的合適的計算環(huán)境300的示例。計算環(huán)境300可在本發(fā)明所描述的計算機和網(wǎng)絡(luò)體系結(jié)構(gòu)中使用。
示例性計算環(huán)境300僅為計算環(huán)境的一個示例,并非暗示對計算機和網(wǎng)絡(luò)體系結(jié)構(gòu)的使用范圍或功能的局限。也不應(yīng)將計算環(huán)境300解釋為對示例性計算環(huán)境300中示出的任一組件或其組合具有依賴或要求。
示例性商品表示器可以使用眾多其它通用或?qū)S糜嬎阆到y(tǒng)環(huán)境或配置來實現(xiàn)。適合使用的眾所周知的計算系統(tǒng)、環(huán)境和/或配置包括但不限于個人計算機、服務(wù)器計算機、薄客戶機、厚客戶機、手持式或膝上設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、機頂盒、可編程消費者電子設(shè)備、網(wǎng)絡(luò)PC、小型機、大型機、包括任一上述系統(tǒng)或設(shè)備的分布式計算環(huán)境等等。
示例性商品表示器可在諸如由計算機執(zhí)行的程序模塊等計算機可執(zhí)行指令的一般上下文環(huán)境中描述。一般而言,程序模塊包括例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等,執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。示例性商品表示器也可以在分布式計算環(huán)境中實踐,其中,任務(wù)由通過通信網(wǎng)絡(luò)連接的遠程處理設(shè)備來執(zhí)行。在分布式計算環(huán)境中,程序模塊可以位于本地和遠程計算機存儲媒質(zhì)中,包括存儲器存儲設(shè)備。
計算環(huán)境300包括以計算機302形式的通用計算裝置。計算機302的組件可包括但不限于,一個或多個處理器或處理單元304、系統(tǒng)存儲器306以及將包括處理器304的各類系統(tǒng)組件耦合至系統(tǒng)存儲器306的系統(tǒng)總線308。
系統(tǒng)總線308可以是若干種總線結(jié)構(gòu)類型的任一種,包括存儲器總線或存儲器控制器、外圍總線、加速圖形端口以及使用各類總線體系結(jié)構(gòu)的處理器或局部總線。作為示例而非局限,這類體系結(jié)構(gòu)包括卡式總線(CardBus)、個人計算機存儲卡國際協(xié)會(PCMCIA)、加速圖形端口(AGP)、小型計算機系統(tǒng)接口(SCSI)、通用串行總線(USB)、IEEE 1394、視頻電子技術(shù)標準協(xié)會(VESA)局部總線以及外圍部件互連(PCI)總線,也稱為Mezzanine總線。
計算機302通常包括各種處理器可讀媒質(zhì)。這類媒質(zhì)可以是可由計算機302訪問的任一可用媒質(zhì),并包括易失和非易失媒質(zhì)、可移動和不可移動媒質(zhì)。
系統(tǒng)存儲器306包括以易失存儲器形式的處理器存儲媒質(zhì),如隨機存取存儲器(RAM)310,和/或非易失存儲器形式的處理器可讀媒質(zhì),如只讀存儲器(ROM)312?;据斎?輸出系統(tǒng)(BIOS)314包括如在啟動時幫助在計算機302內(nèi)的元件之間傳輸信息的基本例程,通常儲存在ROM 312中。RAM 310通常包含處理單元304立即可訪問或者當(dāng)前正在操作的數(shù)據(jù)和/或程序模塊。
計算機302也可包括其它可移動/不可移動、易失/非易失計算機存儲媒質(zhì)。作為示例,圖3示出了對不可移動、非易失磁媒質(zhì)(未示出)進行讀寫的硬盤驅(qū)動器316、對可移動、非易失磁盤320(如,“軟盤”)進行讀寫的磁盤驅(qū)動器318以及對可移動、非易失光盤324,如CD-ROM、DVD-ROM或其它光媒質(zhì)進行讀寫的光盤驅(qū)動器322。硬盤驅(qū)動器316、磁盤驅(qū)動器318和光盤驅(qū)動器322通常通過一個或多個數(shù)據(jù)媒質(zhì)接口325連接到系統(tǒng)總線308。可選地,硬盤驅(qū)動器316、磁盤驅(qū)動器318和光盤驅(qū)動器322可通過一個或多個接口(未示出)連接到系統(tǒng)總線308。
盤驅(qū)動器及其相關(guān)的處理器可讀媒質(zhì)為計算機302提供了計算機可執(zhí)行指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊和其它數(shù)據(jù)的非易失存儲。盡管示例示出了硬盤316、可移動磁盤320以及可移動光盤324,可以理解,也可以使用儲存可由計算機訪問的數(shù)據(jù)的其它類型的處理器可讀媒質(zhì),如盒式磁帶或其它磁存儲設(shè)備、閃存卡、CD-ROM、數(shù)字多功能盤(DVD)或其它光存儲、隨機存取存儲器(RAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)等等,來實現(xiàn)示例性計算系統(tǒng)和環(huán)境。
任意數(shù)量的程序模塊可儲存在硬盤316、磁盤320、光盤324、ROM 312和/或RAM 310中,作為示例,包括操作系統(tǒng)326、一個或多個應(yīng)用程序328、其它程序模塊330以及程序數(shù)據(jù)332。
用戶可以通過輸入設(shè)備,如鍵盤334和定位設(shè)備336(如,“鼠標”)向計算機302輸入命令和信息。其它輸入設(shè)備338(未具體示出)可包括麥克風(fēng)、操縱桿、游戲墊、圓盤式衛(wèi)星天線、串行端口、掃描儀和/或其類似物。這些和其它輸入設(shè)備通常通過耦合至系統(tǒng)總線308的輸入/輸出接口340連接到處理單元304,但也可通過其它接口和總線結(jié)構(gòu)連接,如并行端口、游戲端口或通用串行總線(USB)。
監(jiān)視器342或其它類型的顯示設(shè)備也通過接口,如視頻適配器344連接到系統(tǒng)總線308。除監(jiān)視器之外,其它輸出外圍設(shè)備可包括諸如揚聲器(未示出)和打印機346等組件,它們通過輸入/輸出接口340連接到計算機302。
計算機302可以在使用到一個或多個遠程計算機,如遠程計算機348的邏輯連接的網(wǎng)絡(luò)化環(huán)境中操作。作為示例,遠程計算機348可以是個人計算機、便攜式計算機、服務(wù)器、路由器、網(wǎng)絡(luò)PC、對等設(shè)備或其它公用網(wǎng)絡(luò)節(jié)點等等。遠程計算裝置348被示出為包括此處所描述的涉及計算機302的許多或所有元件和特征的便攜式計算機。
計算機302和遠程計算機348之間的邏輯連接被描述為局域網(wǎng)(LAN)350和廣域網(wǎng)(WAN)352。這類網(wǎng)絡(luò)環(huán)境常見于辦公室、企業(yè)范圍計算機網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)以及因特網(wǎng)。這類網(wǎng)絡(luò)環(huán)境可以是有線或無線的。
當(dāng)在LAN網(wǎng)絡(luò)環(huán)境中實現(xiàn)時,計算機302通過網(wǎng)絡(luò)接口或適配器354連接至局域網(wǎng)350。當(dāng)在WAN網(wǎng)絡(luò)環(huán)境中實現(xiàn)時,計算機302通常包括調(diào)制解調(diào)器356或其它裝置,用于通過廣域網(wǎng)352建立通信。調(diào)制解調(diào)器356可以對計算機302是內(nèi)置或外置的,它可通過輸入/輸出接口340或其它適當(dāng)?shù)臋C制連接至系統(tǒng)總線308。可以理解,示出的網(wǎng)絡(luò)連接是示例性的,也可以使用在計算機302和348之間建立通信鏈路的其它裝置。
在諸如用計算環(huán)境300所示的網(wǎng)絡(luò)化環(huán)境中,所描述的涉及計算機302的程序模塊或其部分可儲存在遠程存儲器存儲設(shè)備中。作為示例,遠程應(yīng)用程序358駐留在遠程計算機348的存儲器設(shè)備上。為說明目的,此處,應(yīng)用程序和其它可執(zhí)行程序程序組件,如操作系統(tǒng),作為離散的塊示出,盡管可以認識到,這些程序和組件在不同的時刻駐留在計算裝置302的不同存儲組件中,并可由計算機的數(shù)據(jù)處理器執(zhí)行。
處理器可執(zhí)行指令示例性商品表示器的一個實現(xiàn)可在諸如由一個或多個計算機或其它設(shè)備執(zhí)行的處理器可執(zhí)行指令的一般上下文中描述。一般而言,程序模塊包括例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu),它們執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。通常,如各個實施例所要求的,程序模塊的功能可被組合或分散。
示例性操作環(huán)境圖3示出了可在其中實現(xiàn)示例性商品表示器的合適的操作環(huán)境300的一個示例。具體地,本發(fā)明所描述的示例性商品表示器可由圖3的任何程序模塊328-330和/或操作系統(tǒng)326或其部分(完全或部分地)實現(xiàn)。
該操作環(huán)境僅為合適的操作環(huán)境的一個示例,并非暗示對本發(fā)明所描述的示例性商品表示器的使用范圍或功能的局限。適合使用的眾所周知的計算系統(tǒng)、環(huán)境和/或配置包括但不限于個人計算機(PC)、服務(wù)器計算機、手持式或膝上設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、可編程消費者電子設(shè)備、無線電話和設(shè)備、通用和專用設(shè)備、應(yīng)用專用集成電路(ASIC)、網(wǎng)絡(luò)PC、小型機、大型機、包括任一上述系統(tǒng)或設(shè)備的分布式計算環(huán)境等等。
處理器可讀媒質(zhì)示例性商品表示器的實現(xiàn)可儲存在某一形式的處理器可讀媒質(zhì)上,或通過其發(fā)送。處理器可讀媒質(zhì)可以是可由計算機訪問的任一可讀媒質(zhì)。作為示例,處理器可讀媒質(zhì)可包括但不限于“計算機存儲媒質(zhì)”和“通信媒質(zhì)”。
“計算機存儲媒質(zhì)”包括以用于儲存諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)等信息的任一方法或技術(shù)實現(xiàn)的易失和非易失,可移動和不可移動媒質(zhì)。計算機存儲媒質(zhì)包括但不限于,RAM、ROM、EEPROM、閃存或其它存儲器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光盤存儲、磁盒、磁帶、磁盤存儲或其它磁存儲設(shè)備、或可以用來儲存所期望的信息并可由計算機訪問的任一其它媒質(zhì)。
“通信媒質(zhì)”通常在諸如載波或其它傳輸機制的已調(diào)制數(shù)據(jù)信號中包含計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)。通信媒質(zhì)也包括任一信息傳送媒質(zhì)。
術(shù)語“已調(diào)制數(shù)據(jù)信號”指以對信號中的信息進行編碼的方式設(shè)置或改變其一個或多個特征的信號。作為示例而非局限,通信媒質(zhì)包括有線媒質(zhì),如有線網(wǎng)絡(luò)或直接連線連接,以及無線媒質(zhì),如聲學(xué)、RF、紅外和其它無線媒質(zhì)。上述任一的組合也應(yīng)當(dāng)包括在處理器可讀媒質(zhì)的范圍之內(nèi)。
總結(jié)盡管以對結(jié)構(gòu)特征和/或方法步驟專用的語言描述了本發(fā)明,然而可以理解,所附權(quán)利要求書中定義的本發(fā)明不必要限于所描述的具體特征或步驟。相反,揭示了具體特征和步驟作為實現(xiàn)本發(fā)明的較佳形式。
權(quán)利要求
1.一種具有處理器可執(zhí)行指令的處理器可讀媒質(zhì),當(dāng)由處理器執(zhí)行所述指令時,執(zhí)行一種包括在定義的表示域中表示數(shù)字商品的方法,其中,該表示是基于矩陣不變性的。
2.如權(quán)利要求1所述的媒質(zhì),其特征在于,所述方法還包括提取所述數(shù)字商品的健壯偽隨機特征,其中,所述特征在所定義的表示域內(nèi)。
3.如權(quán)利要求1所述的媒質(zhì),其特征在于,所述矩陣不變性包括奇異值分解(SVD)。
4.如權(quán)利要求1所述的媒質(zhì),其特征在于,所述數(shù)字商品選自一包括數(shù)字圖像、數(shù)字音頻剪輯、數(shù)字視頻、數(shù)據(jù)庫和軟件圖象的組。
5.一種計算裝置,其特征在于,它包括一音頻/視頻輸出;一如權(quán)利要求1所述的媒質(zhì)。
6.一種具有處理器可執(zhí)行指令的處理器可讀媒質(zhì),當(dāng)由處理器執(zhí)行所述指令時,執(zhí)行一種方便數(shù)字商品的保護的方法,其特征在于,所述方法包括獲取一數(shù)字商品;將所述商品劃分成多個區(qū)域;計算所述多個區(qū)域的一個或多個的統(tǒng)計量,使得所述區(qū)域的統(tǒng)計量表示該區(qū)域,其中,所計算的統(tǒng)計量是基于矩陣不變性的。
7.如權(quán)利要求6所述的媒質(zhì),其特征在于,所述多個區(qū)域的至少某些是重疊的。
8.如權(quán)利要求6所述的媒質(zhì),其特征在于,所述劃分包括偽隨機地將所述商品分割成多個區(qū)域。
9.如權(quán)利要求6所述的媒質(zhì),其特征在于,所述矩陣不變性包括奇異值分解(SVD)。
10.如權(quán)利要求6所述的媒質(zhì),其特征在于,所述數(shù)字商品選自一包括數(shù)字圖像、數(shù)字音頻剪輯、數(shù)字視頻、數(shù)據(jù)庫和軟件圖象的組。
11.如權(quán)利要求6所述的媒質(zhì),其特征在于,所述方法還包括產(chǎn)生包括所述一個或多個區(qū)域的所計算的統(tǒng)計量的輸出。
12.一種由權(quán)利要求11所述的媒質(zhì)生成的已調(diào)制信號。
13.一種包括權(quán)利要求6所述的一個或多個處理器可讀媒質(zhì)的計算機。
14.一種方法,其特征在于,它包括獲取一數(shù)字商品;將所述商品劃分成多個區(qū)域;從所述多個區(qū)域提取健壯特征,其中,所述特征是基于矩陣不變的奇異值分解(SVD)的。
15.如權(quán)利要求14所述的方法,其特征在于,所述多個區(qū)域的至少某些是重疊的。
16.如權(quán)利要求14所述的方法,其特征在于,所述劃分包括偽隨機地將所述商品分割成多個區(qū)域。
17.如權(quán)利要求14所述的方法,其特征在于,所述數(shù)字商品選自一包括數(shù)字圖像、數(shù)字音頻剪輯、數(shù)字商品、數(shù)據(jù)庫和軟件圖象的組。
18.如權(quán)利要求14所述的方法,其特征在于,所述方法還包括產(chǎn)生包括所述一個或多個區(qū)域的健壯特征的輸出。
19.一種系統(tǒng),其特征在于,它包括一獲取器,它被配置成獲取一數(shù)字商品;一分區(qū)器;它被配置成將所述商品劃分成多個區(qū)域;一計算器,它被配置成計算所述多個區(qū)域的一個或多個的統(tǒng)計量,使得所述區(qū)域的統(tǒng)計量表示該區(qū)域,其中,所計算的統(tǒng)計量是基于矩陣不變性的。
20.如權(quán)利要求19所述的系統(tǒng),其特征在于,所述多個區(qū)域的至少某些是重疊的。
21.如權(quán)利要求19所述的系統(tǒng),其特征在于,所述分區(qū)器還被配置成偽隨機地將所述商品分割成多個區(qū)域。
22.如權(quán)利要求19所述的系統(tǒng),其特征在于,所述矩陣不變性包括奇異值分解(SVD)。
23.如權(quán)利要求19所述的系統(tǒng),其特征在于,所述數(shù)字商品選自一包括數(shù)字圖像、數(shù)字音頻剪輯、數(shù)字視頻、數(shù)據(jù)庫和軟件圖象的組。
24.如權(quán)利要求19所述的系統(tǒng),其特征在于,它還包括一輸出設(shè)備,它被配置成產(chǎn)生包括所述一個或多個區(qū)域的所計算的統(tǒng)計量的輸出。
全文摘要
本發(fā)明所描述的是一種在新定義的表示域中產(chǎn)生數(shù)字商品(如圖像)的新表示的實現(xiàn)。特別地,該新域中的表示是基于矩陣不變性的。在某些實現(xiàn)中,矩陣不變性可以例如大量地使用奇異值分解(SVD)。
文檔編號G06Q50/00GK1638328SQ20041010061
公開日2005年7月13日 申請日期2004年12月1日 優(yōu)先權(quán)日2004年1月6日
發(fā)明者M·K·米卡克, R·文卡特杉, S·S·科扎特 申請人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1