亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

確定內(nèi)容對(duì)象目錄中的冗余的制作方法

文檔序號(hào):6432302閱讀:210來源:國知局
專利名稱:確定內(nèi)容對(duì)象目錄中的冗余的制作方法
技術(shù)領(lǐng)域
一般地說,本發(fā)明涉及確定文件指紋以供識(shí)別,更具體地說,涉及確定文件目錄中的冗余。
背景技術(shù)
計(jì)算機(jī)系統(tǒng)的缺點(diǎn)之一是有大量冗余文件被反復(fù)地復(fù)制和存儲(chǔ)在多個(gè)目錄中。盡管試圖利用唯一的名字或特征來標(biāo)識(shí)這些文件,但所造成的結(jié)果往往是這些冗余文件被多次存儲(chǔ)在一個(gè)目錄或計(jì)算機(jī)系統(tǒng)中。結(jié)果,在存儲(chǔ)冗余文件時(shí)發(fā)生存儲(chǔ)器浪費(fèi)。再有,在一個(gè)計(jì)算機(jī)系統(tǒng)中一些文件或無辜地或有意地被誤標(biāo)識(shí)也是常有的事。結(jié)果,駐留在該系統(tǒng)中的文件可能有不正確的標(biāo)識(shí)符,使它們不能被各種用戶或應(yīng)用程序正確地或有效地識(shí)別出來。
作為一個(gè)例子,在通過因特網(wǎng)下載音樂文件產(chǎn)業(yè)中,一個(gè)新的藝術(shù)家往往在一個(gè)受歡迎的藝術(shù)家的名下存儲(chǔ)他們的新歌。其理論是通過把新歌存儲(chǔ)在更受歡迎的藝術(shù)家名下,將會(huì)有更多人可能下載那個(gè)特定文件和聆聽這位新藝術(shù)家的被誤標(biāo)識(shí)的歌。這通常被稱作“Napster爆炸”。顯然,新藝術(shù)家感覺利用Napster爆炸會(huì)有更大的機(jī)會(huì)被聽眾發(fā)現(xiàn)。例如,在對(duì)等網(wǎng)絡(luò)中,一個(gè)人能訪問另一個(gè)用戶的目錄并觀看那個(gè)用戶的可用文件。這樣,控制該物理目錄的用戶能或者有意地或者有目的地誤標(biāo)識(shí)歌曲。在與另一用戶的對(duì)等網(wǎng)絡(luò)連接中涉及的Napster炸彈能誤標(biāo)識(shí)他或她的新歌并允許第二個(gè)用戶下載那個(gè)文件供收聽。這樣,這第二個(gè)用戶可能浪費(fèi)大量時(shí)間去得到被誤標(biāo)識(shí)的歌的副本。
作為另一個(gè)例子,含有冗余數(shù)據(jù)的存儲(chǔ)器系統(tǒng)浪費(fèi)本可以更好地用于非冗余數(shù)據(jù)的存儲(chǔ)空間。例如,當(dāng)在正常的過程中復(fù)制和存儲(chǔ)文件時(shí),為更容易識(shí)別,由用戶給予這些文件新的名字。結(jié)果,含有相同數(shù)據(jù)的多個(gè)文件被存儲(chǔ)在一個(gè)計(jì)算機(jī)系統(tǒng)上。數(shù)日、數(shù)月或數(shù)年之后,難于根據(jù)文件特征或標(biāo)識(shí)符(如文件名)來知道這些文件是否是冗余的。于是,它們只是被內(nèi)務(wù)處理程序簡(jiǎn)單地維持在計(jì)算系統(tǒng)上。
隨著通過計(jì)算機(jī)網(wǎng)絡(luò)下載音頻和視頻文件供用戶在其家用計(jì)算機(jī)中觀看的這種下載活動(dòng)的出現(xiàn),有很大可能性不僅存儲(chǔ)冗余文件而且存儲(chǔ)Napster爆炸視頻文件。結(jié)果,用戶可能浪費(fèi)大量時(shí)間在例如下載一個(gè)被誤標(biāo)識(shí)的視頻文件,與占用存儲(chǔ)空間不那么太大的音頻文件相比,下載這種被誤標(biāo)識(shí)的視頻文件所涉及的下載時(shí)間要明顯多得多。再有,將存儲(chǔ)數(shù)據(jù)或內(nèi)容文件(如視頻文件)的服務(wù)器或高速緩存計(jì)算機(jī)將有有限的存儲(chǔ)容量用于存儲(chǔ)目的。因此,希望能消除任何不必要的冗余文件。

發(fā)明內(nèi)容
本發(fā)明的一個(gè)實(shí)施例提供一個(gè)系統(tǒng)用于消除計(jì)算機(jī)目錄中存儲(chǔ)的冗余文件。本發(fā)明的這一實(shí)施例能通過如下過程完成訪問存儲(chǔ)在存儲(chǔ)器中的多個(gè)文件,這里每個(gè)文件被配置成由一個(gè)指紋標(biāo)識(shí);為存儲(chǔ)在存儲(chǔ)器中的每個(gè)文件確定一個(gè)指紋;建立一個(gè)標(biāo)準(zhǔn),如冗余標(biāo)準(zhǔn),以指出何時(shí)任何兩個(gè)指紋是冗余的;比較為每個(gè)文件確定的指紋;以及根據(jù)該比較確定哪些文件是冗余的。
在一個(gè)方面,冗余文件能從存儲(chǔ)器中被去除或刪除。再有,能利用各種類型的指紋,如以快速付立葉變換(FFT)作為指紋,利用水印作為指紋,或利用CRC(循環(huán)冗余校驗(yàn))作為指紋。
在一個(gè)實(shí)施例中,該系統(tǒng)能用于訪問各種文件格式,如音頻文件或視頻文件。
在另一個(gè)實(shí)施例中,能通過訪問一個(gè)文件向該文件提供一個(gè)標(biāo)識(shí)符;取得該文件的頻率表示;為該文件提供一個(gè)文件名;在一個(gè)目錄中提供該文件名;以及使該文件的頻率表示與該文件名關(guān)聯(lián),從而可經(jīng)由該目錄訪問該頻率表示。
同樣,在本發(fā)明的各種實(shí)施例中能使用付立葉變換,能使用FFT,還能使用離散付立葉變換(DFT)。再有,頻率表示能作為元數(shù)據(jù)被包括在一個(gè)地址列表中。
在本發(fā)明的另一個(gè)實(shí)施例中,能利用一種查找文件的方法,其作法是得到所希望文件的第一頻率表示;訪問第一個(gè)未知文件;得到該未知文件的第二頻率表示;將所希望文件的第一頻率表示與該未知文件的第二頻率表示進(jìn)行比較;以及根據(jù)比較結(jié)果確定該未知文件是否是所希望的文件。
再有,在這一實(shí)施例的各方面中,能利用不同的算法得到頻率表示。例如,能利用FFT或離散付立葉變換(DFT)等來實(shí)現(xiàn)。
在這一實(shí)施例的另一方面中,能通過比較第一和第二頻率表示的頻率范圍來實(shí)現(xiàn)頻率比較,從而確定它們是否等同。
再有,這一實(shí)施例能利用一個(gè)解碼器,以在得到一個(gè)文件的頻率表示之前對(duì)那個(gè)文件解碼。


圖1提供一個(gè)流程圖,說明根據(jù)本發(fā)明一個(gè)實(shí)施例去除冗余文件的方法。
圖2提供一個(gè)流程圖,說明根據(jù)本發(fā)明一個(gè)實(shí)施例標(biāo)識(shí)目錄中文件的方法。
圖3提供一個(gè)流圖,說明根據(jù)本發(fā)明一個(gè)實(shí)施例識(shí)別一個(gè)未知文件的方法。
圖4顯示用于實(shí)現(xiàn)圖1、2、3中所示方法的系統(tǒng)。
圖5顯示用于實(shí)現(xiàn)圖4中所示部件的系統(tǒng)。
具體實(shí)施例方式
隨著通過計(jì)算機(jī)網(wǎng)絡(luò)下載音頻和視頻文件的出現(xiàn),能正確地識(shí)別適當(dāng)?shù)奈募兊帽纫酝又匾Q言之,下載這類文件需要大量的計(jì)算資源,因?yàn)樗鼈兒苷加么鎯?chǔ)器,它們不僅需要大量下載時(shí)間而且還因此占用大量計(jì)算帶寬。因此,下載已被誤標(biāo)識(shí)的文件是無效能的,不能服務(wù)于請(qǐng)求被誤標(biāo)識(shí)的文件的用戶要達(dá)到的目的。再有,計(jì)算機(jī)系統(tǒng)上的存儲(chǔ)空間是一個(gè)一直存在的問題,因此,能識(shí)別出冗余文件并從計(jì)算機(jī)存儲(chǔ)器中去除以造成更多的存儲(chǔ)空間是有益的。
在本發(fā)明的一個(gè)實(shí)施例中,提供了識(shí)別計(jì)算機(jī)系統(tǒng)中冗余文件的方法。這種方法能用于識(shí)別用戶自己的計(jì)算機(jī)上的文件以及識(shí)別他人計(jì)算機(jī)上的文件。在圖1中,顯示方法100,其中根據(jù)塊104,存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器上的多個(gè)文件被訪問。例如,在用戶自己的計(jì)算機(jī)機(jī)上的文件能被訪問。然后,根據(jù)塊108,確定每個(gè)文件的指紋(fingerprint)。
確定指紋可采取多種形式。作為一例,可利用FFT。能根據(jù)任何從市場(chǎng)上可得到的計(jì)算FFT的程序或芯片來產(chǎn)生FFT,如在MIT由MatteoFrigo和Steven G.Johnson開發(fā)的而且當(dāng)前可在FFTW.ORG網(wǎng)站免費(fèi)得到的FFTW2.1.3版(計(jì)算付立葉變換、離散付立葉變換和快速付立葉變換的算法出現(xiàn)在例如Oppenheim和Willsky的《信號(hào)和系統(tǒng)》一書(Prentice Hall 1983出版)中)。
例如,利用FFT,能對(duì)一首歌曲的音頻特性取樣,并能對(duì)那首特定歌曲產(chǎn)生FFT。這樣,便能產(chǎn)生那個(gè)文件的FFT特性。FFT特性隨著該文件用于產(chǎn)生FFT的不同部分而改變。再有,所用歌曲段落的長(zhǎng)度能影響所得到的FFT。
作為另一個(gè)例子,水印能用作一個(gè)文件的指紋。換言之,放在文件上的水印不僅能用于標(biāo)識(shí)該文件的真實(shí)性,還能用于標(biāo)識(shí)那個(gè)文件的特征。再有,能對(duì)特定文件產(chǎn)生CRC,從而導(dǎo)出那個(gè)文件的唯一標(biāo)識(shí)符。
在塊112中,建立一個(gè)冗余標(biāo)準(zhǔn),從而指出何時(shí)兩個(gè)文件是彼此冗余的。例如,在FFT的情況中,能利用對(duì)文件的采樣要求來說明以指定的采樣率對(duì)文件播放時(shí)間的頭5分鐘進(jìn)行采樣。再有,在比較所產(chǎn)生的兩個(gè)文件的頻率直方圖時(shí),直方圖可變化一個(gè)預(yù)定的百分比。例如,如果對(duì)文件a產(chǎn)生一個(gè)直方圖,對(duì)文件b產(chǎn)生一個(gè)直方圖,這兩個(gè)直方框的共同圖案可能改變例如5%,但仍認(rèn)為是冗余文件。可由用戶選擇用于確定文件是否冗余的各種特性。例如,可利用較嚴(yán)格的要求,如在確定兩個(gè)文件是否彼此冗余時(shí)它們的指紋之間要求嚴(yán)格匹配。
在塊116中,能對(duì)至少是一些文件的指紋進(jìn)行比較。這樣,如圖1的塊120中所示,能根據(jù)塊116中的比較結(jié)果確定任何兩個(gè)文件是否彼此冗余。所建立的冗余標(biāo)準(zhǔn)能用于提供判據(jù),用于在比較中確定兩個(gè)指紋是否滿足所建立的冗余標(biāo)準(zhǔn)的判據(jù)。另一種作法中,即使沒有已建立的標(biāo)準(zhǔn),也能將比較結(jié)果顯示給用戶觀察,以使用戶能夠確定這些指紋是否足夠相似而被認(rèn)為是冗余文件。
在塊124中,任何已被確定為冗余的文件能被去除。例如,能顯示文件和文件特性列表供用戶觀看,列表中顯示哪些文件彼此冗余。這樣,用戶能對(duì)是否去除文件或把它們保持在文件系統(tǒng)上作出最終決定??梢灶A(yù)見,在大多數(shù)情況中,這類冗余文件將被簡(jiǎn)單地從存儲(chǔ)器和文件目錄中刪除,從而釋放出空間供新文件使用。另一種作法是,某些文件可被保留,盡管它們滿足冗余標(biāo)準(zhǔn)。
確定冗余文件的方法適用于能被確定指紋的任何數(shù)量數(shù)據(jù)文件。例如,音頻文件能容易地利用FFT算法確定指紋。類似地,視頻文件能以FFT算法確定指紋。在音頻文件的情況中,能通過建立FFT中標(biāo)識(shí)的頻率范圍和必須匹配的那些頻率的水平百分?jǐn)?shù)來建立冗余標(biāo)準(zhǔn)。
一旦已產(chǎn)生了指紋,它能被保留并作為元數(shù)據(jù)附加到該文件的指示符。這樣,它能與文件目錄中的一個(gè)文件名關(guān)聯(lián)。于是,能通過點(diǎn)擊微軟視窗文件目錄中文件名旁邊的FFT指示符來取出那個(gè)文件的FFT指紋。這只不過是涉及把FFT數(shù)據(jù)與文件目錄中的文件名鏈接。這樣,指紋能與文件一起存儲(chǔ)在數(shù)據(jù)庫中。作為這一關(guān)聯(lián)的結(jié)果,指紋和文件名或其他標(biāo)識(shí)符能在數(shù)據(jù)庫中被編目(catalogue)。例如,如果由因特網(wǎng)上的一個(gè)實(shí)體創(chuàng)建一個(gè)視頻文件數(shù)據(jù)庫,該實(shí)體會(huì)創(chuàng)建一個(gè)內(nèi)容對(duì)象主數(shù)據(jù)庫,該內(nèi)容對(duì)象用于流向正在觀看的客戶。這樣,該實(shí)體能通過它的系統(tǒng)分發(fā)內(nèi)容對(duì)象文件并使指紋與每個(gè)文件關(guān)聯(lián)。主數(shù)據(jù)庫還能保持每個(gè)文件的指紋并把指紋用于內(nèi)務(wù)(housekeep)管理功能。例如,能在遠(yuǎn)程數(shù)據(jù)庫如高速緩存服務(wù)器上實(shí)現(xiàn)這些內(nèi)務(wù)管理功能,以去除存儲(chǔ)在該高速緩存上的任何冗余內(nèi)容文件。
在圖2中,描述本發(fā)明的一個(gè)用于標(biāo)識(shí)文件的實(shí)施例。在圖2的流程圖200中,一個(gè)文件被訪問,如塊204所示。例如,可簡(jiǎn)單地利用文件名作為標(biāo)識(shí)符從一文件目錄中訪問該文件。然后,能如塊208中指出的那樣導(dǎo)出該文件的頻率表示。作為一例,能利用該文件數(shù)據(jù)產(chǎn)生一個(gè)FFT,從而產(chǎn)生那個(gè)文件的FFT數(shù)據(jù)。在塊212中,為該文件提供一個(gè)文件名。通常,這只不過是涉及使用一個(gè)先前曾用于訪問該文件的同一個(gè)名字。然而,人們能容易地為該文件提供一個(gè)新名。在塊216中,該文件名能被放在該文件的一個(gè)目錄中。同樣,這只不過是涉及把該文件存儲(chǔ)在一個(gè)目錄中的一個(gè)新名之下。此外,如塊220中所示,該文件的頻率表示與該文件名關(guān)聯(lián)。如前文說明的那樣,通過把由FFT產(chǎn)生的頻率表示數(shù)據(jù)與在該文件目錄中給出的文件名鏈接,便能實(shí)現(xiàn)這種關(guān)聯(lián)。這樣,如果希望進(jìn)一步觀看一個(gè)具有與之關(guān)聯(lián)的頻率表示的特定文件的其他標(biāo)識(shí)符,則可提出該FFT數(shù)據(jù)或其他頻率表現(xiàn)數(shù)據(jù)并觀看那個(gè)文件的頻率表示。在塊224中,該頻率表示能被一個(gè)指示符概括,該指示符作為文件描述符的一部分被顯示。例如,能提供一個(gè)因特網(wǎng)地址的一個(gè)文件描述,其中頻率數(shù)據(jù)作為元數(shù)據(jù)被關(guān)聯(lián),作為那個(gè)文件地址的一部分。
圖3顯示本發(fā)明的一個(gè)用于識(shí)別未知文件的實(shí)施例。在一些情況中,人們希望取一個(gè)已知的文件并搜索那個(gè)已知文件的其他出現(xiàn)情況。通常,這是利用與該文件數(shù)據(jù)關(guān)聯(lián)的文件名和根據(jù)那個(gè)文件名進(jìn)行搜索來實(shí)現(xiàn)的。這里的一個(gè)假設(shè)是該文件名未曾被誤標(biāo)簽到那個(gè)文件數(shù)據(jù)。如上文中在Napster爆炸的情況中說明的那樣,這是一個(gè)不正確的假設(shè),因?yàn)槲募挥心康牡夭徽_地列出,從而愚弄聽眾下載一個(gè)新藝術(shù)家的歌曲。這樣,本發(fā)明的這一實(shí)施例能用于根據(jù)一首歌曲的頻率特征進(jìn)行搜索,這與使用易被破壞的簡(jiǎn)單的文件名的情況不同。
在圖3中顯示方法300,說明本發(fā)明的一個(gè)用于識(shí)別未知文件的實(shí)施例。在塊304中,得到一個(gè)所希望的文件并產(chǎn)生那個(gè)文件的第一頻率表示。例如,這能通過得到一個(gè)視頻文件并根據(jù)那個(gè)視頻文件的音頻部分的頭5分鐘產(chǎn)生一個(gè)FFT來實(shí)現(xiàn)。另一種作法是,能在該視頻文件的視頻部分上完成FFT。這樣便能產(chǎn)生一個(gè)指示該視頻文件的頻率表示作為指紋。在塊308中,一個(gè)文件目錄中的一個(gè)未知文件被訪問。例如,一個(gè)高速緩存服務(wù)器能被訪問,它存儲(chǔ)多個(gè)文件供視頻分發(fā)網(wǎng)絡(luò)中的商業(yè)客戶下載,從該高速緩存服務(wù)器中得到第一個(gè)未知文件。在塊312中,產(chǎn)生這一未知文件的頻率表示,從而產(chǎn)生第二頻率表示用于與所希望文件的先前產(chǎn)生的頻率表示進(jìn)行比較。然后,在塊316中進(jìn)行所希望文件的第一頻率表示與該未知文件的第二頻率表示的比較。在塊320中,根據(jù)這一比較確定該未知文件是否等同于所希望的文件。一個(gè)預(yù)定的標(biāo)準(zhǔn)能用于做出這一確定??梢灶A(yù)見,在確定時(shí)用戶能被給出一個(gè)特征模板,從中選擇要用于該標(biāo)準(zhǔn)的判據(jù)。另一種作法是,該標(biāo)準(zhǔn)能由一個(gè)標(biāo)準(zhǔn)化團(tuán)體(body)預(yù)先定義,該團(tuán)體曾建立判據(jù)用于確定何時(shí)兩個(gè)文件等同。一旦做出確定,用戶能根據(jù)該結(jié)論采取行動(dòng),如刪除一個(gè)冗余文件或進(jìn)行進(jìn)一步的比較以確定更多的部分(如整個(gè)數(shù)據(jù)文件)是否等同。這樣,一個(gè)程序能被設(shè)計(jì)成比較指紋的初始部分以排除顯然不相似的文件,然后通過反復(fù)的過程根據(jù)其后的比較確定實(shí)際等同的那些文件。
圖4顯示本發(fā)明的一個(gè)實(shí)施例,它能用于實(shí)現(xiàn)圖1、2、3的方法。在圖4中顯示系統(tǒng)400,其中顯示一個(gè)網(wǎng)絡(luò),如因特網(wǎng)416。在圖4中,顯示裝有文件數(shù)據(jù)庫的第一計(jì)算機(jī)機(jī)412。再有,所示第二計(jì)算機(jī)404能通過網(wǎng)絡(luò)416與第一計(jì)算機(jī)412通信。再有,所示第三計(jì)算機(jī)408能經(jīng)由網(wǎng)絡(luò)416與計(jì)算機(jī)404和408二者通信。只是作為舉例,這能實(shí)現(xiàn)一個(gè)視頻流網(wǎng)絡(luò),其中計(jì)算機(jī)404作為一個(gè)高速緩存服務(wù)器用于保持視頻文件副本,它們被分發(fā)給客戶,如使用第三計(jì)算機(jī)408的一個(gè)客戶。利用第一計(jì)算機(jī)412能實(shí)現(xiàn)一個(gè)主計(jì)算機(jī)或主數(shù)據(jù)庫。這樣,主計(jì)算機(jī)將希望經(jīng)常地希望消除在第一計(jì)算機(jī)412中它自己的數(shù)據(jù)庫上存儲(chǔ)的冗余文件以及在遠(yuǎn)程計(jì)算機(jī)(如高速緩存儲(chǔ)服務(wù)器404)上存儲(chǔ)的冗余文件。利用這一系統(tǒng),在這三個(gè)計(jì)算機(jī)之間能建立對(duì)等通信。
圖5概括地說明在各種一般被類似配置的處理系統(tǒng)內(nèi)如何能以單獨(dú)的或較為集成的方式實(shí)現(xiàn)單個(gè)系統(tǒng)部件。所示系統(tǒng)500包含的硬件部件經(jīng)由總線508實(shí)現(xiàn)電耦合,這些硬件部件包括處理器501、輸入設(shè)備502、輸出設(shè)備503、存儲(chǔ)設(shè)備504、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀出器505a、通信系統(tǒng)506、處理加速裝置(如DSP或?qū)S锰幚砥?507和存儲(chǔ)器509。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀出器505a進(jìn)一步與計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)505b相連,這一組合可理解地代表遠(yuǎn)程的、本地的、固定的和/或可拆卸的存儲(chǔ)設(shè)備加上存儲(chǔ)介質(zhì)、存儲(chǔ)器等,用于暫時(shí)地和/或更永久性地包含計(jì)算機(jī)可讀信息,這能包括存儲(chǔ)設(shè)備504、存儲(chǔ)器509和/或任何其他這類可訪問的系統(tǒng)500資源。系統(tǒng)500還包含軟件部件(顯示為當(dāng)前位于工作存儲(chǔ)器591內(nèi)),包括操作系統(tǒng)592以及其他代碼593,如程序、小應(yīng)用程序、數(shù)據(jù)等。
希望系統(tǒng)500作為一個(gè)實(shí)施替代物,主要是由于它的強(qiáng)的靈活性和可配置性。這樣,例如,可能利用一個(gè)單一體系結(jié)構(gòu)實(shí)現(xiàn)一個(gè)或多個(gè)服務(wù)器,它們能進(jìn)一步根據(jù)當(dāng)前所希望的協(xié)議、協(xié)議變體、擴(kuò)展等加以配置。然而,對(duì)本領(lǐng)域技術(shù)人員顯然能根據(jù)更具體的應(yīng)用要求很好地利用許多基本的改變。例如,一個(gè)或多個(gè)部件可能作為一個(gè)系統(tǒng)500部件內(nèi)(例如通信系統(tǒng)506內(nèi))的子部件。定制的硬件也可被利用并且/或特定的部件能以硬件、軟件(包括所謂“可移植軟件”,如小應(yīng)用程序)或二者來實(shí)現(xiàn)。再有,盡管可以使用與諸如網(wǎng)絡(luò)輸入/輸出設(shè)備(未畫出)等其他計(jì)算設(shè)備的連接,但應(yīng)該理解,還可以利用有線、無線、調(diào)制解調(diào)器和/或其他連接方式與其他計(jì)算設(shè)備連接。分布式處理、多點(diǎn)觀看、信息轉(zhuǎn)發(fā)、協(xié)作、遠(yuǎn)程信息檢索和合并以及相關(guān)的能力每個(gè)都被考慮。操作系統(tǒng)的利用也將是變化的,這取決于特定的主機(jī)設(shè)備和/或過程類型(例如計(jì)算機(jī)、附屬設(shè)備、便攜設(shè)備等),而且肯定不會(huì)在所有情況中需要系統(tǒng)500的全部部件。
盡管已作為實(shí)現(xiàn)本發(fā)明的方法或裝置描述了本發(fā)明的各種實(shí)施例,但應(yīng)該理解,本發(fā)明能通過與計(jì)算機(jī)耦合的代碼實(shí)現(xiàn),例如駐留在計(jì)算機(jī)上的或可由計(jì)算機(jī)訪問的代碼。例如,軟件和數(shù)據(jù)庫能用于實(shí)現(xiàn)上文討論的許多方法。這樣,除了用硬件實(shí)現(xiàn)本發(fā)明的實(shí)施例外,還應(yīng)指出,這些實(shí)施例能通過使用一個(gè)制造品來實(shí)現(xiàn),該制造品包含一個(gè)計(jì)算機(jī)可讀介質(zhì),其中具有體現(xiàn)的計(jì)算機(jī)可讀程序代碼,它使得能夠?qū)崿F(xiàn)本描述中公開的功能。所以,還希望以其程序代碼手段實(shí)現(xiàn)的本發(fā)明實(shí)施例也被認(rèn)為受本專利的保護(hù)。
還可預(yù)見,本發(fā)明的實(shí)施例還能作為載波中體現(xiàn)的計(jì)算機(jī)信號(hào)以及通過傳輸介質(zhì)傳播的信號(hào)(如電信號(hào)和光信號(hào))來實(shí)現(xiàn)。這樣,上文討論的各種信息能被按格式編排在一個(gè)結(jié)構(gòu)中,如數(shù)據(jù)結(jié)構(gòu),并作為電信號(hào)通過傳輸介質(zhì)傳輸或存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上。
還應(yīng)該指出,這里敘述的許多結(jié)構(gòu)、材料和行動(dòng)能被敘述為實(shí)現(xiàn)一個(gè)功能的手段或?qū)崿F(xiàn)一個(gè)功能的步驟。所以,應(yīng)該理解,這種語言有資格覆蓋本說明書中公開的所有這些結(jié)構(gòu)、材料或行動(dòng)以及它們的等同物。
可以認(rèn)為,根據(jù)本說明書本發(fā)明實(shí)施例的裝置和方法以及伴隨它的許多優(yōu)點(diǎn)將能夠被理解,而且顯然在形式、構(gòu)成及其部件的安排方面可以做出各種改變而不脫離本發(fā)明的精神和范圍或犧牲它的全部實(shí)質(zhì)性優(yōu)點(diǎn),這里上述描述的形式只是本發(fā)明的示例性實(shí)施例。
權(quán)利要求書(按照條約第19條的修改)1.一種為文件提供標(biāo)識(shí)符的方法,所述方法包含訪問所述文件;取得所述文件的頻率表示;為所述文件提供文件名;在一目錄中提供所述文件名;將所述文件的所述頻率表示與所述文件名關(guān)聯(lián),從而可在所述述目錄內(nèi)可搜索到所述頻率表示。
2.如權(quán)利要求1中描述的方法,這里所述頻率表示包含一個(gè)快速付立葉變換。
3.如權(quán)利要求1中描述的方法,進(jìn)一步包含配置一個(gè)地址列表,以所述頻率表示的標(biāo)識(shí)符作為所述地址列表中的元數(shù)據(jù)。
4.一種搜索視頻文件的方法,所述方法包含得到所希望的視頻文件的第一頻率表示;訪問第一個(gè)未知文件;得到所述未知文件的第二頻率表示;將所述第一頻率表示與所述第二頻率表示進(jìn)行比較;以及根據(jù)所述比較,確定所述未知文件是否是所述所希望的視頻文件。
5.如權(quán)利要求4中描述的方法,這里所述得到所希望的視頻文件的所述第一頻率表示包含進(jìn)行快速付立葉變換算法。
6.如權(quán)利要求4描述的方法,其中所述得到所述第一頻率表示包含進(jìn)行離散付立葉變換。
7.如權(quán)利要求4中描述的方法,其中所述將第一頻率表示與第二頻率表示進(jìn)行比較包含比較所述第一和第二頻率表示的頻率范圍。
8.如權(quán)利要求4中描述的方法,進(jìn)一步包含
對(duì)所述未知文件解碼。
9.一種確定內(nèi)容對(duì)象目錄中的冗余的方法,所述方法包含訪問存儲(chǔ)器上存儲(chǔ)的多個(gè)文件,其中每個(gè)所述文件被配置成由一個(gè)指紋標(biāo)識(shí);為每個(gè)所述文件確定所述指紋;建立一個(gè)冗余標(biāo)準(zhǔn),從而指出所述文件中任何兩個(gè)的所述指紋是否彼此冗余;比較為每個(gè)所述文件確定的指紋;根據(jù)對(duì)所述指紋的比較和所述冗余標(biāo)準(zhǔn),確定冗余文件。
10.如權(quán)利要求9中描述的方法,進(jìn)一步包含從所述存儲(chǔ)器中刪除至少一個(gè)冗余文件。
11.如權(quán)利要求9中描述的方法,進(jìn)一步包含利用快速付立葉變換算法計(jì)算所述指紋。
12.如權(quán)利要求9中描述的方法,進(jìn)一步包含利用水印作為所述指紋。
13.如權(quán)利要求9中描述的方法,進(jìn)一步包含利用循環(huán)冗余校驗(yàn)數(shù)據(jù)作為所述指紋。
14.如權(quán)利要求9中描述的方法,其中所述訪問多個(gè)文件包含訪問含有視頻數(shù)據(jù)的多個(gè)文件。
15.如權(quán)利要求9中描述的方法,其中所述訪問多個(gè)文件包含訪問含有音頻數(shù)據(jù)的多個(gè)文件。
16.如權(quán)利要求9中描述的方法,其中所述建立冗余標(biāo)準(zhǔn)包含確定由快速付立葉變換得到的頻率圖案中的頻率范圍用于比較所述指紋。
17.如權(quán)利要求9中描述的方法,進(jìn)一步包含將指紋作為元數(shù)據(jù)附加到至少一個(gè)目錄列表。
18.如權(quán)利要求9中描述的方法,進(jìn)一步包括在一個(gè)數(shù)據(jù)庫中利用從中產(chǎn)生所述指紋的文件對(duì)所述指紋編目。
權(quán)利要求
1.一種為文件提供標(biāo)識(shí)符的方法,所述方法包含訪問所述文件;取得所述文件的頻率表示;為所述文件提供文件名;在一目錄中提供所述文件名;將所述文件的所述頻率表示與所述文件名關(guān)聯(lián),從而可經(jīng)由所述目錄訪問所述頻率表示。
2.如權(quán)利要求1中描述的方法,其中所述頻率表示包含一個(gè)快速付立葉變換。
3.如權(quán)利要求1中描述的方法,進(jìn)一步包含以所述頻率表示的一個(gè)標(biāo)識(shí)符配置一個(gè)地址列表。
4.一種搜索文件的方法,所述方法包含得到所希望文件的第一頻率表示;訪問第一個(gè)未知文件;得到所述未知文件的第二頻率表示;將所述第一頻率表示與所述第二頻率表示進(jìn)行比較;以及根據(jù)所述比較,確定所述未知文件是否是所述所希望的文件。
5.如權(quán)利要求4中描述的方法,其中所述得到所希望文件的所述第一頻率表示包含進(jìn)行快速付立葉變換算法。
6.如權(quán)利要求4描述的方法,其中所述得到所述第一頻率表示包含進(jìn)行離散付立葉變換。
7.如權(quán)利要求4中描述的方法,其中所述將第一頻率表示與第二頻率表示進(jìn)行比較包含比較所述第一和第二頻率表示的頻率范圍。
8.如權(quán)利要求4中描述的方法,進(jìn)一步包含對(duì)所述未知文件解碼。
9.一種確定內(nèi)容對(duì)象目錄中的冗余的方法,所述方法包含訪問存儲(chǔ)器上存儲(chǔ)的多個(gè)文件,其中每個(gè)所述文件被配置成由一個(gè)指紋標(biāo)識(shí);為每個(gè)所述文件確定所述指紋;建立一個(gè)冗余標(biāo)準(zhǔn),從而指出所述文件中任何兩個(gè)的所述指紋是否彼此冗余;比較為每個(gè)所述文件確定的指紋;根據(jù)對(duì)所述指紋的比較和所述冗余標(biāo)準(zhǔn),確定冗余文件。
10.如權(quán)利要求9中描述的方法,進(jìn)一步包含從所述存儲(chǔ)器中刪除至少一個(gè)冗余文件。
11.如權(quán)利要求9中描述的方法,進(jìn)一步包含利用快速付立葉變換算法計(jì)算所述指紋。
12.如權(quán)利要求9中描述的方法,進(jìn)一步包含利用水印作為所述指紋。
13.如權(quán)利要求9中描述的方法,進(jìn)一步包含利用循環(huán)冗余校驗(yàn)數(shù)據(jù)作為所述指紋。
14.如權(quán)利要求9中描述的方法,其中所述訪問多個(gè)文件包含訪問含有視頻數(shù)據(jù)的多個(gè)文件。
15.如權(quán)利要求9中描述的方法,其中所述訪問多個(gè)文件包含訪問含有音頻數(shù)據(jù)的多個(gè)文件。
16.如權(quán)利要求9中描述的方法,其中所述建立冗余標(biāo)準(zhǔn)包含確定由快速付立葉變換得到的頻率圖案中的頻率范圍用于比較所述指紋。
17.如權(quán)利要求9中描述的方法,進(jìn)一步包含將指紋作為元數(shù)據(jù)附加到至少一個(gè)目錄列表。
18.如權(quán)利要求9中描述的方法,進(jìn)一步包括在一個(gè)數(shù)據(jù)庫中利用從中產(chǎn)生所述指紋的文件對(duì)所述指紋編目。
全文摘要
標(biāo)識(shí)文件和/或確定內(nèi)容對(duì)象目錄中冗余的系統(tǒng)(圖1)。例如,該系統(tǒng)能訪問存儲(chǔ)器中存儲(chǔ)的多個(gè)文件(104)。對(duì)于每個(gè)被訪問的文件,能確定相應(yīng)的指紋,如通過使用快速付立葉變換(108)。然后一個(gè)文件的頻率表示能與一個(gè)目錄中該文件的文件名關(guān)聯(lián),使得能經(jīng)由該目錄訪問該文件的頻率表示。能對(duì)文件指紋進(jìn)行比較以識(shí)別冗余(112、116、120),其后這些冗余能被去除或刪除(124)。
文檔編號(hào)G06F17/30GK1596399SQ02823670
公開日2005年3月16日 申請(qǐng)日期2002年11月25日 優(yōu)先權(quán)日2001年11月28日
發(fā)明者馬克·R.·湯普森, 內(nèi)森·F.·拉奇波斯基 申請(qǐng)人:奧羅卡斯特公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1