一種靜態(tài)數(shù)據(jù)文件的存儲方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文件存儲領(lǐng)域,特別是涉及一種靜態(tài)數(shù)據(jù)文件的存儲方法。
【背景技術(shù)】
[0002]隨著計算機的不斷發(fā)展,數(shù)據(jù)保護也逐步在加強。然而隨著數(shù)據(jù)的迅速增加,數(shù)據(jù)保護變得越來越難。磁盤1瓶頸、網(wǎng)絡(luò)帶寬瓶頸、數(shù)據(jù)保護窗口時間均制約著大數(shù)據(jù)量數(shù)據(jù)的保護。
[0003]在很多場景下的大數(shù)據(jù)量數(shù)據(jù)均是靜態(tài)數(shù)據(jù)文件,這些數(shù)據(jù)文件在產(chǎn)生后便不再發(fā)生數(shù)據(jù)的修改。這些數(shù)據(jù)在進行數(shù)據(jù)保護時會多次被存儲到數(shù)據(jù)保護中心,從而造成了數(shù)據(jù)存儲空間的浪費,同時也造成了網(wǎng)絡(luò)帶寬的占用,延長了數(shù)據(jù)保護窗口時間。
【發(fā)明內(nèi)容】
[0004]鑒于以上所述現(xiàn)有技術(shù)的缺點,本發(fā)明的目的在于提供一種靜態(tài)數(shù)據(jù)文件的存儲方法,用于解決現(xiàn)有技術(shù)中數(shù)據(jù)存儲空間的浪費,同時也造成了網(wǎng)絡(luò)帶寬的占用,延長了數(shù)據(jù)保護窗口時間的問題。
[0005]為實現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種靜態(tài)數(shù)據(jù)文件的存儲方法,包括步驟:S1、獲取待存儲文件的元數(shù)據(jù)信息;S2、通過所述元數(shù)據(jù)信息計算所述待存儲文件的指紋;S3、將所述待存儲文件的指紋與已保存文件的指紋進行匹配,判斷所述待存儲文件的指紋是否存在;若存在,則返回所述已保存文件的指紋緩存并結(jié)束存儲;若不存在,則緩存所述待存儲的指紋緩存并結(jié)束存儲。
[0006]于本發(fā)明的一實施例中,所述元數(shù)據(jù)信息包括:創(chuàng)建時間、修改時間、文件基本屬性、文件自定義元數(shù)據(jù)、文件絕對路徑和文件名稱。
[0007]于本發(fā)明的一實施例中,所述返回已保存文件的指紋緩存的步驟還包括步驟:S31、獲取所述已保存文件的指紋緩存的唯一的第一存儲ID; S32、通過所述第一存儲ID獲取所述已保存文件的指紋緩存;S33、返回所述已保存文件的指紋緩存。
[0008]于本發(fā)明的一實施例中,所述緩存所述待存儲的指紋緩存的步驟還包括步驟:S31’、存儲所述待存儲文件的指紋;S32’、生成所述待存儲文件的指紋緩存唯一的第二存儲ID; S33’、根據(jù)所述第二存儲ID存儲所述待存儲文件的指紋緩存。
[0009]于本發(fā)明的一實施例中,所述指紋為對應(yīng)文件元數(shù)據(jù)信息的哈希值;通過哈希算法計算得出。
[0010]如上所述,本發(fā)明的靜態(tài)數(shù)據(jù)文件的存儲方法,具有以下有益效果:能在進行靜態(tài)數(shù)據(jù)文件存儲時,僅讀取文件的元數(shù)據(jù)信息,判斷是否需要進行存儲,從而縮減用戶的數(shù)據(jù)保護窗口時間、網(wǎng)絡(luò)帶寬占用、磁盤存儲空間占用、磁盤1占用等。能積極有效的幫助用戶更快、更及時的完成數(shù)據(jù)保護,從而節(jié)省更多的物力成本和人力成本。
【附圖說明】
[0011]圖1顯示為本發(fā)明靜態(tài)數(shù)據(jù)文件的存儲方法的一實施例中的流程方框示意圖。
[0012]圖2顯示為本發(fā)明靜態(tài)數(shù)據(jù)文件的存儲方法的另一實施例中的流程方框示意圖。
【具體實施方式】
[0013]以下通過特定的具體實例說明本發(fā)明的實施方式,本領(lǐng)域技術(shù)人員可由本說明書所揭露的內(nèi)容輕易地了解本發(fā)明的其他優(yōu)點與功效。本發(fā)明還可以通過另外不同的【具體實施方式】加以實施或應(yīng)用,本說明書中的各項細節(jié)也可以基于不同觀點與應(yīng)用,在沒有背離本發(fā)明的精神下進行各種修飾或改變。需說明的是,在不沖突的情況下,以下實施例及實施例中的特征可以相互組合。
[0014]需要說明的是,以下實施例中所提供的圖示僅以示意方式說明本發(fā)明的基本構(gòu)想,遂圖式中僅顯示與本發(fā)明中有關(guān)的組件而非按照實際實施時的組件數(shù)目、形狀及尺寸繪制,其實際實施時各組件的型態(tài)、數(shù)量及比例可為一種隨意的改變,且其組件布局型態(tài)也可能更為復(fù)雜。
[0015]請參閱圖1至2。如圖1所示,圖1顯示為本發(fā)明靜態(tài)數(shù)據(jù)文件的存儲方法的一實施例中的流程方框示意圖。本發(fā)明的一實施例中提供了一種靜態(tài)數(shù)據(jù)文件的存儲方法,包括步驟:S1、獲取待存儲文件的元數(shù)據(jù)信息;S2、通過所述元數(shù)據(jù)信息計算所述待存儲文件的指紋;S3、將所述待存儲文件的指紋與已保存文件的指紋進行匹配,判斷所述待存儲文件的指紋是否存在;若存在,則返回所述已保存文件的指紋緩存并結(jié)束存儲;若不存在,則緩存所述待存儲的指紋緩存并結(jié)束存儲。能在進行靜態(tài)數(shù)據(jù)文件存儲時,僅讀取文件的元數(shù)據(jù)信息,判斷是否需要進行存儲,從而縮減用戶的數(shù)據(jù)保護窗口時間、網(wǎng)絡(luò)帶寬占用、磁盤存儲空間占用、磁盤1占用等。能積極有效的幫助用戶更快、更及時的完成數(shù)據(jù)保護,從而節(jié)省更多的物力成本和人力成本。
[0016]如圖2所示,圖2顯示為本發(fā)明靜態(tài)數(shù)據(jù)文件的存儲方法的另一實施例中的流程方框示意圖。在本發(fā)明的另一實施例中,本發(fā)明靜態(tài)數(shù)據(jù)文件的存儲方法包括步驟:
[0017]S1、獲取待存儲文件的元數(shù)據(jù)信息;通常所述元數(shù)據(jù)信息包括:創(chuàng)建時間、修改時間、文件基本屬性、文件自定義元數(shù)據(jù)、文件絕對路徑和文件名稱等。也可以根據(jù)需要選擇相關(guān)元數(shù)據(jù)信息的內(nèi)容,只要滿足后續(xù)處理需要,均在本發(fā)明的保護范圍之內(nèi)。
[0018]S2、通過所述元數(shù)據(jù)信息計算所述待存儲文件的指紋;進一步地,所述指紋為對應(yīng)文件元數(shù)據(jù)信息的哈希值;哈希值是一段數(shù)據(jù)唯一且極其緊湊的數(shù)值表示形式。如果散列一段明文而且哪怕只更改該段落的一個字母,隨后的哈希都將產(chǎn)生不同的值。要找到散列為同一個值的兩個不同的輸入,在計算上來說基本上是不可能的。哈希值是根據(jù)文件的內(nèi)容的數(shù)據(jù)通過邏輯運算得到的數(shù)值,不同的文件(即使是相同的文件名)得到的哈希值是不同的,所以哈希值值就成了每一個文件的身份證。不同哈希值的文件被認為是不同的文件,相同的哈希值的文件的內(nèi)容肯定是完全相同(即使文件名不同)WASH值還有文件校驗的功能,相當于文件的校驗碼。因此通過哈希值判斷文件信息是否一致具有明顯的可行性。
[0019]本實施例中,通過哈希算法計算得出對應(yīng)文件元數(shù)據(jù)信息的哈希值。哈希算法將任意長度的二進制值映射為較短的固定長度的二進制值,這個小的二進制值稱為哈希值。哈希值是一段數(shù)據(jù)唯一且極其緊湊的數(shù)值表示形式。如果散列一段明文而且哪怕只更改該段落的一個字母,隨后的哈希都將產(chǎn)生不同的值。要找到散列為同一個值的兩個不同的輸入,在計算上是不可能的,所以數(shù)據(jù)的哈希值可以檢驗數(shù)據(jù)的完整性。一般用于快速查找和加密算法。哈希表是根據(jù)設(shè)定的哈希函數(shù)