一種文件合并方法及裝置的制造方法【專利摘要】本發(fā)明公開了一種文件合并方法及裝置,該方法包括:在分布式數據庫存儲系統(tǒng)中,針對數據庫中任一文件存儲區(qū),在確定出所述文件存儲區(qū)符合設定的文件合并條件時,創(chuàng)建與所述數據庫相同格式的臨時存儲區(qū);將所述文件存儲區(qū)中的第一文件復制到所述臨時存儲區(qū)第二文件中;以及將所述臨時存儲區(qū)中的第二文件回寫入所述文件存儲區(qū)中,以覆蓋所述文件存儲區(qū)中第一文件;從而有效的合并數據庫中的小文件?!緦@f明】一種文件合并方法及裝置
技術領域:
[0001]本發(fā)明涉及計算機大數據領域,尤其是涉及一種文件合并方法及裝置?!?br>背景技術:
】[0002]在計算機
技術領域:
中,隨著通信技術不斷發(fā)展,網絡設備不斷增加,在不同的網絡設備對應不同的日志,在數據庫系統(tǒng)中,針對不同網絡設備對應的日志,需要將該些日志轉換為定義好的日志格式,并將轉換后的日志存儲,用于后續(xù)分析。[0003]通常情況下,在接收到不同格式的日志時,根據預先定義好的日志格式將不同日志解析,解析成功后,日志存儲到數據庫中的存儲區(qū)中,日志存儲到數據庫中之后,后續(xù)可以對存儲的日志進行分析,告警、展示、提供報表等。安全分析對實時性要求很高,這就要求從日志接收,解析,入庫,分析,出結果都必須盡量實時處理,每一個流程都必須快速響應,避免延時。然而,網絡設備發(fā)出日志沒有固定的規(guī)律可言,高峰期可能達到每秒數百萬,低峰期可能沒有日志。傳統(tǒng)的數據庫系統(tǒng)在高峰期承受不住這樣的入庫和存儲壓力,需要依賴能提供類Sql查詢的分布式數據存儲系統(tǒng)。在分布式數據存儲系統(tǒng)中,每次寫分布式文件的時間短,數據量或多或少,日積月累,會導致分布式數據存儲系統(tǒng)寫入了大量的小文件,小文件越多,后續(xù)的分析時需要加載和查詢的文件也就越多,最終導致查詢效率極低,難以做到實時響應。為了提高分析平臺的實時響應能力,有必要對小文件進行合并處理。[0004]傳統(tǒng)的小文件合并是對一次寫分布式數據系統(tǒng)的數據進行合并,寫的數據要盡量多。但是數據量的多少由日志發(fā)送方控制。在進行處理時,需要對日志發(fā)送方發(fā)送的日志做出實時響應,無論日志或多或少,都需要把接收的日志快速寫到分布式數據存儲系統(tǒng),在響應的過程中,就會生成大量的part-*格式的小文件。但是針對小文件合并,目前還沒有提出一種有效方式合并小文件。【
發(fā)明內容】[0005]本發(fā)明提供了一種文件合并方法及裝置,用于有效地合并數據庫中的小文件。[0006]—種文件合并方法,包括:在分布式數據庫存儲系統(tǒng)中,針對數據庫中任一文件存儲區(qū),在確定出所述文件存儲區(qū)符合設定的文件合并條件時,創(chuàng)建與所述數據庫相同格式的臨時存儲區(qū);將所述文件存儲區(qū)中的第一文件復制到所述臨時存儲區(qū)第二文件中;以及將所述臨時存儲區(qū)中的第二文件回寫入所述文件存儲區(qū)中,以覆蓋所述文件存儲區(qū)中第一文件;其中所述第一文件是文件大小符合第一規(guī)則的小文件,第二文件是文件大小符合第二規(guī)則的大文件。[0007]確定所述文件存儲區(qū)符合設定的文件合并條件,包括:確定所述文件存儲區(qū)中的文件大小小于等于設定第一數值的文件的第一數量,和所述文件存儲區(qū)中存儲的全部文件的第二數量;若所述第一數量大于第一設定值,且所述第一數量和所述第二數量的比值大于或等于第二設定值時,確定所述文件存儲區(qū)符合設定的文件合并條件。[0008]還包括:刪除所述臨時存儲區(qū)。[0009]所述第一數值的取值范圍是OM?15M,所述第一數量的取值范圍是O?10,所述第二數量的取值范圍是O?I。[0010]所述第一數值的取值為1M,所述第一數量的取值為5,所述第二數量的取值為0.5ο[0011]一種文件合并裝置,包括:判斷模塊,用于在分布式數據庫存儲系統(tǒng)中,針對數據庫中任一文件存儲區(qū),確定所述文件存儲區(qū)是否符合設定的文件合并條件,以及確定所述文件存儲區(qū)中是否有存儲的文件;執(zhí)行模塊,用于在確定出所述文件存儲區(qū)符合設定的文件合并條件時,創(chuàng)建與所述數據庫相同格式的臨時存儲區(qū);將所述文件存儲區(qū)中的第一文件復制到所述臨時存儲區(qū)第二文件中;以及將所述臨時存儲區(qū)中的第二文件回寫入所述文件存儲區(qū)中,以覆蓋所述文件存儲區(qū)中第一文件;其中所述第一文件是文件大小符合第一規(guī)則的小文件,第二文件是文件大小符合第二規(guī)則的大文件。[0012]所述判斷模塊,具體用于確定所述文件存儲區(qū)中的文件大小小于等于設定第一數值的文件的第一數量,和所述文件存儲區(qū)中存儲的全部文件的第二數量;若所述第一數量大于第一設定值,且所述第一數量和所述第二數量的比值大于或等于第二設定值時,確定所述文件存儲區(qū)符合設定的文件合并條件。[0013]所述執(zhí)行模塊,還用于刪除所述臨時存儲區(qū)。[0014]所述判斷模塊中設定的所述第一數值的取值范圍是OM?15Μ,所述第一數量的取值范圍是O?10,所述第二數量的取值范圍是O?I。[0015]所述判斷模塊中設定的所述第一數值的取值為10Μ,所述第一數量的取值為5,所述第二數量的取值為0.5。[0016]通過采用上述技術方案,針對數據庫中任一文件存儲區(qū),在確定出文件存儲區(qū)符合設定的文件合并條件,且文件存儲區(qū)中有存儲的文件時,創(chuàng)建與數據庫相同格式的臨時存儲區(qū);將文件存儲區(qū)中的文件復制到臨時存儲區(qū)中;以及將臨時存儲區(qū)中的文件回寫入文件存儲區(qū)中,合并所述文件存儲區(qū)中的part-*格式的文件,不論寫的數據量有多大,寫的頻率有多快,都可以合并,并且可以重復合并。資源充足的情況下可以并行合并,資源不足的情況下可以串行合并,合并不成功還可以擴充資源再次合并,直至合并成功為止。合并后的數據庫查詢分析性能在相同資源的情況,得到數量級的提升,大大節(jié)省了查詢分析的所需的硬件資源和時間,提高系統(tǒng)的實時性?!靖綀D說明】[0017]圖1為本發(fā)明實施例中提出的文件合并方法流程圖;[0018]圖2為本發(fā)明實施例中提出的確定是否符合設定的文件合并條件示意圖;[0019]圖3為本發(fā)明實施例中,提出的文件合并裝置結構組成示意圖?!揪唧w實施方式】[0020]下面將結合各個附圖對本發(fā)明實施例技術方案的主要實現(xiàn)原理、【具體實施方式】及其對應能夠達到的有益效果進行詳細地闡述。[0021]在傳統(tǒng)數據庫系統(tǒng)中,在進行數據存儲時,數據直接寫入到數據庫的存儲區(qū)中,但是,傳統(tǒng)的數據庫系統(tǒng)并不能滿足大量、快速的寫入數據,因此提出分布式數據存儲系統(tǒng),以滿足大量、快速的寫入數據。分布式數據存儲系統(tǒng)中,為了實現(xiàn)快速、大量的寫入數據,文件寫入按照塊的方式寫入,不同的存儲區(qū)中分別劃分大小相同或不相同的塊,大量文件同時向不同的塊寫入。然后將寫入數據的塊進行整合,存儲寫入的數據。但是,在數據寫入時,并不是所有數據的大小都和待寫入塊的大小相同,這就造成有的塊只占用一部分。后續(xù)需要整合時,需要加載和查詢的文件也就越多,最終將導致查詢效率低,實時響應較差。針對次,本發(fā)明實施例提出一種文件合并方法,如圖1所示,其具體處理如下述:[0022]步驟11,在分布式數據庫存儲系統(tǒng)中,將數據庫劃分為不同的文件存儲區(qū)。[0023]本發(fā)明實施例提出的技術方案中,可以只針對劃分的每個文件存儲區(qū)中的文件進行合并,也可以針對不同的文件存儲區(qū)之間進行文件合并。一種較佳地實現(xiàn)方式,本發(fā)明實施例提出的技術方案中,以針對劃分的每個文件存儲區(qū)中的文件進行合并為例進行詳細闡述。假設Hive數據庫tableA存儲A類型日志,數據庫tableA按天分區(qū),分區(qū)字段為bsa_default_partit1n_day,該劃分的文件存儲區(qū)為bsa_default_partit1n_day=20151127ο[0024]步驟12,針對數據庫中任一文件存儲區(qū),確定該文件存儲區(qū)是否符合設定的文件合并條件,如果判斷結果為是,執(zhí)行步驟13,反之結束處理。[0025]如圖2所示,確定文件存儲區(qū)是否符合設定的文件合并條件的具體處理方式如下述:[0026]步驟21,獲得文件存儲區(qū)中的各文件大小。[0027]步驟22,確定該文件存儲區(qū)中的各文件大小小于等于設定第一數值的文件的第一數量。[0028]步驟23,確定該文件存儲區(qū)中存儲的全部文件的第二數量。[0029]步驟24,若第一數量大于第一設定值,且第一數量和所述第二數量的比值大于或等于第二設定值時,確定文件存儲區(qū)符合設定的文件合并條件。[0030]其中,在上述步驟21?步驟24中,第一數值的取值范圍是OM?15Μ,第一數量的取值范圍是O?10,第二數量的取值范圍是O?I。[0031]具體地,第一數值的取值為10Μ,所述第一數量的取值為5,第二數量的取值為0.5。[0032]其中,在上述步驟21?步驟24中,僅給出一種較佳地確定文件存儲區(qū)是否符合設定的文件合并條件的實施方式,在具體實施時,設定的文件合并條件還可以根據不同需求做出調整。例如,設定的文件合并條件可以是第一數量大于某一數值,或者設定的文件合并條件是文件存儲區(qū)中的包含文件大小小于等于設定第一數值的文件,在此不做具體地限定。[0033]假設第一數量minFiIeNum=5,第一數值smalIFiIeSize=1M,第二設定值threshold=0.5。確定文件存儲區(qū)是否符合設定的文件合并條件:[0034](I)該文件存儲區(qū)中的小文件(文件大小小于smalIFiIeSize的文件)數量大于HiinFileNum0[0035](2)該文件存儲區(qū)中的小文件數量比上總文件數量大于等于閾值threshold。[0036]同時滿足上述2個條件才進行文件合并。[0037]通過設定文件合并條件,在進行文件合并時,如果小文件的數量太少,或者小文件數量相對于該文件存儲區(qū)匯總的總文件數量太少,在文件查詢過程中,對系統(tǒng)性能影響不大,而當小文件數量占比較高的情況下,會影響系統(tǒng)的能行,本發(fā)明實施例提出的技術方案中,通過對小文件數太少,相對于總文件數太少,查詢性能影響不大。只有當小文件數占比較高,才會極大的影響查詢性能。本發(fā)明實施例上述提出的技術方案中,通過設定文件合并條件,只有在符合文件合并條件的情況下才進行文件合并,這樣可以較好地節(jié)省處理資源。[0038]步驟13,判斷該文件存儲區(qū)中是否有存儲的文件,如果判斷結果為是,執(zhí)行步驟14,反之結束處理。[0039]如果文件存儲區(qū)bsa_default_partit1n_day=20151127滿足文件合并條件,計算該文件存儲區(qū)的記錄數。實現(xiàn)的HiveQL語句如下:[0040]SELECTCOUNT(I)FROMtableAWHEREbsa_defauIt_partit1n_day=20151127[0041]假設查詢結果的記錄數為N。[0042]步驟14,創(chuàng)建與數據庫相同格式的臨時存儲區(qū)。[0043]如果N大于0,創(chuàng)建與數據庫tableA結構相同的臨時存儲區(qū)tableA_20151127_tmp,實現(xiàn)的HiveQL語句如下:[0044]CREATETABLEtableA_20151127_tmpLIKEtableA[0045]步驟15,將文件存儲區(qū)中的第一文件復制到臨時存儲區(qū)第二文件中。[0046]在本發(fā)明實施以上述提出的技術方案中,為便于區(qū)分,將文件存儲區(qū)中的文件和臨時存儲區(qū)中的文件作出區(qū)分,分別是第一文件和第二文件。[0047]其中,第一文件和第二文件可以通過文件大小進行區(qū)分。具體地,第一文件是文件大小符合第一規(guī)則的小文件,第二文件是文件大小符合第二規(guī)則的大文件。[0048]—種較佳地實現(xiàn)方式,小文件和大文件的示例請參見上述步驟13中的詳細闡述。[0049]具體地,將文件存儲器bsa_default_partit1n_day=20151127中的日志拷貝到臨時存儲區(qū)tableA_20151127_tmp中,實現(xiàn)的HiveQL語句如下:[0050]INSERTINTOTABLEtableA_20151127_tmpPARTIT1N(bsa_default_partit1n_day=20151127)SELECT*FR0MtableAWHEREbsa_default_partit1n_day=20151127limitN[0051]步驟16,將臨時存儲區(qū)中的第二文件回寫入所述文件存儲區(qū)中,以覆蓋文件存儲區(qū)中第一文件。[0052]將臨時存儲區(qū)tabIeA_20151127_tmp中的文件回寫到數據庫tabIeA的文件存儲區(qū)bsa_default_partit1n_day=20151127分區(qū)中,實現(xiàn)的HiveQL語句如下:[0053]INSERTOVERWRITETABLEtableAPARTIT10N(bsa_defauIt_partit1n_day=20151127)SELECT*FR0MtabIeA_20I5II27_tmp[0054]本發(fā)明實施例上述提出的技術方案中,具體可以應用在HiveQL文件合并中,假設,創(chuàng)建的臨時存儲區(qū)為表dstB,原文件存儲區(qū)為表srcA,在進行HiveQL文件合并過程中,將表srcA中的文件復制到表dstB中,再將表dstB中的文件寫回到表srcA中,以完成表srcA中的part-*格式的文件合并。在使用HiveQL復制表srcA的文件到表dstB中時,對應語句為:[0055]insertintotabledstBselect*fromsrcAlimitN0[0056]該HiveQL語句實際被解釋成Hadoop里的Map和Reduce任務執(zhí)行,而表srcA和dstB的文件實際是以part-*文件存儲在hdfs文件系統(tǒng)中的。根據Hive的設計原理,Map任務的個數等于表srcA對應數據文件的塊數,默認的塊大小為128M,當一個part-*小于128M被認為是一個塊,當一個part-*大于128M被分成128M倍數的塊數(整除情況)或者塊數+1(不整除情況)。[0057]假如srcA對于數據有100個part-*小文件文件,每個文件都小于塊大小(假如為5M),就有100個Map任務,而Reduce任務數則是I(在沒有groupby的情況下),而輸出文件數等于Reduce任務數,輸出文件數對應表dstB的數據對應的part-*文件數。再將表dstB中的文件回寫表srcA中。對應語句為:[0058]insertoverwritetablesrcAselect*fromdstB[0059]同理,100*5M/128M=3.9,對應4個Map任務數,最終也是產生一個Reduce任務(在沒有groupby的情況下),對應一個輸出文件。[0060]可選地,在上述步驟16之后,還可以包括:[0061]刪除臨時存儲區(qū)。[0062]刪除臨時存儲區(qū)tableA_20151127_tmp,實現(xiàn)的HiveQL語句如下:[0063]DROPTABLEIFEXISTStableA_20151127_tmp[0064]上述為本發(fā)明實施例提出的基于HiveQL實現(xiàn)的Hive數據庫中一個分區(qū)的Hdfs小文件合并方法,在Hive數據庫中,劃分多個文件存儲區(qū),可以簡稱為分區(qū),合并后文件數為I。合并的最少單位為分區(qū),可以合并同一分區(qū)多次,也可以合并不同分區(qū),處理資源足夠的情況下,可以并行合并不同的分區(qū),實現(xiàn)的HiveQL語句為:[0065]SETHIVE.EXEC.PARALLEL=TRUE;[0066]資源不足的情況下,可以串行合并分區(qū),實現(xiàn)方法,循環(huán)執(zhí)行以上步驟即可。[0067]本發(fā)明實施例上述提出的技術方案中,針對分布式文件系統(tǒng)中的小文件進行合并,實現(xiàn)方式是HiveQL,類SQL的語句的實現(xiàn),門檻較低。不論寫的數據量有多大,寫的頻率有多快,都可以合并,并且可以重復合并。資源充足的情況下可以并行合并,資源不足的情況下可以串行合并,合并不成功還可以擴充資源再次合并,直至合并成功為止。合并后的Hive數據庫查詢分析性能在相同資源的情況,得到數量級的提升,大大節(jié)省了查詢分析的所需的硬件資源和時間,提高系統(tǒng)的實時性。[0068]相應地,本發(fā)明實施例還提出一種文件合并裝置,如圖3所示,包括:[0069]判斷模塊301,用于分布式數據庫存儲系統(tǒng)中,針對數據庫中任一文件存儲區(qū),確定所述文件存儲區(qū)是否符合設定的文件合并條件,以及確定所述文件存儲區(qū)中是否有存儲的文件。[0070]執(zhí)行模塊302,用于在確定出所述文件存儲區(qū)符合設定的文件合并條件時,創(chuàng)建與所述數據庫相同格式的臨時存儲區(qū);將所述文件存儲區(qū)中的第一文件復制到所述臨時存儲區(qū)第二文件中;以及將所述臨時存儲區(qū)中的第二文件回寫入所述文件存儲區(qū)中,以覆蓋所述文件存儲區(qū)中第一文件;其中所述第一文件是文件大小符合第一規(guī)則的小文件,第二文件是文件大小符合第二規(guī)則的大文件。[0071]具體地,上述判斷模塊301,具體用于確定所述文件存儲區(qū)中的文件大小小于等于設定第一數值的文件的第一數量,和所述文件存儲區(qū)中存儲的全部文件的第二數量;若所述第一數量大于第一設定值,且所述第一數量和所述第二數量的比值大于或等于第二設定值時,確定所述文件存儲區(qū)符合設定的文件合并條件。[0072]可選地上述執(zhí)行模塊302,還用于刪除所述臨時存儲區(qū)。[0073]具體地,上述判斷模塊301中設定的所述第一數值的取值范圍是OM?15M,所述第一數量的取值范圍是O?10,所述第二數量的取值范圍是O?I。[0074]具體地,上述判斷模塊301設定的所述第一數值的取值為10M,所述第一數量的取值為5,所述第二數量的取值為0.5。[0075]本發(fā)明實施例上述提出的文件合并裝置,具體實現(xiàn)原理請參見上述方法實施例中的詳細闡述,不再贅述。[0076]本發(fā)明實施例上述提出的技術方案中,針對分布式數據存儲系統(tǒng)中的小文件進行合并,實現(xiàn)方式是HiveQL,類SQL的語句的實現(xiàn),門檻較低。不論寫的數據量有多大,寫的頻率有多快,都可以合并,并且可以重復合并。資源充足的情況下可以并行合并,資源不足的情況下可以串行合并,合并不成功還可以擴充資源再次合并,直至合并成功為止。合并后的Hive數據庫查詢分析性能在相同資源的情況,得到數量級的提升,大大節(jié)省了查詢分析的所需的硬件資源和時間,提高系統(tǒng)的實時性。[0077]本領域的技術人員應明白,本發(fā)明的實施例可提供為方法、裝置(設備)、或計算機程序產品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、只讀光盤、光學存儲器等)上實施的計算機程序產品的形式。[0078]本發(fā)明是參照根據本發(fā)明實施例的方法、裝置(設備)和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執(zhí)行的指令產生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。[0079]這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。[0080]這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執(zhí)行一系列操作步驟以產生計算機實現(xiàn)的處理,從而在計算機或其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。[0081]盡管已描述了本發(fā)明的優(yōu)選實施例,但本領域內的技術人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。[0082]顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內,則本發(fā)明也意圖包含這些改動和變型在內?!局鳈囗棥?.一種文件合并方法,其特征在于,包括:在分布式數據庫存儲系統(tǒng)中,針對數據庫中任一文件存儲區(qū),在確定出所述文件存儲區(qū)符合設定的文件合并條件時,創(chuàng)建與所述數據庫相同格式的臨時存儲區(qū);將所述文件存儲區(qū)中的第一文件復制到所述臨時存儲區(qū)第二文件中;以及將所述臨時存儲區(qū)中的第二文件回寫入所述文件存儲區(qū)中,以覆蓋所述文件存儲區(qū)中第一文件;其中所述第一文件是文件大小符合第一規(guī)則的小文件,第二文件是文件大小符合第二規(guī)則的大文件。2.如權利要求1所述的方法,其特征在于,確定所述文件存儲區(qū)符合設定的文件合并條件,包括:確定所述文件存儲區(qū)中的文件大小小于等于設定第一數值的文件的第一數量,和所述文件存儲區(qū)中存儲的全部文件的第二數量;若所述第一數量大于第一設定值,且所述第一數量和所述第二數量的比值大于或等于第二設定值時,確定所述文件存儲區(qū)符合設定的文件合并條件。3.如權利要求1或2所述的方法,其特征在于,還包括:刪除所述臨時存儲區(qū)。4.一種文件合并裝置,其特征在于,包括:判斷模塊,用于在分布式數據庫存儲系統(tǒng)中,針對數據庫中任一文件存儲區(qū),確定所述文件存儲區(qū)是否符合設定的文件合并條件,以及確定所述文件存儲區(qū)中是否有存儲的文件;執(zhí)行模塊,用于在確定出所述文件存儲區(qū)符合設定的文件合并條件時,創(chuàng)建與所述數據庫相同格式的臨時存儲區(qū);將所述文件存儲區(qū)中的第一文件復制到所述臨時存儲區(qū)第二文件中;以及將所述臨時存儲區(qū)中的第二文件回寫入所述文件存儲區(qū)中,以覆蓋所述文件存儲區(qū)中第一文件;其中所述第一文件是文件大小符合第一規(guī)則的小文件,第二文件是文件大小符合第二規(guī)則的大文件。5.如權利要求4所述的裝置,其特征在于,所述判斷模塊,具體用于確定所述文件存儲區(qū)中的文件大小小于等于設定第一數值的文件的第一數量,和所述文件存儲區(qū)中存儲的全部文件的第二數量;若所述第一數量大于第一設定值,且所述第一數量和所述第二數量的比值大于或等于第二設定值時,確定所述文件存儲區(qū)符合設定的文件合并條件。6.如權利要求4或5所述的裝置,其特征在于,所述執(zhí)行模塊,還用于刪除所述臨時存儲區(qū)。【文檔編號】G06F17/30GK105975493SQ201610266690【公開日】2016年9月28日【申請日】2016年4月26日【發(fā)明人】方明【申請人】北京神州綠盟信息安全科技股份有限公司,北京神州綠盟科技有限公司