數據備份方法及裝置、數據恢復方法及裝置的制造方法
【技術領域】
[0001] 本發(fā)明涉及數據備份技術領域,尤其涉及數據備份方法及裝置、數據恢復方法及 裝直。
【背景技術】
[0002] 移動業(yè)務運營支撐系統(Business and Operation Support System,BOSS)的帳 詳單系統已建成多年,承擔著原始話單批價處理、賬單生成、賬詳單查詢等基礎功能,并為 統計分析等提供數據來源,而隨著用戶量和業(yè)務量的日益增長,帳詳單系統的海量數據引 起了存儲空間不足、查詢性能下降、統計分析瓶頸、文件庫修改困難等問題,基于這些問題, 人們引入了基于列模式、適合于存儲海量數據的分布式數據庫(Hbase)系統,為帳詳單系統 的性能帶來了全面提升。
[0003] 在BOSS帳詳單系統的云方案中,Hbase存儲著海量的詳單數據,數據備份在數據 的安全管理等方面起著非常重要的作用;現有的基于Hbase的數據備份方案是利用Hbase 的輸出(Export)工具進行數據的備份,以及利用輸入(Import)工具進行數據的恢復,其具 體步驟為:利用Export工具將Hbase中的指定范圍的數據,以表為粒度導出成HDFS中的文 件;將HDFS中的文件備份到遠端的存儲節(jié)點中進行保存;數據恢復時先從遠端存儲節(jié)點中 將數據恢復到HDFS中,再利用Import工具將HDFS中的文件加載到Hbase中。
[0004] 在需要備份的數據量較大時,上述利用Hbase的Export工具進行數據的備份的方 法需要的備份時間窗口會較長,從而嚴重影響了備份效率;同樣地,在需要恢復的數據量較 大時,上述利用Import工具進行數據的恢復的方法需要的恢復窗口也較長,從而嚴重影響 了恢復效率。
【發(fā)明內容】
[0005] 本發(fā)明實施例提供一種數據備份方法及裝置,用以解決現有技術中利用Hbase的 Export工具進行數據備份的方法需要的備份時間窗口會較長的問題;
[0006] 本發(fā)明實施例還提供一種數據恢復方法及裝置,用以解決現有技術中利用Hbase 的用Import工具進行數據恢復的方法需要的恢復窗口較長的問題。
[0007] 本發(fā)明實施例提供的一種數據備份方法,包括:
[0008] 備份節(jié)點根據控制節(jié)點的指示,通過分布式數據存儲系統Hbase,為備份對象創(chuàng)建 快照;
[0009] 所述備份節(jié)點將創(chuàng)建的所述快照中的數據通過分布式文件系統HDFS備份到遠端 存儲節(jié)點中,其中,所述快照中的數據為在創(chuàng)建該快照之后,下一次為所述備份對象創(chuàng)建快 照之前,所述備份對象中增加或修改的數據。
[0010] 可選地,所述備份節(jié)點為備份對象創(chuàng)建快照,包括:
[0011] 所述備份節(jié)點根據所述控制節(jié)點指示的增量備份時間間隔,為所述控制節(jié)點指示 的備份對象創(chuàng)建快照;其中,具有關聯關系的備份對象之間的增量備份時間間隔相同。
[0012] 本發(fā)明另一實施例提供的一種數據備份方法,包括:
[0013] 控制節(jié)點根據用戶輸入的備份指示信息,生成備份策略;
[0014] 所述控制節(jié)點根據所述備份策略,指示多個備份節(jié)點并行執(zhí)行數據備份任務,所 述數據備份任務包括:針對備份對象創(chuàng)建快照,將創(chuàng)建的所述快照中的數據通過分布式文 件系統HDFS備份到遠端存儲節(jié)點中。
[0015] 可選地,所述備份策略包括:備份對象、備份對象之間的關系和增量備份時間間 隔,其中,具有關聯關系的備份對象之間的增量備份時間間隔相同。
[0016] 本發(fā)明實施例提供的一種數據恢復方法,包括:
[0017] 恢復節(jié)點根據控制節(jié)點的指示,讀取遠端存儲節(jié)點存儲的數據;
[0018] 所述恢復節(jié)點將讀取的數據整理成快照格式的數據,并將整理后的數據通過分布 式文件系統HDFS接口寫入用于提供數據訪問服務的數據恢復系統。
[0019] 可選地,所述恢復節(jié)點將讀取的數據整理成快照格式的數據,包括:
[0020] 所述恢復節(jié)點根據備份前的快照目錄結構,創(chuàng)建讀取的所述數據在所述HDFS中 的快照目錄結構。
[0021] 本發(fā)明另一實施例提供的一種數據恢復方法,包括:
[0022] 控制節(jié)點根據用戶輸入的恢復指示信息,生成恢復策略;
[0023] 所述控制節(jié)點根據所述恢復策略,指示多個恢復節(jié)點并行執(zhí)行數據恢復任務,所 述數據恢復任務包括:讀取遠端存儲節(jié)點存儲的數據,將讀取的數據整理成快照格式的數 據,并將整理后的數據通過分布式文件系統HDFS接口寫入用于提供數據訪問服務的數據 恢復系統。
[0024] 可選地,所述恢復策略包括:恢復對象和恢復的時間段。
[0025] 本發(fā)明實施例提供的一種數據備份裝置,包括:
[0026] 創(chuàng)建模塊,用于根據控制節(jié)點的指示,通過分布式數據存儲系統Hbase,為備份對 象創(chuàng)建快照;
[0027] 備份模塊,用于將所述創(chuàng)建模塊創(chuàng)建的所述快照中的數據通過分布式文件系統 HDFS備份到遠端存儲節(jié)點中,其中,所述快照中的數據為在創(chuàng)建該快照之后,下一次為所述 備份對象創(chuàng)建快照之前,所述備份對象中增加或修改的數據。
[0028] 本發(fā)明另一實施例提供的一種數據備份裝置,包括:
[0029] 生成模塊,用于根據用戶輸入的備份指示信息,生成備份策略;
[0030] 指示模塊,用于根據所述所述生成模塊生成的備份策略,指示多個備份節(jié)點并行 執(zhí)行數據備份任務,所述數據備份任務包括:針對備份對象創(chuàng)建快照,將創(chuàng)建的所述快照中 的數據通過分布式文件系統HDFS備份到遠端存儲節(jié)點中。
[0031] 本發(fā)明實施例提供的一種數據恢復裝置,包括:
[0032] 讀取模塊,用于根據控制節(jié)點的指示,讀取遠端存儲節(jié)點存儲的數據;
[0033] 寫入模塊,用于將所述讀取模塊讀取的數據整理成快照格式的數據,并將整理后 的數據通過分布式文件系統HDFS接口寫入用于提供數據訪問服務的數據恢復系統。
[0034] 本發(fā)明另一實施例提供的一種數據恢復裝置,包括:
[0035] 生成模塊,用于根據用戶輸入的恢復指示信息,生成恢復策略;
[0036] 指示模塊,用于根據所述生成模塊生成的恢復策略,指示多個恢復節(jié)點并行執(zhí)行 數據恢復任務,所述數據恢復任務包括:讀取遠端存儲節(jié)點存儲的數據,將讀取的數據整理 成快照格式的數據,并將整理后的數據通過分布式文件系統HDFS接口寫入用于提供數據 訪問服務的數據恢復系統。
[0037] 本發(fā)明實施例中備份節(jié)點通過Hbase為備份對象創(chuàng)建快照,在需要備份時,將快 照中的數據通過HDFS備份到遠端存儲節(jié)點中,從而不僅可以不必再采用Export工具進行 數據的導出操作,而且可以僅對數據的增量部分進行備份,從而可以極大地縮短了備份窗 口,提高了備份效率。
【附圖說明】
[0038] 圖1為本發(fā)明實施例一提供的數據備份方法流程圖;
[0039] 圖2為本發(fā)明實施例二提供的數據備份方法流程圖;
[0040] 圖3為本發(fā)明實施例一提供的數據恢復方法流程圖;
[0041] 圖4為本發(fā)明實施例二提供的數據恢復方法流程圖;
[0042]圖5為本發(fā)明實施例提供的數據備份及恢復的系統結構示意圖;
[0043] 圖6為本發(fā)明實施例三提供的數據備份方法流程圖;
[0044] 圖6a為備份節(jié)點進行數據備份的方法流程圖;
[0045] 圖7為本發(fā)明實施例三提供的數據恢復方法流程圖;
[0046] 圖8為本發(fā)明實施例一提供的一種數據備份裝置結構示意圖;
[0047] 圖9為本發(fā)明實施例二提供的一種數據備份裝置結構示意圖;
[0048] 圖10為本發(fā)明實施例一提供的一種數據恢復裝置結構示意圖;
[0049] 圖11為本發(fā)明實施例二提供的一種數據恢復裝置結構示意圖。
【具體實施方式】
[0050] 本發(fā)明實施例中備份節(jié)點通過Hbase為備份對象創(chuàng)建快照,在需要備份時,將快 照中的數據通過HDFS備份到遠端存儲節(jié)點中,從而不僅可以不必再采用Export工具進行 數據的導出操作,而且可以僅對數據的增量部分進行備份,從而可以極大地縮短了備份窗 口,提高了備份效率。
[