同城數(shù)據(jù)中心雙活高可用系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本實用新型涉及同城數(shù)據(jù)中心災(zāi)備建設(shè)技術(shù)領(lǐng)域,尤其涉及系統(tǒng)高可用、存儲同步、數(shù)據(jù)中心二層互聯(lián)等具體技術(shù)的融合使用系統(tǒng)。
【背景技術(shù)】
[0002]原有的數(shù)據(jù)中心災(zāi)備建設(shè)主要用于針對大的災(zāi)難性事件,比如:地震、隕石、海嘯、恐怖襲擊等。當(dāng)出現(xiàn)災(zāi)難性事件時,生產(chǎn)數(shù)據(jù)中心所有設(shè)備停止工作,整體切換到災(zāi)備數(shù)據(jù)中心;并啟用災(zāi)備數(shù)據(jù)中心的備用設(shè)備,繼續(xù)對外服務(wù)。
[0003]這種工作模式對于數(shù)據(jù)集中、計算集中的大型機時代的災(zāi)難事件處理是合適的、有效的。
[0004]隨著數(shù)據(jù)量、計算量的飛速發(fā)展,目前已經(jīng)進入數(shù)據(jù)分散、計算分散的小型機、PC服務(wù)器時代,數(shù)據(jù)中心逐漸以大量的小型機、PC服務(wù)器取代大型機計算。這種情況下,數(shù)據(jù)中心出現(xiàn)大的災(zāi)難性事件時,應(yīng)停止生產(chǎn)數(shù)據(jù)中心的整體運行,全面切換到災(zāi)備數(shù)據(jù)中心。但如果出現(xiàn)小的故障,且只涉及一部分設(shè)備、影響一部分應(yīng)用時,將出現(xiàn)兩難狀態(tài):全部切換到災(zāi)備中心,則會影響正常運行的業(yè)務(wù);不切換而就地維修,則維修時間不確定。
[0005]現(xiàn)有數(shù)據(jù)中心災(zāi)備系統(tǒng)解決方案主要有以下幾種實現(xiàn)方式:
[0006]—、整體切換(站點切換):當(dāng)滿足數(shù)據(jù)中心災(zāi)備切換條件時,停止生產(chǎn)數(shù)據(jù)中心所有系統(tǒng)運行,啟動災(zāi)備數(shù)據(jù)中心備用系統(tǒng),繼續(xù)對外服務(wù)。
[0007]這種方式影響所有系統(tǒng)的連續(xù)運行,需要大量的技術(shù)人員和業(yè)務(wù)人員參與,且無法保證切換的成功率,同時無法做年度業(yè)務(wù)連續(xù)性管理的演練工作。
[0008]二、單獨采用存儲同步技術(shù)的節(jié)點切換:由大型機時代進入小型機、PC時代的成熟標準技術(shù)。這種災(zāi)備技術(shù)只考慮到企業(yè)最重要的資產(chǎn)-數(shù)據(jù),生產(chǎn)數(shù)據(jù)中心與災(zāi)備數(shù)據(jù)中心之間采用相同技術(shù)的存儲設(shè)備,兩個存儲設(shè)備之間通過網(wǎng)絡(luò)或者裸光纖連接起來進行同步數(shù)據(jù)復(fù)制。當(dāng)滿足應(yīng)用系統(tǒng)切換條件時,停止應(yīng)用程序運行,卸載存儲設(shè)備連接,存儲設(shè)備改變主備節(jié)點,災(zāi)備數(shù)據(jù)中心內(nèi)備用主機掛接存儲設(shè)備,啟動應(yīng)用系統(tǒng)運行。
[0009]由于網(wǎng)絡(luò)基本原理的限制,應(yīng)用系統(tǒng)在災(zāi)備中心運行的IP地址和原生產(chǎn)中心的IP地址不一樣,因此與這個應(yīng)用系統(tǒng)相通信的其他應(yīng)用及客戶端都要做相應(yīng)的配置更改,甚至需要重新啟動相關(guān)應(yīng)用系統(tǒng)。另外,參與人員多,需要系統(tǒng)層面、網(wǎng)絡(luò)層面、應(yīng)用層面、業(yè)務(wù)層面等各個方面的支持才能完成切換。
[0010]三、采用系統(tǒng)高可用方法+存儲同步技術(shù)的節(jié)點切換:在存儲同步技術(shù)之上發(fā)展起來的一種先進技術(shù),把災(zāi)備管理的范圍擴大到操作系統(tǒng)級別。當(dāng)滿足應(yīng)用系統(tǒng)切換條件時,操作系統(tǒng)高可用軟件與認證的數(shù)據(jù)存儲設(shè)備交互通信,使得生產(chǎn)數(shù)據(jù)中心的數(shù)據(jù)存儲設(shè)備與災(zāi)備數(shù)據(jù)中心的數(shù)據(jù)存儲設(shè)備的主備身份自動切換,應(yīng)用系統(tǒng)從生產(chǎn)數(shù)據(jù)中心自動切換到災(zāi)備數(shù)據(jù)中心運行。
[0011]相比較單獨采用存儲同步技術(shù)的節(jié)點切換技術(shù),這種技術(shù)減少了節(jié)點在生產(chǎn)數(shù)據(jù)中心與災(zāi)備數(shù)據(jù)中心切換時的參與人員數(shù)量,減少了復(fù)雜度。但沒有解決對外服務(wù)的網(wǎng)絡(luò)問題,與這個應(yīng)用系統(tǒng)相通信的其他應(yīng)用及客戶端仍然要做相應(yīng)的配置更改,甚至需要重新啟動相關(guān)應(yīng)用系統(tǒng)。
[0012]四、采用系統(tǒng)高可用方法+存儲同步技術(shù)+裸光纖二層互聯(lián)技術(shù)的節(jié)點切換:由于裸光纖租費的降低,兩個數(shù)據(jù)中心之間的二層網(wǎng)絡(luò)可以簡單地通過裸光纖連接起來,以解決主機在生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心之間切換時對外服務(wù)地址改變而造成其他相關(guān)應(yīng)用系統(tǒng)更改配置甚至重啟應(yīng)用的問題。
[0013]這種技術(shù)要求分清楚主備數(shù)據(jù)中心:所有的網(wǎng)絡(luò)通信中樞都在生產(chǎn)數(shù)據(jù)中心,如果生產(chǎn)數(shù)據(jù)中心的網(wǎng)絡(luò)出現(xiàn)故障時,將無法對外提供服務(wù)。
[0014]五、采用系統(tǒng)高可用方法+存儲同步技術(shù)+DNS的節(jié)點切換:DNS技術(shù)是把主機的IP地址轉(zhuǎn)換為主機名使用。當(dāng)主機在生產(chǎn)數(shù)據(jù)中心與災(zāi)備數(shù)據(jù)中心之間切換時,IP地址改變的同時更改DNS中關(guān)于IP地址與主機名的對應(yīng)關(guān)系,則從主機名的層面來看,應(yīng)用系統(tǒng)之間的通信不需要更改配置參數(shù),簡化了應(yīng)用系統(tǒng)之間的復(fù)雜度。
[0015]這種技術(shù)無法兼容原有軟件產(chǎn)品之間以IP地址為唯一標識的通信,需要大量的開發(fā)測試及驗證工作,特別是長連接業(yè)務(wù)。同時DNS的部署及刷新周期會造成網(wǎng)絡(luò)資源的浪費:如設(shè)置刷新周期過長則恢復(fù)業(yè)務(wù)的周期長,刷新周期過短則占用大量的網(wǎng)絡(luò)流量。另夕卜,系統(tǒng)高可用方法要符合DNS的要求也需要重新配置參數(shù)。
【實用新型內(nèi)容】
[0016]本實用新型所要解決的技術(shù)問題是提供一種同城數(shù)據(jù)中心雙活高可用系統(tǒng),在參與人員很少的情況下,簡單地實現(xiàn)業(yè)務(wù)系統(tǒng)在生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心之間快速地節(jié)點級別切換。所述系統(tǒng)不僅能滿足災(zāi)難性事件發(fā)生時全部系統(tǒng)由生產(chǎn)數(shù)據(jù)中心切換到災(zāi)備數(shù)據(jù)中心的情況,同時也滿足小的事故發(fā)生時單個或部分系統(tǒng)在生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心之間任意切換的應(yīng)急處置。單個系統(tǒng)災(zāi)備能力建設(shè)符合中華人民共和國國家標準GB/T20988-2007《信息安全技術(shù)信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》中災(zāi)難恢復(fù)能力等級六級的標準。達到了可以快速判斷事故級別、快速查找故障原因、快速解決故障的效果。
[0017]為解決以前同城災(zāi)備建設(shè)中遇到的各種技術(shù)問題,本實用新型所采取的技術(shù)方案是:一種同城數(shù)據(jù)中心雙活高可用系統(tǒng),其特征在于:所述系統(tǒng)包括生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心,所述生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心包括核心層設(shè)備、匯聚層設(shè)備、接入層設(shè)備、主機、存儲區(qū)域網(wǎng)絡(luò)交換機、數(shù)據(jù)同步管理控制器、數(shù)據(jù)存儲設(shè)備,所述核心層設(shè)備通過匯聚層設(shè)備與接入層設(shè)備連接,所述接入層設(shè)備與若干個主機連接,主機通過存儲區(qū)域網(wǎng)絡(luò)交換機與數(shù)據(jù)同步管理控制器連接,數(shù)據(jù)同步管理控制器通過存儲區(qū)域網(wǎng)絡(luò)交換機與數(shù)據(jù)存儲設(shè)備連接,生產(chǎn)數(shù)據(jù)中心核心層設(shè)備與災(zāi)備中心核心層設(shè)備通過網(wǎng)絡(luò)連接后利用“數(shù)據(jù)中心二層互聯(lián)方法”建立對外服務(wù)網(wǎng)絡(luò),生產(chǎn)數(shù)據(jù)中心的主機與災(zāi)備數(shù)據(jù)中心主機處于相同編號的對外服務(wù)網(wǎng)絡(luò)內(nèi),生產(chǎn)數(shù)據(jù)中心主機與災(zāi)備中心主機通過“系統(tǒng)高可用方法”在對外服務(wù)網(wǎng)絡(luò)上對外提供唯一服務(wù),生產(chǎn)數(shù)據(jù)中心存儲區(qū)域網(wǎng)絡(luò)交換機通過光纖組成的存儲區(qū)域網(wǎng)絡(luò)與災(zāi)備數(shù)據(jù)中心的存儲區(qū)域網(wǎng)絡(luò)交換機連接,生產(chǎn)數(shù)據(jù)中心的數(shù)據(jù)同步管理控制器與災(zāi)備數(shù)據(jù)中心的數(shù)據(jù)同步管理控制器通過網(wǎng)絡(luò)連接。
[0018]進一步的技術(shù)方案在于:生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心內(nèi)的主機設(shè)有若干個。
[0019]進一步的技術(shù)方案在于:生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心內(nèi)的存儲區(qū)域網(wǎng)絡(luò)交換機設(shè)有若干個。
[0020]進一步的技術(shù)方案在于:系統(tǒng)采用高可用方法。兩臺或以上主機共同支撐一個應(yīng)用系統(tǒng)的運行,但應(yīng)用系統(tǒng)在同一時刻只運行在一臺主機上,當(dāng)運行應(yīng)用系統(tǒng)的主機出現(xiàn)系統(tǒng)故障、網(wǎng)卡失效等單點故障時,按照切換順序切換到另外的熱備主機上繼續(xù)運行。系統(tǒng)高可用方法使應(yīng)用系統(tǒng)在幾臺主機之間的切換自動化,減少了參與人員的干預(yù),減少了出現(xiàn)額外事故的可能性。
[0021]進一步的技術(shù)方案在于:系統(tǒng)采用數(shù)據(jù)中心二層互聯(lián)方法。通過隧道技術(shù)穿越三層網(wǎng)絡(luò)實現(xiàn)二層網(wǎng)絡(luò)的互通,使兩個同城數(shù)據(jù)中心既可以存在相同VLAN,又消除了其他可能的網(wǎng)絡(luò)安全隱患。數(shù)據(jù)中心二層互聯(lián)方法從網(wǎng)絡(luò)層面解決了應(yīng)用在兩個數(shù)據(jù)中心切換時,對外服務(wù)的IP地址無需改變的關(guān)鍵問題。
[0022]進一步的技術(shù)方案在于:系統(tǒng)采用存儲同步方法。生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心的存儲設(shè)備上同時存儲應(yīng)用系統(tǒng)數(shù)據(jù),數(shù)據(jù)同步管理控制器控制了數(shù)據(jù)存儲過程中的數(shù)據(jù)一致性問題。只有數(shù)據(jù)在生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心全部寫成功后,給應(yīng)用系統(tǒng)的寫操作返回成功的標志,使應(yīng)用系統(tǒng)繼續(xù)執(zhí)行。
[0023]采用上述技術(shù)方案所產(chǎn)生的有益效果在于:支持大的災(zāi)難場景,同時也支持普通的故障處理場景;整體架構(gòu)屬于平衡架構(gòu),從技術(shù)上沒有主生產(chǎn)數(shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心之分。任何一個數(shù)據(jù)中心都是一個完整的數(shù)據(jù)中心架構(gòu)(包括完整的網(wǎng)絡(luò)架構(gòu));切換時具體操作人員少、可操作性強。不容易出現(xiàn)節(jié)外生枝的故障。維護簡單,一個應(yīng)用切換時,與之相通信的應(yīng)用和客戶端無需更改配置。對應(yīng)用系統(tǒng)增加、應(yīng)用系統(tǒng)升級及應(yīng)用系統(tǒng)維護等不需要考慮很多,減少出錯的幾率。符合災(zāi)備等級六級的技術(shù)要求。達到了 RT0 = 0,RPO數(shù)分鐘的災(zāi)難恢復(fù)能力等級六級標準。為業(yè)務(wù)連續(xù)性應(yīng)急管理提供了可靠的技術(shù)保障。同時由于RTO = O,業(yè)務(wù)連續(xù)性管理操作手冊也會大大簡化。
【附圖說明】
[0024]圖1是本實用新型的原理框圖。
【具體實施方式】
[0025]下面結(jié)合本實用新型實施例中的附圖,對本實用新型實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本實用新型的一部分實施例,而不是全部的實施例?;诒緦嵱眯滦椭械膶嵤├?,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都