亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

高可用集群系統(tǒng)及基于該系統(tǒng)的告警方法、告警系統(tǒng)的制作方法_5

文檔序號(hào):9417274閱讀:來(lái)源:國(guó)知局
,監(jiān)測(cè)到高可用集群系統(tǒng)出現(xiàn)高可用集群類故障時(shí),將生成的高可用集群類告警信息分別寫入主節(jié)點(diǎn)的兩個(gè)數(shù)據(jù)庫(kù)中,然后通過(guò)同步機(jī)制將該信息同步到各個(gè)節(jié)點(diǎn)的數(shù)據(jù)庫(kù)中。在未發(fā)生數(shù)據(jù)庫(kù)連接故障的情況下,上述各個(gè)數(shù)據(jù)庫(kù)中存儲(chǔ)的告警信息是一致的。因此,無(wú)論用戶當(dāng)前訪問(wèn)(登錄)的是主節(jié)點(diǎn)還是任意一個(gè)從節(jié)點(diǎn),都可以從當(dāng)前訪問(wèn)的節(jié)點(diǎn)的數(shù)據(jù)庫(kù)中獲取告警信息。即便是在主節(jié)點(diǎn)或者主節(jié)點(diǎn)的數(shù)據(jù)庫(kù)出現(xiàn)故障時(shí),用戶也可以從任意一個(gè)從節(jié)點(diǎn)的第二輔助數(shù)據(jù)庫(kù)中獲取到告警信息,從而能夠及時(shí)依據(jù)獲取的告警信息采取相應(yīng)的應(yīng)對(duì)措施,保證了高可用集群系統(tǒng)的正常運(yùn)行,有效避免了由于未及時(shí)采取采取應(yīng)對(duì)措施而造成的損失,大大提高了高可用集群系統(tǒng)的系統(tǒng)性能。
[0143]為了進(jìn)一步地闡述本發(fā)明,下面詳細(xì)說(shuō)明高可用集群系統(tǒng)的配置過(guò)程以及基于該系統(tǒng)的告警方法的驗(yàn)證過(guò)程。
[0144]本實(shí)施例采用高可用集群雙機(jī)主備模式,并選擇其中一個(gè)節(jié)點(diǎn)為主節(jié)點(diǎn),即高可用集群系統(tǒng)包括一個(gè)主節(jié)點(diǎn)和一個(gè)從節(jié)點(diǎn)。主節(jié)點(diǎn)和從節(jié)點(diǎn)之間選用雙心跳直連模式,有效避免了腦裂現(xiàn)象的發(fā)生。
[0145]在安裝完畢高可用集群系統(tǒng)的集群軟件后,需要在主節(jié)點(diǎn)初始化數(shù)據(jù)庫(kù)等操作,并做輔助數(shù)據(jù)庫(kù)的同步設(shè)置。然后,啟動(dòng)集群web相關(guān)服務(wù)后,用戶登錄高可用集群系統(tǒng)的集群軟件的管理頁(yè)面。用戶首先添加高可用集群,然后將主節(jié)點(diǎn)和從節(jié)點(diǎn)添加到剛創(chuàng)建的高可用集群中。然后配置該集群和心跳等信息。然后啟動(dòng)集群,啟動(dòng)集群內(nèi)的主節(jié)點(diǎn)和從節(jié)點(diǎn)。隨后,高可用集群系統(tǒng)中的主節(jié)點(diǎn)和從節(jié)點(diǎn)均處于運(yùn)行狀態(tài),用戶可選擇性部署操作系統(tǒng)負(fù)載類故障監(jiān)測(cè)腳本,過(guò)程中用戶需設(shè)置相應(yīng)的負(fù)載閾值。同時(shí),用戶可添加其它相關(guān)資源,然后運(yùn)行新添加的資源。
[0146]針對(duì)告警信息的不可預(yù)知性,為了驗(yàn)證告警系統(tǒng)的功能,采用模擬集群各類故障的方法,從而產(chǎn)生各相對(duì)應(yīng)的信息,并驗(yàn)證告警信息的完整性和一致性。
[0147]首先,在未出現(xiàn)第一主數(shù)據(jù)庫(kù)類故障的情況下進(jìn)行高可用集群類故障和操作系統(tǒng)負(fù)載類故障的相關(guān)測(cè)試。具體地,用戶可通過(guò)修改添加資源配置參數(shù)等方法,獲取資源類告警信息。用戶也通過(guò)斷開心跳連接線的方法獲取心跳類告警信息和節(jié)點(diǎn)類告警信息。同時(shí),如果已部署操作系統(tǒng)負(fù)載監(jiān)測(cè)腳本,用戶也可通過(guò)對(duì)節(jié)瞇進(jìn)行加壓測(cè)試,使得當(dāng)前節(jié)點(diǎn)負(fù)載高于(或低于)設(shè)定的負(fù)載閾值,從而產(chǎn)生操作系統(tǒng)負(fù)載類告警信息。待系統(tǒng)監(jiān)測(cè)到上述各類故障后,用戶可查閱相應(yīng)告警信息是否正確。
[0148]其次,在出現(xiàn)第一主數(shù)據(jù)庫(kù)類故障的情況下進(jìn)行相關(guān)測(cè)試。用戶可停止第一主數(shù)據(jù)庫(kù)的服務(wù),然后在高可用集群系統(tǒng)上模擬資源類、心跳類、節(jié)點(diǎn)類和操作系統(tǒng)負(fù)載類故障。用戶登錄出現(xiàn)故障的節(jié)點(diǎn)所提供的web服務(wù)頁(yè)面中,可查看到第一主數(shù)據(jù)庫(kù)類故障期間產(chǎn)生的告警信息。同時(shí),查看故障節(jié)點(diǎn)的本地告警信息日志文件和待回寫告警信息日志文件,均可以查閱相應(yīng)告警信息是否正確。
[0149]然后解除第一主數(shù)據(jù)庫(kù)類故障,此時(shí)暫存于上述故障節(jié)點(diǎn)的本地待回寫告警信息日志文件中的信息應(yīng)全部寫入高可用集群系統(tǒng)的所有節(jié)點(diǎn)的數(shù)據(jù)庫(kù)中。用戶可任意登錄一個(gè)節(jié)點(diǎn),通過(guò)查閱保存在該節(jié)點(diǎn)的數(shù)據(jù)庫(kù)中的告警信息驗(yàn)證該告警信息的完整性和一致性(用戶可以用數(shù)據(jù)庫(kù)查詢語(yǔ)句判斷是否成功寫入)。
[0150]本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來(lái)實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái)執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
[0151]雖然本發(fā)明所公開的實(shí)施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所公開的精神和范圍的前提下,可以在實(shí)施的形式上及細(xì)節(jié)上作任何的修改與變化,但本發(fā)明的保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1.一種高可用集群系統(tǒng),其特征在于,包括: 主節(jié)點(diǎn),所述主節(jié)點(diǎn)包括均用于存儲(chǔ)告警信息的第一主數(shù)據(jù)庫(kù)和第一輔助數(shù)據(jù)庫(kù);以及 至少一個(gè)從節(jié)點(diǎn),每個(gè)所述從節(jié)點(diǎn)分別與所述主節(jié)點(diǎn)連接,每個(gè)所述從節(jié)點(diǎn)分別包括用于存儲(chǔ)所述告警信息的第二輔助數(shù)據(jù)庫(kù)。2.—種基于如權(quán)利要求1所述的高可用集群系統(tǒng)的告警方法,其特征在于,包括: 監(jiān)測(cè)所述高可用集群系統(tǒng)的運(yùn)行狀態(tài); 監(jiān)測(cè)到所述高可用集群系統(tǒng)出現(xiàn)高可用集群類故障時(shí),生成高可用集群類告警信息; 將所述高可用集群類告警信息分別寫入所述第一主數(shù)據(jù)庫(kù)和所述第一輔助數(shù)據(jù)庫(kù); 將所述第一輔助數(shù)據(jù)庫(kù)中的高可用集群類告警信息同步到各個(gè)所述第二輔助數(shù)據(jù)庫(kù)中。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述高可用集群類告警信息包括均與所述高可用集群類故障相對(duì)應(yīng)的故障標(biāo)識(shí)和嚴(yán)重級(jí)別標(biāo)識(shí); 所述方法還包括:將所述高可用集群類告警信息呈現(xiàn)在所述高可用集群系統(tǒng)的集群軟件的頁(yè)面上。4.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括: 監(jiān)測(cè)到所述高可用集群系統(tǒng)出現(xiàn)操作系統(tǒng)負(fù)載類故障時(shí),生成操作系統(tǒng)負(fù)載類告警信息; 將所述操作系統(tǒng)負(fù)載類告警信息分別寫入所述第一主數(shù)據(jù)庫(kù)和所述第一輔助數(shù)據(jù)庫(kù)中; 將所述第一輔助數(shù)據(jù)庫(kù)中的操作系統(tǒng)負(fù)載類告警信息同步到各個(gè)所述第二輔助數(shù)據(jù)庫(kù)中。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,生成操作系統(tǒng)負(fù)載類告警信息,包括: 根據(jù)預(yù)設(shè)的負(fù)載閾值和所述操作系統(tǒng)類故障涉及的第一故障節(jié)點(diǎn)的操作系統(tǒng)負(fù)載,確定與所述操作系統(tǒng)負(fù)載類故障相對(duì)應(yīng)的嚴(yán)重級(jí)別標(biāo)識(shí); 生成操作系統(tǒng)負(fù)載類告警信息,并使所述操作系統(tǒng)負(fù)載類告警信息包括均與所述操作系統(tǒng)負(fù)載類故障相對(duì)應(yīng)的故障標(biāo)識(shí)和嚴(yán)重級(jí)別標(biāo)識(shí)。6.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括: 監(jiān)測(cè)到所述高可用集群系統(tǒng)出現(xiàn)第一主數(shù)據(jù)庫(kù)類故障時(shí),生成第一主數(shù)據(jù)庫(kù)類告警信息; 根據(jù)所述第一主數(shù)據(jù)庫(kù)類告警信息、以及均在所述第一主數(shù)據(jù)庫(kù)類故障期間生成的所述高可用集群類告警信息和所述操作系統(tǒng)負(fù)載類告警信息,得到待回寫告警信息; 將所述待回寫告警信息寫入所述第一主數(shù)據(jù)庫(kù)類故障涉及的第二故障節(jié)點(diǎn)的本地待回寫告警信息日志中。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述第一主數(shù)據(jù)庫(kù)類告警信息包括均與所述第一主數(shù)據(jù)庫(kù)類故障相對(duì)應(yīng)的故障標(biāo)識(shí)和嚴(yán)重級(jí)別標(biāo)識(shí); 所述方法還包括:將所述待回寫告警信息和所述第二故障節(jié)點(diǎn)的第二輔助數(shù)據(jù)庫(kù)中的歷史告警信息呈現(xiàn)在所述高可用集群系統(tǒng)的集群軟件的頁(yè)面上。8.根據(jù)權(quán)利要求6所述的方法,其特征在于,還包括: 監(jiān)測(cè)到所述第一主數(shù)據(jù)庫(kù)類故障消除時(shí),將所述待回寫告警信息日志中的所述待回寫告警信息寫入所述第一主數(shù)據(jù)庫(kù)、所述第一輔助數(shù)據(jù)庫(kù)和各個(gè)所述第二數(shù)據(jù)庫(kù)中。9.根據(jù)權(quán)利要求8所述的方法,其特征在于,將所述待回寫告警信息日志中的所述待回寫告警信息寫入所述第一主數(shù)據(jù)庫(kù)、所述第一輔助數(shù)據(jù)庫(kù)和各個(gè)所述第二數(shù)據(jù)庫(kù)中,包括: 依次對(duì)所述待回寫告警信息中的每條待回寫信息,判斷所述待回寫信息是否合法; 判斷出所述待回寫信息合法時(shí),將所述待回寫信息分別寫入所述第一主數(shù)據(jù)庫(kù)和所述第一輔助數(shù)據(jù)庫(kù)中,并將所述第一輔助數(shù)據(jù)庫(kù)中的所述待回寫信息同步到各個(gè)第二輔助數(shù)據(jù)庫(kù)中; 將所述待回寫信息從所述待回寫告警信息日志中刪除。10.根據(jù)權(quán)利要求2至9中任一項(xiàng)所述的方法,其特征在于,還包括: 累計(jì)未處理的告警信息的數(shù)目; 將所述數(shù)目呈現(xiàn)在所述高可用集群系統(tǒng)的集群軟件的各個(gè)頁(yè)面上。11.一種基于如權(quán)利要求1所述的高可用集群系統(tǒng)的告警系統(tǒng),其特征在于,所述告警系統(tǒng)利用權(quán)利要求2至10中任一項(xiàng)所述的告警方法進(jìn)行告警。
【專利摘要】本發(fā)明提供了一種高可用集群系統(tǒng)及基于該系統(tǒng)的告警方法、告警系統(tǒng)。應(yīng)用本發(fā)明,告警信息同時(shí)存儲(chǔ)在主節(jié)點(diǎn)的第一主數(shù)據(jù)庫(kù)和第一輔助數(shù)據(jù)庫(kù)中以及各個(gè)從節(jié)點(diǎn)的第二輔助數(shù)據(jù)庫(kù)中。在未發(fā)生數(shù)據(jù)庫(kù)連接故障的情況下,上述各個(gè)數(shù)據(jù)庫(kù)中存儲(chǔ)的告警信息是一致的。無(wú)論用戶當(dāng)前訪問(wèn)的是主節(jié)點(diǎn)還是從節(jié)點(diǎn),都可以從當(dāng)前訪問(wèn)的節(jié)點(diǎn)的數(shù)據(jù)庫(kù)中獲取告警信息。即便是在主節(jié)點(diǎn)或者主節(jié)點(diǎn)的數(shù)據(jù)庫(kù)出現(xiàn)故障時(shí),用戶也可以從任意一個(gè)從節(jié)點(diǎn)的第二輔助數(shù)據(jù)庫(kù)中獲取到告警信息,從而能夠及時(shí)依據(jù)獲取的告警信息采取相應(yīng)的應(yīng)對(duì)措施,保證了高可用集群系統(tǒng)的正常運(yùn)行,有效避免了由于未及時(shí)采取應(yīng)對(duì)措施而造成的損失,大大提高了高可用集群系統(tǒng)的系統(tǒng)性能。
【IPC分類】G06F3/06, G06F11/30
【公開號(hào)】CN105138441
【申請(qǐng)?zhí)枴緾N201510387184
【發(fā)明人】李奇, 王陽(yáng)利, 劉濤, 宋瀟豫, 張永軍, 趙峰, 喬詠, 申利飛
【申請(qǐng)人】中標(biāo)軟件有限公司
【公開日】2015年12月9日
【申請(qǐng)日】2015年6月30日
當(dāng)前第5頁(yè)1 2 3 4 5 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1