亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

機(jī)群監(jiān)控與預(yù)警方法

文檔序號:7859948閱讀:190來源:國知局
專利名稱:機(jī)群監(jiān)控與預(yù)警方法
技術(shù)領(lǐng)域
本發(fā)明涉及ー種機(jī)群監(jiān)控與預(yù)警方法,尤其是采用分組機(jī)制適應(yīng)不同規(guī)模的機(jī)群以及對大規(guī)模機(jī)群的實時響應(yīng),同時采用拓?fù)浣Y(jié)構(gòu)解決Group的單點故障,且采用監(jiān)控與預(yù)警相結(jié)合的方法達(dá)到用戶對機(jī) 群實時監(jiān)控的目的。
背景技術(shù)
在傳統(tǒng)的機(jī)群監(jiān)控系統(tǒng)中,開源項目Ganglia很好的實現(xiàn)了對具有2000節(jié)點的機(jī)群規(guī)模進(jìn)行監(jiān)控。Ganglia是ー個跨平臺可擴(kuò)展的,高性能計算系統(tǒng)下的分布式監(jiān)控系統(tǒng)。它是基于分層設(shè)計,利用精心設(shè)計的數(shù)據(jù)結(jié)構(gòu)和算法實現(xiàn)節(jié)點之間的低并發(fā)性。但是,Ganglia不支持單點故障的處理,即當(dāng)服務(wù)器出現(xiàn)故障吋,需要人工處理。同吋,由于近年互聯(lián)網(wǎng)的高速發(fā)展,機(jī)群的規(guī)模已遠(yuǎn)遠(yuǎn)超過了 2000節(jié)點,而Ganglia在隨著機(jī)群規(guī)模的擴(kuò)展其監(jiān)控性能并不能得到及時性的響應(yīng)。目前機(jī)群監(jiān)控技術(shù)均是針對某一特殊機(jī)群平臺而設(shè)計的,導(dǎo)致機(jī)群監(jiān)控技術(shù)沒有一定的通用性,同時傳統(tǒng)的監(jiān)控技術(shù)存在不支持單點故障處理問題且不能提供預(yù)警的方案。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是為了克服現(xiàn)有技術(shù)存在的缺陷而提供ー種機(jī)群監(jiān)控與預(yù)警方法,以適應(yīng)不同規(guī)模的機(jī)群以及對大規(guī)模機(jī)群的實時響應(yīng),其能監(jiān)控的機(jī)群規(guī)模將遠(yuǎn)遠(yuǎn)超過2000個節(jié)點,同時,解決單點故障處理問題。本發(fā)明為解決其技術(shù)問題所采取的技術(shù)路線是首先采用分組思想,將機(jī)群分成N組,確定姆組的節(jié)點數(shù),即姆ー組由ー個Group和M臺Agent組成;然后采用星形拓?fù)浣Y(jié)構(gòu)解決單點故障問題,將稱為ControlNode的節(jié)點作為中心節(jié)點,姆組中的Group和SecondaryGroup與ControlNode直接相連,構(gòu)成一個星型拓?fù)浣Y(jié)構(gòu),ControlNode實時記錄著姆個Group與SecondaryGroup的映射關(guān)系,一旦Group出現(xiàn)故障,該Group下的所有Agent將會暫時連接到SecondaryGroup,當(dāng)故障被消除后,Agent又會連接回Group ;最后采用監(jiān)控與預(yù)警相結(jié)合的方法,實時挖掘由監(jiān)控生成的數(shù)據(jù),通過與系統(tǒng)性能指標(biāo)相比較,當(dāng)發(fā)現(xiàn)某個節(jié)點超過性能閾值的時候,將會以短信或者郵箱的方式通知指定用戶,具體包含以下過程(I)機(jī)群分組根據(jù)機(jī)群的規(guī)模確定將機(jī)群分成N組,其中,ClusterSize為機(jī)群的總節(jié)點數(shù),_7] —>麵0),
IcimferSte < 100則每組的節(jié)點數(shù)
權(quán)利要求
1.ー種機(jī)群監(jiān)控與預(yù)警方法,采用分組機(jī)制適應(yīng)不同規(guī)模的機(jī)群以及對大規(guī)模機(jī)群的實時響應(yīng),采用拓?fù)浣Y(jié)構(gòu)解決Group的單點故障,用監(jiān)控與預(yù)警相結(jié)合對機(jī)群實時監(jiān)控,其特征在于,具體包括以下過程 (1)機(jī)群分組 根據(jù)機(jī)群的規(guī)模確定將機(jī)群分成N組,
全文摘要
本發(fā)明公開了一種機(jī)群監(jiān)控與預(yù)警方法,采用分組機(jī)制適應(yīng)不同規(guī)模的機(jī)群以及對大規(guī)模機(jī)群的實時響應(yīng),采用拓?fù)浣Y(jié)構(gòu)解決Group的單點故障,用監(jiān)控與預(yù)警相結(jié)合對機(jī)群實時監(jiān)控,通過實時分析由監(jiān)控采集的數(shù)據(jù)與系統(tǒng)的性能指標(biāo)進(jìn)行比較,一旦發(fā)現(xiàn)某個數(shù)據(jù)超過了性能指標(biāo)的閾值,將會通過短信的方式發(fā)送給用戶,通知用戶及時解決故障。
文檔編號H04L12/24GK102761448SQ20121027760
公開日2012年10月31日 申請日期2012年8月7日 優(yōu)先權(quán)日2012年8月7日
發(fā)明者俞輝, 高傳俊 申請人:中國石油大學(xué)(華東)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1