跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)、方法及裝置制造方法
【專利摘要】本發(fā)明實(shí)施例公開(kāi)了一種跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)、方法及裝置。其中,該跨數(shù)據(jù)中心的管理員節(jié)點(diǎn)接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,判斷故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,向除主動(dòng)監(jiān)控節(jié)點(diǎn)和目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求;接收其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;基于故障與否應(yīng)答結(jié)果,確定目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);當(dāng)運(yùn)行狀態(tài)表明目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);指示臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作??梢?jiàn),通過(guò)利用本方案,可以兼顧監(jiān)控設(shè)備節(jié)點(diǎn)的準(zhǔn)確性和有效性。
【專利說(shuō)明】跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)、方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,特別涉及一種跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)、方法及裝置。
【背景技術(shù)】
[0002]大型互聯(lián)網(wǎng)公司為了保證承載有大量數(shù)據(jù)信息的設(shè)備節(jié)點(diǎn)(例如:業(yè)務(wù)服務(wù)器、數(shù)據(jù)服務(wù)器等)的有效運(yùn)行,通常會(huì)對(duì)這些設(shè)備節(jié)點(diǎn)進(jìn)行監(jiān)控?,F(xiàn)有的監(jiān)控模式通常包括如下兩種方式:
[0003](I)同數(shù)據(jù)中心的監(jiān)控:監(jiān)控節(jié)點(diǎn)(負(fù)責(zé)監(jiān)控的設(shè)備)和設(shè)備節(jié)點(diǎn)(被監(jiān)控的設(shè)備)位于同一機(jī)房;
[0004](2)跨數(shù)據(jù)中心的監(jiān)控:監(jiān)控節(jié)點(diǎn)和設(shè)備節(jié)點(diǎn)位于不同的機(jī)房。
[0005]但是,上述兩種監(jiān)控模式,在實(shí)際使用時(shí)具有如下的缺點(diǎn):
[0006]對(duì)于同數(shù)據(jù)中心的監(jiān)控模式而言,由于監(jiān)控節(jié)點(diǎn)和設(shè)備節(jié)點(diǎn)位于同一機(jī)房?jī)?nèi),如果機(jī)房發(fā)生災(zāi)難(斷電、大規(guī)模宕機(jī)等),監(jiān)控節(jié)點(diǎn)和設(shè)備節(jié)點(diǎn)將同時(shí)失效,業(yè)務(wù)負(fù)責(zé)人員不能及時(shí)接收到報(bào)警,也無(wú)法登陸到監(jiān)控系統(tǒng)上去查看災(zāi)難的具體狀況,嚴(yán)重影響災(zāi)后修復(fù)效率。
[0007]而對(duì)于跨數(shù)據(jù)中心的監(jiān)控模式而言,監(jiān)控節(jié)點(diǎn)和設(shè)備節(jié)點(diǎn)之間的通信需要經(jīng)過(guò)跨數(shù)據(jù)中心的網(wǎng)絡(luò)專線,大量消耗專線網(wǎng)絡(luò)帶寬;同時(shí),監(jiān)控的準(zhǔn)確性受到網(wǎng)絡(luò)狀況的影響,例如:數(shù)據(jù)中心之間的網(wǎng)絡(luò)抖動(dòng)會(huì)引起大量的監(jiān)控誤報(bào),嚴(yán)重降低了監(jiān)控報(bào)警的準(zhǔn)確性。
【發(fā)明內(nèi)容】
[0008]基于上述問(wèn)題,本發(fā)明實(shí)施例公開(kāi)了一種跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)、方法及裝置,以兼顧監(jiān)控設(shè)備節(jié)點(diǎn)的準(zhǔn)確性和有效性。技術(shù)方案如下:
[0009]第一方面,本發(fā)明實(shí)施例提供了一種跨數(shù)據(jù)中心的監(jiān)控系統(tǒng),包括:
[0010]管理員節(jié)點(diǎn)以及能夠與所述管理員節(jié)點(diǎn)通信的且能夠相互通信的至少一個(gè)監(jiān)控節(jié)點(diǎn),其中,所述至少一個(gè)監(jiān)控節(jié)點(diǎn)中的任意兩個(gè)監(jiān)控節(jié)點(diǎn)位于同一數(shù)據(jù)中心或不同的數(shù)據(jù)中心,每一監(jiān)控節(jié)點(diǎn)負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn);
[0011 ] 所述監(jiān)控節(jié)點(diǎn)用于:定時(shí)對(duì)自身以外的監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,在對(duì)所述自身以外的任意一監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí),將作為主動(dòng)監(jiān)控節(jié)點(diǎn)構(gòu)造針對(duì)于作為目標(biāo)監(jiān)控節(jié)點(diǎn)的該任意一監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,并發(fā)送給管理員節(jié)點(diǎn),并且,在接收到管理員節(jié)點(diǎn)發(fā)送的針對(duì)于作為目標(biāo)監(jiān)控節(jié)點(diǎn)的任意一監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);
[0012]所述管理員節(jié)點(diǎn)用于:接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,其中,所述主動(dòng)監(jiān)控節(jié)點(diǎn)為所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的任意一個(gè)監(jiān)控節(jié)點(diǎn),所述故障與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí)構(gòu)造并發(fā)送的;判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,向除所述主動(dòng)監(jiān)控節(jié)點(diǎn)和所述目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
[0013]第二方面,本發(fā)明實(shí)施例提供了一種跨數(shù)據(jù)中心的監(jiān)控方法,應(yīng)用于第一方面所提供的所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)的管理員節(jié)點(diǎn);所述方法包括:
[0014]接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,其中,所述主動(dòng)監(jiān)控節(jié)點(diǎn)為所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的任意一個(gè)監(jiān)控節(jié)點(diǎn),所述故障與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí)構(gòu)造并發(fā)送的;
[0015]判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,向除所述主動(dòng)監(jiān)控節(jié)點(diǎn)和所述目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);
[0016]接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;
[0017]基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);
[0018]當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0019]指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
[0020]可選的,本發(fā)明實(shí)施例所提供的跨數(shù)據(jù)中心的監(jiān)控方法,還包括:
[0021]指示所述主動(dòng)監(jiān)控節(jié)點(diǎn)繼續(xù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,以及指示所述其他監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作;
[0022]接收所述主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否投票請(qǐng)求,其中,所述恢復(fù)與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)時(shí)構(gòu)造并發(fā)送的;
[0023]向所述其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述恢復(fù)與否詢問(wèn)請(qǐng)求后對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作,并將Ping操作結(jié)果作為恢復(fù)與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);
[0024]接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述恢復(fù)與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;
[0025]基于所述恢復(fù)與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);
[0026]當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)恢復(fù)時(shí),指示該臨時(shí)監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)的臨時(shí)監(jiān)控操作。
[0027]可選的,所述預(yù)設(shè)請(qǐng)求條件包括:
[0028]連續(xù)預(yù)定次數(shù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而無(wú)法ping通;
[0029]或者,
[0030]在預(yù)定時(shí)間段內(nèi)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而無(wú)法ping通。
[0031]可選的,所述判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,包括:
[0032]判斷所述故障與否投票請(qǐng)求所對(duì)應(yīng)的發(fā)送節(jié)點(diǎn)是否為預(yù)先為所述目標(biāo)監(jiān)控節(jié)點(diǎn)設(shè)置的監(jiān)控節(jié)點(diǎn),如果是,表明所述故障與否投票請(qǐng)求滿足預(yù)設(shè)響應(yīng)條件。
[0033]可選的,所述管理員節(jié)點(diǎn)記錄有各個(gè)監(jiān)控節(jié)點(diǎn)的當(dāng)前的運(yùn)行狀態(tài);
[0034]所述判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,包括:
[0035]判斷所述故障與否投票請(qǐng)求是否為在所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的運(yùn)行狀態(tài)表明未故障時(shí)的第一個(gè)故障與否投票請(qǐng)求,如果是,表明所述故障與否投票請(qǐng)求滿足預(yù)設(shè)響應(yīng)條件。
[0036]可選的,基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài),包括:
[0037]設(shè)定目標(biāo)監(jiān)控節(jié)點(diǎn)的起始分?jǐn)?shù)為預(yù)定基準(zhǔn)分?jǐn)?shù);
[0038]對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作:
[0039]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第一分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第二分?jǐn)?shù)值的操作,其中,所述第一分?jǐn)?shù)值小于所述第二分?jǐn)?shù)值;
[0040]對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于不同數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作:
[0041]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第二分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第一分?jǐn)?shù)值的操作;
[0042]并且,在處理完畢所有的其他監(jiān)控節(jié)點(diǎn)后,如果所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的分?jǐn)?shù)小于所述預(yù)定基準(zhǔn)分?jǐn)?shù),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
[0043]可選的,基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài),包括:
[0044]判斷表明未ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果的個(gè)數(shù)是否超過(guò)預(yù)設(shè)閾值,如果是,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
[0045]可選的,所述確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn),包括:
[0046]將所述主動(dòng)監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0047]或者,
[0048]將所述其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0049]或者,
[0050]將與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn)。
[0051]第三方面,本發(fā)明實(shí)施例提供了一種跨數(shù)據(jù)中心的監(jiān)控裝置,應(yīng)用于第一方面所提供的所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的管理員節(jié)點(diǎn);所述裝置包括:
[0052]故障與否投票請(qǐng)求接收模塊,用于接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,其中,所述主動(dòng)監(jiān)控節(jié)點(diǎn)為所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的任意一個(gè)監(jiān)控節(jié)點(diǎn),所述故障與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí)構(gòu)造并發(fā)送的;
[0053]判斷模塊,用于判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,觸發(fā)故障與否詢問(wèn)請(qǐng)求發(fā)送模塊;
[0054]所述故障與否詢問(wèn)請(qǐng)求發(fā)送模塊,用于向除所述主動(dòng)監(jiān)控節(jié)點(diǎn)和所述目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);
[0055]第一故障與否應(yīng)答結(jié)果接收模塊,用于接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;
[0056]第一運(yùn)行狀態(tài)確定模塊,用于基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);
[0057]臨時(shí)監(jiān)控節(jié)點(diǎn)確定模塊,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0058]第一指示模塊,用于指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
[0059]可選的,本發(fā)明實(shí)施例所提供的跨數(shù)據(jù)中心的監(jiān)控裝置,還包括:
[0060]指示模塊,用于指示所述主動(dòng)監(jiān)控節(jié)點(diǎn)繼續(xù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,以及指示所述其他監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作;
[0061]恢復(fù)與否投票請(qǐng)求接收模塊,用于接收所述主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否投票請(qǐng)求,其中,所述恢復(fù)與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)時(shí)構(gòu)造并發(fā)送的;
[0062]恢復(fù)與否詢問(wèn)請(qǐng)求發(fā)送模塊,用于向所述其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述恢復(fù)與否詢問(wèn)請(qǐng)求后對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作,并將Ping操作結(jié)果作為恢復(fù)與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);
[0063]第二故障與否應(yīng)答結(jié)果接收模塊,用于接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述恢復(fù)與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;
[0064]第二運(yùn)行狀態(tài)確定模塊,用于基于所述恢復(fù)與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);
[0065]第二指示模塊,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)恢復(fù)時(shí),指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)的臨時(shí)監(jiān)控操作。
[0066]可選的,所述預(yù)設(shè)請(qǐng)求條件包括:
[0067]連續(xù)預(yù)定次數(shù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而無(wú)法ping通;
[0068]或者,
[0069]在預(yù)定時(shí)間段內(nèi)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而無(wú)法ping通。
[0070]可選的,所述判斷模塊,包括:
[0071]第一判斷單元,用于:
[0072]判斷所述故障與否投票請(qǐng)求所對(duì)應(yīng)的發(fā)送節(jié)點(diǎn)是否為預(yù)先為所述目標(biāo)監(jiān)控節(jié)點(diǎn)設(shè)置的監(jiān)控節(jié)點(diǎn),如果是,觸發(fā)故障與否詢問(wèn)請(qǐng)求發(fā)送模塊。
[0073]可選的,所述管理員節(jié)點(diǎn)記錄有各個(gè)監(jiān)控節(jié)點(diǎn)的當(dāng)前的運(yùn)行狀態(tài);
[0074]所述判斷模塊,包括:
[0075]第二判斷單元,用于判斷所述故障與否投票請(qǐng)求是否為在所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的運(yùn)行狀態(tài)表明未故障時(shí)的第一個(gè)故障與否投票請(qǐng)求,如果是,觸發(fā)故障與否詢問(wèn)請(qǐng)求發(fā)送模塊。
[0076]可選的,第一運(yùn)行狀態(tài)確定模塊,包括:
[0077]起始分?jǐn)?shù)設(shè)定單元,用于設(shè)定目標(biāo)監(jiān)控節(jié)點(diǎn)的起始分?jǐn)?shù)為預(yù)定基準(zhǔn)分?jǐn)?shù);
[0078]第一處理單元,用于對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作:
[0079]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第一分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第二分?jǐn)?shù)值的操作,其中,所述第一分?jǐn)?shù)值小于所述第二分?jǐn)?shù)值;
[0080]第二處理單元,用于對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于不同數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作:
[0081]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第二分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第一分?jǐn)?shù)值的操作;
[0082]分?jǐn)?shù)處理單元,用于在處理完畢所有的其他監(jiān)控節(jié)點(diǎn)后,如果所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的分?jǐn)?shù)小于所述預(yù)定基準(zhǔn)分?jǐn)?shù),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
[0083]可選的,所述第一運(yùn)行狀態(tài)確定模塊,包括:
[0084]個(gè)數(shù)處理單元,用于判斷表明未ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果的個(gè)數(shù)是否超過(guò)預(yù)設(shè)閾值,如果是,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
[0085]可選的,所述臨時(shí)監(jiān)控節(jié)點(diǎn)確定模塊,包括:
[0086]第一臨時(shí)監(jiān)控節(jié)點(diǎn)確定單元,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),將所述主動(dòng)監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0087]或者,
[0088]第二臨時(shí)監(jiān)控節(jié)點(diǎn)確定單元,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),將所述其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0089]或者,
[0090]第三臨時(shí)監(jiān)控節(jié)點(diǎn)確定單元,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),將與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn)。
[0091]本方案中,設(shè)備節(jié)點(diǎn)由包括監(jiān)控節(jié)點(diǎn)和管理員節(jié)點(diǎn)的跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)進(jìn)行監(jiān)控,并且,各個(gè)監(jiān)控節(jié)點(diǎn)負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn),各個(gè)監(jiān)控節(jié)點(diǎn)能夠相互通信以及與管理員節(jié)點(diǎn)通信;在監(jiān)控過(guò)程中,如果任意一監(jiān)控節(jié)點(diǎn)對(duì)自身外的任意一目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí),將通知管理員節(jié)點(diǎn)進(jìn)行關(guān)于該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障的投票,而管理員節(jié)點(diǎn)將詢問(wèn)這兩個(gè)監(jiān)控節(jié)點(diǎn)以外的監(jiān)控節(jié)點(diǎn),并基于所接收到的反饋結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障,進(jìn)而在判斷出該目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),指示所確定出的臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作??梢?jiàn),通過(guò)利用本方案,可以兼顧監(jiān)控設(shè)備節(jié)點(diǎn)的準(zhǔn)確性和有效性。
【專利附圖】
【附圖說(shuō)明】
[0092]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0093]圖1為本發(fā)明實(shí)施例所提供的一種跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖;
[0094]圖2為本發(fā)明實(shí)施例所提供的一種跨數(shù)據(jù)中心的監(jiān)控方法的第一種流程圖;
[0095]圖3為本發(fā)明實(shí)施例所提供的一種跨數(shù)據(jù)中心的監(jiān)控方法的第二種流程圖;
[0096]圖4為本發(fā)明實(shí)施例所提供的一種跨數(shù)據(jù)中心的監(jiān)控裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0097]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0098]本發(fā)明實(shí)施例提供了一種跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)、方法及裝置,以兼顧監(jiān)控設(shè)備節(jié)點(diǎn)的準(zhǔn)確性和有效性。
[0099]下面首先介紹本發(fā)明實(shí)施例所提供的一種跨數(shù)據(jù)中心的監(jiān)控系統(tǒng),具體的,該監(jiān)控系統(tǒng)可以包括:
[0100]管理員節(jié)點(diǎn)以及能夠與所述管理員節(jié)點(diǎn)通信的且能夠相互通信的至少一個(gè)監(jiān)控節(jié)點(diǎn),其中,所述至少一個(gè)監(jiān)控節(jié)點(diǎn)中的任意兩個(gè)監(jiān)控節(jié)點(diǎn)位于同一數(shù)據(jù)中心或不同的數(shù)據(jù)中心,每一監(jiān)控節(jié)點(diǎn)負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn);
[0101]所述監(jiān)控節(jié)點(diǎn)用于:定時(shí)對(duì)自身以外的監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,在對(duì)所述自身以外的任意一監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí),將作為主動(dòng)監(jiān)控節(jié)點(diǎn)構(gòu)造針對(duì)于作為目標(biāo)監(jiān)控節(jié)點(diǎn)的該任意一監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,并發(fā)送給管理員節(jié)點(diǎn),并且,在接收到管理員節(jié)點(diǎn)發(fā)送的針對(duì)于作為目標(biāo)監(jiān)控節(jié)點(diǎn)的任意一監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);
[0102]所述管理員節(jié)點(diǎn)用于:接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,其中,所述主動(dòng)監(jiān)控節(jié)點(diǎn)為所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的任意一個(gè)監(jiān)控節(jié)點(diǎn),所述故障與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí)構(gòu)造并發(fā)送的;判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,向除所述主動(dòng)監(jiān)控節(jié)點(diǎn)和所述目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
[0103]舉例而言:如圖1所示的跨數(shù)據(jù)中心的監(jiān)控系統(tǒng),其包括管理員節(jié)點(diǎn)110以及能夠與所述管理員節(jié)點(diǎn)通信的且能夠相互通信的3個(gè)監(jiān)控節(jié)點(diǎn),其中,所述3個(gè)監(jiān)控節(jié)點(diǎn)中的任意兩個(gè)監(jiān)控節(jié)點(diǎn)120位于同一數(shù)據(jù)中心或不同的數(shù)據(jù)中心,每一監(jiān)控節(jié)點(diǎn)120負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn);在監(jiān)控過(guò)程中,如果任意一監(jiān)控節(jié)點(diǎn)120對(duì)自身外的任意一目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí),將通知管理員節(jié)點(diǎn)110進(jìn)行關(guān)于該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障的投票,而管理員節(jié)點(diǎn)110將詢問(wèn)這兩個(gè)監(jiān)控節(jié)點(diǎn)以外的監(jiān)控節(jié)點(diǎn),并基于所接收到的反饋結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障,進(jìn)而在判斷出該目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),指示所確定出的臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
[0104]更進(jìn)一步的,管理員節(jié)點(diǎn)還用于指示所述主動(dòng)監(jiān)控節(jié)點(diǎn)繼續(xù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,以及指示所述其他監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作;接收所述主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否投票請(qǐng)求,其中,所述恢復(fù)與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)時(shí)構(gòu)造并發(fā)送的;向所述其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述恢復(fù)與否詢問(wèn)請(qǐng)求后對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作,并將Ping操作結(jié)果作為恢復(fù)與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述恢復(fù)與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;基于所述恢復(fù)與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)恢復(fù)時(shí),指示該臨時(shí)監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)的臨時(shí)監(jiān)控操作。相應(yīng)的,任意一監(jiān)控節(jié)點(diǎn)作為主動(dòng)監(jiān)控節(jié)點(diǎn)時(shí),繼續(xù)對(duì)目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作的指示后,將響應(yīng)所接收到的指示,并且,在能夠Ping通該目標(biāo)監(jiān)控節(jié)點(diǎn)時(shí),向管理員節(jié)點(diǎn)發(fā)送針對(duì)于該監(jiān)控節(jié)點(diǎn)的恢復(fù)與否投票請(qǐng)求;任意一監(jiān)控節(jié)點(diǎn)作為除主動(dòng)監(jiān)控節(jié)點(diǎn)和目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)時(shí),在接收到管理員節(jié)點(diǎn)發(fā)送的停止對(duì)目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作的指示后,將響應(yīng)所接收到的指示,并且,如果接收到針對(duì)于該目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否詢問(wèn)請(qǐng)求,則對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作,并將ping操作結(jié)果作為恢復(fù)與否應(yīng)答結(jié)果反饋給該管理員節(jié)點(diǎn)。
[0105]本發(fā)明實(shí)施例中,設(shè)備節(jié)點(diǎn)由包括監(jiān)控節(jié)點(diǎn)和管理員節(jié)點(diǎn)的跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)進(jìn)行監(jiān)控,并且,各個(gè)監(jiān)控節(jié)點(diǎn)負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn),各個(gè)監(jiān)控節(jié)點(diǎn)能夠相互通信以及與管理員節(jié)點(diǎn)通信;在監(jiān)控過(guò)程中,如果任意一監(jiān)控節(jié)點(diǎn)對(duì)自身外的任意一目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí),將通知管理員節(jié)點(diǎn)進(jìn)行關(guān)于該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障的投票,而管理員節(jié)點(diǎn)將詢問(wèn)這兩個(gè)監(jiān)控節(jié)點(diǎn)以外的監(jiān)控節(jié)點(diǎn),并基于所接收到的反饋結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障,進(jìn)而在判斷出該目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),指示所確定出的臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作??梢?jiàn),通過(guò)利用本方案,可以兼顧監(jiān)控設(shè)備節(jié)點(diǎn)的準(zhǔn)確性和有效性。
[0106]基于上述所給出的跨數(shù)據(jù)中心的監(jiān)控系統(tǒng),下面對(duì)本發(fā)明實(shí)施例所提供的一種跨數(shù)據(jù)中心的監(jiān)控方法進(jìn)行介紹。
[0107]需要說(shuō)明的是,本發(fā)明實(shí)施例所提供的一種跨數(shù)據(jù)中心的監(jiān)控方法,應(yīng)用于跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的管理員節(jié)點(diǎn),其中,跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)還包括:能夠與管理員節(jié)點(diǎn)通信的且能夠相互通信的至少一個(gè)監(jiān)控節(jié)點(diǎn),其中,至少一個(gè)監(jiān)控節(jié)點(diǎn)中的任意兩個(gè)監(jiān)控節(jié)點(diǎn)位于同一數(shù)據(jù)中心或不同的數(shù)據(jù)中心,每一監(jiān)控節(jié)點(diǎn)負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn),并且,每一監(jiān)控節(jié)點(diǎn)定時(shí)對(duì)自身以外的監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作。
[0108]并且,設(shè)備節(jié)點(diǎn)可以為承載數(shù)據(jù)信息的待監(jiān)控的各類服務(wù)器,當(dāng)然并不局限于此;監(jiān)控節(jié)點(diǎn)可以為負(fù)責(zé)監(jiān)控設(shè)備節(jié)點(diǎn)的服務(wù)器設(shè)備,當(dāng)然并不局限與此;而管理員節(jié)點(diǎn)可以為負(fù)責(zé)監(jiān)控所有監(jiān)控節(jié)點(diǎn)的服務(wù)器設(shè)備,當(dāng)然并不局限與此。
[0109]如圖2所示,一種跨數(shù)據(jù)中心的監(jiān)控方法,可以包括:
[0110]S201,接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求;
[0111]其中,該主動(dòng)監(jiān)控節(jié)點(diǎn)為該跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的任意一個(gè)監(jiān)控節(jié)點(diǎn),該故障與否投票請(qǐng)求為該主動(dòng)監(jiān)控節(jié)點(diǎn)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí)構(gòu)造并發(fā)送的。舉例而言:該預(yù)設(shè)請(qǐng)求條件可以包括:連續(xù)預(yù)定次數(shù)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而無(wú)法ping通;或者,在預(yù)定時(shí)間段內(nèi)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而無(wú)法ping通。
[0112]需要強(qiáng)調(diào)的是,為了引用方便與清楚,將發(fā)送故障與否投票請(qǐng)求的節(jié)點(diǎn)稱為主動(dòng)監(jiān)控節(jié)點(diǎn),將故障與否投票請(qǐng)求所針對(duì)的監(jiān)控節(jié)點(diǎn)稱為目標(biāo)監(jiān)控節(jié);可以理解的是,該主動(dòng)監(jiān)控節(jié)點(diǎn)和目標(biāo)監(jiān)控節(jié)點(diǎn)可以為監(jiān)控系統(tǒng)中的任意兩個(gè)監(jiān)控節(jié)點(diǎn)。
[0113]S202,判斷故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,執(zhí)行S203 ;否則,不作處理;
[0114]在接收到故障與否投票請(qǐng)求后,管理員節(jié)點(diǎn)可以判斷故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,并根據(jù)不同的判斷結(jié)果執(zhí)行不同的操作。具體的,當(dāng)判斷出該故障與否投票請(qǐng)求滿足預(yù)設(shè)響應(yīng)條件,可以執(zhí)行S203 ;而當(dāng)判斷出該故障與否投票請(qǐng)求不滿足預(yù)設(shè)響應(yīng)條件時(shí),可以不作處理。
[0115]在一種具體實(shí)現(xiàn)方式中,預(yù)先為每個(gè)監(jiān)控節(jié)點(diǎn)設(shè)置一個(gè)能夠發(fā)送故障與否投票請(qǐng)求的主動(dòng)監(jiān)控節(jié)點(diǎn),其中,所設(shè)置的一個(gè)能夠發(fā)送故障與否投票請(qǐng)求的主動(dòng)監(jiān)控節(jié)點(diǎn)為從剩余的監(jiān)控節(jié)點(diǎn)中所選擇的;相應(yīng)的,所述判斷該故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,可以包括:
[0116]判斷該故障與否投票請(qǐng)求所對(duì)應(yīng)的發(fā)送節(jié)點(diǎn)是否為預(yù)先為該目標(biāo)監(jiān)控節(jié)點(diǎn)設(shè)置的監(jiān)控節(jié)點(diǎn),如果是,表明該故障與否投票請(qǐng)求滿足預(yù)設(shè)響應(yīng)條件。
[0117]在另一種具體實(shí)現(xiàn)方式中,該管理員節(jié)點(diǎn)記錄有各個(gè)監(jiān)控節(jié)點(diǎn)的當(dāng)前的運(yùn)行狀態(tài);相應(yīng)的,
[0118]所述判斷該故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,可以包括:
[0119]判斷該故障與否投票請(qǐng)求是否為在該目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的運(yùn)行狀態(tài)表明未故障時(shí)的第一個(gè)故障與否投票請(qǐng)求,如果是,表明該故障與否投票請(qǐng)求滿足預(yù)設(shè)響應(yīng)條件。
[0120]可見(jiàn),在另一種具體實(shí)現(xiàn)方式中,管理員節(jié)點(diǎn)僅僅響應(yīng)首次的針對(duì)于未故障的監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求。
[0121]需要強(qiáng)調(diào)的是,上述的所述判斷該故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件的具體實(shí)現(xiàn)方式僅僅作為示例,并不應(yīng)該構(gòu)成對(duì)本發(fā)明實(shí)施例的限定。
[0122]S203,向除該主動(dòng)監(jiān)控節(jié)點(diǎn)和該目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于該目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求;
[0123]其中,如果判斷出故障與否投票請(qǐng)求滿足預(yù)設(shè)響應(yīng)條件,則向除該主動(dòng)監(jiān)控節(jié)點(diǎn)和該目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于該目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求,以使得其他監(jiān)控節(jié)點(diǎn)在接收到該故障與否詢問(wèn)請(qǐng)求后,將對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給該管理員節(jié)點(diǎn)。
[0124]S204,接收其他監(jiān)控節(jié)點(diǎn)發(fā)送的該故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;
[0125]S205,基于故障與否應(yīng)答結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);
[0126]其中,在接收到其他監(jiān)控節(jié)點(diǎn)發(fā)送的該故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果后,可以基于故障與否應(yīng)答結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)。
[0127]在一種實(shí)現(xiàn)方式中,基于故障與否應(yīng)答結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài),可以包括:
[0128]設(shè)定目標(biāo)監(jiān)控節(jié)點(diǎn)的起始分?jǐn)?shù)為預(yù)定基準(zhǔn)分?jǐn)?shù);
[0129]對(duì)與該目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作;
[0130]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第一分?jǐn)?shù)值的操作,否則,對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第二分?jǐn)?shù)值的操作,其中,第一分?jǐn)?shù)值小于該第二分?jǐn)?shù)值;
[0131]對(duì)與該目標(biāo)監(jiān)控節(jié)點(diǎn)屬于不同數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作;
[0132]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第二分?jǐn)?shù)值的操作,否則,對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第一分?jǐn)?shù)值的操作;
[0133]在處理完畢所有的其他監(jiān)控節(jié)點(diǎn)后,如果該目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的分?jǐn)?shù)小于該預(yù)定基準(zhǔn)分?jǐn)?shù),確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
[0134]需要說(shuō)明的是,該預(yù)定基準(zhǔn)分?jǐn)?shù)可以根據(jù)實(shí)際情況進(jìn)行設(shè)定,例如:該預(yù)定基準(zhǔn)分?jǐn)?shù)可以為O分,也可以為100分。并且,對(duì)于與目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的任意一其他監(jiān)控節(jié)點(diǎn)而言,由于受到網(wǎng)絡(luò)環(huán)境因素的影響較小,如果該其他監(jiān)控節(jié)點(diǎn)無(wú)法Ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),表明該目標(biāo)監(jiān)控節(jié)點(diǎn)發(fā)生故障的可能性極大,因此,扣除的分值較大,而如果該其他監(jiān)控節(jié)點(diǎn)能夠Ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),增加的分值較??;同樣的,對(duì)于與目標(biāo)監(jiān)控節(jié)點(diǎn)屬于不同的數(shù)據(jù)中心的任意一其他監(jiān)控節(jié)點(diǎn)而言,由于受到網(wǎng)絡(luò)環(huán)境因素的影響較大,如果該其他監(jiān)控節(jié)點(diǎn)能夠Ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),表明該目標(biāo)監(jiān)控節(jié)點(diǎn)發(fā)生故障的可能性極小,因此,增加的分值較大,而如果該其他監(jiān)控節(jié)點(diǎn)無(wú)法Ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),則扣除的分值較小。
[0135]在另一種實(shí)現(xiàn)方式中,基于故障與否應(yīng)答結(jié)果,確定目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài),可以包括:
[0136]判斷表明未ping通該目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果的個(gè)數(shù)是否超過(guò)預(yù)設(shè)閾值,如果是,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
[0137]其中,該預(yù)設(shè)閾值可以根據(jù)實(shí)際情況設(shè)定,例如:該預(yù)設(shè)閾值可以為監(jiān)控節(jié)點(diǎn)總數(shù)的二分之一,也可以為監(jiān)控節(jié)點(diǎn)總數(shù)的四分之三,等等。
[0138]S206,當(dāng)該運(yùn)行狀態(tài)表明該目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定該目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0139]其中,當(dāng)該運(yùn)行狀態(tài)表明該目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),可以認(rèn)定該目標(biāo)監(jiān)控節(jié)點(diǎn)故障,此時(shí),可以確定該目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn),以通過(guò)該臨時(shí)監(jiān)控節(jié)點(diǎn)代替該目標(biāo)監(jiān)控節(jié)點(diǎn)來(lái)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的設(shè)備節(jié)點(diǎn)進(jìn)行監(jiān)控;當(dāng)然,當(dāng)該運(yùn)行狀態(tài)表明該目標(biāo)監(jiān)控節(jié)點(diǎn)非故障時(shí),可以認(rèn)定該目標(biāo)監(jiān)控節(jié)點(diǎn)非故障,此時(shí),可以結(jié)束本次流程。
[0140]具體的,所述確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn),可以包括:
[0141]將該主動(dòng)監(jiān)控節(jié)點(diǎn)確定為該目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0142]或者,
[0143]將其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為該目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0144]或者,
[0145]將與該目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為該目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn)。
[0146]需要強(qiáng)調(diào)的是,上述的確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn)具體實(shí)現(xiàn)僅僅作為示例,并不應(yīng)該構(gòu)成對(duì)本發(fā)明實(shí)施例的限定。
[0147]S207,指示該臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
[0148]可以理解的是,指示該臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作的具體實(shí)現(xiàn)可以采用現(xiàn)有技術(shù)。
[0149]本發(fā)明實(shí)施例中,設(shè)備節(jié)點(diǎn)由包括監(jiān)控節(jié)點(diǎn)和管理員節(jié)點(diǎn)的跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)進(jìn)行監(jiān)控,并且,各個(gè)監(jiān)控節(jié)點(diǎn)負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn),各個(gè)監(jiān)控節(jié)點(diǎn)能夠相互通信以及與管理員節(jié)點(diǎn)通信;在監(jiān)控過(guò)程中,如果任意一監(jiān)控節(jié)點(diǎn)對(duì)自身外的任意一目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí),將通知管理員節(jié)點(diǎn)進(jìn)行關(guān)于該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障的投票,而管理員節(jié)點(diǎn)將詢問(wèn)這兩個(gè)監(jiān)控節(jié)點(diǎn)以外的監(jiān)控節(jié)點(diǎn),并基于所接收到的反饋結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障,進(jìn)而在判斷出該目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),指示所確定出的臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作??梢?jiàn),通過(guò)利用本方案,可以兼顧監(jiān)控設(shè)備節(jié)點(diǎn)的準(zhǔn)確性和有效性。
[0150]更進(jìn)一步的,在S201-S207的基礎(chǔ)上,本發(fā)明另一實(shí)施例所提供一種跨數(shù)據(jù)中心的監(jiān)控方法,還可以包括:
[0151]S208,指示該主動(dòng)監(jiān)控節(jié)點(diǎn)繼續(xù)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,以及指示其他監(jiān)控節(jié)點(diǎn)停止對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作;
[0152]其中,指示該主動(dòng)監(jiān)控節(jié)點(diǎn)繼續(xù)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作的具體實(shí)現(xiàn)可以采用現(xiàn)有技術(shù),以及指示其他監(jiān)控節(jié)點(diǎn)停止對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作的具體實(shí)現(xiàn)可以采用現(xiàn)有技術(shù)。
[0153]S209,接收該主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于該目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否投票請(qǐng)求;
[0154]其中,該恢復(fù)與否投票請(qǐng)求為該主動(dòng)監(jiān)控節(jié)點(diǎn)ping通該目標(biāo)監(jiān)控節(jié)點(diǎn)時(shí)構(gòu)造并發(fā)送的。
[0155]S210,向其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于該目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否詢問(wèn)請(qǐng)求;
[0156]其中,其他監(jiān)控節(jié)點(diǎn)在接收到該恢復(fù)與否詢問(wèn)請(qǐng)求后對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,并將Ping操作結(jié)果作為恢復(fù)與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn)。
[0157]S211,接收其他監(jiān)控節(jié)點(diǎn)發(fā)送的該恢復(fù)與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;
[0158]S212,基于恢復(fù)與否應(yīng)答結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);
[0159]在一種實(shí)現(xiàn)方式中,基于恢復(fù)與否應(yīng)答結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài),可以包括:
[0160]設(shè)定目標(biāo)監(jiān)控節(jié)點(diǎn)的起始分?jǐn)?shù)為預(yù)定起始分?jǐn)?shù);
[0161]對(duì)與該目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作;
[0162]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第三分?jǐn)?shù)值的操作,否則,對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第四分?jǐn)?shù)值的操作,其中,第三分?jǐn)?shù)值小于該第四分?jǐn)?shù)值;
[0163]對(duì)與該目標(biāo)監(jiān)控節(jié)點(diǎn)屬于不同數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作;
[0164]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第四分?jǐn)?shù)值的操作,否則,對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第三分?jǐn)?shù)值的操作;
[0165]在處理完畢所有的其他監(jiān)控節(jié)點(diǎn)后,如果該目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的分?jǐn)?shù)小于該預(yù)定起始分?jǐn)?shù),確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為已恢復(fù)狀態(tài),否則,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為未恢復(fù)狀態(tài)。
[0166]需要說(shuō)明的是,該預(yù)定起始分?jǐn)?shù)可以根據(jù)實(shí)際情況進(jìn)行設(shè)定,例如:該預(yù)定起始分?jǐn)?shù)可以為O分,也可以為100分。并且,對(duì)于與目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的任意一其他監(jiān)控節(jié)點(diǎn)而言,由于受到網(wǎng)絡(luò)環(huán)境因素的影響較小,如果該其他監(jiān)控節(jié)點(diǎn)無(wú)法Ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),表明該目標(biāo)監(jiān)控節(jié)點(diǎn)未恢復(fù)的可能性極大,因此,扣除的分值較大,而如果該其他監(jiān)控節(jié)點(diǎn)能夠Ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),增加的分值較??;同樣的,對(duì)于與目標(biāo)監(jiān)控節(jié)點(diǎn)屬于不同的數(shù)據(jù)中心的任意一其他監(jiān)控節(jié)點(diǎn)而言,由于受到網(wǎng)絡(luò)環(huán)境因素的影響較大,如果該其他監(jiān)控節(jié)點(diǎn)能夠Ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),表明該目標(biāo)監(jiān)控節(jié)點(diǎn)已恢復(fù)的可能性極達(dá),因此,增加的分值較大,而如果該其他監(jiān)控節(jié)點(diǎn)無(wú)法Ping通該目標(biāo)監(jiān)控節(jié)點(diǎn),則扣除的分值較小。
[0167]在另一種實(shí)現(xiàn)方式中,基于恢復(fù)與否應(yīng)答結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài),可以包括:
[0168]判斷表明未ping通該目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否應(yīng)答結(jié)果的個(gè)數(shù)是否超過(guò)特定閾值,如果是,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為未恢復(fù)狀態(tài),否則,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為已恢復(fù)狀態(tài)。
[0169]其中,該特定閾值可以根據(jù)實(shí)際情況設(shè)定,例如:該特定閾值可以為監(jiān)控節(jié)點(diǎn)總數(shù)的二分之一,也可以為監(jiān)控節(jié)點(diǎn)總數(shù)的四分之三,等等。
[0170]S213,當(dāng)運(yùn)行狀態(tài)表明該目標(biāo)監(jiān)控節(jié)點(diǎn)恢復(fù)時(shí),指示該臨時(shí)監(jiān)控節(jié)點(diǎn)停止對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)的臨時(shí)監(jiān)控操作。
[0171]其中,當(dāng)運(yùn)行狀態(tài)表明該目標(biāo)監(jiān)控節(jié)點(diǎn)恢復(fù)時(shí),可以指示該臨時(shí)監(jiān)控節(jié)點(diǎn)停止對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)的臨時(shí)監(jiān)控操作,而由于目標(biāo)監(jiān)控節(jié)點(diǎn)已恢復(fù),該目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的設(shè)備節(jié)點(diǎn)可以由該目標(biāo)監(jiān)控節(jié)點(diǎn)繼續(xù)監(jiān)控。
[0172]本實(shí)施例中,可以兼顧監(jiān)控設(shè)備節(jié)點(diǎn)的準(zhǔn)確性和有效性;并且,在判斷出目標(biāo)監(jiān)控節(jié)點(diǎn)恢復(fù)時(shí),繼續(xù)由目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)自身的設(shè)備節(jié)點(diǎn)進(jìn)行監(jiān)控,進(jìn)一步有效保證了監(jiān)控設(shè)備節(jié)點(diǎn)的準(zhǔn)確性。
[0173]相應(yīng)于上述方法實(shí)施例,本發(fā)明實(shí)施例還提供了一種跨數(shù)據(jù)中心的監(jiān)控裝置,應(yīng)用于跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的管理員節(jié)點(diǎn),其中,所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)還包括:能夠與所述管理員節(jié)點(diǎn)通信的且能夠相互通信的至少一個(gè)監(jiān)控節(jié)點(diǎn),其中,所述至少一個(gè)監(jiān)控節(jié)點(diǎn)中的任意兩個(gè)監(jiān)控節(jié)點(diǎn)位于同一數(shù)據(jù)中心或不同的數(shù)據(jù)中心,每一監(jiān)控節(jié)點(diǎn)負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn),并且,每一監(jiān)控節(jié)點(diǎn)定時(shí)對(duì)自身以外的監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作;如圖4所示,所述裝置可以包括:
[0174]故障與否投票請(qǐng)求接收模塊410,用于接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,其中,所述主動(dòng)監(jiān)控節(jié)點(diǎn)為所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的任意一個(gè)監(jiān)控節(jié)點(diǎn),所述故障與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí)構(gòu)造并發(fā)送的;
[0175]判斷模塊420,用于判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,觸發(fā)故障與否詢問(wèn)請(qǐng)求發(fā)送模塊;
[0176]所述故障與否詢問(wèn)請(qǐng)求發(fā)送模塊430,用于向除所述主動(dòng)監(jiān)控節(jié)點(diǎn)和所述目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);
[0177]第一故障與否應(yīng)答結(jié)果接收模塊440,用于接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;
[0178]第一運(yùn)行狀態(tài)確定模塊450,用于基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);
[0179]臨時(shí)監(jiān)控節(jié)點(diǎn)確定模塊460,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0180]第一指示模塊470,用于指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
[0181]本發(fā)明實(shí)施例中,設(shè)備節(jié)點(diǎn)由包括監(jiān)控節(jié)點(diǎn)和管理員節(jié)點(diǎn)的跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)進(jìn)行監(jiān)控,并且,各個(gè)監(jiān)控節(jié)點(diǎn)負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn),各個(gè)監(jiān)控節(jié)點(diǎn)能夠相互通信以及與管理員節(jié)點(diǎn)通信;在監(jiān)控過(guò)程中,如果任意一監(jiān)控節(jié)點(diǎn)對(duì)自身外的任意一目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí),將通知管理員節(jié)點(diǎn)進(jìn)行關(guān)于該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障的投票,而管理員節(jié)點(diǎn)將詢問(wèn)這兩個(gè)監(jiān)控節(jié)點(diǎn)以外的監(jiān)控節(jié)點(diǎn),并基于所接收到的反饋結(jié)果,確定該目標(biāo)監(jiān)控節(jié)點(diǎn)是否故障,進(jìn)而在判斷出該目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),指示所確定出的臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)該目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作??梢?jiàn),通過(guò)利用本方案,可以兼顧監(jiān)控設(shè)備節(jié)點(diǎn)的準(zhǔn)確性和有效性。
[0182]更進(jìn)一步的,本發(fā)明實(shí)施例所提供的跨數(shù)據(jù)中心的監(jiān)控裝置,還可以包括:
[0183]指示模塊,用于指示所述主動(dòng)監(jiān)控節(jié)點(diǎn)繼續(xù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,以及指示所述其他監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作;
[0184]恢復(fù)與否投票請(qǐng)求接收模塊,用于接收所述主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否投票請(qǐng)求,其中,所述恢復(fù)與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)時(shí)構(gòu)造并發(fā)送的;
[0185]恢復(fù)與否詢問(wèn)請(qǐng)求發(fā)送模塊,用于向所述其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述恢復(fù)與否詢問(wèn)請(qǐng)求后對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作,并將Ping操作結(jié)果作為恢復(fù)與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);
[0186]第二故障與否應(yīng)答結(jié)果接收模塊,用于接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述恢復(fù)與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;
[0187]第二運(yùn)行狀態(tài)確定模塊,用于基于所述恢復(fù)與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);
[0188]第二指示模塊,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)恢復(fù)時(shí),指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)的臨時(shí)監(jiān)控操作。
[0189]具體的,所述預(yù)設(shè)請(qǐng)求條件可以包括:
[0190]連續(xù)預(yù)定次數(shù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而無(wú)法ping通;
[0191]或者,
[0192]在預(yù)定時(shí)間段內(nèi)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而無(wú)法ping通。
[0193]具體的,所述判斷模塊420,可以包括:
[0194]第一判斷單元,用于:
[0195]判斷所述故障與否投票請(qǐng)求所對(duì)應(yīng)的發(fā)送節(jié)點(diǎn)是否為預(yù)先為所述目標(biāo)監(jiān)控節(jié)點(diǎn)設(shè)置的監(jiān)控節(jié)點(diǎn),如果是,觸發(fā)故障與否詢問(wèn)請(qǐng)求發(fā)送模塊。
[0196]具體的,所述管理員節(jié)點(diǎn)記錄有各個(gè)監(jiān)控節(jié)點(diǎn)的當(dāng)前的運(yùn)行狀態(tài);
[0197]所述判斷模塊420,可以包括:
[0198]第二判斷單元,用于判斷所述故障與否投票請(qǐng)求是否為在所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的運(yùn)行狀態(tài)表明未故障時(shí)的第一個(gè)故障與否投票請(qǐng)求,如果是,觸發(fā)故障與否詢問(wèn)請(qǐng)求發(fā)送模塊。
[0199]具體的,第一運(yùn)行狀態(tài)確定模塊450,可以包括:
[0200]起始分?jǐn)?shù)設(shè)定單元,用于設(shè)定目標(biāo)監(jiān)控節(jié)點(diǎn)的起始分?jǐn)?shù)為預(yù)定基準(zhǔn)分?jǐn)?shù);
[0201]第一處理單元,用于對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作:
[0202]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第一分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第二分?jǐn)?shù)值的操作,其中,所述第一分?jǐn)?shù)值小于所述第二分?jǐn)?shù)值;
[0203]第二處理單元,用于對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于不同數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作:
[0204]如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第二分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第一分?jǐn)?shù)值的操作;
[0205]分?jǐn)?shù)處理單元,用于在處理完畢所有的其他監(jiān)控節(jié)點(diǎn)后,如果所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的分?jǐn)?shù)小于所述預(yù)定基準(zhǔn)分?jǐn)?shù),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
[0206]具體的,所述第一運(yùn)行狀態(tài)確定模塊450,可以包括:
[0207]個(gè)數(shù)處理單元,用于判斷表明未ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果的個(gè)數(shù)是否超過(guò)預(yù)設(shè)閾值,如果是,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
[0208]具體的,所述臨時(shí)監(jiān)控節(jié)點(diǎn)確定模塊460,可以包括:
[0209]第一臨時(shí)監(jiān)控節(jié)點(diǎn)確定單元,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),將所述主動(dòng)監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0210]或者,
[0211]第二臨時(shí)監(jiān)控節(jié)點(diǎn)確定單元,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),將所述其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);
[0212]或者,
[0213]第三臨時(shí)監(jiān)控節(jié)點(diǎn)確定單元,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),將與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn)。
[0214]對(duì)于系統(tǒng)或裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。
[0215]需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0216]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施方式中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,這里所稱得的存儲(chǔ)介質(zhì),如:R0M/RAM、磁碟、光盤等。
[0217]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種跨數(shù)據(jù)中心的監(jiān)控系統(tǒng),其特征在于,包括: 管理員節(jié)點(diǎn)以及能夠與所述管理員節(jié)點(diǎn)通信的且能夠相互通信的至少一個(gè)監(jiān)控節(jié)點(diǎn),其中,所述至少一個(gè)監(jiān)控節(jié)點(diǎn)中的任意兩個(gè)監(jiān)控節(jié)點(diǎn)位于同一數(shù)據(jù)中心或不同的數(shù)據(jù)中心,每一監(jiān)控節(jié)點(diǎn)負(fù)責(zé)監(jiān)控自身所在數(shù)據(jù)中心內(nèi)的設(shè)備節(jié)點(diǎn); 所述監(jiān)控節(jié)點(diǎn)用于:定時(shí)對(duì)自身以外的監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作,在對(duì)所述自身以外的任意一監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí),將作為主動(dòng)監(jiān)控節(jié)點(diǎn)構(gòu)造針對(duì)于作為目標(biāo)監(jiān)控節(jié)點(diǎn)的該任意一監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,并發(fā)送給管理員節(jié)點(diǎn),并且,在接收到管理員節(jié)點(diǎn)發(fā)送的針對(duì)于作為目標(biāo)監(jiān)控節(jié)點(diǎn)的任意一監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn); 所述管理員節(jié)點(diǎn)用于:接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,其中,所述主動(dòng)監(jiān)控節(jié)點(diǎn)為所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的任意一個(gè)監(jiān)控節(jié)點(diǎn),所述故障與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí)構(gòu)造并發(fā)送的;判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,向除所述主動(dòng)監(jiān)控節(jié)點(diǎn)和所述目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn);接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果;基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài);當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn);指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
2.一種跨數(shù)據(jù)中心的監(jiān)控方法,其特征在于,應(yīng)用于權(quán)利要求1所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)的管理員節(jié)點(diǎn);所述方法包括: 接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,其中,所述主動(dòng)監(jiān)控節(jié)點(diǎn)為所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的任意一個(gè)監(jiān)控節(jié)點(diǎn),所述故障與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí)構(gòu)造并發(fā)送的; 判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,向除所述主動(dòng)監(jiān)控節(jié)點(diǎn)和所述目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn); 接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果; 基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài); 當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn); 指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括: 指示所述主動(dòng)監(jiān)控節(jié)點(diǎn)繼續(xù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,以及指示所述其他監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作;接收所述主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否投票請(qǐng)求,其中,所述恢復(fù)與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)時(shí)構(gòu)造并發(fā)送的;向所述其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述恢復(fù)與否詢問(wèn)請(qǐng)求后對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作,并將Ping操作結(jié)果作為恢復(fù)與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn); 接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述恢復(fù)與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果; 基于所述恢復(fù)與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài); 當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)恢復(fù)時(shí),指示該臨時(shí)監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)的臨時(shí)監(jiān)控操作。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述預(yù)設(shè)請(qǐng)求條件包括: 連續(xù)預(yù)定次數(shù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而無(wú)法ping通; 或者, 在預(yù)定時(shí)間段內(nèi)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而無(wú)法ping通。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,包括: 判斷所述故障與否投票請(qǐng)求所對(duì)應(yīng)的發(fā)送節(jié)點(diǎn)是否為預(yù)先為所述目標(biāo)監(jiān)控節(jié)點(diǎn)設(shè)置的監(jiān)控節(jié)點(diǎn),如果是,表明所述故障與否投票請(qǐng)求滿足預(yù)設(shè)響應(yīng)條件。
6.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述管理員節(jié)點(diǎn)記錄有各個(gè)監(jiān)控節(jié)點(diǎn)的當(dāng)前的運(yùn)行狀態(tài); 所述判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,包括: 判斷所述故障與否投票請(qǐng)求是否為在所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的運(yùn)行狀態(tài)表明未故障時(shí)的第一個(gè)故障與否投票請(qǐng)求,如果是,表明所述故障與否投票請(qǐng)求滿足預(yù)設(shè)響應(yīng)條件。
7.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài),包括: 設(shè)定目標(biāo)監(jiān)控節(jié)點(diǎn)的起始分?jǐn)?shù)為預(yù)定基準(zhǔn)分?jǐn)?shù); 對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作: 如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第一分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第二分?jǐn)?shù)值的操作,其中,所述第一分?jǐn)?shù)值小于所述第二分?jǐn)?shù)值; 對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于不同數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作: 如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第二分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第一分?jǐn)?shù)值的操作; 并且,在處理完畢所有的其他監(jiān)控節(jié)點(diǎn)后,如果所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的分?jǐn)?shù)小于所述預(yù)定基準(zhǔn)分?jǐn)?shù),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
8.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài),包括: 判斷表明未Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果的個(gè)數(shù)是否超過(guò)預(yù)設(shè)閾值,如果是,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
9.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn),包括: 將所述主動(dòng)監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn); 或者, 將所述其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn); 或者, 將與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn)。
10.一種跨數(shù)據(jù)中心的監(jiān)控裝置,其特征在于,應(yīng)用于權(quán)利要求1所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的管理員節(jié)點(diǎn);所述裝置包括: 故障與否投票請(qǐng)求接收模塊,用于接收主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否投票請(qǐng)求,其中,所述主動(dòng)監(jiān)控節(jié)點(diǎn)為所述跨數(shù)據(jù)中心的監(jiān)控系統(tǒng)中的任意一個(gè)監(jiān)控節(jié)點(diǎn),所述故障與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而滿足預(yù)設(shè)請(qǐng)求條件時(shí)構(gòu)造并發(fā)送的; 判斷模塊,用于判斷所述故障與否投票請(qǐng)求是否滿足預(yù)設(shè)響應(yīng)條件,如果是,觸發(fā)故障與否詢問(wèn)請(qǐng)求發(fā)送模塊; 所述故障與否詢問(wèn)請(qǐng)求發(fā)送模塊,用于向除所述主動(dòng)監(jiān)控節(jié)點(diǎn)和所述目標(biāo)監(jiān)控節(jié)點(diǎn)以外的其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述故障與否詢問(wèn)請(qǐng)求后,將對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)的Ping操作結(jié)果作為故障與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn); 第一故障與否應(yīng)答結(jié)果接收模塊,用于接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述故障與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果; 第一運(yùn)行狀態(tài)確定模塊,用于基于所述故障與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài); 臨時(shí)監(jiān)控節(jié)點(diǎn)確定模塊,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)所對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn); 第一指示模塊,用于指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)執(zhí)行臨時(shí)監(jiān)控操作。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,還包括: 指示模塊,用于指示所述主動(dòng)監(jiān)控節(jié)點(diǎn)繼續(xù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作,以及指示所述其他監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作; 恢復(fù)與否投票請(qǐng)求接收模塊,用于接收所述主動(dòng)監(jiān)控節(jié)點(diǎn)發(fā)送的針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否投票請(qǐng)求,其中,所述恢復(fù)與否投票請(qǐng)求為所述主動(dòng)監(jiān)控節(jié)點(diǎn)Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)時(shí)構(gòu)造并發(fā)送的; 恢復(fù)與否詢問(wèn)請(qǐng)求發(fā)送模塊,用于向所述其他監(jiān)控節(jié)點(diǎn)發(fā)送針對(duì)于所述目標(biāo)監(jiān)控節(jié)點(diǎn)的恢復(fù)與否詢問(wèn)請(qǐng)求,以使得所述其他監(jiān)控節(jié)點(diǎn)在接收到所述恢復(fù)與否詢問(wèn)請(qǐng)求后對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作,并將ping操作結(jié)果作為恢復(fù)與否應(yīng)答結(jié)果反饋給所述管理員節(jié)點(diǎn); 第二故障與否應(yīng)答結(jié)果接收模塊,用于接收所述其他監(jiān)控節(jié)點(diǎn)發(fā)送的所述恢復(fù)與否詢問(wèn)請(qǐng)求對(duì)應(yīng)的故障與否應(yīng)答結(jié)果; 第二運(yùn)行狀態(tài)確定模塊,用于基于所述恢復(fù)與否應(yīng)答結(jié)果,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài); 第二指示模塊,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)恢復(fù)時(shí),指示所述臨時(shí)監(jiān)控節(jié)點(diǎn)停止對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)所監(jiān)控的設(shè)備節(jié)點(diǎn)的臨時(shí)監(jiān)控操作。
12.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述預(yù)設(shè)請(qǐng)求條件包括: 連續(xù)預(yù)定次數(shù)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行ping操作而無(wú)法ping通; 或者, 在預(yù)定時(shí)間段內(nèi)對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行Ping操作而無(wú)法ping通。
13.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述判斷模塊,包括: 第一判斷單元,用于: 判斷所述故障與否投票請(qǐng)求所對(duì)應(yīng)的發(fā)送節(jié)點(diǎn)是否為預(yù)先為所述目標(biāo)監(jiān)控節(jié)點(diǎn)設(shè)置的監(jiān)控節(jié)點(diǎn),如果是,觸發(fā)故障與否詢問(wèn)請(qǐng)求發(fā)送模塊。
14.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述管理員節(jié)點(diǎn)記錄有各個(gè)監(jiān)控節(jié)點(diǎn)的當(dāng)前的運(yùn)行狀態(tài); 所述判斷模塊,包括: 第二判斷單元,用于判斷所述故障與否投票請(qǐng)求是否為在所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的運(yùn)行狀態(tài)表明未故障時(shí)的第一個(gè)故障與否投票請(qǐng)求,如果是,觸發(fā)故障與否詢問(wèn)請(qǐng)求發(fā)送模塊。
15.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,第一運(yùn)行狀態(tài)確定模塊,包括: 起始分?jǐn)?shù)設(shè)定單元,用于設(shè)定目標(biāo)監(jiān)控節(jié)點(diǎn)的起始分?jǐn)?shù)為預(yù)定基準(zhǔn)分?jǐn)?shù); 第一處理單元,用于對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作: 如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第一分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第二分?jǐn)?shù)值的操作,其中,所述第一分?jǐn)?shù)值小于所述第二分?jǐn)?shù)值; 第二處理單元,用于對(duì)與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于不同數(shù)據(jù)中心的每一其他監(jiān)控節(jié)點(diǎn)執(zhí)行如下操作: 如果當(dāng)前監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果表明其Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn),則對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行加第二分?jǐn)?shù)值的操作,否則,對(duì)所述目標(biāo)監(jiān)控節(jié)點(diǎn)執(zhí)行減第一分?jǐn)?shù)值的操作; 分?jǐn)?shù)處理單元,用于在處理完畢所有的其他監(jiān)控節(jié)點(diǎn)后,如果所述目標(biāo)監(jiān)控節(jié)點(diǎn)當(dāng)前的分?jǐn)?shù)小于所述預(yù)定基準(zhǔn)分?jǐn)?shù),確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
16.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述第一運(yùn)行狀態(tài)確定模塊,包括: 個(gè)數(shù)處理單元,用于判斷表明未Ping通所述目標(biāo)監(jiān)控節(jié)點(diǎn)的故障與否應(yīng)答結(jié)果的個(gè)數(shù)是否超過(guò)預(yù)設(shè)閾值,如果是,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為故障狀態(tài),否則,確定所述目標(biāo)監(jiān)控節(jié)點(diǎn)的運(yùn)行狀態(tài)為非故障狀態(tài)。
17.根據(jù)權(quán)利要求10或11所述的裝置,其特征在于,所述臨時(shí)監(jiān)控節(jié)點(diǎn)確定模塊,包括: 第一臨時(shí)監(jiān)控節(jié)點(diǎn)確定單元,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),將所述主動(dòng)監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn); 或者, 第二臨時(shí)監(jiān)控節(jié)點(diǎn)確定單元,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),將所述其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn); 或者, 第三臨時(shí)監(jiān)控節(jié)點(diǎn)確定單元,用于當(dāng)所述運(yùn)行狀態(tài)表明所述目標(biāo)監(jiān)控節(jié)點(diǎn)故障時(shí),將與所述目標(biāo)監(jiān)控節(jié)點(diǎn)屬于同一數(shù)據(jù)中心的其他監(jiān)控節(jié)點(diǎn)中設(shè)備節(jié)點(diǎn)負(fù)載最少的監(jiān)控節(jié)點(diǎn)確定為所述目標(biāo)監(jiān)控節(jié)點(diǎn)對(duì)應(yīng)的臨時(shí)監(jiān)控節(jié)點(diǎn)。
【文檔編號(hào)】H04L12/24GK104394033SQ201410693552
【公開(kāi)日】2015年3月4日 申請(qǐng)日期:2014年11月26日 優(yōu)先權(quán)日:2014年11月26日
【發(fā)明者】葉煒晨 申請(qǐng)人:北京奇藝世紀(jì)科技有限公司