亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

告警風暴處理方法以及告警風暴處理系統(tǒng)的制作方法

文檔序號:8433588閱讀:1046來源:國知局
告警風暴處理方法以及告警風暴處理系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)管理技術(shù),特別是涉及一種對告警信息進行過濾、處理的網(wǎng)絡(luò)管理技術(shù)。
【背景技術(shù)】
[0002]對網(wǎng)絡(luò)產(chǎn)生的告警信息進行采集、處理是網(wǎng)絡(luò)中的網(wǎng)絡(luò)管理系統(tǒng)的一項重要工作。在正常情況下,網(wǎng)絡(luò)單位時間內(nèi)產(chǎn)生的告警信息數(shù)量不會很多,但是,當網(wǎng)絡(luò)的規(guī)模較大且發(fā)生了某些特定的故障時,網(wǎng)絡(luò)有可能在短時間內(nèi)產(chǎn)生大量的告警信息并上報給網(wǎng)絡(luò)中的網(wǎng)管系統(tǒng),這種短時間內(nèi)大量告警信息的上報被稱為告警風暴。
[0003]告警風暴會帶來許多負面的影響。例如,受到網(wǎng)管系統(tǒng)處理速度的限值,上報給網(wǎng)管系統(tǒng)的告警信息可能無法被及時接收和處理,從而導(dǎo)致告警信息的丟失?;蛘?,告警風暴往往意味著網(wǎng)絡(luò)存在嚴重的故障,這時需要通過網(wǎng)管系統(tǒng)對網(wǎng)絡(luò)下發(fā)相關(guān)指令用于故障檢測、修復(fù)或隔離,此時的網(wǎng)管系統(tǒng)正忙于處理上報的告警信息,往往不能及時下發(fā)相關(guān)指令或影響網(wǎng)絡(luò)發(fā)送的操作請求,而這些相關(guān)指令和操作請求得不到執(zhí)行的后果是告警風暴持續(xù)的時間會更長,從而形成惡性循環(huán)。
[0004]因此,如何抵御告警風暴帶來的負面影響也是網(wǎng)管系統(tǒng)中的一項重要技術(shù)。作為抵御告警風暴的方法,現(xiàn)有技術(shù)中大多數(shù)系統(tǒng)都會對告警信息進行集中收集及展現(xiàn),通過收集應(yīng)用的告警信息,可以及時監(jiān)控應(yīng)用的運行狀態(tài),當應(yīng)用系統(tǒng)發(fā)生異常時,做出及時的應(yīng)對措施。
[0005]目前大多數(shù)系統(tǒng)的告警收集端對非預(yù)期性告警都是采用黑名單的方式,這種方式屬于事后處理方式,即收到非預(yù)期性告警信息后,再將該告警信息加入數(shù)據(jù)庫的黑名單表中。這種黑名單式的處理方式,隨著系統(tǒng)的運行,黑名單的記錄個數(shù)也會逐漸增加,對黑名單表的搜索也會越來越慢。另外,當某些應(yīng)用出現(xiàn)異常,發(fā)生告警風暴的時候,對告警收集端的性能壓力極大,可能導(dǎo)致告警收集端丟棄其他正常應(yīng)用的告警信息,系統(tǒng)運維人員也無法在海量的告警信息中找到需要關(guān)注的信息。
[0006]

【發(fā)明內(nèi)容】

[0007]鑒于上述問題,本發(fā)明旨在提供一種能夠避免對報錯收集端造成較大壓力且能夠使得運維人員的注意力更加集中到關(guān)鍵告警信息上的告警風暴的處理系統(tǒng)以及告警風暴的處理方法。
[0008]本發(fā)明的告警風暴處理系統(tǒng),其特征在于,具備:
告警接收模塊,用于接收應(yīng)用系統(tǒng)發(fā)送來的告警信息;
告警過濾模塊,接收來自上述告警接收模塊的告警信息,對每個應(yīng)用系統(tǒng)分別設(shè)置告警緩沖區(qū),根據(jù)告警信息判斷是否轉(zhuǎn)發(fā)給下述的告警展示模塊;
告警轉(zhuǎn)發(fā)模塊,每隔規(guī)定期間檢查上述告警過濾模塊的告警緩沖區(qū)將符合規(guī)定條件的告警信息轉(zhuǎn)發(fā)給下述告警展示模塊;
告警展示模塊,用于將來自上述告警過濾模塊和告警轉(zhuǎn)發(fā)模塊的告警信息以可讀的方式展示在終端上。
[0009]優(yōu)選地,所述告警過濾模塊針對每個應(yīng)用系統(tǒng)分別設(shè)置告警緩沖區(qū)以使得各告警緩沖區(qū)包括告警計數(shù)、展現(xiàn)標志、告警時間、HASH值。
[0010]優(yōu)選地,所述告警過濾模塊對于收到的每條告警信息,根據(jù)收到的告警信息中的關(guān)鍵域生成對應(yīng)的HASH值,并根據(jù)HASH值檢查告警緩沖區(qū)中是否存在該告警信息。
[0011]優(yōu)選地,所述告警過濾模塊在判斷收到的告警信息未存在于告警緩沖區(qū)的情況下,將該告警信息插入告警緩沖區(qū)并且將該告警信息轉(zhuǎn)發(fā)給上述告警展現(xiàn)模塊;所述告警過濾模塊在判斷收到的告警信息存在于告警緩沖區(qū)的情況下,對應(yīng)的告警計數(shù)加I并且修改告警時間為當前時間,并且,當該告警信息對應(yīng)的告警計數(shù)小于等于規(guī)定閾值的情況下則將該告警信息轉(zhuǎn)發(fā)給上述告警展現(xiàn)模塊而當該告警信息對應(yīng)的告警計數(shù)大于該規(guī)定閾值的情況下則不將該告警信息轉(zhuǎn)發(fā)給上述告警展現(xiàn)模塊且將上述展現(xiàn)標志修改為“否”,其中,上述展現(xiàn)標志默認“是”。
[0012]優(yōu)選地,所述告警轉(zhuǎn)發(fā)模塊每隔規(guī)定期間檢查上述告警過濾模塊的告警緩沖區(qū),將上述展現(xiàn)標志為“否”的告警信息轉(zhuǎn)發(fā)給上述告警展示模塊并且將該展現(xiàn)標志重新設(shè)置為“是”且將告警計數(shù)重置為O。
[0013]優(yōu)選地,所述告警過濾模塊在某個應(yīng)用系統(tǒng)的告警緩沖區(qū)全部占用的情況下將最早被插入告警信息且該告警信息對應(yīng)的計數(shù)最小的告警緩沖區(qū)作為替換告警緩沖區(qū)并且將新收到的告警信息寫入該替換告警緩沖區(qū)。
[0014]本發(fā)明的告警風暴處理方法,其特征在于,包括下述步驟:
告警接收步驟,接收應(yīng)用系統(tǒng)發(fā)送來的告警信息;
告警過濾步驟,按照每個應(yīng)用系統(tǒng)分別設(shè)置告警緩沖區(qū),對接收到的上述告警信息,根據(jù)告警信息判斷是否進行告警信息的展示;
告警展示步驟,根據(jù)告警過濾步驟的判斷結(jié)果,將需要進行展示的告警信息以可讀的方式展示在終端上。
[0015]優(yōu)選地,告警轉(zhuǎn)發(fā)步驟,每隔規(guī)定期間檢查上述告警緩沖區(qū)中是否存在符合規(guī)定條件的告警信息需要進行告警信息的展示。
[0016]優(yōu)選地,在上述告警展示步驟中,根據(jù)告警過濾步驟以及/或者告警轉(zhuǎn)發(fā)步驟的判斷結(jié)果,將需要進行展示的告警信息以可讀的方式展示在終端上。
[0017]優(yōu)選地,在上述告警過濾步驟中,針對每個應(yīng)用系統(tǒng)分別設(shè)置告警緩沖區(qū)以使得各告警緩沖區(qū)包括告警計數(shù)、展現(xiàn)標志、告警時間、HASH值。
[0018]優(yōu)選地,在所述告警過濾步驟中,對于收到的每條告警信息,根據(jù)收到的告警信息中的關(guān)鍵域生成對應(yīng)的HASH值,并根據(jù)HASH值檢查告警緩沖區(qū)中是否存在該告警信息。
[0019]優(yōu)選地,在所述告警過濾步驟中,在判斷收到的告警信息未存在于告警緩沖區(qū)的情況下,將該告警信息插入告警緩沖區(qū)并且判斷需要展現(xiàn)該告警信息;在所述告警過濾步驟中,在判斷收到的告警信息存在于告警緩沖區(qū)的情況下,對應(yīng)的告警計數(shù)加I并且修改告警時間為當前時間,并且,當該告警信息對應(yīng)的告警計數(shù)小于等于規(guī)定閾值的情況下則判斷需要展現(xiàn)該告警信息而當該告警信息對應(yīng)的告警計數(shù)大于該規(guī)定閾值的情況下則判斷不需要展現(xiàn)該告警信息且將上述展現(xiàn)標志修改為“否”,其中,上述展現(xiàn)標志默認“是”。
[0020]優(yōu)選地,在告警轉(zhuǎn)發(fā)步驟中,每隔規(guī)定期間檢查上述告警緩沖區(qū),將上述展現(xiàn)標志為“否”的告警信息轉(zhuǎn)發(fā)給上述告警展示模塊并且將該展現(xiàn)標志重新設(shè)置為“是”且將告警計數(shù)重置為O。
[0021]在本發(fā)明的告警風暴處理系統(tǒng)中,借助于告警過濾模塊和告警轉(zhuǎn)發(fā)模塊,能夠?qū)?yīng)用系統(tǒng)的告警信息按照告警次數(shù)進行合并分類,當一條或者若干條告警信息在短時間內(nèi)重復(fù)報錯時,告警展現(xiàn)模塊也只會每隔規(guī)定時間收到一條合并后的告警信息,這樣既能夠保證告警收集端不會因為短時間內(nèi)告警信息過多而丟棄告警信息,也能夠使得運維人員的注意力更加集中于關(guān)鍵的告警信息上。
[0022]因此,本發(fā)明的告警風暴處理系統(tǒng)以及告警風暴處理方法具有如下優(yōu)點:相比于黑名單的方式,本發(fā)明的處理方法屬于事前和事中處理方式,可以避免對報錯收集端造成較大的性能壓力,另外也可以使運維監(jiān)控人員的注意力集中于關(guān)鍵的告警信息上;使用本發(fā)明的處理方法不依賴于數(shù)據(jù)庫,隨著系統(tǒng)的運行,報錯收集端的性能也不會下降。
[0023]
【附圖說明】
[0024]圖1是本發(fā)明的告警風暴處理系統(tǒng)的結(jié)構(gòu)框圖。
[0025]圖2是本發(fā)明的告警風暴處理系統(tǒng)中告警過濾模塊中設(shè)置的告警信息緩沖區(qū)的示意圖。
[0026]圖3是表示本發(fā)明的告警風暴處理方法的流程圖。
【具體實施方式】
[0027]下面介紹的是本發(fā)明的多個實施例中的一些,旨在提供對本發(fā)明的基本了解。并不旨在確認本發(fā)明的關(guān)鍵或決定性的要素或限定所要保護的范圍。
[0028]圖1是本發(fā)明的告警風暴處理系統(tǒng)的結(jié)構(gòu)框圖。
[0029]下面參照圖1對于本發(fā)明的告警風暴處理系統(tǒng)進行說明。如圖1所示,本發(fā)明的告警風暴處理系統(tǒng)包括告警接收模塊100、告警過濾模塊200、告警信息轉(zhuǎn)發(fā)模塊300、告警信息展現(xiàn)模塊400。
[0030]具體地,告警接收模塊100通過網(wǎng)絡(luò)從各個應(yīng)用系統(tǒng)(圖1中例如為應(yīng)用系統(tǒng)I?應(yīng)用系統(tǒng)3)接收告警信息。
[0031]告警過濾模塊200接收來自告警接收模塊100的告警信息,對每個應(yīng)用系統(tǒng)I?3分別設(shè)置告警緩沖區(qū)I?3,通過對告警信息進行判斷來確定是否將告警信息轉(zhuǎn)發(fā)到告警信息展現(xiàn)模塊400。
[0032]圖2是本發(fā)明的告警風暴處理系統(tǒng)中告警過濾模塊中設(shè)置的告警信息緩沖區(qū)的示意圖。在圖2中表示了設(shè)置了 N個告警緩沖區(qū)的情況。如圖2所示,對于每個告警緩沖區(qū),至少設(shè)置下述項目:告警計數(shù)、展現(xiàn)標志、告警時間、HASH值。
[0033]其中,告警計數(shù)是累計的告警信息收到的次數(shù)。
[0034]展現(xiàn)標志是用于表示是否需要發(fā)送到告警展現(xiàn)模塊400對告警信息進行展現(xiàn)。即,若展現(xiàn)標志設(shè)置為“是”(例如可以設(shè)置為“I”)的情況下,則需要發(fā)送到告警展現(xiàn)模塊400由其在終端上對告警信息進行展現(xiàn),若展現(xiàn)標志設(shè)置為“否”(例如可以設(shè)置為“O”)的情況下,則不需要發(fā)送到告警展現(xiàn)模塊400由其在終端上對告警信息進行展現(xiàn)。在本發(fā)明中,展現(xiàn)標志默認設(shè)置為“是”。
[0035]告警時間是指收到告警信息的時間。HASH值是根據(jù)告警信息中的關(guān)鍵域生成的HASH值,這里利用HASH值來分辨是哪種類型的告警信息。
[0036]具體地,告警過濾模塊200首先判斷接收到的告警信息是否存在圖2所示的告警緩沖區(qū)中,在判斷收到的告警信息未存在于告警緩沖區(qū)的情況下,將該告警信息插入告警緩沖區(qū)并且將該告警信息轉(zhuǎn)發(fā)給告警展現(xiàn)模塊300 ;告警過濾模塊200在判斷收到的告警信息已存在于告警緩沖區(qū)的情況下,對應(yīng)的告警計數(shù)加I并且修改告警時間為當前時間,并且,當該告警信息對應(yīng)的告警計數(shù)小于等于規(guī)定閾值的情況下則將該告警信息轉(zhuǎn)發(fā)給告警展現(xiàn)模塊400而當該告警信息對應(yīng)的告警計數(shù)大于該規(guī)定閾值的情況下則不將該告警信息轉(zhuǎn)發(fā)給告警展現(xiàn)模塊400且
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1