專利名稱:一種告警排序方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)管理領(lǐng)域,特別涉及一種告警排序方法和裝置。
背景技術(shù):
在網(wǎng)絡(luò)管理領(lǐng)域,故障管理是一個非常重要的部分,網(wǎng)絡(luò)管理員的日常主要工作就是密切關(guān)注網(wǎng)絡(luò)基礎(chǔ)設(shè)施中出現(xiàn)的故障,并及時進(jìn)行分析和處理。故障管理的過程一般如下網(wǎng)絡(luò)設(shè)備發(fā)現(xiàn)自身出現(xiàn)故障或者疑似故障,通過網(wǎng)絡(luò)向網(wǎng)絡(luò)管理系統(tǒng)發(fā)送故障告警,網(wǎng)絡(luò)管理系統(tǒng)接收和解析之后提示網(wǎng)絡(luò)管理員告警詳細(xì)信息,網(wǎng)絡(luò)管理員查看并分析告警詳細(xì)信息后,然后對故障進(jìn)行分析和處理,直至故障恢復(fù)。一般網(wǎng)絡(luò)管理系統(tǒng)在接收到告警信息后,會直接呈現(xiàn)給網(wǎng)絡(luò)管理員,網(wǎng)絡(luò)管理員需要一個一個的查看并分析告警詳細(xì)信息,在網(wǎng)絡(luò)比較小,告警信息比較少的情況下,這種做法可以滿足日常網(wǎng)絡(luò)管理的需要,但是當(dāng)網(wǎng)絡(luò)規(guī)模逐漸變大,告警信息日漸增多的時候, 網(wǎng)絡(luò)管理員顯然無法保證及時的處理完所有告警信息,這個時候一般的網(wǎng)絡(luò)管理系統(tǒng)提供了根據(jù)網(wǎng)絡(luò)故障優(yōu)先級排序的功能,這種功能一般是根據(jù)網(wǎng)絡(luò)設(shè)備發(fā)送的告警信息中的告警級別進(jìn)行排序,這種排序方法可以讓網(wǎng)絡(luò)管理員優(yōu)先分析和處理級別高的告警,從而提高告警的處理效率。但是這種排序方式在實際應(yīng)用過程中是存在問題的,如這種排序方法無法區(qū)分網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)線路對業(yè)務(wù)影響的嚴(yán)重程度,而網(wǎng)絡(luò)中的設(shè)備和線路其實是存在主和備、重要和不重要的差異的,如果不加以區(qū)別,網(wǎng)絡(luò)管理員就需要人工的去區(qū)分哪些告警是需要馬上處理的,哪些是不需要的。這種不加區(qū)別的排序方式會導(dǎo)致網(wǎng)絡(luò)管理員處理告警的效率降低,且影響重要業(yè)務(wù)的總體可用性水平。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種告警排序方法和裝置,能夠提高告警處理效率,及重要業(yè)務(wù)的總體可用性水平。為解決上述技術(shù)問題,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的一種告警排序方法,預(yù)先為網(wǎng)絡(luò)中各告警源設(shè)置告警源重要級別并保存,所述方法包括接收告警源因檢測到網(wǎng)絡(luò)故障或疑似故障而發(fā)送的告警,分析所述告警并獲取所述告警的告警源和告警級別;根據(jù)所述獲取的告警源查找到預(yù)先設(shè)置的對應(yīng)告警源重要級別;通過所述查找到的告警源重要級別和所述獲取的告警級別確定告警排序因子,并根據(jù)該告警排序因子確定該告警在未處理的告警中的排序位置。一種告警排序裝置,所述裝置包括配置單元、接收單元、獲取單元、查找單元和確定單元;所述配置單元,用于為網(wǎng)絡(luò)中各告警源設(shè)置告警源重要級別并保存;
所述接收單元,用于接收告警源因檢測到網(wǎng)絡(luò)故障或疑似故障而發(fā)送的告警;所述獲取單元,用于分析所述接收單元接收的告警并獲取該告警的告警源和告警級別;所述查找單元,用于根據(jù)所述獲取單元獲取的告警源在所述配置單元中查找到預(yù)先設(shè)置的對應(yīng)告警源重要級別;所述確定單元,用于通過所述查找單元查找到的告警源重要級別和所述獲取單元獲取的告警級別確定告警排序因子,并根據(jù)該告警排序因子確定該告警在未處理的告警中的排序位置。綜上所述,本發(fā)明中網(wǎng)絡(luò)管理系統(tǒng)利用預(yù)先設(shè)置的告警源重要級別結(jié)合告警級別確定告警排序因子,根據(jù)確定的告警排序因子確定該告警在未處理的告警中排序位置,能夠提高告警處理效率,及重要業(yè)務(wù)的總體可用性水平。
圖1為本發(fā)明實施例中告警排序方法流程示意圖;圖2為告警排序裝置結(jié)構(gòu)示意圖。
具體實施例方式為使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下參照附圖并舉實施例,對本發(fā)明所述方案作進(jìn)一步地詳細(xì)說明。參見圖1,圖1為本發(fā)明實施例中告警排序方法流程示意圖。具體步驟為步驟101,網(wǎng)絡(luò)管理系統(tǒng)為網(wǎng)絡(luò)中各告警源設(shè)置告警源重要級別并保存。本步驟中,告警源表示哪個網(wǎng)絡(luò)設(shè)備、接口發(fā)出的告警;告警源重要級別設(shè)置為一個數(shù)值,級別越高表示對業(yè)務(wù)的影響的重要程度越高。告警源級別一般設(shè)置為整數(shù),為了達(dá)到微調(diào)的效果也可以設(shè)置為實數(shù),如5. 2等。步驟102,網(wǎng)絡(luò)管理系統(tǒng)接收告警源因檢測到網(wǎng)絡(luò)故障或疑似故障而發(fā)送的告警, 分析該告警并獲取該告警的告警源和告警級別。本步驟中告警源檢測到網(wǎng)絡(luò)故障或疑似故障,如設(shè)備接口 DOWN或者設(shè)備CPU利用率長時間高位運(yùn)行等。告警源將這些信息放入告警中,并通過網(wǎng)絡(luò)向網(wǎng)絡(luò)管理系統(tǒng)上報,上報告警的網(wǎng)絡(luò)協(xié)議可以為SYSLOG或者SNMP通知等標(biāo)準(zhǔn)告警,也可以為自定義的私有協(xié)議。步驟103,網(wǎng)絡(luò)管理系統(tǒng)根據(jù)獲取的告警源查找到保存的對應(yīng)告警源重要級別。步驟104,網(wǎng)絡(luò)管理系統(tǒng)通過查找到的告警源重要級別和獲取的告警級別確定告警排序因子,并根據(jù)該告警排序因子確定該告警在未處理的告警中的排序位置。本步驟中新收到的告警根據(jù)自身的告警排序因子,確定在未處理的告警中的排序位置,將該告警插入到排序告警中合適的位置。步驟101中為告警源預(yù)先設(shè)置告警源重要級別的方法為根據(jù)對業(yè)務(wù)影響的程度,和/或網(wǎng)絡(luò)管理員職責(zé)的不同為告警源預(yù)先設(shè)置告警源重要級別。由于實際環(huán)境中,網(wǎng)絡(luò)管理員分工不同,導(dǎo)致各自需要重點關(guān)注的告警是不一樣的,針對這種情況,網(wǎng)絡(luò)管理系統(tǒng)可以為每個網(wǎng)絡(luò)管理員獨立設(shè)置告警源對應(yīng)的告警源重要級別,這樣告警在呈現(xiàn)給不同的網(wǎng)絡(luò)管理員時可以使用各自對應(yīng)的告警源重要級別來計算告警排序因子,而從獲得個性化的排序結(jié)果。在具體實現(xiàn)中,有些標(biāo)準(zhǔn)中告警級別越小表示重要性越高。若確定告警源的告警級別越小表示重要性越高,則按預(yù)設(shè)規(guī)則將該告警級別進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換為告警級別越大表示重要性越高的相應(yīng)值。若各告警源在表示告警級別和重要性的標(biāo)準(zhǔn)不同時,在確定告警排序因子之前統(tǒng)一為告警級別越大重要性越高,告警級別轉(zhuǎn)換的規(guī)則由網(wǎng)絡(luò)管理系統(tǒng)預(yù)先設(shè)定,也可以根據(jù)實際情況進(jìn)行修改。因此為告警源預(yù)先設(shè)置告警源重要級別,還根據(jù)網(wǎng)絡(luò)管理員職責(zé)的不同進(jìn)行設(shè)置。網(wǎng)絡(luò)管理系統(tǒng)接收到告警,從告警信息中解析出告警源和告警級別,針對無法直接解析出告警源或者告警級別的告警,則通過告警中包含的某些信息進(jìn)行推斷并獲取到所需告警源和告警級別。網(wǎng)絡(luò)管理系統(tǒng)可以通過告警中包含的某些信息進(jìn)行推斷并獲取到所需的信息。通過查找到的告警源重要級別和獲取的告警級別確定告警排序因子的方法為告警排序因子為告警源重要級別與告警級別的乘積;或,告警排序因子為告警源重要級別與告警級別分別加權(quán)后求和。其中,對告警源重要級別與告警級別加權(quán)可以根據(jù)實際應(yīng)用情況確定誰起到的影響更大,則所加權(quán)值就大一些。下面結(jié)合具體實施例,詳細(xì)介紹本發(fā)明告警排序方法的實施過程。本實施例中告警源為網(wǎng)絡(luò)設(shè)備A在以太接口 0上報告警。網(wǎng)絡(luò)設(shè)備A檢測到其以太接口 0狀態(tài)變?yōu)镈OWN。網(wǎng)絡(luò)設(shè)備將這此信息加入告警M 中,該告警以Syslog協(xié)議封裝,并通過網(wǎng)絡(luò)向網(wǎng)絡(luò)管理系統(tǒng)上報,告警內(nèi)容如下<59>0ct 4 10:34:15 128.255.1.1 PPPmp/vl/Router/MP1700Interface_ downThe interface ‘ 1‘ ^fastethernetO' changed status to down網(wǎng)絡(luò)管理系統(tǒng)接收到告警M,由于告警采用Syslog協(xié)議封裝,因此其格式是固定。 從標(biāo)準(zhǔn)的Syslog Header部分就可以解析其告警級別為3,而告警源為128. 255. 1. 1,由于 Syslog標(biāo)準(zhǔn)中定義的告警級別總共為8級,且越小表示越重要,因此需要將告警級別3進(jìn)行轉(zhuǎn)換,假設(shè)網(wǎng)絡(luò)管理系統(tǒng)中的告警級別定義為100級,則轉(zhuǎn)換結(jié)果為(8-3) X 100/8 = 62. 5。網(wǎng)絡(luò)管理系統(tǒng)根據(jù)獲得的告警源128. 255. 1. 1,查詢出之前準(zhǔn)備過程中保存的告警源重要級別,這里假設(shè)預(yù)先對告警源128. 255. 1. 1設(shè)置的告警源重要級別為5。網(wǎng)絡(luò)管理系統(tǒng)根據(jù)告警源重要級別和告警級別信息計算該告警對應(yīng)的告警排序因子,其計算結(jié)果為告警排序因子=5X62. 5 = 312. 5。網(wǎng)絡(luò)管理系統(tǒng)根據(jù)告警排序因子將該告警插入到現(xiàn)有告警列表中,并呈現(xiàn)給網(wǎng)絡(luò)
管理員?;谕瑯拥陌l(fā)明構(gòu)思,本發(fā)明還提出一種告警排序裝置。參見圖2,圖2為告警排序裝置結(jié)構(gòu)示意圖。該裝置包括配置單元201、接收單元202、獲取單元203、查找單元204 和確定單元205。配置單元201,用于為網(wǎng)絡(luò)中各告警源設(shè)置告警源重要級別并保存。
接收單元202,用于接收告警源因檢測到網(wǎng)絡(luò)故障或疑似故障而發(fā)送的告警。獲取單元203,用于分析接收單元202接收的告警并獲取該告警的告警源和告警級別。查找單元204,用于根據(jù)獲取單元203獲取的告警源在配置單元201中查找到預(yù)先設(shè)置的對應(yīng)告警源重要級別。確定單元205,用于通過查找單元204查找到的告警源重要級別和獲取單元203獲取的告警級別確定告警排序因子,并根據(jù)該告警排序因子確定該告警在未處理的告警中的排序位置。較佳地,該裝置進(jìn)一步包括轉(zhuǎn)換單元206配置單元設(shè)置的告警源重要級別越大表示重要性越高。轉(zhuǎn)換單元206,用于若告警源的告警級別越小表示重要性越高,則按預(yù)設(shè)規(guī)則將獲取單元203獲取的告警級別進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換為告警級別越大表示重要性越高的相應(yīng)值,并替換獲取單元203獲取的告警級別。較佳地,配置單元201,用于根據(jù)對業(yè)務(wù)影響的程度,和/或,網(wǎng)絡(luò)管理員職責(zé)的不同為告警源預(yù)先設(shè)置告警源重要級別。較佳地,獲取單元203,用于從接收單元202接收的告警中解析出告警源和告警級別;或,通過接收單元202接收的告警中包含的信息進(jìn)行推斷并獲取告警源和告警級別。較佳地,確定單元205,用于確定告警排序因子為告警源重要級別與告警級別的乘積;或,告警排序因子為告警源重要級別與告警級別分別加權(quán)后求和。上述實施例的單元可以集成于一體,也可以分離部署;可以合并為一個單元,也可以進(jìn)一步拆分成多個子單元。綜上所述,本發(fā)明具體實施例中網(wǎng)絡(luò)管理系統(tǒng)利用預(yù)先設(shè)置的告警源重要級別結(jié)合告警級別確定告警排序因子,并對未處理的告警進(jìn)行排序,從而將網(wǎng)絡(luò)中影響重要業(yè)務(wù)的告警源的告警優(yōu)先呈現(xiàn)給網(wǎng)絡(luò)管理員,讓網(wǎng)絡(luò)管理員能夠優(yōu)先關(guān)注并處理這些告警,能夠提高告警處理效率,及重要業(yè)務(wù)的總體可用性水平。以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種告警排序方法,其特征在于,預(yù)先為網(wǎng)絡(luò)中各告警源設(shè)置告警源重要級別并保存,所述方法包括接收告警源因檢測到網(wǎng)絡(luò)故障或疑似故障而發(fā)送的告警,分析所述告警并獲取所述告警的告警源和告警級別;根據(jù)所述獲取的告警源查找到預(yù)先設(shè)置的對應(yīng)告警源重要級別; 通過所述查找到的告警源重要級別和所述獲取的告警級別確定告警排序因子,并根據(jù)該告警排序因子確定該告警在未處理的告警中的排序位置。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述預(yù)設(shè)的告警源重要級別越大表示重要性越高; 所述獲取告警級別之后,所述方法進(jìn)一步包括若確定所述告警源的告警級別越小表示重要性越高,則按預(yù)設(shè)規(guī)則將該告警級別進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換為告警級別越大表示重要性越高的相應(yīng)值。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述為告警源預(yù)先設(shè)置告警源重要級別的方法為根據(jù)對業(yè)務(wù)影響的程度,和/或,網(wǎng)絡(luò)管理員職責(zé)的不同為告警源預(yù)先設(shè)置告警源重要級別。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述告警的告警源和告警級別的方法為從所述告警中解析出告警源和告警級別;或,通過所述告警中包含的信息進(jìn)行推斷并獲取告警源和告警級別。
5.根據(jù)權(quán)利要求1-4任意一項所述的方法,其特征在于,所述通過所述查找到的告警源重要級別和所述獲取的告警級別確定告警排序因子的方法為告警排序因子為告警源重要級別與告警級別的乘積; 或,告警排序因子為告警源重要級別與告警級別分別加權(quán)后求和。
6.一種告警排序裝置,其特征在于,所述裝置包括配置單元、接收單元、獲取單元、查找單元和確定單元;所述配置單元,用于為網(wǎng)絡(luò)中各告警源設(shè)置告警源重要級別并保存; 所述接收單元,用于接收告警源因檢測到網(wǎng)絡(luò)故障或疑似故障而發(fā)送的告警; 所述獲取單元,用于分析所述接收單元接收的告警并獲取該告警的告警源和告警級別;所述查找單元,用于根據(jù)所述獲取單元獲取的告警源在所述配置單元中查找到預(yù)先設(shè)置的對應(yīng)告警源重要級別;所述確定單元,用于通過所述查找單元查找到的告警源重要級別和所述獲取單元獲取的告警級別確定告警排序因子,并根據(jù)該告警排序因子確定該告警在未處理的告警中的排序位置。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置進(jìn)一步包括轉(zhuǎn)換單元; 所述配置單元設(shè)置的告警源重要級別越大表示重要性越高;所述轉(zhuǎn)換單元,用于若所述告警源的告警級別越小表示重要性越高,則按預(yù)設(shè)規(guī)則將該告警級別進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換為告警級別越大表示重要性越高的相應(yīng)值,并替換所述獲取單元獲取的告警級別。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述配置單元,用于根據(jù)對業(yè)務(wù)影響的程度,和/或,網(wǎng)絡(luò)管理員職責(zé)的不同為告警源預(yù)先設(shè)置告警源重要級別。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述獲取單元,用于從所述接收單元接收的告警中解析出告警源和告警級別; 或,通過所述接收單元接收的告警中包含的信息進(jìn)行推斷并獲取告警源和告警級別。
10.根據(jù)權(quán)利要求6-9任意一項所述的裝置,其特征在于,所述確定單元,用于確定告警排序因子為告警源重要級別與告警級別的乘積; 或,告警排序因子為告警源重要級別與告警級別分別加權(quán)后求和。
全文摘要
本發(fā)明公開了一種告警排序方法,預(yù)先為網(wǎng)絡(luò)中各告警源設(shè)置告警源重要級別并保存,該方法包括接收告警源因檢測到網(wǎng)絡(luò)故障或疑似故障而發(fā)送的告警,分析該告警并獲取該告警的告警源和告警級別;根據(jù)獲取的告警源查找到預(yù)先設(shè)置的對應(yīng)告警源重要級別;通過查找到的告警源重要級別和獲取的告警級別確定告警排序因子,并根據(jù)該告警排序因子確定該告警在未處理的告警中的排序位置。基于同樣的發(fā)明構(gòu)思,本發(fā)明還提出一種告警排序裝置,能夠提高告警處理效率,及重要業(yè)務(wù)的總體可用性水平。
文檔編號H04L12/24GK102333002SQ20111034649
公開日2012年1月25日 申請日期2011年11月4日 優(yōu)先權(quán)日2011年11月4日
發(fā)明者吳飛 申請人:邁普通信技術(shù)股份有限公司