實現(xiàn)it運維中變更引起發(fā)的告警處理方法及告警處理系統(tǒng)的制作方法
【技術(shù)領域】
[0001]本發(fā)明涉及IT運維管理技術(shù),特別是涉及一種對告警信息進行過濾、處理的IT運維管理技術(shù)。
【背景技術(shù)】
[0002]對IT運維生產(chǎn)運行過程中產(chǎn)生的告警信息進行采集、處理是不間斷運行的信息交換系統(tǒng)運維工作中的一項重要工作。
[0003]IT運維過程中會對變更進行登記和管理,以控制變更的時間、操作人等。而對變更中可能引發(fā)的告警一般會需在監(jiān)控系統(tǒng)中手工設置進行過濾,每次變更操作都需要進行設置操作,要么是提前設置好時間,在某個時間點的告警都屏蔽掉,要么在變更時間窗口內(nèi)手工開啟過濾或者關閉。
[0004]另外,變更相關信息需要在流程平臺登記,還需要在監(jiān)控系統(tǒng)中設置。對于提前設置時間進行過濾的方案,可能會在變更真正開始前錯誤地屏蔽掉本應該報出來的告警,如果變更期間出現(xiàn)變更預期外的異常告警,而又因為屏蔽過濾導致被忽略,將錯失及時發(fā)現(xiàn)系統(tǒng)隱患的機會,是不間斷運行的信息交換系統(tǒng)運維工作中的大忌。
[0005]對于在變更窗口內(nèi)手動設置開啟關閉過濾的方法,由于每個變更都需要操作員手工錄入,不具可復制性,占用人力資源較大,且手工錄入操作的誤操作的可能性較大,容易因操作員的錄入疏忽導致過濾偏差。
[0006]
【發(fā)明內(nèi)容】
[0007]鑒于上述問題,本發(fā)明旨在提供一種能夠準確過濾預期內(nèi)產(chǎn)生的告警的告警處理方法以及告警處理系統(tǒng)。
[0008]本發(fā)明的實現(xiàn)IT運維中變更引發(fā)的告警處理方法,其特征在于,包括下述步驟: 告警配置項設置步驟,在監(jiān)控平臺中對每條告警設置配置項;
關聯(lián)影響配置項求取步驟,在流程平臺的變更流程中,對每個工單設置變更配置項,并且根據(jù)每個工單的實施內(nèi)容對所述變更配置項的關聯(lián)影響,求取每個工單的關聯(lián)影響配置項;
變更預期告警標識步驟,在變更過程中從流程平臺將所述關聯(lián)影響配置項同步到所述監(jiān)控平臺,在監(jiān)控平臺標識所述關聯(lián)影響配置項為變更影響配置項并且將標識有所述變更影響配置項的告警作為變更預期告警;
變更預期告警判斷步驟,當告警發(fā)生時判斷該告警是否為變更預期告警,如果是變更預期告警的話,則對該告警做規(guī)定處理,如果不是變更預期告警的話,則對該告警做正常告警處理。
[0009]優(yōu)選地,在所述告警配置項設置步驟中,告警與配置項為一對一的單射關系。
[0010]優(yōu)選地,所述關聯(lián)影響配置項求取步驟包括下述子步驟:
在流程平臺的變更流程中對每個工單設置變更配置項,其中配置項與工單為一對一單身寸關系;
對每個工單的工單開始和結(jié)束時間進行定義;
根據(jù)所述工單的工單開始和結(jié)束時間,求取與每個工單的變更配置關聯(lián)的影響并作為關聯(lián)影響配置項。
[0011]優(yōu)選地,所述變更預期告警標識步驟包括下述子步驟:
在變更過程中每個工單開始時從流程平臺通過服務器將所述關聯(lián)影響配置項同步到所述監(jiān)控平臺;
監(jiān)控平臺標識所述關聯(lián)影響配置項為變更影響配置項;
將所述標識為變更影響配置項的告警都作為變更預期告警并獨立保存在變更告警表。
[0012]優(yōu)選地,所述變更預期告警判斷步驟包括下述子步驟:
當告警發(fā)生時判斷該告警的配置項與所述變更影響配置項是否為一致;
如果兩者一致,則判斷該告警為變更預期告警,對該告警做規(guī)定處理,如果兩者不一致,則判斷該告警不是變更預期告警,對該告警做正常告警處理。
[0013]優(yōu)選地,在所述變更預期告警標識步驟和所述變更預期告警判斷步驟之間還包括:
優(yōu)化變更關聯(lián)配置步驟,在變更結(jié)束后檢查告警所關聯(lián)的配置項在本次變更中是否實際發(fā)出了預期告警以優(yōu)化變更關聯(lián)配置項的準確性。
[0014]本發(fā)明的實現(xiàn)IT運維中變更引發(fā)的告警處理系統(tǒng),其特征在于,包括:
流程平臺,用于在變更流程中對每個工單設置變更配置項,并且根據(jù)每個工單的實施內(nèi)容對所述變更配置項的關聯(lián)影響求取每個工單的關聯(lián)影響配置項;以及
監(jiān)控平臺,用于對每一個條告警設置配置項,在變更過程中根據(jù)將從所述流程平臺同步過來的所述關聯(lián)影響配置項標識為變更影響配置項并且將標識有所述變更影響配置項的告警作為變更預期告警,當告警發(fā)生時判斷該告警是否為變更預期告警,如果是變更預期告警的話,則對該告警做規(guī)定處理,如果不是變更預期告警的話,則對該告警做正常告警處理。
[0015]優(yōu)選地,所述流程平臺在變更流程中對每個工單設置一對一單射關系的變更配置項,對每個工單的工單開始和結(jié)束時間進行定義,根據(jù)所述工單的工單開始和結(jié)束時間,求取與每個工單的變更配置關聯(lián)的影響并作為關聯(lián)影響配置項。
[0016]優(yōu)選地,所述監(jiān)控平臺用于在告警發(fā)生時判斷該告警的配置項與所述變更影響配置項是否為一致,如果兩者一致,則判斷該告警為變更預期告警,對該告警做規(guī)定處理,如果兩者不一致,則判斷該告警不是變更預期告警,對該告警做正常告警處理。
[0017]優(yōu)選地,所述監(jiān)控平臺還用于在變更結(jié)束后檢查告警所關聯(lián)的配置項在本次變更中是否實際發(fā)出了預期告警以優(yōu)化變更關聯(lián)配置項的準確性。
[0018]本發(fā)明的實現(xiàn)IT運維中變更引發(fā)的告警處理方法以及告警處理系統(tǒng)打破了目前現(xiàn)有IT運維中過程中流程平臺與監(jiān)控平臺獨立運行的模式,取代了傳統(tǒng)變更預期告警在監(jiān)控系統(tǒng)中手工設置的方法,避免了重復勞動和可能出現(xiàn)的人為操作失誤。通過在實施變更時自動同步工單ID及關聯(lián)的配置項至監(jiān)控平臺,只對執(zhí)行的變更關聯(lián)的配置項對應的告警進行特殊標記,把變更影響的時間和范圍與實際變更操作達到較高水平的一致,能夠有效過濾預期內(nèi)產(chǎn)生的告警。
[0019]
【附圖說明】
[0020]圖1是本發(fā)明的實現(xiàn)IT運維中變更引發(fā)的告警處理方法的示意圖。
[0021]_
【具體實施方式】
[0022]下面介紹的是本發(fā)明的多個實施例中的一些,旨在提供對本發(fā)明的基本了解。并不旨在確認本發(fā)明的關鍵或決定性的要素或限定所要保護的范圍。
[0023]在不間斷運行的信息交換系統(tǒng)運維工作中存在計劃內(nèi)版本變更和維護工作,會觸發(fā)預期內(nèi)可接受的系統(tǒng)告警。監(jiān)控平臺需要從告警本身分辨是否為預期告警,避免預期告警對正常的系統(tǒng)監(jiān)控造成影響。本發(fā)明通過在IT運維管理系統(tǒng)中配置一定的條件規(guī)則,識別出每一條系統(tǒng)告警所屬配置項信息,當告警發(fā)生時判斷其配置項信息與預期所關聯(lián)的配置項信息是否相符,對預期內(nèi)告警進行特殊處理,避免對系統(tǒng)的正常監(jiān)控造成影響。
[0024]本發(fā)明的實現(xiàn)IT運維中變更引發(fā)的告警處理方法包括下述步驟:
告警配置項設置步驟,在監(jiān)控平臺中對每條告警設置配置項;
關聯(lián)影響配置項求取步驟,在流程平臺的變更流程中,對每個工單設置變更配置項,并且根據(jù)每個工單的實施內(nèi)容對所述變更配置項的關聯(lián)影響,求取每個工單的關聯(lián)影響配置項;
變更預期告警標識步驟,在變更過程中從流程平臺將所述關聯(lián)影響配置項同步到所述監(jiān)控平臺,在監(jiān)控平臺標識所述關聯(lián)影響配置項為變更影響配置項并且將標識有所述變更影響配置項的告警都作為變更預期告警;
優(yōu)化變更關聯(lián)配置步驟,在變更結(jié)束后檢查告警所關聯(lián)的配置項在本次變更中是否實際發(fā)出了預期告警以優(yōu)化變更關聯(lián)配置項的準確性;
變更預期告警判斷步驟,當告警發(fā)生時判斷該告警是否為變更預期告警,如果是變更預期告警的話,則對該告警做規(guī)定處理,如果不是變更預期告警的話,則對該告警做正常告警處理。
[0025]其中,優(yōu)化變更關聯(lián)配置步驟是優(yōu)選步驟,它的設置可以為下一次變更的配置項關聯(lián)關系進行優(yōu)化總結(jié)。
[0026]圖1是本發(fā)明的實現(xiàn)IT運維中變更引發(fā)的告警處理方法的示意圖。
[0027]下面參照圖1對于本發(fā)明的實現(xiàn)IT運維中變更引發(fā)的告警處理方法中的各步驟進行具體說明。
[0028]( I)告警配置項設置步驟
在IT運維管理系統(tǒng)的監(jiān)控平臺中設置配置項匹配規(guī)則,對生產(chǎn)運營中的每一條告警識別其配置項,告警與配置項為一對一的單射關系。
[0029]具體地,一般原始告警是不具備配置項信息的,如圖1所示,通過“配置項豐富規(guī)貝1J”即通過制定匹配條件,對滿足條件的告警補充其配置項信息。也就是說,在本發(fā)明中,是通過“配置項豐富規(guī)則”來豐富告警中的配置項信息,以配置項信息為主鍵銜接流程平臺與監(jiān)控平臺。這樣,在圖1中對告警A、告警B、告警C分別設置了配置項,而且告警A、告警B、告警C與其配置項的關系是一對一的單射關系。
[0030](2)關聯(lián)影響配置項求取步驟
在IT運維管理系統(tǒng)的流程平臺中對信息交換系統(tǒng)中的各運行實體建立專屬配置項。配置項與運行實體為一對一的單射關系。在圖1中對工單A、工單B、工單C分別設置配置項。而且,流程平臺的變更流程中增加實施工單與影響配置項的關聯(lián),對每個工單的實施內(nèi)容對配置項影響范圍、即工單的開始和結(jié)束實施時間進行明確定義。
[0031]根據(jù)CMDB (Configurat1n Management DataBase)的配置相關系樹關聯(lián)出可能間接影響的其他配置項,最終得出變更的每個工單影響的一組關聯(lián)影響配置項。在CMDB關系型數(shù)據(jù)庫中存儲了信息交換系統(tǒng)中各配置項信息,包括配置項類型、版本號、合同號、維護記錄、所屬地域、管理員等信息。其中有一項關鍵屬性“關聯(lián)關系”記錄了與該配置項為直接關系的其他配置項ID。理論上可通過單一配置項發(fā)散出全交換系統(tǒng)的整個配置項拓撲。但在變更管理中,為了防止配置項關聯(lián)的范圍無限蔓延,在變更工單構(gòu)建工作中,先定義了此工單操作的直接配置項,然后通過關聯(lián)關系獲取到直接配置項的關聯(lián)配置項,作為間接配置項供評估是否受影響。最終評估確定的一組直接配置項和間接配置項的集合為本工單的關聯(lián)影響配置項。
[0032](3)變更預期告警標識步驟
在實際變更過程中,每個工單開始時會從流程平臺通過服務器同步該工單的關聯(lián)影響配置項至監(jiān)控系統(tǒng)直到工單結(jié)