專利名稱:一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng)及事件監(jiān)控方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體地,涉及一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng)及事件監(jiān)控方法。
背景技術(shù):
對于復雜環(huán)境下的計算機網(wǎng)絡(luò)系統(tǒng),其物理架構(gòu)以及邏輯結(jié)構(gòu)相當復雜,當其中組件出現(xiàn)問題時,問題就會很難定位,為此計算機網(wǎng)絡(luò)系統(tǒng)中引入了事件監(jiān)控系統(tǒng),當組件出現(xiàn)問題時,事件監(jiān)控系統(tǒng)會產(chǎn)生一個故障事件的報警信息,以便系統(tǒng)維護人員可以根據(jù)該報警信息進行故障排查,以解決問題而使計算機網(wǎng)絡(luò)系統(tǒng)盡快恢復正常的運轉(zhuǎn)。目前常見的計算機網(wǎng)絡(luò)系統(tǒng)中,針對不同的廠商或者應(yīng)用組件,各種事件的發(fā)生邏輯各不相同,事件監(jiān)控系統(tǒng)就要遵循不同的邏輯去定義不同事件的相關(guān)信息,從而在處理不同事件的相關(guān)信息時,事件監(jiān)控系統(tǒng)所采用的處理邏輯也相應(yīng)不同;例如操作系統(tǒng)報警、數(shù)據(jù)庫報警、中間件報警等,各有一百個字段,而這些字段各不相同,為了維護這些報警事件,至少需要三類數(shù)據(jù)庫表來保存不同的故障事件信息,因此就會就存在如下問題:首先,由于這些故障事件信息的字段中,并不是所有字段都是有意義的,可能對系統(tǒng)維護人員來說只是關(guān)注其中的某些字段,所以對這些冗余字段的存儲,加大了數(shù)據(jù)庫本身的存儲成本;其次,由于這三類數(shù)據(jù)庫表的字段結(jié)構(gòu)各不相同,系統(tǒng)進行不同事件查詢的時候,至少需要三類SQL語句,這樣無形中增加了系統(tǒng)的查詢成本;再次,由于此類故障事件信息一般來說比較專業(yè),所以對于維護人員的要求較高,需要維護人員理解不同系統(tǒng)故障事件信息的含義,這也增加了維護的成本。此外,目前的計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng)對事件進行處理時,采用的是將不同故障事件信息集中進行歸集處理的方式,即對于不同內(nèi)容,不同格式的監(jiān)控事件,都統(tǒng)一上送到服務(wù)器端進行處理,這樣對于不同類型的故障事件,需要有不同處理邏輯,從而增加了程序的二次開發(fā)量,同時,由于處理邏輯不同,所以增加了故障事件解析的復雜性,從而降低了系統(tǒng)的效率和吞吐量。
發(fā)明內(nèi)容
本發(fā)明實施例的主要目的在于提供一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng)及事件監(jiān)控方法,以解決現(xiàn)有計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng)對不同的故障事件采用不同的處理邏輯,而導致監(jiān)控處理過程復雜,效率低下、軟件開發(fā)難度高、維護成本高等缺陷。為了實現(xiàn)上述目的,本發(fā)明實施例提供一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng),所述事件監(jiān)控系統(tǒng)包括:事件模型生成裝置、事件采集裝置、事件適配裝置、執(zhí)行處理裝置和事件存儲裝直;所述事件模型生成裝置,連接所述事件適配裝置,用于根據(jù)計算機網(wǎng)絡(luò)系統(tǒng)中的各種故障事件類型生成對應(yīng)的事件模型,并將所述事件模型發(fā)送給所述事件適配裝置;所述事件采集裝置,連接所述事件適配裝置,用于采集原始故障事件信息,并將所述原始故障事件信息發(fā)送給所述事件適配裝置;
所述事件適配裝置,連接所述執(zhí)行處理裝置,用于接收并存儲所述事件模型,當接收到原始故障事件信息時,根據(jù)所述原始故障事件信息所屬的故障事件類型確定對應(yīng)的事件模型,根據(jù)該確定的事件模型對所述原始故障事件信息進行歸集處理,得到歸集處理后事件信息,將所述歸集處理后事件信息發(fā)送給所述執(zhí)行處理裝置;其中,所述歸集處理后事件信息符合預(yù)設(shè)的統(tǒng)一標準格式;所述執(zhí)行處理裝置,連接所述事件存儲裝置,用于接收所述歸集處理后事件信息并對其進行處理,然后將處理結(jié)果發(fā)送給所述事件存儲裝置;所述事件存儲裝置,用于存儲所述處理結(jié)果。一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控方法,所述事件監(jiān)控方法包括:采集原始故障事件信息;根據(jù)所述原始故障事件信息所屬的故障事件類型確定對應(yīng)的事件模型;其中,所述事件模型為預(yù)先生成的,并且所述事件模型與計算機網(wǎng)絡(luò)系統(tǒng)中的各種故障事件類型相對應(yīng);根據(jù)所述確定的事件模型對所述原始故障事件信息進行歸集處理,得到歸集處理后事件信息;其中,所述歸集處理后事件信息符合預(yù)設(shè)的統(tǒng)一標準格式;對所述歸集處理后事件信息進行處理,得到處理結(jié)果;存儲所述處理結(jié)果。借助于上述技術(shù)方案,本發(fā)明根據(jù)計算機網(wǎng)絡(luò)系統(tǒng)中不同的故障事件類型生成相應(yīng)的事件模型,并根據(jù)事件模型對原始故障事件信息進行歸集處理,由于歸集處理后事件信息具有統(tǒng)一的標準格式,因此針對不同的故障事件,事件監(jiān)控系統(tǒng)都可以采用統(tǒng)一的處理邏輯進行監(jiān)控處理,相比于現(xiàn)有技術(shù),本發(fā)明簡化了監(jiān)控處理過程,減少了事件監(jiān)控系統(tǒng)的開發(fā)工作量,提高了事件監(jiān)控效率,降低了系統(tǒng)維護成本。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實施例一提供的計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖;圖2是本發(fā)明實施例一提供的事件模型生成裝置結(jié)構(gòu)示意圖;圖3是本發(fā)明實施例一提供的采用XML Schema定義的通用事件模型要素示意圖;圖4是本發(fā)明實施例一提供的另一種事件模型生成裝置結(jié)構(gòu)示意圖;圖5是本發(fā)明實施例一提供的事件存儲裝置結(jié)構(gòu)示意圖;圖6是本發(fā)明實施例一提供的另一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖;圖7是本發(fā)明實施例二提供的計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖;圖8是本發(fā)明實施例三提供的計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控方法流程示意圖;圖9是本發(fā)明實施例四提供的計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控方法流程示意圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。實施例一本實施例提供一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng),如圖1所示,該事件監(jiān)控系統(tǒng)包括:事件模型生成裝置11、事件采集裝置12、事件適配裝置13、執(zhí)行處理裝置14和事件存儲裝置15 ;所述事件模型生成裝置11,連接所述事件適配裝置13,用于根據(jù)計算機網(wǎng)絡(luò)系統(tǒng)中的各種故障事件類型生成對應(yīng)的事件模型,并將所述事件模型發(fā)送給所述事件適配裝置13 ;所述事件采集裝置12,連接所述事件適配裝置13,用于采集原始故障事件信息,并將所述原始故障事件信息發(fā)送給所述事件適配裝置13 ;所述事件適配裝置13,連接所述執(zhí)行處理裝置14,用于接收并存儲所述事件模型,當接收到原始故障事件信息時,根據(jù)所述原始故障事件信息所屬的故障事件類型確定對應(yīng)的事件模型,根據(jù)該確定的事件模型對所述原始故障事件信息進行歸集處理,得到歸集處理后事件信息,將所述歸集處理后事件信息發(fā)送給所述執(zhí)行處理裝置14 ;其中,所述歸集處理后事件信息符合預(yù)設(shè)的統(tǒng)一標準格式;所述執(zhí)行處理裝置14,連接所述事件存儲裝置15,用于接收所述歸集處理后事件信息并對其進行處理,然后將處理結(jié)果發(fā)送給所述事件存儲裝置15 ;所述事件存儲裝置15,用于存儲所述處理結(jié)果。具體的,由于在計算機網(wǎng)絡(luò)系統(tǒng)中,不同故障事件類型所對應(yīng)的原始故障事件信息的邏輯不同,例如描述不同故障事件信息的字段結(jié)構(gòu)不同,為了能夠簡化事件監(jiān)控系統(tǒng)的處理邏輯,本實施例中,事件模型生成裝置11根據(jù)計算機網(wǎng)絡(luò)系統(tǒng)中各種故障事件類型的特點生成相應(yīng)的事件模型,該事件模型的作用是總結(jié)歸納相應(yīng)故障事件類型對應(yīng)的原始故障事件信息的邏輯特征(如字段結(jié)構(gòu)特征),以使事件適配裝置13可根據(jù)相應(yīng)的事件模型對原始故障事件信息進行解析及歸集處理,得到符合統(tǒng)一標準格式的歸集處理后事件信息,進一步的,執(zhí)行處理裝置14就可以采用統(tǒng)一的處理邏輯對具有統(tǒng)一標準格式的歸集處理后事件信息進行監(jiān)控處理,從而簡化了事件監(jiān)控處理過程,減少了事件監(jiān)控系統(tǒng)的開發(fā)工作量,提高了事件監(jiān)控效率,降低了系統(tǒng)維護成本。本實施例中,歸集處理后事件信息所符合的統(tǒng)一標準格式是預(yù)先設(shè)定的,并且本實施例對其不作具體限定,可根據(jù)應(yīng)用本事件監(jiān)控系統(tǒng)的計算機網(wǎng)絡(luò)系統(tǒng)的實際需要,確定合適的統(tǒng)一標準格式。優(yōu)選的,如圖2所示,本實施例中,事件模型生成裝置11具體可包括:故障類型處理器111、事件模型處理器112、事件模型發(fā)送器113 ;所述故障類型處理器111,連接所述事件模型處理器112,用于確定所述計算機網(wǎng)絡(luò)系統(tǒng)中的各種故障事件類型,并將所述各種故障事件類型發(fā)送給所述事件模型處理器112 ;
所述事件模型處理器112,連接所述事件模型發(fā)送器113,用于接收所述各種故障事件類型,根據(jù)預(yù)設(shè)的通用事件模型要素對所述各種故障事件類型進行解析,根據(jù)所述解析的結(jié)果生成所述各種故障事件類型對應(yīng)的事件模型,將所述生成的事件模型發(fā)送給所述事件模型發(fā)送器113;所述事件模型發(fā)送器113,連接所述事件適配裝置13,用于將所述事件模型發(fā)送給所述事件適配裝置13。具體的,本實施例中,事件模型處理器112所采用的通用事件模型要素是預(yù)先設(shè)定的,其設(shè)定原則是:對計算機網(wǎng)絡(luò)系統(tǒng)中的各種故障事件類型進行解析,總結(jié)歸納出能夠表征故障事件的特征要素,通過這些特征要素能夠清楚明確的表達出故障事件信息,并且能夠唯一表征出相應(yīng)的故障事件。進一步的,事件模型處理器112根據(jù)各種故障事件類型對應(yīng)的原始故障事件信息的邏輯特點(例如原始故障事件信息的字段結(jié)構(gòu)特點),基于所述通用事件模型要素,構(gòu)建出與每一故障事件類型相對應(yīng)的事件模型。本實施例對所采用的通用事件模型要素不作具體限定,可根據(jù)應(yīng)用本事件監(jiān)控系統(tǒng)的計算機網(wǎng)絡(luò)系統(tǒng)的實際需要,確定合適的通用事件模型要素?;诔R姷挠嬎銠C網(wǎng)絡(luò)系統(tǒng),本實施例提供了以下多種通用事件模型要素,如表I所示:表權(quán)利要求
1.一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng),其特征在于,所述事件監(jiān)控系統(tǒng)包括:事件模型生成裝置、事件采集裝置、事件適配裝置、執(zhí)行處理裝置和事件存儲裝置; 所述事件模型生成裝置,連接所述事件適配裝置,用于根據(jù)計算機網(wǎng)絡(luò)系統(tǒng)中的各種故障事件類型生成對應(yīng)的事件模型,并將所述事件模型發(fā)送給所述事件適配裝置; 所述事件采集裝置,連接所述事件適配裝置,用于采集原始故障事件信息,并將所述原始故障事件信息發(fā)送給所述事件適配裝置; 所述事件適配裝置,連接所述執(zhí)行處理裝置,用于接收并存儲所述事件模型,當接收到原始故障事件信息時,根據(jù)所述原始故障事件信息所屬的故障事件類型確定對應(yīng)的事件模型,根據(jù)該確定的事件模型對所述原始故障事件信息進行歸集處理,得到歸集處理后事件信息,將所述歸集處理后事件信息發(fā)送給所述執(zhí)行處理裝置;其中,所述歸集處理后事件信息符合預(yù)設(shè)的統(tǒng)一標準格式; 所述執(zhí)行處理裝置,連接所述事件存儲裝置,用于接收所述歸集處理后事件信息并對其進行處理,然后將處理結(jié)果發(fā)送給所述事件存儲裝置; 所述事件存儲裝置,用于存儲所述處理結(jié)果。
2.根據(jù)權(quán)利要求1所述的 事件監(jiān)控系統(tǒng),其特征在于,所述事件模型生成裝置具體包括:故障類型處理器、事件模型處理器、事件模型發(fā)送器; 所述故障類型處理器,連接所述事件模型處理器,用于確定所述計算機網(wǎng)絡(luò)系統(tǒng)中的各種故障事件類型,并將所述各種故障事件類型發(fā)送給所述事件模型處理器; 所述事件模型處理器,連接所述事件模型發(fā)送器,用于接收所述各種故障事件類型,根據(jù)預(yù)設(shè)的通用事件模型要素對所述各種故障事件類型進行解析,根據(jù)所述解析的結(jié)果生成所述各種故障事件類型對應(yīng)的事件模型,將所述生成的事件模型發(fā)送給所述事件模型發(fā)送器; 所述事件模型發(fā)送器,連接所述事件適配裝置,用于將所述事件模型發(fā)送給所述事件適配裝置。
3.根據(jù)權(quán)利要求2所述的事件監(jiān)控系統(tǒng),其特征在于,所述事件模型生成裝置還包括:故障類型過濾器; 所述故障類型過濾器,分別連接所述故障類型處理器和事件模型處理器,用于根據(jù)預(yù)設(shè)的過濾條件,對所述故障類型處理器發(fā)送給所述事件模型處理器的各種故障事件類型進行過濾,并將過濾后的故障事件類型發(fā)送給所述事件模型處理器。
4.根據(jù)權(quán)利要求2所述的事件監(jiān)控系統(tǒng),其特征在于,所述事件采集裝置與所述事件適配裝置的數(shù)量都至少為一個,且所述事件采集裝置與所述事件適配裝置一一對應(yīng),相對應(yīng)的所述事件采集裝置與所述事件適配裝置相連接并作為一個監(jiān)控組合,不同監(jiān)控組合的事件采集裝置和事件適配裝置對應(yīng)不同的故障事件類型; 所述事件模型發(fā)送器還用于根據(jù)所述每一監(jiān)控組合對應(yīng)的故障事件類型,將相應(yīng)的事件模型發(fā)送給該監(jiān)控組合中的事件適配裝置。
5.根據(jù)權(quán)利要求1所述的事件監(jiān)控系統(tǒng),其特征在于,所述執(zhí)行處理裝置接收所述歸集處理后事件信息并對其進行處理時,具體用于: 根據(jù)所述歸集處理后事件信息,判斷當前故障事件是否首次出現(xiàn); 若是,則將所述歸集處理后事件信息作為處理結(jié)果發(fā)送給所述事件存儲裝置;若否,則對當前故障事件的狀態(tài)信息進行更新,并將更新后的狀態(tài)信息作為處理結(jié)果發(fā)送給所述事件存儲裝置。
6.根據(jù)權(quán)利要求1所述的事件監(jiān)控系統(tǒng),其特征在于,所述事件存儲裝置包括:實時存儲器和永久存儲器; 所述實時存儲器,連接所述執(zhí)行處理裝置,用于實時接收所述執(zhí)行處理裝置發(fā)送的處理結(jié)果并保存; 所述永久存儲器,連接所述實時存儲器,用于根據(jù)預(yù)設(shè)的時間間隔,從所述實時存儲器中獲取所述處理結(jié)果并保存,同時將所述獲取的處理結(jié)果從所述實時存儲其中刪除。
7.根據(jù)權(quán)利要求1所述的事件監(jiān)控系統(tǒng),其特征在于,所述事件監(jiān)控系統(tǒng)還包括:事件顯示裝置; 所述事件顯示裝置,連接所述事件存儲裝置,用于從所述事件存儲裝置獲取處理結(jié)果并顯示給用戶。
8.根據(jù)權(quán)利要求7所述的事件監(jiān)控系統(tǒng),其特征在于,所述事件顯示裝置具體包括:權(quán)限設(shè)置器、結(jié)果操作器和顯示器; 所述權(quán)限設(shè)置器,用于設(shè)置用戶對所述事件存儲裝置中存儲的處理結(jié)果的操作權(quán)限;所述結(jié)果操作器,連接所述權(quán)限設(shè)置器,用于根據(jù)所述權(quán)限設(shè)置器設(shè)置的操作權(quán)限對所述事件存儲裝置中存儲的處理結(jié)果進行確認和/或刪除操作; 所述顯示器,連接所述結(jié)果操作器,用于根據(jù)所述結(jié)果操作器的操作結(jié)果將所述操作之后的處理結(jié)果顯示給用戶。
9.根據(jù)權(quán)利 要求1所述的事件監(jiān)控系統(tǒng),其特征在于,所述事件采集裝置至少包括:操作系統(tǒng)收集器、數(shù)據(jù)庫收集器,中間件收集器和VMware虛擬機收集器; 所述操作系統(tǒng)收集器,用于收集CPU、內(nèi)存、磁盤信息; 所述數(shù)據(jù)庫收集器,用于收集表空間使用率、游標使用率、會話使用率; 所述中間件收集器,用于收集中間件使用率、垃圾回收時間占比; 所述VMware虛擬機收集器,用于收集VMware CPU資源池、內(nèi)存資源池、存儲信息。
10.一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控方法,其特征在于,所述事件監(jiān)控方法包括: 采集原始故障事件信息; 根據(jù)所述原始故障事件信息所屬的故障事件類型確定對應(yīng)的事件模型;其中,所述事件模型為預(yù)先生成的,并且所述事件模型與計算機網(wǎng)絡(luò)系統(tǒng)中的各種故障事件類型相對應(yīng); 根據(jù)所述確定的事件模型對所述原始故障事件信息進行歸集處理,得到歸集處理后事件信息;其中,所述歸集處理后事件信息符合預(yù)設(shè)的統(tǒng)一標準格式; 對所述歸集處理后事件信息進行處理,得到處理結(jié)果; 存儲所述處理結(jié)果。
11.根據(jù)權(quán)利要求10所述的事件監(jiān)控方法,其特征在于,所述事件模型的生成方法包括: 確定所述計算機網(wǎng)絡(luò)系統(tǒng)中的各種故障事件類型; 根據(jù)預(yù)設(shè)的通用事件模型要素對所述各種故障事件類型進行解析; 根據(jù)所述解析的結(jié)果生成所述各種故障事件類型對應(yīng)的事件模型。
12.根據(jù)權(quán)利要求11所述的事件監(jiān)控方法,其特征在于,所述根據(jù)預(yù)設(shè)的通用事件模型要素對所述各種故障事件類型進行解析之前,還包括: 根據(jù)預(yù)設(shè)的過濾條件,對所述各種故障事件類型進行過濾; 則所述根據(jù)預(yù)設(shè)的通用事件模型要素對所述各種故障事件類型進行解析,具體為: 根據(jù)預(yù)設(shè)的通用事件模型要素對所述過濾后的故障事件類型進行解析。
13.根據(jù)權(quán)利要求10所述的事件監(jiān)控方法,其特征在于,還包括: 根據(jù)所述原始故障事件信息所屬的故障事件類型確定不存在對應(yīng)的事件模型時,進行報警處理。
14.根據(jù)權(quán)利要求10所述的事件監(jiān)控方法,其特征在于,所述對所述歸集處理后事件信息進行處理,得到處理結(jié)果,具體包括: 根據(jù)所述歸集處理后事件信息,判斷當前故障事件是否首次出現(xiàn); 若是,則將所述歸集處 理后事件信息確定為處理結(jié)果; 若否,則對當前故障事件的狀態(tài)信息進行更新,并將更新后的狀態(tài)信息確定為處理結(jié)果O
15.根據(jù)權(quán)利要求10所述的事件監(jiān)控方法,其特征在于,所述事件監(jiān)控方法還包括: 將所述處理結(jié)果顯示給用戶。
16.根據(jù)權(quán)利要求15所述的事件監(jiān)控方法,其特征在于,所述將所述處理結(jié)果顯示給用戶,具體包括: 設(shè)置用戶對所述處理結(jié)果的操作權(quán)限; 根據(jù)所述操作權(quán)限對所述處理結(jié)果進行確認和/或刪除操作; 將所述操作之后的處理結(jié)果顯示給用戶。
全文摘要
本發(fā)明提供一種計算機網(wǎng)絡(luò)系統(tǒng)的事件監(jiān)控系統(tǒng)及事件監(jiān)控方法,該事件監(jiān)控系統(tǒng)包括事件模型生成裝置、事件采集裝置、事件適配裝置、執(zhí)行處理裝置和事件存儲裝置;所述事件模型生成裝置,連接所述事件適配裝置;所述事件采集裝置,連接所述事件適配裝置;所述事件適配裝置,連接所述執(zhí)行處理裝置;所述執(zhí)行處理裝置,連接所述事件存儲裝置。本發(fā)明簡化了監(jiān)控處理過程,減少了事件監(jiān)控系統(tǒng)的開發(fā)工作量,提高了事件監(jiān)控效率,降低了系統(tǒng)維護成本。
文檔編號H04L12/26GK103152219SQ20131005271
公開日2013年6月12日 申請日期2013年2月18日 優(yōu)先權(quán)日2013年2月18日
發(fā)明者方揚, 李笠, 李博, 田斌, 趙同, 賀安輝, 薛大宇 申請人:中國工商銀行股份有限公司