專利名稱:一種綜合前端系統(tǒng)故障處理方法及計算機(jī)設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機(jī)應(yīng)用領(lǐng)域,尤其涉及一種綜合前端系統(tǒng)故障處理方法 及計算機(jī)設(shè)備。
背景技術(shù):
目前銀行前端上線營運(yùn)系統(tǒng)的重大故障(服務(wù)器宕機(jī)等)處理模式基本 上停留在前臺報告故障,分析運(yùn)維人員經(jīng)過初步分析后,通過熱線與后臺技 術(shù)專家團(tuán)隊溝通,由后臺專家遠(yuǎn)程分析解決問題,其實(shí)現(xiàn)的全過程基本上全 部由人工完成。
隨著銀行業(yè)務(wù)的發(fā)展,銀行對生產(chǎn)系統(tǒng)穩(wěn)定運(yùn)行的要求越來越嚴(yán)格,傳 統(tǒng)的全人工處理流程無法滿足整個系統(tǒng)運(yùn)營的要求,由于完全靠人工處理,
診斷全憑經(jīng)驗(yàn),許多情況下無法立刻給出處理預(yù)案,難以保證運(yùn)行的穩(wěn)定性; 且對于故障出現(xiàn)之后,其診斷過程和分析取決于維護(hù)人員和專家團(tuán)隊的溝通 效率,/人而不能保證快速解決故障,而且人工解決方式其人工成本也4艮高。
發(fā)明內(nèi)容
鑒于上述現(xiàn)有技術(shù)所存在的問題,本發(fā)明提供了一種綜合前端系統(tǒng)故障 處理方法及計算機(jī)設(shè)備,對于綜合前端系統(tǒng)出現(xiàn)的故障采取不同的處理方法。
為了達(dá)到上述發(fā)明目的,本發(fā)明提供了一種綜合前端系統(tǒng)故障處理方法, 包括
檢測綜合前端系統(tǒng)是否出現(xiàn)故障;
當(dāng)檢測到綜合前端系統(tǒng)出現(xiàn)了故障時,分析所述故障的類別; 當(dāng)分析出所述故障的類別時,根據(jù)所述故障的類別選擇所迷故障的類別 所對應(yīng)的故障處理模式對所述故障進(jìn)行處理。
相應(yīng)地,本發(fā)明還提供了一種計算機(jī)設(shè)備,包括 檢測模塊,用于檢測綜合前端系統(tǒng)是否出現(xiàn)故障;分析模塊,用于當(dāng)所述檢測模塊檢測到綜合前端系統(tǒng)出現(xiàn)了故障時,分
析所述故障的類別;
處理模塊,用于當(dāng)所述分析模塊分析出所述故障的類別時,根據(jù)所述故 障的類別選擇所對應(yīng)的故障處理才莫式對所迷故障進(jìn)行處理。
通過實(shí)施本發(fā)明,在;^測綜合前端系統(tǒng)出現(xiàn)故障時,對出現(xiàn)的故障進(jìn)行 分析出故障的類別,再根據(jù)故障的類別選擇所對應(yīng)的故障處理^i式對故障進(jìn) 行處理,這樣通過針對不同級別的故障,采用不同的處理模式,減少處理時 間,保障了系統(tǒng)連續(xù)穩(wěn)定的運(yùn)行。
圖l是本發(fā)明實(shí)施例的綜合前端系統(tǒng)故障處理方法的流程圖; 圖2是本發(fā)明實(shí)施例的計算機(jī)設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施例方式
實(shí)施本發(fā)明實(shí)施例通過在綜合前端系統(tǒng)增加了故障診斷手段和處理手段, 改變了以往完全依賴于人工診斷和處理故障的模式,下面結(jié)合附圖來詳細(xì)說 明。
首先,請參閱圖l,圖l示出了本發(fā)明實(shí)施例的綜合前端系統(tǒng)故障處理方 法的流程圖,包括以下步驟 步驟S101,開始;
步驟S102,檢測綜合前端系統(tǒng)是否現(xiàn)出故障,若檢測到綜合前端系統(tǒng)出 現(xiàn)故障,則進(jìn)行步驟S103,否則繼續(xù)進(jìn)行步驟S102;
具體的,在綜合前端系統(tǒng)中設(shè)置一個軟件客戶端,通過相應(yīng)的軟件客戶 端來監(jiān)控綜合前端系統(tǒng),當(dāng)檢測到綜合前端系統(tǒng)出現(xiàn)故障時,執(zhí)行步驟S103。
系統(tǒng)一般可以分為操作系統(tǒng),基礎(chǔ)軟件系統(tǒng),應(yīng)用軟件模塊(通訊, 服務(wù),安全,數(shù)據(jù)庫)等層次。監(jiān)控平臺會每隔一段時間(可以設(shè)定)啟動 安裝在服務(wù)器上的代理程序(Agent),啟動一個系統(tǒng)檢查腳本,首先檢查各 參數(shù)是否在設(shè)定的正常范圍內(nèi)。例如文件描述符、進(jìn)程數(shù)、已經(jīng)使用的中央 處理器(CPU)消耗、內(nèi)存(MEM)消耗等這樣的操作系統(tǒng)參數(shù)是否會超過 設(shè)定的安全閥值;例如已使用的線程、連接數(shù)等這樣的服務(wù)器參數(shù)是否超過設(shè)定的安全閥值。然后檢查運(yùn)行進(jìn)程列表各中關(guān)鍵進(jìn)程(主進(jìn)程,通訊進(jìn)程, 安全服務(wù)進(jìn)程)是否缺失。接下來自動測試各端口是否處于正常監(jiān)聽狀態(tài), 如果出現(xiàn)問題就會給出相應(yīng)提示。隨后代理程序會發(fā)起一個模擬交易(可以
設(shè)定判斷策略,例如每分鐘發(fā)起3次交易,如果成功2次代表正常),測試系 統(tǒng)的反應(yīng),從而判斷系統(tǒng)的狀態(tài),并且如果未能得到預(yù)期結(jié)果或者超時(可 以設(shè)定時間),會通過返回碼提示進(jìn)程在哪個軟件模塊內(nèi)出現(xiàn)異常。這個過 程基本覆蓋了系統(tǒng)的各層次,并且基本能夠基本判斷在哪一個層次或模塊出 現(xiàn)異常。
步驟S103,分析故障的類別;
具體的,根據(jù)故障威脅程度將檢測出的故障進(jìn)行分析,其故障類別主要 是系統(tǒng)級故障和應(yīng)用級故障,其中,系統(tǒng)級故障包括硬件故障和操作故障, 應(yīng)用級故障包括基礎(chǔ)軟件故障和交易級故障。
在實(shí)施過程中,對綜合前端系統(tǒng)上的數(shù)據(jù)進(jìn)行收集,當(dāng)檢測到綜合前端 系統(tǒng)出現(xiàn)故障時,分析故障所處的環(huán)境和位置,若是系統(tǒng)本身自身檢測到的 故障,在上報故障過程中,可以獲知該系統(tǒng)故障的類別;也可以根據(jù)基礎(chǔ)軟 件的日志上報故障信息,根據(jù)該日志上報的故障信息分析出該故障的類別。 這里主要采用的方式是系統(tǒng)內(nèi)部的自偵測故障模式,在進(jìn)行故障收集,根據(jù) 收集的故障來分析出故障的類別。
步驟S104,根據(jù)所述故障類別選擇所對應(yīng)的故障處理模式對所述故障進(jìn) 行處理。
具體的,根據(jù)故障類別選擇故障處理模式對出現(xiàn)的故障進(jìn)行相應(yīng)處理, 故障處理4莫式為自動處理^^莫式或通知人工處理^t式。其中自動處理才莫式主 要由熱備機(jī)制提供技術(shù)支持,采用2+N分組熱備刀片集群,每組2片備機(jī)+N片 生產(chǎn)機(jī)(每組最多不超過10片),當(dāng)生產(chǎn)刀片發(fā)生故障時,備份刀片會短時 間內(nèi)自動接管,從而保證正常生產(chǎn)不間斷。自動處理模式可以處理系統(tǒng)故障 中的硬件故障因刀片服務(wù)器本身故障導(dǎo)致的連續(xù)運(yùn)行問題和滿足操作系統(tǒng)故 障連續(xù)運(yùn)行的需求,同時也可以解決應(yīng)用級故障中的基礎(chǔ)軟件故障,自動處 理模式只需要重新啟動系統(tǒng)就可以運(yùn)行的故障導(dǎo)致的連續(xù)運(yùn)行問題。通知人 工處理模式可以處理所有級別的故障,其主要用于分析和解決問題。
進(jìn)一步需要說明的,在此過程中,可以首先對故障分析后,下發(fā)故障告警方式給管理平臺或者管理人員,如通過短信或者郵件或者日志報告等方式 讓管理人員獲得故障信息。
步驟S105:結(jié)束。
通過實(shí)施本發(fā)明實(shí)施例,在檢測綜合前端系統(tǒng)出現(xiàn)故障時,對出現(xiàn)的故 障進(jìn)行分析出故障的類別,再根據(jù)故障的類別選擇所對應(yīng)的故障處理模式對 故障進(jìn)行處理,這樣通過針對不同級別的故障,采用不同的處理模式,減少 處理時間,保障了系統(tǒng)連續(xù)穩(wěn)定的運(yùn)行。
請參閱圖2,圖2示出了本發(fā)明實(shí)施例的計算機(jī)設(shè)備的結(jié)構(gòu)示意圖,包括 檢測模塊21、分析模塊22和處理模塊23,其中
檢測模塊21 ,用于檢測綜合前端系統(tǒng)是否出現(xiàn)故障;
具體的,在綜合前端系統(tǒng)中設(shè)置一個軟件客戶端,通過相應(yīng)的軟件客戶 端來監(jiān)控綜合前端系統(tǒng)。
分析模塊22,用于當(dāng)所述檢測模塊21檢測到綜合前端系統(tǒng)出現(xiàn)了故障時, 分析所述故障的類別;
具體的,根據(jù)故障威脅程度將檢測出的故障進(jìn)行分析,其故障類別主要 分為系統(tǒng)級故障和應(yīng)用級故障,其中,系統(tǒng)級故障包括硬件故障和操作故障, 應(yīng)用級故障包括^出軟件故障和交易級故障。
在實(shí)施過程中,檢測到綜合前端系統(tǒng)出現(xiàn)故障時,分析故障所處的環(huán)境 和位置,若是系統(tǒng)本身自身檢測到的故障,在上報故障過程中,可以獲知該 系統(tǒng)故障的類別;也可以根據(jù)基礎(chǔ)軟件的日志上報故障信息,根據(jù)該日志上 報的故障信息分析出該故障的類別。這里主要采用的方式是系統(tǒng)內(nèi)部的自偵 測故障才莫式,在進(jìn)行故障收集,才艮據(jù)收集的故障來分析出故障的類別。
處理模塊23,用于當(dāng)所述分析模塊22分析出所述故障的類別時,根據(jù)所 述故障的類別選擇所述故障的類別所對應(yīng)的故障處理才莫式對所述故障進(jìn)行處 理。
具體的,根據(jù)故障類別選擇所對應(yīng)的故障處理模式對所述故障進(jìn)行處理, 故障處理模式為自動處理模式或通知人工處理模式。自動處理模式主要由熱 備機(jī)制提供技術(shù)支持,采用2+N分組熱備刀片集群,每組2片備機(jī)+N片生產(chǎn)機(jī) (每組最多不超過10片),當(dāng)生產(chǎn)刀片發(fā)生故障時,^f分刀片會短時間內(nèi)自 動接管,從而保證正常生產(chǎn)不間斷。自動處理模式可以處理系統(tǒng)故障中的硬件故障因刀片服務(wù)器本身故障導(dǎo)致的連續(xù)運(yùn)行問題和滿足操作系統(tǒng)故障連續(xù) 運(yùn)行的需求,同時也可以解決應(yīng)用級故障中的基礎(chǔ)軟件故障,自動處理^t式 只需要重新啟動系統(tǒng)就可以運(yùn)行的故障導(dǎo)致的連續(xù)運(yùn)行問題。通知人工處理 模式可以處理所有級別的故障,其主要用于分析和解決問題。進(jìn)一步需要說
明的,處理模塊23可以首先對故障分析后,下發(fā)故障告警方式給管理平臺或 者管理人員,如通過短信或者郵件或者日志報告等方式讓管理人員獲得故障 信息。
綜上所述,通過實(shí)施本發(fā)明實(shí)施例,在4企測綜合前端系統(tǒng)出現(xiàn)故障時, 對出現(xiàn)的故障進(jìn)行分析出故障的類別,再根據(jù)故障的類別選擇所對應(yīng)的故障 處理模式對故障進(jìn)行處理,這樣通過針對不同級別的故障,采用不同的處理 模式,減少反應(yīng)時間,保障了系統(tǒng)連續(xù)穩(wěn)定的運(yùn)行。
以上所揭露的僅為本發(fā)明 一種較佳實(shí)施例而已,當(dāng)然不能以此來限定本 發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵 蓋的范圍。
權(quán)利要求
1.一種綜合前端系統(tǒng)故障處理方法,其特征在于,包括檢測綜合前端系統(tǒng)是否出現(xiàn)故障;當(dāng)檢測到所述綜合前端系統(tǒng)出現(xiàn)了故障時,分析所述故障的類別;當(dāng)分析出所述故障的類別時,根據(jù)所述故障的類別選擇所述故障的類別所對應(yīng)的故障處理模式對所述故障進(jìn)行處理。
2. 如權(quán)利要求1所述的方法,其特征在于,所述分析所述故障的類別步驟 具體為根據(jù)故障威脅程度對所述檢測出的故障進(jìn)行故障類別的分析。
3. 如權(quán)利要求1或2所述的方法,其特征在于,所述故障的類別包括系統(tǒng)級 故障和應(yīng)用級故障。
4. 如權(quán)利要求3所述的方法,其特征在于,所述系統(tǒng)級故障包括硬件級故 障和操作系統(tǒng)級故障。
5. 如權(quán)利要求3所述的方法,其特征在于,所述應(yīng)用級故障包括^f出軟件 級故障和交易級故障。
6. 如權(quán)利要求1所述的方法,其特征在于,所述故障處理模式為自動處理 才莫式或通知人工處理纟莫式。
7. 如權(quán)利要求6所述的方法,其特征在于,所述自動處理模式為熱備切換 模式,當(dāng)分析出所述故障的類別時,將當(dāng)前的綜合前端系統(tǒng)切換到備用的綜 合前端系統(tǒng)。
8. —種計算機(jī)設(shè)備,其特征在于,包括 檢測模塊,用于檢測綜合前端系統(tǒng)是否出現(xiàn)故障;分析模塊,用于當(dāng)所述檢測模塊檢測到綜合前端系統(tǒng)出現(xiàn)了故障時,分析所述故障的類別;處理模塊,用于當(dāng)所述分析模塊分析出所述故障的類別時,根據(jù)所述故 障的類別選擇所述故障的類別所對應(yīng)的故障處理才莫式對所述故障進(jìn)^t處理。
9.如權(quán)利要求8所述的計算機(jī)設(shè)備,其特征在于,所述分析模塊具體根據(jù) 故障威脅程度對所述檢測出的故障進(jìn)行故障類別的分析。
全文摘要
本發(fā)明公開了一種綜合前端系統(tǒng)故障處理方法,包括檢測綜合前端系統(tǒng)是否出現(xiàn)故障;當(dāng)檢測到所述綜合前端系統(tǒng)出現(xiàn)了故障時,分析所述故障的類別;當(dāng)分析出所述故障的類別時,根據(jù)所述故障的類別選擇所對應(yīng)的故障處理模式對所述故障進(jìn)行處理。本發(fā)明還公開了一種計算機(jī)設(shè)備,采用本發(fā)明所提供的方案,通過分析檢測出的故障類別,并根據(jù)故障類別選擇所對應(yīng)的故障處理模式對故障進(jìn)行處理,改變以往對故障完全依賴于人工診斷和處理的模式,減少了處理時間,保障了系統(tǒng)連續(xù)穩(wěn)定的運(yùn)行。
文檔編號G06Q40/00GK101556679SQ20091020343
公開日2009年10月14日 申請日期2009年5月21日 優(yōu)先權(quán)日2009年5月21日
發(fā)明者卜天奇, 周子堅, 燁 曾, 杜永健, 楊志勇, 臻 王, 意 羅, 蕓 耿, 宏 胡, 靜 邵 申請人:中國建設(shè)銀行股份有限公司