存儲雙活環(huán)境下存儲資源異地同步共享的監(jiān)測與管理方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于企業(yè)信息化技術(shù)領(lǐng)域,特別是涉及一種存儲雙活環(huán)境下存儲資源異地同步共享的監(jiān)測與管理方法。
【背景技術(shù)】
[0002]在服務(wù)器虛擬化技術(shù)不斷成熟的大背景下,現(xiàn)代企業(yè)的IT工作者紛紛將目光投向了網(wǎng)絡(luò)和存儲,欲使用基于“同城雙活”的存儲虛擬化網(wǎng)關(guān)技術(shù)實現(xiàn)信息系統(tǒng)的不間斷服務(wù)。采用雙活模式進行信息系統(tǒng)存儲資源,可實現(xiàn)數(shù)據(jù)丟失率低、切換速度快、消除切換陷阱、數(shù)據(jù)零丟失及遠程集群支持的最高級別容災(zāi),可以在很大程度上提高系統(tǒng)資源利用率,為企業(yè)穩(wěn)定發(fā)展作出貢獻。
[0003]在基于存儲雙活技術(shù)的系統(tǒng)下,系統(tǒng)變得日趨復(fù)雜,同時隱藏了底層故障。但全面掌握信息系統(tǒng)的運行狀態(tài)對運維管理而言非常重要,因此在容錯機制存在的情況下,系統(tǒng)監(jiān)測和管理變得尤為重要。但是目前系統(tǒng)的運行狀態(tài)監(jiān)測較為分散,基于獨立設(shè)備的監(jiān)測,缺乏系統(tǒng)整體監(jiān)測和管理工具,存在如下缺陷:
[0004]1、監(jiān)測分散,多廠家設(shè)備獨立監(jiān)測,各自使用獨立的監(jiān)測工具,缺乏整體監(jiān)測。無法掌握系統(tǒng)運行全貌;
[0005]2、專業(yè)技術(shù)能力要求較高,需要具備較高的專業(yè)技術(shù)能力才能有效分析系統(tǒng)運行狀態(tài)和對整個系統(tǒng)進行日常管理;
[0006]3、資源監(jiān)測僅監(jiān)測獨立設(shè)備,未能從整體進行系統(tǒng)監(jiān)測,不能有效整合多個環(huán)節(jié)的狀態(tài),具有較大的局限性。
[0007]4、系統(tǒng)多個邏輯單元管理具備依賴關(guān)系,不具備系統(tǒng)整體管理能力。
[0008]通過本工具,以整合系統(tǒng)為一個整體,預(yù)設(shè)系統(tǒng)模塊和層級,設(shè)定關(guān)聯(lián)關(guān)系和參數(shù)指標(biāo),建立起以整體系統(tǒng)為監(jiān)測對象的整體監(jiān)測體系規(guī)范,整個系統(tǒng)系統(tǒng)運行狀態(tài)、運行性能,各個邏輯組件之間的交互性能變化可持續(xù)跟蹤、基于歷史知識積累,可預(yù)測系統(tǒng)后期狀態(tài)軌跡,提早預(yù)警。本工具提供基于邏輯依賴關(guān)系管理,提供可視化、流程化的自動管理工具,通過本工具結(jié)合逐步積累的知識庫,實現(xiàn)系統(tǒng)的高穩(wěn)定性、高可維護性、高安全性、高性會泛。
【發(fā)明內(nèi)容】
[0009]為了解決上述問題,本發(fā)明的目的在于提供一種存儲雙活環(huán)境下存儲資源異地同步共享的監(jiān)測與管理方法。
[0010]為了達到上述目的,本發(fā)明提供的存儲雙活環(huán)境下存儲資源異地同步共享的監(jiān)測與管理方法包括按順序進行的下列步驟:
[0011 ]步驟1)建立監(jiān)測與管理系統(tǒng);
[0012] 所述的監(jiān)測與管理系統(tǒng)主要包括系統(tǒng)監(jiān)測裝置、監(jiān)測數(shù)據(jù)處理裝置、監(jiān)測數(shù)據(jù)展示裝置、系統(tǒng)管理裝置和管理執(zhí)行裝置;
[0013]步驟2)將上述監(jiān)測與管理系統(tǒng)與存儲有存儲資源的資源組件連接并初始化監(jiān)測與管理系統(tǒng);
[0014]將各個存儲雙活環(huán)境下存儲資源異地共享系統(tǒng)的資源組件管理接口及一臺網(wǎng)絡(luò)接口與上述監(jiān)測與管理系統(tǒng)的IP網(wǎng)絡(luò)互聯(lián),配置存儲在資源組件內(nèi)的存儲資源的SNMP、SM1-S、Sysl0g參數(shù)及服務(wù)器部署Agent,開啟存儲資源的telnet/ssh服務(wù);在監(jiān)測與管理系統(tǒng)上初始化存儲資源的各個子對象;在監(jiān)測數(shù)據(jù)展示裝置上建立業(yè)務(wù)視圖,通過建立資源對象,初始化對象基本屬性,包括設(shè)備名稱、設(shè)備部署位置、設(shè)備廠家、設(shè)備型號、設(shè)備管理參數(shù)、設(shè)備其他附加屬性,基于拓撲創(chuàng)建資源關(guān)聯(lián)關(guān)系;
[0015]步驟3)利用上述監(jiān)測與管理系統(tǒng)對存儲資源進行監(jiān)測與管理;
[0016]啟動監(jiān)測與管理系統(tǒng),并利用該系統(tǒng)周期性通過系統(tǒng)監(jiān)測裝置采集存儲資源的信息。
[0017]在步驟3)中,所述的利用上述監(jiān)測與管理系統(tǒng)對存儲資源進行監(jiān)測與管理的方法包括按順序進行的下列步驟:
[0018]步驟3.1)存儲資源信息采集;系統(tǒng)監(jiān)測裝置周期性通過適配器SM1-SAgent,SNMPAgent,SysLog Agent,Host Agent采集存儲資源的數(shù)據(jù);數(shù)據(jù)采集成功后進行格式化處理,生成XML文件,并發(fā)送給監(jiān)測數(shù)據(jù)處理裝置,發(fā)送的數(shù)據(jù)內(nèi)容包括數(shù)據(jù)采集的對象、采集時間、采集的類型、采集的結(jié)果、資源對象名稱、采集開始時間、采集結(jié)束時間、采集操作類型、采集操作結(jié)果、采集數(shù)據(jù)內(nèi)容、采集操作方式;
[0019]步驟3.2)監(jiān)測數(shù)據(jù)處理裝置將系統(tǒng)監(jiān)測裝置發(fā)送的數(shù)據(jù)進行解析、轉(zhuǎn)換并存儲入數(shù)據(jù)庫,同時觸發(fā)監(jiān)測數(shù)據(jù)展示裝置刷新展示數(shù)據(jù);監(jiān)測數(shù)據(jù)處理裝置按照包括采集對象設(shè)備類型、采集操作類型、采集批次在內(nèi)的信息對采集數(shù)據(jù)進行自動關(guān)聯(lián)、歸并、提取指標(biāo)信息,并基于數(shù)據(jù)庫歷史監(jiān)測數(shù)據(jù)進行聯(lián)想分析;
[0020]步驟3.3)監(jiān)測數(shù)據(jù)展示裝置基于監(jiān)測數(shù)據(jù)處理裝置提供的監(jiān)測數(shù)據(jù),結(jié)合初始業(yè)務(wù)配置,構(gòu)建基于業(yè)務(wù)的圖形化拓撲展示,業(yè)務(wù)拓撲視圖可切換至資源視圖,然后提供各個存儲資源的基本運行狀態(tài)展示、性能狀態(tài)展示和設(shè)備告警提醒;監(jiān)測數(shù)據(jù)展示裝置能夠基于多種主題生成報表數(shù)據(jù),并結(jié)合歷史數(shù)據(jù)生成系統(tǒng)預(yù)警和系統(tǒng)建議;
[0021]步驟3.4)當(dāng)監(jiān)測數(shù)據(jù)處理裝置基于系統(tǒng)監(jiān)測裝置傳輸?shù)臄?shù)據(jù)解析出存儲資源的設(shè)備告警、系統(tǒng)錯誤及基于歷史數(shù)據(jù)分析的性能降級情況時,系統(tǒng)自動觸發(fā)事件服務(wù),向系統(tǒng)管理人員提示是否進入系統(tǒng)管理視圖;系統(tǒng)管理人員選擇進入管理視圖后,監(jiān)測數(shù)據(jù)處理裝置通過事件服務(wù)模塊將事件代碼發(fā)送給系統(tǒng)管理裝置;
[0022]步驟3.5)系統(tǒng)管理裝置接收到監(jiān)測數(shù)據(jù)處理裝置提交的事件代碼后,自動檢索系統(tǒng)預(yù)設(shè)管理,進行管理匹配,若匹配成功,系統(tǒng)自動開啟圖形化提示管理功能,以提示出操作步驟及注意事項,如果系統(tǒng)管理裝置判斷出可以自動操作完成,提示系統(tǒng)管理人員是否進行自動化操作;當(dāng)系統(tǒng)管理人員確定進行自動化操作時,系統(tǒng)管理裝置通過觸發(fā)管理模塊將管理對象信息和管理操作目標(biāo)經(jīng)XML文件封裝并分發(fā)至管理執(zhí)行裝置;
[0023]步驟3.5)管理執(zhí)行裝置接收到系統(tǒng)管理裝置分發(fā)的管理任務(wù)后,解析任務(wù)文件,調(diào)用預(yù)設(shè)指令庫,通過SSH/Telnet/SM1-S協(xié)議和Host Agent對存儲資源執(zhí)行管理操作,并處理管理指令執(zhí)行結(jié)果。
[0024]本發(fā)明提供的存儲雙活環(huán)境下存儲資源異地同步共享的監(jiān)測與管理方法的效果:
[0025]存儲雙活環(huán)境下存儲資源異地同步共享的監(jiān)測與管理是基于資源共享平臺的業(yè)務(wù)系統(tǒng)建設(shè)的基礎(chǔ)。通過整個系統(tǒng)的監(jiān)測與管理,為上層業(yè)務(wù)系統(tǒng)系統(tǒng)的建設(shè)數(shù)據(jù)支撐。同時,通過該工具積累的監(jiān)測和管理數(shù)據(jù),能夠不斷完善存儲雙活環(huán)境下的存儲資源異地同步共享的維護手段,為國家電網(wǎng)公司兩地三中心建設(shè)的運維管理提供有益補充。
【附圖說明】
[0026]圖1為本發(fā)明提供的存儲雙活環(huán)境下存儲資源異地同步共享的監(jiān)測與管理方法所采用的監(jiān)測與管理系統(tǒng)邏輯示意圖。
[0027]圖2為本發(fā)明提供的存儲雙活環(huán)境下存儲資源異地同步共享的監(jiān)測與管理方法中監(jiān)測與管理方法流程圖。
【具體實施方式】
[0028]下面結(jié)合附圖和具體實施例對本發(fā)明提供的存儲雙活環(huán)境下存儲資源異步共享的監(jiān)測與管理方法進行詳細說明。
[0029]本發(fā)明提供的存儲雙活環(huán)境下存儲資源異步共享的監(jiān)測與管理方法包括按順序進行的下列步驟:
[0030]步驟1)建立監(jiān)測與管理系統(tǒng);
[0031]建立如圖1所示的監(jiān)測與管理系統(tǒng),其主要包括系統(tǒng)監(jiān)測裝置1、監(jiān)測數(shù)據(jù)處理裝置2、監(jiān)測數(shù)據(jù)展示裝置3、系統(tǒng)管理裝置4和管理執(zhí)行裝置5;其中系統(tǒng)監(jiān)測裝置1通過適配器SM1-S Agent,SNMP Agent,SysLog Agent,Host Agent獲取監(jiān)測對象存儲與虛擬化網(wǎng)關(guān)、光纖交換機、服務(wù)器的運行狀態(tài)、鏈路狀態(tài)、磁盤狀態(tài)、性能參數(shù)、日志告警等信息并發(fā)送給監(jiān)測數(shù)據(jù)處理裝置2,監(jiān)測數(shù)據(jù)處理裝置2將數(shù)據(jù)進行關(guān)聯(lián)、歸并、梳理、整合及存儲,并將數(shù)據(jù)處理結(jié)果通過監(jiān)測數(shù)據(jù)展示裝置3進行展示,展示內(nèi)容以業(yè)務(wù)拓撲形式,數(shù)據(jù)包括系統(tǒng)基本狀態(tài)展示、性能展示、圖形故障告警等。當(dāng)數(shù)據(jù)處理裝置2經(jīng)過數(shù)據(jù)處理后發(fā)現(xiàn)需要進行系統(tǒng)管理操作的事件時,將需要處理的事件通過事件服務(wù)請求發(fā)到系統(tǒng)管理裝置4,系統(tǒng)管理裝置4根據(jù)事件請求數(shù)據(jù)按照預(yù)設(shè)管理操作進行觸發(fā)管理,并將系統(tǒng)管理操作對象、管理操作目標(biāo)分發(fā)至管理執(zhí)行裝置5,管理執(zhí)行裝置5按照預(yù)設(shè)指令庫順序執(zhí)行指令。
[0032]所述的系統(tǒng)監(jiān)測裝置1可以根據(jù)作為被監(jiān)測對象的存儲資源6的類型分為以下四類,由于實際運行過程中每類監(jiān)測對象都存在多種型號實體,因此根據(jù)監(jiān)測對象的不同,實際監(jiān)測的參數(shù)會存在變化。
[0033]第一類監(jiān)測對象為虛擬化存儲網(wǎng)關(guān),主要采集后端存儲信息及存儲LUN、存儲LUN的綁定關(guān)系、虛擬化存儲網(wǎng)關(guān)資源消耗、虛擬化存儲網(wǎng)關(guān)日志告警等、存儲資源使用率、虛擬化網(wǎng)關(guān)鏈路狀態(tài)、虛擬化網(wǎng)關(guān)存儲群集節(jié)點狀態(tài);后端存儲信息及存儲LUN、后端存儲資源消耗、后端存儲日志告警、后端存儲鏈路活動狀態(tài)、存儲資源利用率。
[0034]第二類監(jiān)測對象為后端存儲系統(tǒng),主要采集存儲基本信息,存儲LUN信息,存儲鏈路活動狀態(tài),存儲資源利用率,存儲日志告警信息。
[0035]第三類監(jiān)測對象為光纖交換機,主要采集光纖交換機基本信息、接口狀態(tài)、接口速率、數(shù)據(jù)包轉(zhuǎn)發(fā)速率、接口鏈路狀態(tài)。
[00