亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于虛擬化的高可用計(jì)算機(jī)系統(tǒng)的制作方法

文檔序號(hào):6397892閱讀:173來(lái)源:國(guó)知局
專利名稱:一種基于虛擬化的高可用計(jì)算機(jī)系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,具體地說(shuō)是一種基于虛擬化的高可用計(jì)算機(jī)系統(tǒng)。
背景技術(shù)
基于虛擬化的高可用計(jì)算機(jī)系統(tǒng)的研制主要面復(fù)雜業(yè)務(wù)系統(tǒng)。復(fù)雜業(yè)務(wù)系統(tǒng)是一種實(shí)時(shí)復(fù)雜的信息與控制系統(tǒng),它擔(dān)負(fù)著數(shù)據(jù)收集、數(shù)據(jù)融合、數(shù)據(jù)分發(fā)及指令的處理等重要任務(wù)。一般采用全分布式的體系結(jié)構(gòu),所有的設(shè)備均與網(wǎng)絡(luò)相連,進(jìn)行信息交換。作為復(fù)雜業(yè)務(wù)系統(tǒng)的核心,其服務(wù)器平臺(tái)需要完成系統(tǒng)管理、數(shù)據(jù)收發(fā)、數(shù)據(jù)處理、指令處理、文電處理以及軟件處理等重要功能,對(duì)計(jì)算機(jī)系統(tǒng)同時(shí)提出了高可用性和高處理能力的需求,此外考慮到可能出現(xiàn)的在多個(gè)不同層次的部署的需求,還要求計(jì)算機(jī)系統(tǒng)具備規(guī)??缮炜s性,對(duì)可擴(kuò)展性存在較高要求。目前在高可用計(jì)算機(jī)系統(tǒng)的設(shè)計(jì)及評(píng)測(cè)方面開(kāi)展了一些研究,突破了一些關(guān)鍵技術(shù)。在一些項(xiàng)目的研制過(guò)程中,積累了關(guān)于基于集群的服務(wù)器研制的寶貴經(jīng)驗(yàn),在系統(tǒng)管理、可用性設(shè)計(jì)方面取得了一定成果。在這些研究基礎(chǔ)上,重點(diǎn)研究基于虛擬化技術(shù)的主動(dòng)故障管理機(jī)制,進(jìn)一步展開(kāi)以故障為核心的高可用服務(wù)器的研制。虛擬化技術(shù)可以主動(dòng)故障管理系統(tǒng)在任務(wù)的管理、故障管理和恢復(fù)等方面的性能得到更大的提升。在硬件方面,采用基于國(guó)產(chǎn)處理器及TCM芯片的全國(guó)產(chǎn)硬件計(jì)算平臺(tái),使用基于CPCI總線架構(gòu)的刀片設(shè)計(jì),也可以提供高效的多機(jī)處理能力及良好的可擴(kuò)展性。

發(fā)明內(nèi)容
本發(fā)明的技術(shù)任務(wù)是解決現(xiàn)有技術(shù)的不足,提供一種基于虛擬化的高可用計(jì)算機(jī)系統(tǒng)。本發(fā)明的技術(shù)方案是按以下方式實(shí)現(xiàn)的,系統(tǒng)采用基于國(guó)產(chǎn)處理器及TCM芯片的全國(guó)產(chǎn)硬件計(jì)算平臺(tái),使用基于CPCI總線架構(gòu)的刀片設(shè)計(jì),提供高效的多機(jī)處理能力及良好的可擴(kuò)展性,該系統(tǒng)的核心為主動(dòng)故障管理系統(tǒng),其通過(guò)帶內(nèi)、帶外兩種方式對(duì)系統(tǒng)硬件及軟件狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測(cè),通過(guò)對(duì)獲取數(shù)據(jù)的分析,以實(shí)現(xiàn)故障的預(yù)測(cè)、檢測(cè)及診斷過(guò)程,及時(shí)完成對(duì)故障的隔離與恢復(fù),基于虛擬化的高可用計(jì)算機(jī)系統(tǒng)分為三部分設(shè)計(jì),即系統(tǒng)硬件平臺(tái)、主動(dòng)故障管理系統(tǒng)、系統(tǒng)管理軟件平臺(tái),其中:
系統(tǒng)硬件平臺(tái):由計(jì)算單元通過(guò)高速互連單元形成一個(gè)并行處理系統(tǒng),計(jì)算單元之間沒(méi)有直接聯(lián)系,所有的業(yè)務(wù)數(shù)據(jù)及系統(tǒng)管理都通過(guò)上層兩個(gè)冗余的互連模塊傳輸?shù)接?jì)算單元上,互連模塊的上行端口直接連接到兩個(gè)容錯(cuò)管理模塊,兩個(gè)容錯(cuò)管理模塊相互為備份,通過(guò)心跳檢測(cè)相互檢查是否處于active狀態(tài)和進(jìn)行故障時(shí)兩個(gè)容錯(cuò)管理模塊之間的數(shù)據(jù)同步;
主動(dòng)故障管理系統(tǒng),主動(dòng)故障管理系統(tǒng)是整個(gè)系統(tǒng)的核心,包括局部故障管理模塊和整體故障管理模塊,局部故障管理模塊包括帶內(nèi)、帶外監(jiān)控模塊和故障處理模塊,整體故障管理模塊包括主動(dòng)故障管理模塊、通訊模塊和用戶管理接口,在本系統(tǒng)中,將消息傳輸層獨(dú)立于管理組件來(lái)設(shè)計(jì),其間定義標(biāo)準(zhǔn)的消息規(guī)范和定義,便于模塊化設(shè)計(jì),提高故障管理系統(tǒng)的擴(kuò)展性和可移植性,通過(guò)監(jiān)視器對(duì)系統(tǒng)資源的狀態(tài)和行為進(jìn)行檢測(cè),將異常狀態(tài)或行為形成故障描述傳遞給診斷組件,對(duì)故障位置、傳播途徑及影響范圍做出評(píng)價(jià),并根據(jù)知識(shí)/規(guī)則庫(kù)形成處理規(guī)則,由執(zhí)行器對(duì)涉及的故障組件進(jìn)行隔離、恢復(fù)相關(guān)操作。系統(tǒng)管理軟件平臺(tái),具有管理系統(tǒng)資源、任務(wù)調(diào)度與切換、為客戶端提供系統(tǒng)映像功能,系統(tǒng)管理軟件平臺(tái)采一種雙層容錯(cuò)機(jī)制實(shí)現(xiàn),系統(tǒng)管理軟件平臺(tái)統(tǒng)一有序地管理雙容錯(cuò)管理、各計(jì)算單元、共享存儲(chǔ)器,并借助有效的故障處理機(jī)制,保證系統(tǒng)高可用的工作,協(xié)同管理模塊協(xié)調(diào)管理其他各模塊的工作,并為管理員提供友良好的管理界面。系統(tǒng)硬件平臺(tái)采用CPCI系統(tǒng)結(jié)構(gòu),以其高效的多機(jī)并行處理能力提供系統(tǒng)所需的處理能力和良好的可擴(kuò)展性,其接口簡(jiǎn)單集中,便于熱插拔設(shè)計(jì),對(duì)可維護(hù)性設(shè)計(jì)提供支持,同時(shí)可大大縮短系統(tǒng)“展開(kāi)時(shí)間”,另外,在通信與存儲(chǔ)接口、電源/散熱模塊都采用了冗余設(shè)計(jì)。本發(fā)明的有益效果:作為復(fù)雜業(yè)務(wù)系統(tǒng)的核心,其服務(wù)器平臺(tái)需要完成系統(tǒng)管理、數(shù)據(jù)收發(fā)、數(shù)據(jù)處理、指令處理、文電處理以及軟件處理等重要功能,對(duì)計(jì)算機(jī)系統(tǒng)同時(shí)提出了高可用性和高處理能力的需求,同時(shí)考慮到可能出現(xiàn)的在多個(gè)不同層次的部署的需求,還要求計(jì)算機(jī)系統(tǒng)具備規(guī)??缮炜s性,對(duì)可擴(kuò)展性存在較高要求。高可用技術(shù)與虛擬化技術(shù)相結(jié)合是一種比較簡(jiǎn)單有效且節(jié)約成本的方法。高可用技術(shù)作為虛擬化的保障,為虛擬化提供可以穩(wěn)定運(yùn)行環(huán)境;將負(fù)載在虛擬化環(huán)境中,使得負(fù)載可以在可用的虛擬化環(huán)境中動(dòng)態(tài)地在線遷移,從而保證了業(yè)務(wù)的不間斷性,使系統(tǒng)的可用性得到了滿足。本發(fā)明提出的系統(tǒng)結(jié)構(gòu),能夠?qū)Ρ旧淼牟考拖到y(tǒng)性能要進(jìn)行復(fù)雜的管理,能夠及時(shí)發(fā)現(xiàn)解決系統(tǒng)的故障,動(dòng)態(tài)遷移故障設(shè)備上的任務(wù),監(jiān)控設(shè)備性能,從而提高系統(tǒng)的可用性。主動(dòng)故障管理系統(tǒng)作為整個(gè)系統(tǒng)的核心,通過(guò)帶內(nèi)、帶外兩種方式對(duì)系統(tǒng)硬件及軟件狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測(cè),通過(guò)對(duì)獲取數(shù)據(jù)的分析,以實(shí)現(xiàn)故障的預(yù)測(cè)、檢測(cè)及診斷過(guò)程,及時(shí)完成對(duì)故障的隔離與恢復(fù)。


圖1是系統(tǒng)硬件設(shè)計(jì)拓?fù)? 圖2是故障管理系統(tǒng)結(jié)構(gòu) 圖3是主動(dòng)故障管理系統(tǒng)設(shè)計(jì) 圖4是管理態(tài)軟件的結(jié)構(gòu) 圖5是系統(tǒng)在線遷移方案圖。
具體實(shí)施例方式下面參照附圖,對(duì)本發(fā)明的內(nèi)容以一個(gè)具體實(shí)例來(lái)描述實(shí)現(xiàn)這一體系結(jié)構(gòu)的過(guò)程。在系統(tǒng)啟動(dòng)后,通過(guò)高速互連單元形成一個(gè)并行處理系統(tǒng),計(jì)算單元之間沒(méi)有直接聯(lián)系,所有的業(yè)務(wù)數(shù)據(jù)及系統(tǒng)管理都通過(guò)上層兩個(gè)冗余的互連模塊傳輸?shù)接?jì)算單元上?;ミB模塊的上行端口直接連接到兩個(gè)容錯(cuò)管理模塊,容錯(cuò)管理模塊A和容錯(cuò)管理模塊B模塊相互為備份。正常情況下,容錯(cuò)管理模塊A負(fù)責(zé)整個(gè)系統(tǒng)的業(yè)務(wù)管理,同時(shí)容錯(cuò)管理模塊B和容錯(cuò)管理模塊A也在做相互狀態(tài)備份,當(dāng)容錯(cuò)管理A出現(xiàn)問(wèn)題或整體故障管理系統(tǒng)發(fā)現(xiàn)容錯(cuò)管理模塊A有可能出現(xiàn)問(wèn)題時(shí)。主動(dòng)故障管理系統(tǒng)會(huì)對(duì)故障進(jìn)行隔離與恢復(fù),從而將業(yè)務(wù)管理交由容錯(cuò)管理模塊B處理,使系統(tǒng)具備較高的可用性。主動(dòng)故障管理系統(tǒng)中的局部故障管理模塊負(fù)責(zé)完成節(jié)點(diǎn)自身的故障檢測(cè)和故障處理。當(dāng)預(yù)測(cè)或檢測(cè)出故障后,通過(guò)故障消息發(fā)送接口發(fā)送給局部故障管理單元;監(jiān)控模塊定期存儲(chǔ)歷史采集數(shù)據(jù),當(dāng)接收到局部故障管理單元數(shù)據(jù)請(qǐng)求后,通過(guò)周期性消息發(fā)送接口將本周期內(nèi)的采樣數(shù)據(jù)通過(guò)局部故障管理單元發(fā)送給整體故障管理單元,供整體故障管理單元做全局健康分析;當(dāng)通過(guò)故障修復(fù)接口接收到局部故障管理單元發(fā)送的故障處理指令時(shí),監(jiān)控模塊對(duì)處理指令作出分析,并對(duì)系統(tǒng)進(jìn)行帶內(nèi)故障修復(fù);監(jiān)控模塊為系統(tǒng)管理者提供用戶查詢接口,允許用戶動(dòng)態(tài)查詢當(dāng)前能進(jìn)行故障檢測(cè)的對(duì)象相關(guān)信息,增強(qiáng)檢測(cè)對(duì)象的可控制性;監(jiān)控模塊為系統(tǒng)管理者提供用戶配置接口,允許用戶動(dòng)態(tài)配置故障檢測(cè)對(duì)象,增加帶內(nèi)故障檢測(cè)的可擴(kuò)展性;監(jiān)控模塊通過(guò)管理軟件查詢接口,為系統(tǒng)管理軟件提供本地節(jié)點(diǎn)的系統(tǒng)運(yùn)行狀態(tài)數(shù)據(jù),方便系統(tǒng)管理軟件的全局資源調(diào)度。對(duì)于局部故障管理單元發(fā)送給整體故障管理單元的帶內(nèi)外異常信息首先由主動(dòng)故障管理單元中的診斷器進(jìn)行診斷,而對(duì)于整體故障管理單元周期性主動(dòng)獲取的各計(jì)算單元的信息則由分析器進(jìn)行分析,兩者工作的結(jié)果都傳遞給計(jì)劃器,然后由計(jì)劃器對(duì)照故障知識(shí)規(guī)則庫(kù)規(guī)劃出將要執(zhí)行的故障處理行為,最后由執(zhí)行器執(zhí)行。執(zhí)行器會(huì)形成相應(yīng)的指令流發(fā)送給用戶管理接口或者是局部故障管理單元。而學(xué)習(xí)器則針對(duì)整個(gè)過(guò)程進(jìn)行學(xué)習(xí)。另外,分析器還要用周期性獲取的各計(jì)算單元的軟硬件信息來(lái)維護(hù)計(jì)算單元狀態(tài)信息表以便系統(tǒng)管理軟件獲取。系統(tǒng)的資源由系統(tǒng)軟件管理平臺(tái)統(tǒng)一管理。包擴(kuò)由兩個(gè)容錯(cuò)管理單元組成的一個(gè)高可用的容錯(cuò)管理層,以及由運(yùn)行在計(jì)算單元上的從態(tài)軟件和輔助管理態(tài)軟件組成的從態(tài)單元。當(dāng)故障管理模塊檢測(cè)到目標(biāo)虛擬機(jī)發(fā)生故障或虛擬機(jī)運(yùn)行硬件發(fā)生故障時(shí),虛擬機(jī)管理模塊立即對(duì)該虛擬機(jī)實(shí)施現(xiàn)場(chǎng)保護(hù),例如保存內(nèi)存中的數(shù)據(jù)、記錄設(shè)備狀態(tài)等。同時(shí),自動(dòng)重新創(chuàng)建虛擬機(jī)并在新的虛擬機(jī)中恢復(fù)運(yùn)行環(huán)境,或者通知另外一個(gè)健康的計(jì)算節(jié)點(diǎn)上的虛擬機(jī)管理模塊,創(chuàng)建相同的虛擬機(jī),并接管原故障虛擬機(jī)上的運(yùn)行數(shù)據(jù),最終實(shí)現(xiàn)系統(tǒng)的整體遷移。除本發(fā)明的說(shuō)明書(shū)公開(kāi)的技術(shù)特征外均為本專業(yè)技術(shù)人員的公職技術(shù)。
權(quán)利要求
1.一種基于虛擬化的高可用計(jì)算機(jī)系統(tǒng)的設(shè)計(jì)方法,其特征在于,系統(tǒng)采用基于國(guó)產(chǎn)處理器及TCM芯片的全國(guó)產(chǎn)硬件計(jì)算平臺(tái),使用基于CPCI總線架構(gòu)的刀片設(shè)計(jì),提供高效的多機(jī)處理能力及良好的可擴(kuò)展性,該系統(tǒng)的核心為主動(dòng)故障管理系統(tǒng),其通過(guò)帶內(nèi)、帶外兩種方式對(duì)系統(tǒng)硬件及軟件狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)測(cè),通過(guò)對(duì)獲取數(shù)據(jù)的分析,以實(shí)現(xiàn)故障的預(yù)測(cè)、檢測(cè)及診斷過(guò)程,及時(shí)完成對(duì)故障的隔離與恢復(fù),基于虛擬化的高可用計(jì)算機(jī)系統(tǒng)分為三部分設(shè)計(jì),即系統(tǒng)硬件平臺(tái)、主動(dòng)故障管理系統(tǒng)、系統(tǒng)管理軟件平臺(tái),其中: 系統(tǒng)硬件平臺(tái):由計(jì)算單元通過(guò)高速互連單元形成一個(gè)并行處理系統(tǒng),計(jì)算單元之間沒(méi)有直接聯(lián)系,所有的業(yè)務(wù)數(shù)據(jù)及系統(tǒng)管理都通過(guò)上層兩個(gè)冗余的互連模塊傳輸?shù)接?jì)算單元上,互連模塊的上行端口直接連接到兩個(gè)容錯(cuò)管理模塊,兩個(gè)容錯(cuò)管理模塊相互為備份,通過(guò)心跳檢測(cè)相互檢查是否處于active狀態(tài)和進(jìn)行故障時(shí)兩個(gè)容錯(cuò)管理模塊之間的數(shù)據(jù)同步; 主動(dòng)故障管理系統(tǒng),主動(dòng)故障管理系統(tǒng)是整個(gè)系統(tǒng)的核心,包括局部故障管理模塊和整體故障管理模塊,局部故障管理模塊包括帶內(nèi)、帶外監(jiān)控模塊和故障處理模塊,整體故障管理模塊包括主動(dòng)故障管理模塊、通訊模塊和用戶管理接口,在本系統(tǒng)中,將消息傳輸層獨(dú)立于管理組件來(lái)設(shè)計(jì),其間定義標(biāo)準(zhǔn)的消息規(guī)范和定義,便于模塊化設(shè)計(jì),提高故障管理系統(tǒng)的擴(kuò)展性和可移植性,通過(guò)監(jiān)視器對(duì)系統(tǒng)資源的狀態(tài)和行為進(jìn)行檢測(cè),將異常狀態(tài)或行為形成故障描述傳遞給診斷組件,對(duì)故障位置、傳播途徑及影響范圍做出評(píng)價(jià),并根據(jù)知識(shí)/規(guī)則庫(kù)形成處理規(guī)則,由執(zhí)行器對(duì)涉及的故障組件進(jìn)行隔離、恢復(fù)相關(guān)操作; 系統(tǒng)管理軟件平臺(tái),具有管理系統(tǒng)資源、任務(wù)調(diào)度與切換、為客戶端提供系統(tǒng)映像功能,系統(tǒng)管理軟件平臺(tái)采一種雙層容錯(cuò)機(jī)制實(shí)現(xiàn),系統(tǒng)管理軟件平臺(tái)統(tǒng)一有序地管理雙容錯(cuò)管理、各計(jì)算單元、共享存儲(chǔ)器,并借助有效的故障處理機(jī)制,保證系統(tǒng)高可用的工作,協(xié)同管理模塊協(xié)調(diào)管理其他各模塊的工作,并為管理員提供友良好的管理界面。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,系統(tǒng)硬件平臺(tái)采用CPCI系統(tǒng)結(jié)構(gòu),以其高效的多機(jī)并行處理能力提供系統(tǒng)所需的處理能力和良好的可擴(kuò)展性,其接口簡(jiǎn)單集中,便于熱插拔設(shè)計(jì),對(duì)可維護(hù)性設(shè)計(jì)提供支持,同時(shí)可大大縮短系統(tǒng)“展開(kāi)時(shí)間”,另外,在通信與存儲(chǔ)接口、電源/散熱模塊都采用了冗余設(shè)計(jì)。
全文摘要
本發(fā)明提供一種基于虛擬化的高可用計(jì)算機(jī)系統(tǒng),高可用技術(shù)與虛擬化技術(shù)相結(jié)合是一種比較簡(jiǎn)單有效且節(jié)約成本的方法,高可用技術(shù)作為虛擬化的保障,為虛擬化提供可以穩(wěn)定運(yùn)行環(huán)境;將負(fù)載在虛擬化環(huán)境中,使得負(fù)載可以在可用的虛擬化環(huán)境中動(dòng)態(tài)地在線遷移,從而保證了業(yè)務(wù)的不間斷性,使系統(tǒng)的可用性得到了滿足。作為復(fù)雜業(yè)務(wù)系統(tǒng)的核心,其服務(wù)器平臺(tái)需要完成系統(tǒng)管理、數(shù)據(jù)收發(fā)、數(shù)據(jù)處理、指令處理、文電處理以及軟件處理等重要功能,對(duì)計(jì)算機(jī)系統(tǒng)同時(shí)提出了高可用性和高處理能力的需求,同時(shí)考慮到可能出現(xiàn)的在多個(gè)不同層次的部署的需求,還要求計(jì)算機(jī)系統(tǒng)具備規(guī)??缮炜s性,對(duì)可擴(kuò)展性存在較高要求。
文檔編號(hào)G06F9/455GK103106126SQ20131001481
公開(kāi)日2013年5月15日 申請(qǐng)日期2013年1月16日 優(yōu)先權(quán)日2013年1月16日
發(fā)明者叢戎, 吳楠 申請(qǐng)人:浪潮電子信息產(chǎn)業(yè)股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1