專利名稱:用于刀片服務(wù)器的雙機熱備的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體涉及網(wǎng)絡(luò)領(lǐng)域,更具體地,涉及用于刀片服務(wù)器的雙機熱備的方法和裝置。
背景技術(shù):
在當前的刀片服務(wù)器應(yīng)用中,管理模塊的作用是毋庸置疑的。然而,由于系統(tǒng)自身 的穩(wěn)定性以及諸如軟硬件等原因,管理模塊存在發(fā)生故障的可能。故障一旦發(fā)生,就會導致 刀片服務(wù)器不能正常運轉(zhuǎn)。而修復系統(tǒng)是需要花費時間的,對于一些重要的業(yè)務(wù)入口或接 入點(企業(yè)、銀行等),管理模塊出現(xiàn)故障時,目前的系統(tǒng)存在著很大的風險。因此,市場上 急需一種具有備份機制的刀片服務(wù)器來避免這種情況發(fā)生。而對于其他領(lǐng)域的備份機制,如果直接應(yīng)用于本發(fā)明,則會得到具有主備關(guān)系的 雙機機制,即,雙機熱備機制。然而,這樣的方案仍然存在很大的缺陷。例如無法自動監(jiān)控 運行管理模塊的故障;無法自動啟動備用管理模塊;無法在運行管理模塊出現(xiàn)故障并開啟 備用管理模塊時保留之前接收、處理的數(shù)據(jù)資源等等。而這些不足會在時間和數(shù)據(jù)資源方 面造成極大的浪費,對刀片服務(wù)器的運行產(chǎn)生顯著的不利影響。
發(fā)明內(nèi)容
考慮到上述問題而做出本發(fā)明。本發(fā)明提供了一種雙機熱備方法,包括以下步驟通過以太網(wǎng)接口對運行管理模 塊與備用管理模塊的同步數(shù)據(jù)進行同步;監(jiān)控運行管理模塊的故障;當出現(xiàn)故障時,備用 管理模塊根據(jù)同步數(shù)據(jù)替代運行管理模塊工作,其中,監(jiān)控包括步驟一,檢查運行管理模 塊與備用管理模塊之間的以太網(wǎng)接口是否有數(shù)據(jù)傳輸;步驟二,當在第一預定時間內(nèi)以太 網(wǎng)接口沒有數(shù)據(jù)傳輸時,檢查運行管理模塊與備用管理模塊之間的串口是否有數(shù)據(jù)傳輸; 步驟三,當在第二預定時間內(nèi)串口沒有數(shù)據(jù)傳輸時,確定運行管理模塊出現(xiàn)故障。其中,步驟二進一步包括當在第一預定時間內(nèi)以太網(wǎng)接口有數(shù)據(jù)傳輸時,返回步 馬聚-““‘ο其中,步驟三進一步包括當在第二預定時間內(nèi)串口有數(shù)據(jù)傳輸時,返回步驟一。其中,同步數(shù)據(jù)包括IP、時間。其中,監(jiān)控進一步包括檢查運行管理模塊的處理器在第三預定時間內(nèi)是否工作, 當處理器在第三預定時間內(nèi)不工作時,確定出現(xiàn)故障。此外,本發(fā)明還提供了一種雙機熱備裝置,包括同步模塊,用于通過以太網(wǎng)接口 對運行管理模塊與備用管理模塊的同步數(shù)據(jù)進行同步;監(jiān)控模塊,用于監(jiān)控運行管理模塊 的故障;以及替代模塊,用于在出現(xiàn)故障時使備用管理模塊根據(jù)同步數(shù)據(jù)替代運行管理模 塊工作,其中,監(jiān)控模塊包括第一檢查子模塊,用于檢查運行管理模塊與備用管理模塊之 間的以太網(wǎng)接口在第一預定時間內(nèi)是否有數(shù)據(jù)傳輸;第二檢查子模塊,用于在沒有數(shù)據(jù)傳 輸時檢查運行管理模塊與備用管理模塊之間的串口在第二預定時間內(nèi)是否有數(shù)據(jù)傳輸;以及故障確定子模塊,用于在沒有數(shù)據(jù)傳輸時確定運行管理模塊出現(xiàn)故障。其中,同步數(shù)據(jù)包括IP、時間。其中,監(jiān)控模塊進一步包括第三檢查子模塊,用于檢查運行管理模塊的處理器在 第三預定時間內(nèi)是否工作,當處理器在第三預定時間內(nèi)不工作時,確定出現(xiàn)故障。本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變 得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明 書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分,本發(fā) 明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。在附圖中圖1示出了根據(jù)本發(fā)明的示例性實施例的雙機熱備方法的流程圖;圖2示出了根據(jù)本發(fā)明的示例性實施例的雙機熱備方法中監(jiān)控步驟的流程圖;圖3示出了根據(jù)本發(fā)明的示例性實施例的雙機熱備裝置的框圖;以及圖4示出了根據(jù)本發(fā)明的示例性實施例的雙機熱備裝置中監(jiān)控模塊的流程圖。
具體實施例方式下面將結(jié)合附圖來詳細說明本發(fā)明的實施例。圖1示出了根據(jù)本發(fā)明的示例性實施例的雙機熱備方法的流程圖。如圖1所示, 雙機熱備方法可以包括S101,通過以太網(wǎng)接口對運行管理模塊與備用管理模塊的同步數(shù) 據(jù)進行同步;S103,監(jiān)控運行管理模塊的故障;S105,當出現(xiàn)故障時,備用管理模塊根據(jù)同 步數(shù)據(jù)替代運行管理模塊工作。其中,步驟S103可以具有多個子步驟。圖2示出了根據(jù)本發(fā)明的示例性實施例的雙機熱備方法中監(jiān)控步驟的流程圖。如 圖2所示,監(jiān)控步驟S103包括S1031,檢查運行管理模塊與備用管理模塊之間的以太網(wǎng)接 口是否有數(shù)據(jù)傳輸;S1033,當在第一預定時間內(nèi)以太網(wǎng)接口沒有數(shù)據(jù)傳輸時,檢查運行管 理模塊與備用管理模塊之間的串口是否有數(shù)據(jù)傳輸;S1035,當在第二預定時間內(nèi)串口沒有 數(shù)據(jù)傳輸時,確定運行管理模塊出現(xiàn)故障。其中,步驟S1033進一步包括當在第一預定時間內(nèi)以太網(wǎng)接口有數(shù)據(jù)傳輸時,返 回步驟S1031。步驟S1035進一步包括當在第二預定時間內(nèi)串口有數(shù)據(jù)傳輸時,返回步驟 S1031。而監(jiān)控步驟S103進一步包括檢查運行管理模塊的處理器在第三預定時間內(nèi)是 否工作,當處理器在第三預定時間內(nèi)不工作時,確定出現(xiàn)故障。上述方法具有如下功能1)通過以太網(wǎng)接口,實現(xiàn)兩個管理模塊之間IP、時間等數(shù)據(jù)的同步。2)對兩個管理模塊經(jīng)以太網(wǎng)及串口進行交互的雙管理模塊狀態(tài)進行監(jiān)控,出故障 時進行正確處理。3)在運行管理模塊出故障時,備用管理模塊能夠根據(jù)保存的信息順利升格為運行 管理模塊,保證系統(tǒng)穩(wěn)定運行硬件對于兩個管理模塊同時激活的情況還會有機制進行控制。即,當出現(xiàn)兩個管理模塊均激活的情況時,可以采取如下機制中的至少一種來進行控制1)停止所有管理模塊的工作,并重新啟動;2)根據(jù)預先設(shè)置的主備優(yōu)先級對其中的主管理模塊進行保持,并停止另一管理模 塊的工作;3)對當前兩個管理模塊的性能進行評分,并根據(jù)預定策略選擇一個管理模塊為運 行管理模塊,并停止另一管理模塊的工作(例如,第一管理模塊的性能高于第二管理模塊 的性能,則第一管理模塊為運行管理模塊)。此外,圖3示出了根據(jù)本發(fā)明的示例性實施例的雙機熱備裝置的框圖。如圖3所 示,雙機熱備裝置可以包括同步模塊301,用于通過以太網(wǎng)接口對運行管理模塊與備用管 理模塊的同步數(shù)據(jù)進行同步;監(jiān)控模塊303,用于監(jiān)控運行管理模塊的故障;以及替代模塊 305,用于在出現(xiàn)故障時使備用管理模塊根據(jù)同步數(shù)據(jù)替代運行管理模塊工作.而圖4示出了根據(jù)本發(fā)明的示例性實施例的雙機熱備裝置中監(jiān)控模塊的流程圖。 如圖4所示,監(jiān)控模塊303包括第一檢查子模塊3031,用于檢查運行管理模塊與備用管 理模塊之間的以太網(wǎng)接口在第一預定時間內(nèi)是否有數(shù)據(jù)傳輸;第二檢查子模塊3033,用于 在沒有數(shù)據(jù)傳輸時檢查運行管理模塊與備用管理模塊之間的串口在第二預定時間內(nèi)是否 有數(shù)據(jù)傳輸;以及故障確定子模塊3035,用于在沒有數(shù)據(jù)傳輸時確定運行管理模塊出現(xiàn)故 障。此外,監(jiān)控模塊303還可以包括第三檢查子模塊(未示出),用于檢查運行管理 模塊的處理器在第三預定時間內(nèi)是否工作,當處理器在第三預定時間內(nèi)不工作時,確定出 現(xiàn)故障。在本發(fā)明里,第一預定時間可以是60秒,第二預定時間可以是5秒,而第三預定時 間可以是小于1秒。當然,根據(jù)設(shè)計需求,這三個預定時間可以是相等或不等的。以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技 術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修 改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1.一種雙機熱備方法,其特征在于,所述方法包括以下步驟通過以太網(wǎng)接口對運行管理模塊與備用管理模塊的同步數(shù)據(jù)進行同步; 監(jiān)控所述運行管理模塊的故障;當出現(xiàn)故障時,所述備用管理模塊根據(jù)所述同步數(shù)據(jù)替代所述運行管理模塊工作, 其中,所述監(jiān)控包括步驟一,檢查所述運行管理模塊與所述備用管理模塊之間的所述以太網(wǎng)接口是否有數(shù) 據(jù)傳輸;步驟二,當在第一預定時間內(nèi)所述以太網(wǎng)接口沒有數(shù)據(jù)傳輸時,檢查所述運行管理模 塊與所述備用管理模塊之間的串口是否有數(shù)據(jù)傳輸;步驟三,當在第二預定時間內(nèi)所述串口沒有數(shù)據(jù)傳輸時,確定所述運行管理模塊出現(xiàn) 故障。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟二進一步包括 當在所述第一預定時間內(nèi)所述以太網(wǎng)接口有數(shù)據(jù)傳輸時,返回所述步驟一。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟三進一步包括 當在所述第二預定時間內(nèi)所述串口有數(shù)據(jù)傳輸時,返回所述步驟一。
4.根據(jù)權(quán)利要求1至3中任一項所述的方法,其特征在于,所述同步數(shù)據(jù)包括IP、時間。
5.根據(jù)權(quán)利要求1至3中任一項所述的方法,其特征在于,所述監(jiān)控進一步包括檢查所述運行管理模塊的處理器在第三預定時間內(nèi)是否工作,當所述處理器在所述第 三預定時間內(nèi)不工作時,確定出現(xiàn)故障。
6.一種雙機熱備裝置,其特征在于,包括同步模塊,用于通過以太網(wǎng)接口對運行管理模塊與備用管理模塊的同步數(shù)據(jù)進行同止少;監(jiān)控模塊,用于監(jiān)控所述運行管理模塊的故障;以及替代模塊,用于在出現(xiàn)故障時使所述備用管理模塊根據(jù)所述同步數(shù)據(jù)替代所述運行管 理模塊工作,其中,所述監(jiān)控模塊包括第一檢查子模塊,用于檢查所述運行管理模塊與所述備用管理模塊之間的所述以太網(wǎng) 接口在第一預定時間內(nèi)是否有數(shù)據(jù)傳輸;第二檢查子模塊,用于在沒有數(shù)據(jù)傳輸時檢查所述運行管理模塊與所述備用管理模塊 之間的串口在第二預定時間內(nèi)是否有數(shù)據(jù)傳輸;以及故障確定子模塊,用于在沒有數(shù)據(jù)傳輸時確定所述運行管理模塊出現(xiàn)故障。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述同步數(shù)據(jù)包括IP、時間。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述監(jiān)控模塊進一步包括第三檢查子模塊,用于檢查所述運行管理模塊的處理器在第三預定時間內(nèi)是否工作, 當所述處理器在所述第三預定時間內(nèi)不工作時,確定出現(xiàn)故障。
全文摘要
本發(fā)明涉及用于刀片服務(wù)器的雙機熱備的方法和裝置。本發(fā)明公開了一種雙機熱備方法,包括以下步驟通過以太網(wǎng)接口對運行管理模塊與備用管理模塊的同步數(shù)據(jù)進行同步;監(jiān)控運行管理模塊的故障;當出現(xiàn)故障時,備用管理模塊根據(jù)同步數(shù)據(jù)替代運行管理模塊工作,其中,監(jiān)控包括步驟一,檢查運行管理模塊與備用管理模塊之間的以太網(wǎng)接口是否有數(shù)據(jù)傳輸;步驟二,當在第一預定時間內(nèi)以太網(wǎng)接口沒有數(shù)據(jù)傳輸時,檢查運行管理模塊與備用管理模塊之間的串口是否有數(shù)據(jù)傳輸;步驟三,當在第二預定時間內(nèi)串口沒有數(shù)據(jù)傳輸時,確定運行管理模塊出現(xiàn)故障。此外,本發(fā)明還提供了一種雙機熱備裝置。
文檔編號G06F11/16GK102043688SQ20101059620
公開日2011年5月4日 申請日期2010年12月10日 優(yōu)先權(quán)日2010年12月10日
發(fā)明者張考華, 李華, 王峰, 鄭謙 申請人:曙光信息產(chǎn)業(yè)(北京)有限公司