專利名稱:分布式體系中主備倒換檢測(cè)和控制裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種以以太網(wǎng)方式實(shí)現(xiàn)通信和控制總線的分布式的體系中主備倒換檢測(cè)和控 制裝置和方法。
背景技術(shù):
在具有通信和控制總線的分布式的體系中,經(jīng)常需要為比較重要的單元捧供熱備份(所 謂熱備份,是指?jìng)浞莸膯卧幱谏想姞顟B(tài),在受保護(hù)的單元失效的時(shí)候,能夠自動(dòng)進(jìn)入工作 狀態(tài),代替失效單元的功能,同時(shí)不影響系統(tǒng)中其他單元的正常工作)。
現(xiàn)有的技術(shù)中,要實(shí)現(xiàn)主備倒換往往需要對(duì)整個(gè)系統(tǒng)架構(gòu),尤其是背板和其他單元進(jìn)行 很大的改造,實(shí)現(xiàn)熱備份往往帶來(lái)業(yè)務(wù)的中斷,不能自動(dòng)的實(shí)現(xiàn)工作狀態(tài)和備用狀態(tài)的靈活 遷移,不能在主備之間數(shù)據(jù)同步的基礎(chǔ)上快速實(shí)現(xiàn)倒換。在主備倒換發(fā)生的時(shí)候,往往會(huì)影 響到系統(tǒng)中其他單元的工作,或者需要對(duì)其他單元的軟硬件結(jié)構(gòu)進(jìn)行改變。有些主備倒換的 設(shè)計(jì)往往只能在系統(tǒng)中對(duì)關(guān)鍵單元進(jìn)行備份,如果都備份的話造成系統(tǒng)結(jié)構(gòu)非常復(fù)雜。目前 檢索到的一些專利,都增大了系統(tǒng)的復(fù)雜性,并沒有從根本上解決問(wèn)題,相反還降低了系統(tǒng) 的可靠性,或者給軟件帶來(lái)很大的實(shí)現(xiàn)難度。專利02150116通過(guò)與門、非門、異或門和上下 拉電阻的裝置,根據(jù)對(duì)方板所處狀態(tài),調(diào)整本單板狀態(tài);對(duì)方板接收本單板的狀態(tài)信息后, 作相應(yīng)狀態(tài)調(diào)整,參與主備倒換。但由于系統(tǒng)的結(jié)構(gòu)復(fù)雜性,影響了切換的速度和靈活性, 不利于實(shí)現(xiàn)快速無(wú)縫切換。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)存在的缺陷和不足,本發(fā)明提供一種分布式體系中主備倒換檢測(cè)和控制方
法
為了達(dá)到上述發(fā)明目的,本發(fā)明分布式體系中主備倒換檢測(cè)和控制方法,包括以下步驟:
(1) 初始化主單元和備份單元,主單元與系統(tǒng)數(shù)據(jù)總線連通,備份單元與系統(tǒng)數(shù)據(jù)總線
斷開
(2) 主單元控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信
(3) 主、備單元周期性相互進(jìn)行狀態(tài)檢測(cè),并進(jìn)行數(shù)據(jù)同步。
上述的分布式體系中主備倒換檢測(cè)和控制方法中,步驟(3)具體為 當(dāng)主備單元狀態(tài)正常時(shí),主備數(shù)據(jù)完成同步;
當(dāng)主單元檢測(cè)到備份單元狀態(tài)異常時(shí),主單元對(duì)備份單元進(jìn)行復(fù)位,同時(shí)向網(wǎng)管發(fā)出告 警消息
當(dāng)備份單元檢測(cè)到主單元狀態(tài)異常時(shí),備份單元對(duì)主單元進(jìn)行復(fù)位,同時(shí)將主單元與系 統(tǒng)數(shù)據(jù)總線斷開,向網(wǎng)管發(fā)出告警消息,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線 與下級(jí)設(shè)備之間的通信;
當(dāng)主單元檢測(cè)到自身狀態(tài)異常時(shí),主單元項(xiàng)備份單元發(fā)出請(qǐng)求倒換申請(qǐng),備份單元接到 所述請(qǐng)求倒換申請(qǐng)后,對(duì)主單元進(jìn)行復(fù)位,同時(shí)將主單元與系統(tǒng)數(shù)據(jù)總線斷開,向網(wǎng)管發(fā)出 告警消息,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信。
作為改進(jìn),所述步驟(3)還可以為
當(dāng)主備單元狀態(tài)正常時(shí),主備數(shù)據(jù)完成同步;
當(dāng)主單元檢測(cè)到備份單元狀態(tài)異常時(shí),主單元對(duì)備份單元進(jìn)行復(fù)位,同時(shí)向網(wǎng)管發(fā)出告 警消息;
當(dāng)備份單元檢測(cè)到主單元狀態(tài)異常時(shí),備份單元對(duì)主單元進(jìn)行復(fù)位,同時(shí)將主單元與系 統(tǒng)數(shù)據(jù)總線斷開,向網(wǎng)管發(fā)出告瞀消息,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線 與下級(jí)設(shè)備之間的通信,之后, 一旦主單元恢復(fù)正常,備份單元與系統(tǒng)數(shù)據(jù)總線斷開,主單 元恢復(fù)與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信;
當(dāng)主單元檢測(cè)到自身狀態(tài)異常時(shí),主單元項(xiàng)備份單元發(fā)出請(qǐng)求倒換申請(qǐng),備份單元接到 所述請(qǐng)求倒換申請(qǐng)后,對(duì)主單元進(jìn)行復(fù)位,同時(shí)將主單元與系統(tǒng)數(shù)據(jù)總線斷開,向網(wǎng)管發(fā)出 告警消息,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信,之后, 一旦主單元恢復(fù)正常,備份單元與系統(tǒng)數(shù)據(jù)總線斷開,主單元恢復(fù)與系統(tǒng)數(shù)據(jù)總線連通,控 制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信。
作為改進(jìn),所述步驟(3)還可以為
主備單元接收到強(qiáng)制倒換信號(hào),主備數(shù)據(jù)完成同步,主單元與系統(tǒng)數(shù)據(jù)總線斷開并進(jìn)行 復(fù)位,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信。
一種分布式體系中主備倒換檢測(cè)和控制裝置,包括
一端與系統(tǒng)數(shù)據(jù)總線相連,另一端分別與主備單元以及主備單元的以太網(wǎng)開關(guān)相連的二 層交換單元;所述主備單元分別都包括一個(gè)中央處理器和一個(gè)可編成邏輯電路;所述中央處 理器一端通過(guò)數(shù)據(jù)同步用IP數(shù)據(jù)線與二層交換單元相連,另一端通過(guò)中央處理器IP數(shù)據(jù)端 口與以太網(wǎng)開關(guān)使能端相連;可編成邏輯電路一端通過(guò)主備檢測(cè)和控制線與系統(tǒng)控制總線相 連,另一端通過(guò)開關(guān)控制線與以太網(wǎng)開關(guān)相連以太網(wǎng)開關(guān)通過(guò)IP數(shù)據(jù)線與二層交換單元相 連..
其中,中央處理器檢測(cè)本單元狀態(tài)并通過(guò)可編成邏輯電路經(jīng)過(guò)系統(tǒng)控制總線檢測(cè)其他單 元狀態(tài),根據(jù)設(shè)定,中央處理器通過(guò)可編成邏輯電路打開或關(guān)閉以太網(wǎng)開關(guān)。
采用本發(fā)明所述方法和裝置,與現(xiàn)有技術(shù)相比,在故障發(fā)生時(shí)能夠在不影響系統(tǒng)正常工 作的情況下實(shí)現(xiàn)倒換。并可以在故障排除之后自動(dòng)實(shí)現(xiàn)回復(fù)??梢詫?duì)系統(tǒng)進(jìn)行靈活的升級(jí), 最大限度的保證原有背板和工作單元不動(dòng),各個(gè)工作單元可以獨(dú)立升級(jí),實(shí)現(xiàn)熱備份。
本發(fā)明可以不僅僅對(duì)系統(tǒng)中的關(guān)鍵單元進(jìn)行備份,任何單元都可以在不影響背板和其他 單元的結(jié)構(gòu)的情況下,實(shí)現(xiàn)熱備份。
本發(fā)明可以實(shí)現(xiàn)快速倒換,實(shí)現(xiàn)無(wú)縫切換,不丟失數(shù)據(jù)。
本發(fā)明任何一個(gè)單元發(fā)生主備倒換,都不影響到其他單元的正常運(yùn)行,甚至可以不知曉, 也可以獨(dú)立發(fā)出報(bào)警。
本發(fā)明可以對(duì)單板上的二層交換單元可以進(jìn)行冗余設(shè)計(jì)和主備倒換。
本發(fā)明可以對(duì)多個(gè)CPU的系統(tǒng)協(xié)同倒換。
本發(fā)明可以支持一個(gè)主用單元和多個(gè)備用單元,備用單元競(jìng)爭(zhēng)上崗的機(jī)制,對(duì)其他單板 沒有影響。
本發(fā)明極大地提高了控制系統(tǒng)的可靠性,使得主備單元相對(duì)獨(dú)立,便于實(shí)現(xiàn)自動(dòng)倒換, 自動(dòng)回復(fù),便于和其他各種冗余方式結(jié)合使用。
圖1為實(shí)現(xiàn)主備倒換的檢測(cè)部分和控制部分組成示意圖2為智能光網(wǎng)絡(luò)設(shè)備中實(shí)現(xiàn)主備倒換檢測(cè)和控制的實(shí)施過(guò)程示意圖3為S也參與備份,系統(tǒng)中有多個(gè)CPU協(xié)同要求冗余的設(shè)計(jì)實(shí)施過(guò)程示意圖。
具體實(shí)施例方式
下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明
在圖l所示實(shí)施例中,檢測(cè)和控制部分的結(jié)構(gòu)是其中:
0:多組IP數(shù)據(jù)接口線,
1: IP數(shù)據(jù)線,
2: IP數(shù)據(jù)線,
11:數(shù)據(jù)同步用IP數(shù)據(jù)線,
22:數(shù)據(jù)同步用IP數(shù)據(jù)線,
Dl: CPUIP數(shù)據(jù)端口,
D2: CPUIP數(shù)據(jù)端口,
SW1:開關(guān)控制線,
SW2:開關(guān)控制線,
Rl:主備檢測(cè)和控制線,
R2:主備檢測(cè)和控制線,
DB:系統(tǒng)數(shù)據(jù)總線,
CB:系統(tǒng)控制總線,
Al:主單元(也可以叫工作單元),
A2:備份單元,
Cl:可編程邏輯電路,
C2:可編程邏輯電路,
CPU1:有至少2個(gè)IP通信接口的CPU系統(tǒng), CPU2:有至少2個(gè)IP通信接口的CPU系統(tǒng), El:以太網(wǎng)開關(guān), E2:以太網(wǎng)開關(guān), S: 二層交換單元。
其中檢測(cè)都分由CPU (#),可編程控制電路(#),主備檢測(cè)和控制線(#),系統(tǒng)控 制總線組成(#),主要進(jìn)行主備狀態(tài)的識(shí)別和故障的檢測(cè)和通知;控制部分由CPU,可編 程控制電路,開關(guān)控制線,以太網(wǎng)開關(guān),主備檢測(cè)和控制線,系統(tǒng)控制總線,并結(jié)合系統(tǒng)數(shù) 據(jù)總線和二層交換單元來(lái)實(shí)現(xiàn),這部分主要用來(lái)在確認(rèn)倒換信號(hào)后執(zhí)行各種形式的復(fù)位和倒 換動(dòng)作。
本發(fā)明分布式體系中主備倒換檢測(cè)和控制方法,包括以下步驟
(不失一般性,以圖l所示的實(shí)施例為例,Al為主單元及工作單元、A2為備用單元)
步驟1:初始化過(guò)程——設(shè)置主、備狀態(tài),(主、備工作差別),主單元將相連接的以 太網(wǎng)開關(guān)(El)打開,備份單元相連接的以太網(wǎng)開關(guān)(E2)關(guān)閉。不失一般性,設(shè)置初始化 前的單元按照備用狀態(tài)來(lái)進(jìn)行初始化,如果通過(guò)主備檢測(cè)和控制總線發(fā)現(xiàn)系統(tǒng)中沒有主用工 作單元存在則可以按照主用狀態(tài)進(jìn)行初始化??删幊踢壿嬰娐钒凑毡締卧臓顟B(tài)來(lái)控制以太 網(wǎng)開關(guān)的打開與關(guān)閉。
步驟2:主單元承擔(dān)系統(tǒng)中必要的通信和控制功能,通過(guò)S與DB進(jìn)行數(shù)據(jù)交換和處理。 當(dāng)可編程邏輯電路完成初始化設(shè)置后,系統(tǒng)單元上的應(yīng)用軟件進(jìn)行初始化,在軟件初試化之 前首先査看可編程邏輯電路中主備狀態(tài)寄存器的狀態(tài),不同的狀態(tài)進(jìn)入不同的初始化流程。 如果狀態(tài)是"主",那么應(yīng)用軟件進(jìn)入正常的初始化過(guò)程,創(chuàng)建和啟動(dòng)所有的應(yīng)用層進(jìn)程。 如果狀態(tài)是"備",那么只創(chuàng)建和啟動(dòng)進(jìn)行數(shù)據(jù)備份和定時(shí)檢測(cè)相關(guān)的進(jìn)程。
歩驟3:主、備單元周期性地進(jìn)行狀態(tài)檢測(cè)和數(shù)據(jù)同步。Cl和C2周期性的通過(guò)檢測(cè)和 控制總線相互進(jìn)行心跳檢測(cè)(不失一般性,定時(shí)檢測(cè)和清零對(duì)方的可編程邏輯電路中的故障 檢測(cè)寄存器);備用單元通過(guò)11和22周期性的和工作單元在DB上進(jìn)行數(shù)據(jù)同步。如果心 跳檢測(cè)出現(xiàn)異常,或者不能正常的進(jìn)行數(shù)據(jù)同歩,則判斷自己或者對(duì)方是否出現(xiàn)故障;
步驟4:當(dāng)工作單元發(fā)現(xiàn)備份單元出現(xiàn)異常時(shí),對(duì)備份單元進(jìn)行復(fù)位和發(fā)出告警
步驟5:當(dāng)備份單元發(fā)現(xiàn)工作單元出現(xiàn)異常時(shí),對(duì)工作單元進(jìn)行復(fù)位,同時(shí)關(guān)閉以太網(wǎng) 開關(guān)(El)和發(fā)出告警,備份單元狀態(tài)變?yōu)楣ぷ鲉卧?。同時(shí)將相連接的以太網(wǎng)開關(guān)(E2〉打 開。返回步驟2。
步驟6:當(dāng)工作單元發(fā)現(xiàn)自身出現(xiàn)異常時(shí),向備用單元發(fā)出請(qǐng)求倒換申請(qǐng);收到申請(qǐng)后,
備用單元對(duì)工作單元進(jìn)行復(fù)位,同時(shí)關(guān)閉以太網(wǎng)開關(guān)(El)和發(fā)出告警,備份單元狀態(tài)變?yōu)?工作單元。同時(shí)將相連接的以太網(wǎng)開關(guān)(E2)打開。返回步驟2。
另外,本發(fā)明還可以以以下方式進(jìn)行。
步驟5:當(dāng)備份單元發(fā)現(xiàn)工作單元出現(xiàn)異常時(shí),對(duì)工作單元進(jìn)行復(fù)位,同時(shí)關(guān)閉以太網(wǎng) 開關(guān)(El)和發(fā)出告警,備份單元狀態(tài)變?yōu)楣ぷ鲉卧?。同時(shí)將相連接的以太網(wǎng)開關(guān)(E2)打 開。
步驟6: Al恢復(fù)正常時(shí)(Cl, C2的作用),主備數(shù)據(jù)完成同步。A1打開E1, A2關(guān)閉E2。
作為另一種實(shí)施方案,本發(fā)明還可以是 與圖l所示流程的步驟l,步驟2,步驟3相同;
步驟4:強(qiáng)制信號(hào)到來(lái)時(shí)(如從CB,或R1, R2, Cl, C2),進(jìn)行數(shù)據(jù)同步,完成后當(dāng) 前工作單元復(fù)位,對(duì)應(yīng)的以太網(wǎng)開關(guān)關(guān)閉(E1或E2);同時(shí),備份單元狀態(tài)變?yōu)楣ぷ鲉卧?同時(shí)將相連接的以太網(wǎng)開關(guān)(El或E2)打開。返回圖1所示流程的歩驟2。
在圖2所示實(shí)施例中,是為智能光網(wǎng)絡(luò)設(shè)備中實(shí)現(xiàn)主備倒換檢測(cè)和控制裝置結(jié)構(gòu)。
在智能光網(wǎng)絡(luò)設(shè)睪中,機(jī)架單元的分布式控制總線體系的實(shí)現(xiàn)主備倒換檢測(cè)和控制的具 體實(shí)施過(guò)程如下所述
智能光網(wǎng)絡(luò)設(shè)備中,控制板有兩個(gè)以太網(wǎng)口,都連接到二層交換單元上(HUB),其中 一個(gè)網(wǎng)口用來(lái)主備控制板之間的數(shù)據(jù)同步,主備控制板的這個(gè)網(wǎng)口分配不同的IP地址,另一 個(gè)以太網(wǎng)口用作控制板同其它單板和其它網(wǎng)元之間進(jìn)行的通訊,主備控制板上的這個(gè)網(wǎng)口分 配相同的IP地址,由以太網(wǎng)開關(guān)控制網(wǎng)口是否連接到二層交換單元上,即確保在某一特定時(shí) 刻只有一個(gè)控制板能通過(guò)以太網(wǎng)和外部通訊,不會(huì)發(fā)生地址沖突。
FPGA的開關(guān)控制線負(fù)責(zé)控制以太網(wǎng)開關(guān)的通斷,復(fù)位控制線負(fù)責(zé)控制另一個(gè)控制板的 故障檢測(cè)和復(fù)位。節(jié)點(diǎn)上電初始化后,先完成初始化的控制板作為主板,另一控制板作為備 份板。
節(jié)點(diǎn)上電初始化過(guò)程中,首先是FPGA初始化過(guò)程,F(xiàn)PGA初試設(shè)置主備控制板的FPGA 主備狀態(tài)寄存器都為備份狀態(tài),完成初試化的FPGA通過(guò)復(fù)位控制線査看另一控制板狀態(tài), 如果狀態(tài)為"主",則將本板FPGA主備狀態(tài)寄存器設(shè)置為"備",反之設(shè)置為"主"。當(dāng)FPGA完成初始化設(shè)置后,應(yīng)用軟件進(jìn)行初始化,在軟件初試化之前首先査看FPGA 主備狀態(tài)寄存器的狀態(tài),不同的狀態(tài)進(jìn)入不同的初始化流程。如果狀態(tài)是"主",那么應(yīng)用 軟件進(jìn)入正常的初始化過(guò)程,創(chuàng)建和啟動(dòng)所有的應(yīng)用層進(jìn)程。如果狀態(tài)是"備",那么只創(chuàng) 建和啟動(dòng)進(jìn)行數(shù)據(jù)備份和定時(shí)檢測(cè)的相關(guān)進(jìn)程,其它應(yīng)用進(jìn)程不創(chuàng)建和啟動(dòng)。
主備控制板都初試化完成后,主控制板運(yùn)行應(yīng)用軟件的所有功能,備份控制板只負(fù)責(zé)檢 測(cè)主控制板狀態(tài),并且主備控制板的數(shù)據(jù)要同歩,需要主控制板將數(shù)據(jù)庫(kù)中的信息通過(guò)通訊 接口備份到備控制板上。
當(dāng)前工作的主控制板故障后,要發(fā)生主備倒換,故障的檢測(cè)機(jī)制如下
1、 主控制板控制平面應(yīng)用軟件的定時(shí)檢測(cè)任務(wù)以50ms為周期將主控制板的FPGA故障 檢測(cè)寄存器加l;
2、 備份控制板的FPGA通過(guò)復(fù)位控制線以200ms為周期檢測(cè)主控制板FPGA故障檢測(cè) 寄存器是否為0;
3、 如果不等于O,則將寄存器置O,重復(fù)步驟1 2;
4、 如果等于O,說(shuō)明控制板發(fā)生故障。
上述過(guò)程是對(duì)稱的,也同樣適用于主控制板檢測(cè)備份控制板的故障。
當(dāng)主控制板發(fā)現(xiàn)備用板出現(xiàn)異常時(shí),則對(duì)備份單元進(jìn)行復(fù)位,并發(fā)出聲光告螯,同時(shí)向 網(wǎng)管發(fā)出告警消息這個(gè)過(guò)程中,主用板和備用板的主備狀態(tài)不發(fā)生變化;
當(dāng)備用控制板發(fā)現(xiàn)主控制板出現(xiàn)異常時(shí),對(duì)主控制板進(jìn)行復(fù)位,在主控制板被復(fù)位的同 時(shí),上面的FPGA的主備狀態(tài)回到缺省的備用態(tài),這時(shí)主控制板上的以太網(wǎng)開關(guān)就立即在 FPGA的邏輯控制下被關(guān)閉,備控制板上面的FPGA的邏輯由"備"變?yōu)?主",系統(tǒng)單元 的狀態(tài)變?yōu)橹骺刂瓢澹l(fā)出聲光告瞀,同時(shí)向網(wǎng)管發(fā)出告警消息,當(dāng)前控制板上的以太網(wǎng) 開關(guān)就立即在FPGA的邏輯控制下被打開。
備份控制板FPGA產(chǎn)生主備倒換中斷信號(hào),通知本板的應(yīng)用層軟件應(yīng)用層軟件的ISR 接收到中斷信號(hào)后,啟動(dòng)應(yīng)用層的所有進(jìn)程,按照主控制板的IP地址和系統(tǒng)內(nèi)的其他單元之 間進(jìn)行通訊,進(jìn)行任務(wù)處理故障控制板重啟后成為備份控制板,重新與當(dāng)前工作的主控制 板建立通訊,主控制板周期性的向備份控制板發(fā)送同步數(shù)據(jù);
當(dāng)主控制板發(fā)現(xiàn)自身出現(xiàn)異常時(shí),也可以直接向備用板發(fā)出請(qǐng)求倒換申請(qǐng);收到申請(qǐng)后,
備用板對(duì)主控制板進(jìn)行復(fù)位,同時(shí)關(guān)閉以太網(wǎng)開關(guān)和發(fā)出告聱,備份單元狀態(tài)變?yōu)楣ぷ鲉卧?br>
同時(shí)將相連接的以太網(wǎng)開關(guān)(E2)打開,擔(dān)負(fù)其系統(tǒng)主控制板的作用。
在圖3所示實(shí)施例中,S也參與備份,系統(tǒng)中有多個(gè)CPU協(xié)同要求冗余的設(shè)計(jì)實(shí)施過(guò)程 示意圖
圖3中,控制板上帶有兩個(gè)CPU,能夠統(tǒng)一的參與主備檢測(cè)和倒換機(jī)制;,并且板上的二 層交換單元也能夠參與倒換,方法是本板外聯(lián)的所有以太網(wǎng)數(shù)據(jù)總線端口在背板和二層交換 單元之間都通過(guò)以太網(wǎng)開關(guān)相連(用于數(shù)據(jù)同步的網(wǎng)口除外)。
當(dāng)本板狀態(tài)為主時(shí),所有以太網(wǎng)開關(guān)為打開狀態(tài);當(dāng)本板狀態(tài)為備時(shí),所有以太網(wǎng)開關(guān) 為關(guān)閉狀態(tài);
如果工作單元上的CPU子板出現(xiàn)故障,則工作單元的控制板上的FPGA:能夠檢測(cè)到,并 通知備用板,要求進(jìn)行倒換操作;
如果工作單元上的二層交換單元出現(xiàn)故障,則工作單元與備用單元之間的數(shù)據(jù)同步,工 作單元與系統(tǒng)其他單元之間,工作單元上的主控CPU與子板上的CPU之間的通訊將出現(xiàn)問(wèn) 題,可以通過(guò)系統(tǒng)控制進(jìn)程通知備用板上的FPGA,則可以啟動(dòng)主備倒換進(jìn)程,這樣可以最 大限度的避免由于二層交換單元的失效而導(dǎo)致系統(tǒng)癱瘓的問(wèn)題,可以實(shí)現(xiàn)對(duì)二層交換單元的 備份。也可以通過(guò)這樣的機(jī)制,實(shí)現(xiàn)多CPU系統(tǒng)單元中的協(xié)同冗余和主備倒換。
強(qiáng)制倒換的實(shí)施例
強(qiáng)制倒換的機(jī)制實(shí)際就是給管理員提供了一種可以手動(dòng)啟動(dòng)倒換的機(jī)制,在不需要理由 的情況下,管理員可以按下主控制板或者備用板上的手動(dòng)倒換鍵,都可以啟動(dòng)主備倒換過(guò)程。
其他機(jī)制都和實(shí)施例1所說(shuō)的類似或相同,只是當(dāng)強(qiáng)制信號(hào)到來(lái)時(shí)(如從CB,或R1, R2, Cl, C2),進(jìn)行數(shù)據(jù)同步,當(dāng)前工作單元復(fù)位,對(duì)應(yīng)的以太網(wǎng)開關(guān)關(guān)閉(E1或E2); 同時(shí),備份單元狀態(tài)變?yōu)楣ぷ鲉卧M瑫r(shí)將相連接的以太網(wǎng)開關(guān)(E1或E2)打開。
在這個(gè)機(jī)制基礎(chǔ)上,也支持讓主控制板被突然拔掉或者調(diào)電的時(shí)候,備用板一旦發(fā)現(xiàn)主 用板消失(通過(guò)主備檢測(cè)和控制總線),就馬上啟動(dòng)倒換進(jìn)程,將自己的狀態(tài)由"備"轉(zhuǎn)為 "主",同時(shí)啟動(dòng)應(yīng)用軟件進(jìn)程,擔(dān)負(fù)起數(shù)據(jù)處理和網(wǎng)元內(nèi)部數(shù)據(jù)通訊的作用。
回復(fù)功能的實(shí)施例
回復(fù)過(guò)程指的是A1、 A2不是對(duì)稱關(guān)系,而是主次關(guān)系,也就是系統(tǒng)中始終有塊單元是
主用板,當(dāng)主用板發(fā)生故障,將系統(tǒng)的控制權(quán)暫時(shí)移交給備用板后,當(dāng)主用板復(fù)位以后正常, 還要把控制權(quán)交回給原來(lái)的主用板。具體的過(guò)程是,當(dāng)備份單元發(fā)現(xiàn)工作單元出現(xiàn)異常時(shí), 對(duì)工作單元進(jìn)行復(fù)位,同時(shí)關(guān)閉以太網(wǎng)開關(guān)(El)和發(fā)出告警,備份單元狀態(tài)變?yōu)楣ぷ鲉卧?同時(shí)將相連接的以太網(wǎng)開關(guān)(E2)打開。
當(dāng)確認(rèn)原來(lái)的主控制板恢復(fù)正常時(shí),馬上進(jìn)行最后一次主備數(shù)據(jù)同歩,完成后,立即改 變雙方的主備狀態(tài),主備板上的以太網(wǎng)開關(guān)也分別關(guān)閉和打開,這樣在不用進(jìn)行復(fù)位的情況 下完成主備狀態(tài)更迭。
本發(fā)明的裝置可以不僅僅對(duì)系統(tǒng)中的關(guān)鍵單元進(jìn)行備份,任何單元都可以在使用本裝置 之后在不影響背板和其他單元的結(jié)構(gòu)的情況下,實(shí)現(xiàn)熱備份。
本發(fā)明自動(dòng)操作,可以實(shí)現(xiàn)快速倒換,實(shí)現(xiàn)無(wú)縫切換,不丟失數(shù)據(jù)。
本發(fā)明各單元相互獨(dú)立,任何一個(gè)單元發(fā)生主備倒換,都不影響到其他單元的正常運(yùn)行, 甚至可以不知曉,也可以獨(dú)立發(fā)出報(bào)警。
本發(fā)明可以對(duì)單板上的二層交換單元可以進(jìn)行冗余設(shè)計(jì)和主備倒換。
本發(fā)明可以對(duì)多個(gè)CPU的系統(tǒng)協(xié)同倒換。
本發(fā)明可以支持一個(gè)主用單元和多個(gè)備用單元,備用單元競(jìng)爭(zhēng)上崗的機(jī)制,對(duì)其他單板 沒有影響。
本發(fā)明極大地提高了控制系統(tǒng)的可靠性,使得主備單元相對(duì)獨(dú)立,便于實(shí)現(xiàn)自動(dòng)倒換, 自動(dòng)回復(fù),便于和其他各種冗余方式結(jié)合使用。
權(quán)利要求
1、一種分布式體系中主備倒換檢測(cè)和控制方法,其特征在于包括以下步驟(1)初始化主單元和備份單元,主單元與系統(tǒng)數(shù)據(jù)總線連通,備份單元與系統(tǒng)數(shù)據(jù)總線斷開;(2)主單元控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信;(3)主、備單元周期性相互進(jìn)行狀態(tài)檢測(cè),并進(jìn)行數(shù)據(jù)同步。
2、 根據(jù)權(quán)利要求1所述的分布式體系中主備倒換檢測(cè)和控制方法,其特征在于所述步 驟(3)具體為當(dāng)主備單元狀態(tài)正常時(shí),主備數(shù)據(jù)完成同步當(dāng)主單元檢測(cè)到備份單元狀態(tài)異常時(shí),主單元對(duì)備份單元進(jìn)行復(fù)位,同時(shí)向網(wǎng)管發(fā)出告 警消息;當(dāng)備份單元檢測(cè)到主單元狀態(tài)異常時(shí),備份單元對(duì)主單元進(jìn)行復(fù)位,同時(shí)將主單元與系 統(tǒng)數(shù)據(jù)總線斷開,向網(wǎng)管發(fā)出告警消息,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線 與下級(jí)設(shè)備之間的通信;當(dāng)主單元檢測(cè)到自身狀態(tài)異常時(shí),主單元項(xiàng)備份單元發(fā)出請(qǐng)求倒換申請(qǐng),備份單元接到 所述請(qǐng)求倒換申請(qǐng)后,對(duì)主單元進(jìn)行復(fù)位,同時(shí)將主單元與系統(tǒng)數(shù)據(jù)總線斷開,向網(wǎng)管發(fā)出 告警消息,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信。
3、 根據(jù)權(quán)利要求1所述的分布式體系中主備倒換檢測(cè)和控制方法,其特征在于所述步 驟(3)具體為當(dāng)主備單元狀態(tài)正常時(shí),主備數(shù)據(jù)完成同步;當(dāng)主單元檢測(cè)到備份單元狀態(tài)異常時(shí),主單元對(duì)備份單元進(jìn)行復(fù)位,同時(shí)向網(wǎng)管發(fā)出告 蝥消息;當(dāng)備份單元檢測(cè)到主單元狀態(tài)異常時(shí),備份單元對(duì)主單元進(jìn)行復(fù)位,同時(shí)將主單元與系 統(tǒng)數(shù)據(jù)總線斷開,向網(wǎng)管發(fā)出告警消息,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線 與下級(jí)設(shè)備之間的通信,之后,一旦主單元恢復(fù)正常,備份單元與系統(tǒng)數(shù)據(jù)總線斷開,主單 元恢復(fù)與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信;當(dāng)主單元檢測(cè)到自身狀態(tài)異常時(shí),主單元項(xiàng)備份單元發(fā)出請(qǐng)求倒換申請(qǐng)^備份單元接到所述請(qǐng)求倒換申請(qǐng)后,對(duì)主單元進(jìn)行復(fù)位,同時(shí)將主單元與系統(tǒng)數(shù)據(jù)總線斷開,向網(wǎng)管發(fā)出 告警消息,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信,之后, 一旦主單元恢復(fù)正常,備份單元與系統(tǒng)數(shù)據(jù)總線斷開,主單元恢復(fù)與系統(tǒng)數(shù)據(jù)總線連通,控 制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信。
4、 根據(jù)權(quán)利要求l所述的分布式體系中主備倒換檢測(cè)和控制方法,其特征在于所述歩 驟(3)具體為主備單元接收到強(qiáng)制倒換信號(hào),主備數(shù)據(jù)完成同步,主單元與系統(tǒng)數(shù)據(jù)總線斷開并進(jìn)行 復(fù)位,備份單元與系統(tǒng)數(shù)據(jù)總線連通,控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信。
5、 一種分布式體系中主備倒換檢測(cè)和控制裝置,其特征在于包括一端與系統(tǒng)數(shù)據(jù)總線相連,另一端分別與主備單元以及主備單元的以太網(wǎng)開關(guān)相連的二 層交換單元;所述主備單元分別都包括一個(gè)中央處理器和一個(gè)可編成邏輯電路;所述中央處 理器一端通過(guò)數(shù)據(jù)同步用IP數(shù)據(jù)線與二層交換單元相連,另一端通過(guò)中央處理器IP數(shù)據(jù)端 口與以太網(wǎng)開關(guān)使能端相連;可編成邏輯電路一端通過(guò)主備檢測(cè)和控制線與系統(tǒng)控制總線相 連,另一端通過(guò)開關(guān)控制線與以太網(wǎng)開關(guān)相連;以太網(wǎng)開關(guān)通過(guò)IP數(shù)據(jù)線與二層交換單元相 連;其中,中央處理器檢測(cè)本單元狀態(tài)并通過(guò)可編成邏輯電路經(jīng)過(guò)系統(tǒng)控制總線檢測(cè)其他單 元狀態(tài),根據(jù)設(shè)定,中央處理器通過(guò)可編成邏輯電路打開或關(guān)閉以太網(wǎng)開關(guān)。
全文摘要
本發(fā)明公開了一種分布式體系中主備倒換檢測(cè)和控制裝置和方法?,F(xiàn)有技術(shù)中,要實(shí)現(xiàn)主備倒換需要對(duì)整個(gè)系統(tǒng)架構(gòu)進(jìn)行很大的改造,實(shí)現(xiàn)熱備份往往帶來(lái)業(yè)務(wù)的中斷,不能自動(dòng)的實(shí)現(xiàn)工作狀態(tài)和備用狀態(tài)的靈活遷移,不能在主備之間數(shù)據(jù)同步的基礎(chǔ)上快速實(shí)現(xiàn)倒換。為解決上述問(wèn)題,本發(fā)明多電壓監(jiān)控和保護(hù)電路的實(shí)現(xiàn)方法,包括以下步驟(1)初始化主單元和備份單元,主單元與系統(tǒng)數(shù)據(jù)總線連通,備份單元與系統(tǒng)數(shù)據(jù)總線斷開;(2)主單元控制系統(tǒng)數(shù)據(jù)總線與下級(jí)設(shè)備之間的通信;(3)主、備單元周期性相互進(jìn)行狀態(tài)檢測(cè),并進(jìn)行數(shù)據(jù)同步。本發(fā)明適用于各種分布式體系。
文檔編號(hào)H04L12/24GK101192960SQ200610144989
公開日2008年6月4日 申請(qǐng)日期2006年11月28日 優(yōu)先權(quán)日2006年11月28日
發(fā)明者永 李, 王加瑩 申請(qǐng)人:中興通訊股份有限公司