亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

小型電信和計(jì)算通用硬件平臺(tái)架構(gòu)系統(tǒng)及可靠性管理方法

文檔序號(hào):7662761閱讀:201來(lái)源:國(guó)知局
專利名稱:小型電信和計(jì)算通用硬件平臺(tái)架構(gòu)系統(tǒng)及可靠性管理方法
技術(shù)領(lǐng)域
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別是指一種小型電信和計(jì)算通用硬件平臺(tái)架
構(gòu)(Micro Telecommunications Computing Architecture, MicroTCA)系統(tǒng)及可 靠性管理方法。
背景技術(shù)
MicroTCA是PCI工業(yè)計(jì)算機(jī)廠家協(xié)會(huì)(PCI Industrial Computer Manufacturers Group, PICMG)組織制定的小型電信和計(jì)算通用硬件平臺(tái)架構(gòu), MicroTCA利用先進(jìn)夾層卡(Advanced Mezzanine Card, AMC )來(lái)構(gòu)筑系統(tǒng), 支持熱插拔的AMC可以直接插到MicroTCA的背板。MicroTCA主要定位中 低端、對(duì)成本比較壽丈感、要求小物理尺寸的電信或計(jì)算應(yīng)用。主要的應(yīng)用包括 無(wú)線基站、路由器、媒體網(wǎng)關(guān)等。MicroTCA基本規(guī)范名稱是MicroTCA.O,定 義了 MicroTCA的機(jī)框結(jié)構(gòu)、管理、電源、散熱、互連等內(nèi)容。
AMC是PICMG組織定義的可以支持熱插拔的通用夾層卡,具體類型包括 數(shù)字信號(hào)處理(DSP) AMC、中央處理器(CPU) AMC、網(wǎng)絡(luò)處理器(NP) AMC、接口 AMC、存儲(chǔ)AMC等類型。AMC模塊可以直接插到MicroTCA的 背板上來(lái)應(yīng)用,構(gòu)成MicroTCA系統(tǒng)。AMC規(guī)范包括AMC.X系列標(biāo)準(zhǔn)規(guī)范, 定義了AMC的結(jié)構(gòu)、管理、電源、散熱、互連及交換網(wǎng)建議等內(nèi)容。
智能平臺(tái)管理接口 (Intelligent Platform Management Interface,, IPMI)是 為提高服務(wù)器的可用性指標(biāo)而推出的智能化平臺(tái)管理接口標(biāo)準(zhǔn),最初目的是為 服務(wù)器提供設(shè)備管理、傳感器/事件管理、用戶管理、風(fēng)扇框/電源框管理、遠(yuǎn)
管理規(guī)范。智能平臺(tái)管理總線(Intelligent Platform Management Bus, IPMB )是基于 IPMI規(guī)范的管理總線的統(tǒng)稱。在MicroTCA中IPMB總線又分為兩種,IPMB-0 和本地智能平臺(tái)管理總線I (Local Intelligent Platform Management Bus, IPMB-L )。其中IPMB-0連接MicroTCA系統(tǒng)中的MicroTCA承載管理控制器 (MicroTCA承載板Manager Controller, MCMC )和增強(qiáng)模塊管理控制器 (Enhanced Management Controller, EMMC ),實(shí)現(xiàn)MicroTCA的交換控制才莫塊 (MicroTCA承載板Hub, MCH)對(duì)電源模塊和風(fēng)扇單元的管理。而IPMB-L 連接MicroTCA系統(tǒng)中的MCMC和模塊管理控制器(Management Controller, MMC),實(shí)現(xiàn)MCH對(duì)各AMC模塊的管理。
根據(jù)MicroTCA的規(guī)范, 一個(gè)基本的MicroTCA系統(tǒng)支持的AMC數(shù)量最 大為12,支持的MCH數(shù)量最大為2,所支持的兩個(gè)MCH可以互為冗余備份 關(guān)系。
圖1為MicroTCA.O規(guī)范承載板FRU信息設(shè)備連接示意圖。參見(jiàn)圖1所示, 每塊MCMC通過(guò)獨(dú)立的I2C訪問(wèn)一個(gè)承載板FRU信息設(shè)備,利用承載板FRU 信息設(shè)備的FRU數(shù)據(jù)配置系統(tǒng)設(shè)備。所述系統(tǒng)設(shè)備可以包括MCH、 AMC、電 源單元以及風(fēng)扇單元??紤]到MCH的通用性,承載板FRU信息設(shè)備作為獨(dú)立 的物理實(shí)體,可以由固定于MicroTCA背板的非易失性存儲(chǔ)器實(shí)現(xiàn)。圖1中示 出,MCMC1通過(guò)其專用通道I2(31訪問(wèn)其對(duì)應(yīng)的承載板FRU信息設(shè)備1,同
基于AMC規(guī)范設(shè)計(jì)的任何AMC單板,其FRU存儲(chǔ)信息描述AMC槽位 每個(gè)端口能力,同時(shí)承載板FRU信息設(shè)備存儲(chǔ)的信息中描述背板每個(gè)端口能 力,MCMC的FRU存儲(chǔ)信息中描述MCH槽位每個(gè)端口能力。通過(guò)比較這些 資源信息中各端口能力,承載板管理器決定AMC或MCH星型端口是否使能。
力信息,保證只有兼容的端口才能使能打開(kāi)。承載板FRU信息設(shè)備存儲(chǔ)的FRU 數(shù)據(jù)包括MicroTCA承載板屬性,如背板聯(lián)接,AMC上下電順序,其存儲(chǔ)信息反映MicroTCA承載板管理AMC單板能力。承載板FRU信息設(shè)備在MCMC 外部,通過(guò)專用總線與MCMC連接。MicroTCA機(jī)框考慮到每個(gè)與MCMC與 承載板FRU信息設(shè)備通過(guò)I2C總線連接。 一旦承載板FRU信息設(shè)備被MCMC 發(fā)現(xiàn),首先檢查器件有效性。在冗余MCMC系統(tǒng)中,兩塊MCMC之間會(huì)實(shí)時(shí) 傳達(dá)承載板FRU信息設(shè)備狀態(tài)。MCMC之間協(xié)商兩個(gè)承載板FRU信息設(shè)備 的主備關(guān)系。
圖2為MicroTCA.O規(guī)范MCH訪問(wèn)承載板FRU信息設(shè)備故障示意圖。 如圖2所示,當(dāng)MCMC1與承載板FRU信息設(shè)備1間專用I2C總線發(fā)生故障 時(shí),MCH1無(wú)法對(duì)承載板FRU信息設(shè)備1進(jìn)行管理。此時(shí),系統(tǒng)會(huì)面臨兩個(gè) 問(wèn)題
一,系統(tǒng)倒換頻繁風(fēng)險(xiǎn)。如果MicroTCA系統(tǒng)需要正常工作,MCH2必須 啟動(dòng)主備倒換動(dòng)作,激活MCH2,由MCH2來(lái)接替MCH1的工作,MCH2通 過(guò)專用I2C總線訪問(wèn)承載板FRU信息設(shè)備2接替管理工作,控制AMC單板正 常上下電及進(jìn)行E-Keying管理,該倒換觸發(fā)增加了主備倒換頻率和風(fēng)險(xiǎn)。
二,系統(tǒng)存在長(zhǎng)期帶故障運(yùn)行風(fēng)險(xiǎn)。當(dāng)MCm對(duì)應(yīng)的承載板FRU信息設(shè) 備l器件數(shù)據(jù)異常但可訪問(wèn)時(shí),MCH1無(wú)法及時(shí)用MCH2對(duì)應(yīng)的承載板FRU信 息設(shè)備2有效數(shù)據(jù)及時(shí)同步MCH1對(duì)應(yīng)的故障承載板FRU信息設(shè)備l內(nèi)容, 承載板FRU信息設(shè)備1故障不能及時(shí)得到修復(fù),系統(tǒng)存在帶故障運(yùn)行風(fēng)險(xiǎn)。 同樣,當(dāng)故障發(fā)生在承載板FRU信息設(shè)備2與MCMC2間時(shí),同樣存在上述 問(wèn)題。
綜上所述,在MicroTCA規(guī)范中,MCH與承載板FRU信息設(shè)備只通過(guò)一 個(gè)專用的fC接口連接,因此,可以導(dǎo)致MicroTCA規(guī)范定義的承載板FRU管 理總線架構(gòu)存在承載板FRU信息設(shè)備信息同步不一致及主備倒換負(fù)擔(dān)過(guò)重問(wèn) 題。信息同步故障將導(dǎo)致MCH對(duì)AMC管理失去控制,系統(tǒng)無(wú)法對(duì)AMC進(jìn) 行正常的配置和管理。同時(shí)MCH的倒換依賴其對(duì)應(yīng)的承載板FRU信息設(shè)備好 壞,降低了系統(tǒng)的可靠性。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例的主要目的是提供一種小型電信和計(jì)算通用硬件 平臺(tái)架構(gòu)系統(tǒng)及可靠性管理方法,以保證由于發(fā)生信息同步故障時(shí),實(shí)現(xiàn)對(duì)系 統(tǒng)設(shè)備進(jìn)行正常的配置和管理。
本發(fā)明實(shí)施例提供的一種MicroTCA系統(tǒng)的可靠性管理的方法,其中,所 述MicroTCA系統(tǒng)至少包括MCMC、主承載板FRU信息設(shè)備以及備承載板FRU 信息設(shè)備,該方法包4舌
當(dāng)確定主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí),所述MCMC利用所 述備承載板FRU信息設(shè)備的FRU數(shù)據(jù)進(jìn)行配置處理。
本發(fā)明提供的一種MicroTCA系統(tǒng),包括MCMC、主承載板FRU信息 設(shè)備以及備承載板FRU信息設(shè)備,所述MCMC與主承載板FRU信息設(shè)備以 及備承載板FRU信息設(shè)備分別相連,
所述主承載板FRU信息設(shè)備,用于在正常運(yùn)行時(shí),向所述MCMC提供 FRU數(shù)據(jù);
所述備承載板FRU信息設(shè)備,用于所述主承載板FRU信息設(shè)備不在位或 發(fā)生故障時(shí),向所述MCMC提供FRU數(shù)據(jù);
所述MCMC,用于獲取FRU數(shù)據(jù),并利用獲取的FRU數(shù)據(jù)進(jìn)行配置處理。
本發(fā)明提供的一種MicroTCA承載管理控制器,包括
數(shù)據(jù)獲取單元,用于在主承載板FRU信息設(shè)備運(yùn)行正常時(shí),從所述主承 載板FRU信息設(shè)備獲取FRU數(shù)據(jù);在所述主承載板FRU信息設(shè)備不在位或 發(fā)生故障時(shí),從所述備承載板FRU信息設(shè)備獲取FRU數(shù)據(jù);
配置單元,用于利用獲取的FRU數(shù)據(jù)進(jìn)行配置處理。
在本發(fā)明實(shí)施例中,當(dāng)MCH對(duì)應(yīng)承載板FRU信息設(shè)備發(fā)生故障時(shí),MCH 不需要啟動(dòng)復(fù)雜的主備倒換流程,而只需要通過(guò)訪問(wèn)備用承載板FRU信息設(shè) 備獲取正確的FRU數(shù)據(jù),進(jìn)而可以實(shí)現(xiàn)對(duì)系統(tǒng)設(shè)備進(jìn)行正常的配置和管理。


圖1為現(xiàn)有技術(shù)中MicroTCA.O規(guī)范承載板FRU信息設(shè)備連接示意圖; 圖2為針對(duì)圖1所示的MicroTCA.O規(guī)范MCH訪問(wèn)承載板FRU信息設(shè) 備故障示意圖3為本發(fā)明實(shí)施例的MicroTCA.O系統(tǒng)結(jié)構(gòu)示意圖4為本發(fā)明實(shí)施例的MCMC的結(jié)構(gòu)示意圖5為本發(fā)明實(shí)施例實(shí)現(xiàn)可靠性的方法流程示意圖。
具體實(shí)施例方式
在本發(fā)明實(shí)施例中,在MicroTCA系統(tǒng)中,當(dāng)確定主承載板FRU信息設(shè) 備不在位或發(fā)生故障時(shí),利用所述備承載板FRU信息設(shè)備的FRU數(shù)據(jù)配置系 統(tǒng)設(shè)備。所述系統(tǒng)設(shè)備可以包括MCH、 AMC、電源單元以及風(fēng)扇單元。
這里,確定主承載板FRU信息設(shè)備是否發(fā)生故障可以這樣實(shí)現(xiàn)在主承 載板FRU信息設(shè)備在位時(shí),但無(wú)法讀取主承載板FRU信息設(shè)備的FRU數(shù)據(jù), 或,對(duì)所述主承載板FRU信息設(shè)備所保存的信息一t驗(yàn)不成功時(shí),確定主承載 板FRU信息設(shè)備發(fā)生故障。
進(jìn)一步地,為了使系統(tǒng)更可靠的進(jìn)行配置,在利用所述備承載板FRU信 息設(shè)備的數(shù)據(jù)更新所述主承載板FRU信息設(shè)備所保存的FRU數(shù)據(jù)之前,可以 進(jìn)一步判斷備用FRU存儲(chǔ)設(shè)備是否在位,在所述備用FRU存儲(chǔ)設(shè)備在位,且 讀數(shù)據(jù)成功并對(duì)讀取的數(shù)據(jù)校驗(yàn)成功時(shí),獲得所述備承載板FRU信息設(shè)備所 保存的FRU數(shù)據(jù)。此后,再利用所述備承載板FRU信息設(shè)備的數(shù)據(jù)更新所述 主承載板FRU信息設(shè)備所保存的FRU數(shù)據(jù)。
當(dāng)確定主承載板FRU信息設(shè)備運(yùn)行正常時(shí),可以直接利用所述主承栽板 FRU信息設(shè)備的FRU數(shù)據(jù)配置系統(tǒng)設(shè)備。
當(dāng)然,當(dāng)主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí),且所述備承載板 FRU信息設(shè)備不在位或發(fā)生故障時(shí),可以提示用戶系統(tǒng)發(fā)生故障。為了實(shí)現(xiàn)數(shù)據(jù)同步,當(dāng)確定主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí), 可以利用所述備承載板FRU信息設(shè)備的FRU數(shù)據(jù)更新所述主承載板FRU信 息設(shè)備所保存的FRU數(shù)據(jù)。
參見(jiàn)圖3所示,本發(fā)明實(shí)施例的系統(tǒng)包括MCMC、主承載板FRU信息 設(shè)備以及備承載板FRU信息設(shè)備,如承載板FRU信息設(shè)備1為主承載板FRU 信息設(shè)備,承載板FRU信息設(shè)備2為備承載板FRU信息設(shè)備,所述MCMC與 主承載板FRU信息設(shè)備以及備承載板FRU信息設(shè)備分別相連。
所述主承載板FRU信息設(shè)備,用于存儲(chǔ)FRU數(shù)據(jù),并在正常運(yùn)行時(shí),向 所述MCMC提供FRU數(shù)據(jù);所述備承載板FRU信息設(shè)備,用于存儲(chǔ)FRU數(shù) 據(jù),在所述主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí),向所述MCMC提供 FRU數(shù)據(jù);
所述MCMC,用于獲取FRU數(shù)據(jù),并利用獲取的FRU數(shù)據(jù)進(jìn)行配置處理。 在圖3中,12(31是MCMC1到承載板FRU信息設(shè)備1專用I2C通道,I2C4 是MCMC2到承載板FRU信息設(shè)備2專用I2C通道。在現(xiàn)有方案基礎(chǔ)上,增 加MCMC1到承載板FRU信息設(shè)備2的I2C通道I2C2,如圖3虛線所示I2C2, 作為MCMC1訪問(wèn)承載板FRU信息設(shè)備2的訪問(wèn)通道。增加MCMC2到承載 板FRU信息設(shè)備1的I2C通道I2C3,如圖3虛線所示I2C3,作為MCMC2訪 問(wèn)承載板FRU信息設(shè)備1的訪問(wèn)通道。MCMC1通過(guò)專用通道fCl訪問(wèn)其對(duì) 應(yīng)的承載板FRU設(shè)備承載板FRU信息設(shè)備1,通過(guò)專用通道fC2訪問(wèn)其對(duì) 應(yīng)的承載板FRU設(shè)備承載板FRU信息設(shè)備2;同樣,MCMC2通過(guò)專用通道 I2C3訪問(wèn)其對(duì)應(yīng)的承載板FRU設(shè)備承載板FRU信息設(shè)備1,通過(guò)專用通道 I2C4訪問(wèn)其對(duì)應(yīng)的承載板FRU設(shè)備承載板FRU信息設(shè)備2??紤]單板上電隨 機(jī)性,這里假定圖3中左側(cè)MCMC為主用單板,其專用fC通道fCl對(duì)應(yīng)的 承載板FRU信息設(shè)備1為主用FRU存儲(chǔ)設(shè)備,圖3中右側(cè)MCMC為備用單 板,其專用I2C通道I2C4對(duì)應(yīng)的承載板FRU信息設(shè)備2為備用FRU存儲(chǔ)設(shè) 備。圖3中示出的MCMC與承載板FRU信息設(shè)備通過(guò)I2C總線相連,也可以 通過(guò)IPMB-L管理總線、CAN、串口以及其它總線實(shí)現(xiàn)。
參見(jiàn)圖4所示,所述MCMC可以包括數(shù)據(jù)獲耳又單元42以及配置單元 43。數(shù)據(jù)獲取單元42,用于在主承載板FRU信息設(shè)備運(yùn)行正常時(shí),從所述主 承載板FRU信息設(shè)備獲取FRU數(shù)據(jù);在所述主承載板FRU信息設(shè)備不在位 或發(fā)生故障時(shí),從所述備承載板FRU信息設(shè)備獲取FRU數(shù)據(jù);配置單元43, 用于利用獲取的FRU數(shù)據(jù)進(jìn)行配置處理。
所述MCMC可以包括第一檢測(cè)單元41,用于4企測(cè)所述主承載板FRU 信息設(shè)備運(yùn)行是否正常。
所述MCMC還可以包括第二檢測(cè)單元44,用于在所述主承載板FRU 信息設(shè)備不在位或發(fā)生故障時(shí),檢測(cè)所述備承載板FRU信息設(shè)備是否在位或 發(fā)生故障,在所述備承載板FRU信息設(shè)備在位或沒(méi)有發(fā)生故障時(shí),指示所述 數(shù)據(jù)獲取單元42從所述備承載板FRU信息設(shè)備獲取FRU數(shù)據(jù)。因此,數(shù)據(jù) 獲取單元42在所述備承載板FRU信息設(shè)備是否在位或發(fā)生故障時(shí),從所述備 承載板FRU信息設(shè)備獲取FRU數(shù)據(jù)。
所述MCMC還可以包括同步更新單元45,用于當(dāng)主承載板FRU信息設(shè) 備不在位或發(fā)生故障時(shí),利用所述備承載板FRU信息設(shè)備的FRU數(shù)據(jù)更新所 述主承載板FRU信息設(shè)備所保存的FRU數(shù)據(jù)。
所述MCMC還可以包括告警單元,用于在所述備承載板FRU信息設(shè)備 不在位或發(fā)生故障時(shí),提示用戶系統(tǒng)發(fā)生故障。
在本發(fā)明實(shí)施例中,根據(jù)主備承載板FRU信息設(shè)備的不同狀態(tài),MCMC 可以分別采取不同的措施
當(dāng)主用FRU存儲(chǔ)設(shè)備在位,MCMCl通過(guò)主用FRU專用通道I2(31讀主用 FRU數(shù)據(jù)成功,數(shù)據(jù)校驗(yàn)正確時(shí)MCMCl接受主用FRU存儲(chǔ)設(shè)備的存儲(chǔ)數(shù) 據(jù),利用該配置文件配置MicroTCA系統(tǒng),對(duì)系統(tǒng)內(nèi)AMC單板進(jìn)行端口配置, 實(shí)現(xiàn)上下電管理等功能。當(dāng)主用FRU存儲(chǔ)設(shè)備在位,MCMC1通過(guò)主用FRU專用通道^C1讀主用 FRU存儲(chǔ)設(shè)備數(shù)據(jù)失敗,備用FRU存儲(chǔ)設(shè)備在位時(shí)MCMC1通過(guò)備用FRU 存儲(chǔ)設(shè)備專用通道I2C2從備用FRU存儲(chǔ)設(shè)備讀數(shù)據(jù),并對(duì)存儲(chǔ)信息進(jìn)行校驗(yàn)。 如果校驗(yàn)成功,則采用備用FRU存儲(chǔ)設(shè)備數(shù)據(jù)。如果備用數(shù)據(jù)獲取失敗,則 MCMC板給出嚴(yán)重告警指示,啟動(dòng)自檢失敗,輸出錯(cuò)誤信息"承載板FRU數(shù) 據(jù)無(wú)效"。
當(dāng)主用FRU存儲(chǔ)設(shè)備在位,MCMCl通過(guò)主用FRU專用通道fCl讀數(shù)據(jù) 成功,但是校驗(yàn)數(shù)據(jù)不通過(guò),備用FRU存儲(chǔ)設(shè)備在位時(shí),MCMCl通過(guò)產(chǎn)C2 從備用FRU存儲(chǔ)設(shè)備讀數(shù)據(jù),并進(jìn)行校驗(yàn)。如果成功,MCMCl接受備用FRU 存儲(chǔ)設(shè)備的存儲(chǔ)數(shù)據(jù),利用該配置文件配置MicroTCA系統(tǒng),對(duì)系統(tǒng)內(nèi)AMC 單板進(jìn)行端口配置,實(shí)現(xiàn)上下電管理等功能。并使用備用數(shù)據(jù)通過(guò)主用FRU 專用通道^C1覆蓋主用FRU數(shù)據(jù)。如果備用數(shù)據(jù)獲取失敗,則MCMC板給 出嚴(yán)重告警指示,啟動(dòng)自檢失敗,輸出錯(cuò)誤信息"承載板FRU數(shù)據(jù)無(wú)效"。
當(dāng)主用FRU存儲(chǔ)設(shè)備在位,MCMCl通過(guò)主用FRU專用通道I2(31讀數(shù)據(jù) 不成功,備用FRU存儲(chǔ)設(shè)備在位時(shí),MCMCl通過(guò)^C2從備用FRU存儲(chǔ)設(shè)備 讀數(shù)據(jù),并進(jìn)行校驗(yàn)。如果成功,MCMCl接受備用FRU存儲(chǔ)設(shè)備的存儲(chǔ)數(shù)據(jù), 利用該配置文件配置MicroTCA系統(tǒng),對(duì)系統(tǒng)內(nèi)AMC單板進(jìn)行端口配置,實(shí) 現(xiàn)上下電管理等功能。如果備用數(shù)據(jù)獲取失敗,則MCMC板給出嚴(yán)重告警指 示,啟動(dòng)自檢失敗,輸出錯(cuò)誤信息"承載板FRU數(shù)據(jù)無(wú)效"。
當(dāng)主用FRU存儲(chǔ)設(shè)備不在位,備用FRU存儲(chǔ)設(shè)備在位時(shí),MCMCl通過(guò) 產(chǎn)C2從備用FRU存儲(chǔ)設(shè)備讀數(shù)據(jù),并進(jìn)行校驗(yàn)。如果成功,采用備用FRU存 儲(chǔ)設(shè)備數(shù)據(jù)。如果備用數(shù)據(jù)獲取失敗,則MCMC板給出嚴(yán)重告警指示,啟動(dòng) 自檢失敗,輸出錯(cuò)誤信息"承載板FRU數(shù)據(jù)無(wú)效"。
當(dāng)主備用FRU存儲(chǔ)設(shè)備都不在位時(shí),MCMC板給出嚴(yán)重告警指示,啟動(dòng) 自檢失敗,輸出錯(cuò)誤信息"承載板FRU數(shù)據(jù)無(wú)效"。
如圖5所示,本發(fā)明實(shí)施例實(shí)現(xiàn)可靠性管理的具體過(guò)程如下步驟501:判斷主用承載板FRU信息設(shè)備是否在位,如果在位,則執(zhí)行步 驟502,否則,執(zhí)行步驟504。
步驟502: MCMC1通過(guò)主用FRU專用通道I2C 1讀主承載板FRU信息 設(shè)備的FRU數(shù)據(jù),如果讀取成功,則執(zhí)行步驟503,否則,執(zhí)行步驟504。
步驟503: MCMC1對(duì)讀取的FRU數(shù)據(jù)進(jìn)行校驗(yàn),如果校驗(yàn)正確,MCMC1 接受該FRU數(shù)據(jù),執(zhí)行步驟509,否則,執(zhí)行步驟504。
步驟504:判斷備承載板FRU信息設(shè)備是否在位,如果在位,則執(zhí)行步驟 505,否則,執(zhí)行步驟508。
步驟505: MCMC1通過(guò)備用FRU專用通道I2C讀備承載板FRU信息設(shè) 備的FRU數(shù)據(jù),如果讀取成功,則執(zhí)行步驟506,否則,執(zhí)行步驟508。
步驟506: MCMC1對(duì)讀取的備承載板FRU信息設(shè)備的FRU數(shù)據(jù)進(jìn)行校 驗(yàn),如果校驗(yàn)正確,MCMC1接受備承載板FRU信息設(shè)備的FRU數(shù)據(jù),執(zhí)行 步驟509,否則,執(zhí)行步驟508。
步驟507:判斷讀備承載板FRU信息設(shè)備的FRU數(shù)據(jù)是否成功,如果成 功,則MCMC1接受備承載板FRU信息設(shè)備的FRU數(shù)據(jù),執(zhí)行步驟509,如 果不成功,則MCMC1接受主承載板FRU信息設(shè)備的FRU數(shù)據(jù),且利用備承 載板FRU信息設(shè)備同步主承載板FRU信息設(shè)備的FRU數(shù)據(jù),執(zhí)行步驟509。
這里,承載板FRU信息設(shè)備數(shù)據(jù)同步通過(guò)IPMB—L, CAN,串口及其他 總線實(shí)現(xiàn)。
步驟508:確定備承載板FRU信息設(shè)備不在位或發(fā)生故障,返回步驟501。 步驟509: MCMC按照備承載板FRU信息設(shè)備的FRU數(shù)據(jù)配置系統(tǒng)設(shè)備。 同樣,當(dāng)MCMC1和MCMC2發(fā)生主備倒換或者M(jìn)CMC2主用時(shí),從 MCMC2開(kāi)始啟動(dòng),MCMC1為備用,按照?qǐng)D5示意流程,進(jìn)行倒換控制。承 載板FRU信息設(shè)備的冗余配置保證了主備FRU存儲(chǔ)設(shè)備數(shù)據(jù)的同步一致性。 同時(shí)在主用承載板FRU信息設(shè)備發(fā)生故障時(shí),MCH不需要啟動(dòng)復(fù)雜的主備倒 換流程,增加系統(tǒng)倒換負(fù)擔(dān),而只需要增加到對(duì)板的專用^C通道訪問(wèn)對(duì)板承載板FRU信息設(shè)備,降低了系統(tǒng)倒換負(fù)擔(dān)及倒換引起的風(fēng)險(xiǎn),提高M(jìn)icroTCA 系統(tǒng)可靠性。
當(dāng)MCMC校驗(yàn)承載板FRU信息設(shè)備存儲(chǔ)的FRU數(shù)據(jù)通過(guò)后,MCMC首 先分析承載板FRU信息設(shè)備中的承載板FRU記錄。從其中的復(fù)合記錄(Multi Record )中提取出"承載板激活與電源管理記錄(Activation and Power Management Record)",根據(jù)其中的"FRU激活與電源控制描述記錄(FRU Activation and Power Descriptor ),,的配置參數(shù),決定是否激活該岸義載板FRU信 息設(shè)備。如果配置參數(shù)為允許激活,則MCMC通過(guò)IPMB命令發(fā)送Set FRU Activation ( Activate FRU)命令激活承載板FRU信息設(shè)備,該承載板FRU信 息設(shè)備進(jìn)入激活狀態(tài)。然后,MCMC比較MCH、 AMC單板中的FRU資源信 息中各端口能力,決定AMC或MCH星型端口是否使能。承載板管理器與AMC 上的MMC模塊或者M(jìn)CH上的MCMC模塊傳遞各自對(duì)應(yīng)端口能力信息。保 證只有兼容的端口才能使能打開(kāi)。
綜上所示,本發(fā)明實(shí)施例具有如下優(yōu)點(diǎn)
(1) 提供MCH通過(guò)串行總線對(duì)本板及對(duì)板MCH對(duì)應(yīng)的承載板FRU信 息設(shè)備可靠管理方案,提高系統(tǒng)可靠性。
(2) 提供承載板FRU信息設(shè)備冗余備份同步的過(guò)程和方法,保證承載板 FRU信息設(shè)備信息同步。
(3) 當(dāng)MCH對(duì)應(yīng)承載板FRU信息設(shè)備發(fā)生故障時(shí),MCH不需要啟動(dòng) 復(fù)雜的主備倒換流程,而只需要通過(guò)訪問(wèn)備用承載板FRU信息設(shè)備獲取正確 的系統(tǒng)啟動(dòng)信息。
顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā) 明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及 其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1、一種小型電信和計(jì)算通用硬件平臺(tái)架構(gòu)MicroTCA系統(tǒng)的可靠性管理的方法,所述MicroTCA系統(tǒng)至少包括MicroTCA承載管理控制器MCMC、主承載板FRU信息設(shè)備以及備承載板FRU信息設(shè)備,其特征在于,該方法包括當(dāng)確定主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí),所述承載管理控制器MCMC利用所述備承載板FRU信息設(shè)備的FRU數(shù)據(jù)進(jìn)行配置處理。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,確定主承載板FRU信息設(shè) 備是否發(fā)生故障包括在主承載板FRU信息設(shè)備在位,但無(wú)法讀取主承載板FRU信息設(shè)備的 FRU數(shù)據(jù),或,對(duì)所述主承載板FRU信息設(shè)備所保存的信息校驗(yàn)不成功時(shí), 確定主承載板FRU信息設(shè)備發(fā)生故障。
3、 根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)確定主承載板FRU信息 設(shè)備不在位或發(fā)生故障時(shí),該方法進(jìn)一步包括利用所述備承載板FRU信息 設(shè)備的FRU數(shù)據(jù)更新所述主承載板FRU信息設(shè)備所保存的FRU數(shù)據(jù)。
4、 根據(jù)權(quán)利要求3所述的方法,其特征在于,在利用所述備承載板FRU 信息設(shè)備的數(shù)據(jù)更新所述主承載板FRU信息設(shè)備所保存的FRU數(shù)據(jù)之前,該 方法進(jìn)一步包括判斷備承載板FRU信息設(shè)備是否在位,在所述備承載板FRU信息設(shè)備在 位,且讀數(shù)據(jù)成功并對(duì)讀取的數(shù)據(jù)校驗(yàn)成功時(shí),獲得所述備承載板FRU信息 設(shè)備所保存的FRU數(shù)據(jù)。
5、 根據(jù)權(quán)利要求4所述的方法,其特征在于,當(dāng)主承載板FRU信息設(shè)備 不在位或發(fā)生故障時(shí),且所述備承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí), 提示用戶系統(tǒng)發(fā)生故障。
6、 根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)確定主承載板FRU信息 設(shè)備運(yùn)行正常時(shí),利用所述主承載板FRU信息設(shè)備的FRU數(shù)據(jù)進(jìn)行配置處理。
7、 一種MicroTCA系統(tǒng),包括MCMC、主承載板FRU信息設(shè)備以及備承載板FRU信息設(shè)備,其特征在于,所述MCMC與主承載板FRU信息設(shè)備 以及備承載板FRU信息設(shè)備分別相連,所述主承載板FRU信息設(shè)備,用于在正常運(yùn)行時(shí),向所述MCMC提供 FRU數(shù)據(jù);所述備承載板FRU信息設(shè)備,用于在所述主承載板FRU信息設(shè)備不在位 或發(fā)生故障時(shí),向所述MCMC提供FRU數(shù)據(jù);所述MCMC,用于獲取FRU數(shù)據(jù),并利用獲取的FRU數(shù)據(jù)進(jìn)行配置處理。
8、 根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述MCMC包括 數(shù)據(jù)獲取單元,用于在主承載板FRU信息設(shè)備運(yùn)行正常時(shí),從所述主承載板FRU信息設(shè)備獲取FRU數(shù)據(jù);在所述主承載板FRU信息設(shè)備不在位或 發(fā)生故障時(shí),從所述備承載板FRU信息設(shè)備獲取FRU數(shù)據(jù); 配置單元,用于利用獲取的FRU數(shù)據(jù)進(jìn)行配置處理。
9、 根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述MCMC還包括 第一檢測(cè)單元,用于檢測(cè)所述主承載板FRU信息設(shè)備運(yùn)行是否正常。
10、 根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述MCMC還包括第二檢測(cè)單元,用于在所述主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí), 檢測(cè)所述備承載板FRU信息設(shè)備是否在位或發(fā)生故障;所試教椐獲取單l用千在所述備承栽板FRU信息設(shè)備在位或沒(méi)有發(fā)生 故障時(shí),從所述備承載板FRU信息設(shè)備獲取FRU數(shù)據(jù)。
11、 根據(jù)權(quán)利要求IO所述的系統(tǒng),其特征在于,所述MCMC還包括 告警單元,用于在所述備承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí),提示用戶系統(tǒng)發(fā)生故障。
12、 根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述MCMC與備承載板 FRU信息設(shè)備通過(guò)^C總線、IPMB-L管理總線、CAN或串口相連。
13、 根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述MCMC還包括 同步更新單元,用于當(dāng)主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí),利用所述備承載板FRU信息設(shè)備的FRU數(shù)據(jù)更新所述主承載板FRU信息設(shè)備 所保存的FRU數(shù)據(jù)。
14、 一種MicroTCA承載管理控制器,其特征在于,包括 數(shù)據(jù)獲取單元,用于在主承載板FRU信息設(shè)備運(yùn)行正常時(shí),從所述主承載板FRU信息設(shè)備獲取FRU數(shù)據(jù);在所述主承載板FRU信息設(shè)備不在位或 發(fā)生故障時(shí),從所述備承載板FRU信息設(shè)備獲取FRU數(shù)據(jù); 配置單元,用于利用獲取的FRU數(shù)據(jù)進(jìn)行配置處理。
15、 根據(jù)權(quán)利要求14所述的控制器,其特征在于,所述控制器還包括 第一檢測(cè)單元,用于檢測(cè)所述主承載板FRU信息設(shè)備運(yùn)行是否正常。
16、 根據(jù)權(quán)利要求14所述的控制器,其特征在于,所述控制器還包括 第二檢測(cè)單元,用于在所述主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí),檢測(cè)所述備承載板FRU信息設(shè)備是否在位或發(fā)生故障;所述數(shù)據(jù)獲取單元,用于在所述備承載板FRU信息設(shè)備在位或沒(méi)有發(fā)生 故障時(shí),從所述備承載板FRU信息設(shè)備獲取FRU數(shù)據(jù)。
17、 根據(jù)權(quán)利要求14所述的控制器,其特征在于,所述控制器還包括 同步更新單元,用于當(dāng)主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí),利用所述備承載板FRU信息設(shè)備的FRU數(shù)據(jù)更新所述主承載板FRU信息設(shè)備 所保存的FRU數(shù)據(jù)。
全文摘要
本發(fā)明公開(kāi)了一種小型電信和計(jì)算通用硬件平臺(tái)架構(gòu)(MicroTCA)系統(tǒng)的可靠性管理的方法,所述MicroTCA系統(tǒng)至少包括MicroTCA承載管理控制器(MCMC)、主承載板FRU信息設(shè)備以及備承載板FRU信息設(shè)備,該方法包括當(dāng)確定主承載板FRU信息設(shè)備不在位或發(fā)生故障時(shí),利用所述備承載板FRU信息設(shè)備的FRU數(shù)據(jù)進(jìn)行配置處理。同時(shí),本發(fā)明還公開(kāi)了一種MicroTCA系統(tǒng)以及MicroTCA承載管理控制器。本發(fā)明實(shí)施例中,當(dāng)承載板FRU信息設(shè)備發(fā)生故障時(shí),不需要啟動(dòng)復(fù)雜的主備倒換流程,而只需要通過(guò)訪問(wèn)備用承載板FRU信息設(shè)備獲取正確的FRU數(shù)據(jù),進(jìn)而可以實(shí)現(xiàn)對(duì)系統(tǒng)設(shè)備進(jìn)行正常配置和管理。
文檔編號(hào)H04Q3/00GK101415127SQ20071016319
公開(kāi)日2009年4月22日 申請(qǐng)日期2007年10月16日 優(yōu)先權(quán)日2007年10月16日
發(fā)明者夏強(qiáng)志, 方慶銀 申請(qǐng)人:華為技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1