一種高端容錯(cuò)服務(wù)器的電源故障記錄方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及服務(wù)器監(jiān)控管理領(lǐng)域和電源故障監(jiān)控領(lǐng)域,尤其涉及一種高端容錯(cuò)服務(wù)器的電源故障記錄方法。主要針對(duì)高端容錯(cuò)服務(wù)器電源集中供電和集中管理的特點(diǎn),月艮務(wù)器電源的故障直接影響整個(gè)設(shè)備的使用。
【背景技術(shù)】
[0002]隨著用戶對(duì)計(jì)算機(jī)的計(jì)算需求的提高,用戶對(duì)單臺(tái)計(jì)算機(jī)的計(jì)算性能要求越來(lái)越高。高端容錯(cuò)服務(wù)器是一款多路服務(wù)器。與傳統(tǒng)服務(wù)器相比,在計(jì)算性能和可靠性上與傳統(tǒng)服務(wù)器相比具有很大的優(yōu)勢(shì),并在對(duì)實(shí)時(shí)性、可靠性和可用性要求苛刻的領(lǐng)域中應(yīng)用越來(lái)越廣泛。同時(shí)高端容錯(cuò)服務(wù)器在機(jī)柜內(nèi)采取集中供電和集中管理的策略。整機(jī)柜通過(guò)RMC統(tǒng)一進(jìn)行電源的故障管理和故障記錄,RMC統(tǒng)一管理整機(jī)柜的所有電源模塊PSU,高端容錯(cuò)服務(wù)器對(duì)電源的故障管理和故障記與傳統(tǒng)的服務(wù)器相比提出了新的挑戰(zhàn)。
[0003]目前在高端容錯(cuò)服務(wù)器對(duì)電源的故障管理和故障記錄具體內(nèi)容并不明確,如果按照傳統(tǒng)服務(wù)器下進(jìn)行,因?yàn)殡娫醇泄╇姾图泄芾?,需要記錄的電源狀態(tài)比較復(fù)雜,很難滿足管理的要求。
【發(fā)明內(nèi)容】
[0004]為了解決以上問(wèn)題,本發(fā)明提出了一種高端容錯(cuò)服務(wù)器的電源故障記錄方法。
[0005]通過(guò)一種高端容錯(cuò)服務(wù)器的電源故障記錄方法,高端容錯(cuò)服務(wù)器的RMC監(jiān)測(cè)所有電源的在位信息、健康狀態(tài)、輸入輸出電壓電流功耗信息和故障LOG記錄工作,可以有效地完成RMC對(duì)機(jī)柜級(jí)別的電源故障LOG的記錄和故障管理,使用戶管理高端容錯(cuò)電源的故障信息,如同管理單臺(tái)服務(wù)器的電源信息一樣方便。
[0006]在RMC統(tǒng)一對(duì)電源進(jìn)行管理。首先定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG級(jí)別。其次定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG內(nèi)容。最后定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG的觸發(fā)條件。具體實(shí)現(xiàn)方式如下所示:
1)定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG級(jí)別。管理的主要級(jí)別包含三個(gè)部分:Info、warning和critical。
[0007]2)定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG內(nèi)容。主要內(nèi)容包括LOG的級(jí)別,設(shè)備的類型PCM(電源控制管理模塊)和PSU,電源故障的Event Descript1n。
[0008]3)定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG的觸發(fā)條件。
[0009]本發(fā)明的有益效果是。
[0010]I)提供了高端容錯(cuò)服務(wù)器電源故障記錄方法,適用于高端容錯(cuò)服務(wù)器的要求;
2)有助于公司在高端容錯(cuò)服務(wù)器領(lǐng)域形成技術(shù)壁皇,保證公司在整機(jī)柜服務(wù)器的優(yōu)勢(shì)。
【具體實(shí)施方式】
[0011]下面對(duì)本發(fā)明的內(nèi)容進(jìn)行更加詳細(xì)的闡述:
本發(fā)明的一種高端容錯(cuò)服務(wù)器的電源故障記錄方法主要包括:
(I)定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG級(jí)別^管理的主要級(jí)別包含三個(gè)部分:1nfo、warning和criticaL.Inf ο是節(jié)電源的故障狀態(tài)恢復(fù)、電源上電和電源模塊的插入的操作信息;warning主要是指電源的移除、電源的不在位和電源的狀態(tài)告警;critical主要指電源出現(xiàn)輸入和輸出故障,電源超過(guò)最大電源告警閾值。
[0012](2)定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG內(nèi)容。主要內(nèi)容包括LOG的級(jí)別,設(shè)備的類型PCM(電源控制管理模塊)和PSU,電源故障的Event Descript1n。
[0013](3)定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG的觸發(fā)條件,主要觸發(fā)時(shí)間包括: A.1nfo 級(jí)別的LOG:
1PCM was OK,power control module電源控制模塊從故障狀態(tài)恢復(fù);
2PSU was OK PSU從故障狀態(tài)恢復(fù);
3PSU was added PSU被插入;
4PSU was DC output on 打開PSU 電源DC輸出;
5was DC input on打開PSU 電源DC輸入;
6was AC input on打開PSU電源AC輸入 B.warning 級(jí)別的 LOG:
1was DC output off 關(guān)閉PSU 電源DC輸出;
2was removed PSU被移除;
3was absent PSU不在位;
4XXX loading was too high PSU負(fù)載過(guò)高;
5XXX Output Overvoltage Warning PSU輸出電壓超高告警;
6XXX Output Undervoltage Warning PSU輸出電壓超低告警;
7XXX Output Overcurrent Warning PSU輸出電流超高告警
8XXX Input Overvoltage Warning.PSU 輸入電壓超高告警
9XXX Input Undervoltage Warning PSU 輸入電壓超低告警;
10XXX OTP Warning PSU溫度過(guò)高告警;
C.critical級(jí)別的LOG:
1PCM was fail電源控制模塊故障;
2PCM the rack power was xxx over Maxpower xxx服務(wù)期功耗過(guò)高告警
3xxx hotspot OTP error PSU溫度超過(guò)故障
4xxx Output Overvoltage error PSU輸出電壓過(guò)高故障;
5xxx Output Overcurrent error PSU輸出電流過(guò)高故障;
6xxx Input Overvoltage error PSU輸入電壓過(guò)高故障
7xxx AC Input Undervoltage error PSU輸入電壓過(guò)低故障
8was fan fail PSU風(fēng)扇故障;
其中XXX代表電壓電流發(fā)生告警或者故障時(shí)的實(shí)際讀數(shù)。
【主權(quán)項(xiàng)】
1.一種高端容錯(cuò)服務(wù)器的電源故障記錄方法,其特征在于,首先定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG級(jí)別;其次定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG內(nèi)容;最后定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG的觸發(fā)條件;通過(guò)RMC監(jiān)測(cè)所有電源的在位信息、健康狀態(tài)、輸入輸出電壓電流功耗信息和故障LOG記錄工作。2.根據(jù)權(quán)利要求1所述的方法,其特征在于, 定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG級(jí)別:管理的主要級(jí)別包含三個(gè)部分:Info、warning和critical03.根據(jù)權(quán)利要求2所述的方法,其特征在于, 定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG內(nèi)容:主要內(nèi)容包括LOG的級(jí)別,設(shè)備的類型PCM和PSU,電源故障的Event Descript1n。
【專利摘要】本發(fā)明提供一種高端容錯(cuò)服務(wù)器的電源故障記錄方法,涉及服務(wù)器監(jiān)控管理領(lǐng)域和電源故障監(jiān)控領(lǐng)域,首先定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG級(jí)別;其次定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG內(nèi)容;最后定義RMC對(duì)機(jī)柜內(nèi)部電源故障管理LOG的觸發(fā)條件;通過(guò)RMC監(jiān)測(cè)所有電源的在位信息、健康狀態(tài)、輸入輸出電壓電流功耗信息和故障LOG記錄工作,可以有效地完成RMC對(duì)機(jī)柜級(jí)別的電源故障LOG的記錄和故障管理。
【IPC分類】G06F11/07, G06F1/28
【公開號(hào)】CN105511980
【申請(qǐng)?zhí)枴緾N201510921696
【發(fā)明人】黃家明, 喬英良, 李冠廣
【申請(qǐng)人】山東海量信息技術(shù)研究院
【公開日】2016年4月20日
【申請(qǐng)日】2015年12月14日