一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法
【專利說(shuō)明】一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行
reboot測(cè)試的方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及一種多節(jié)點(diǎn)并行測(cè)試的方法,具體地說(shuō)是一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法。
【背景技術(shù)】
[0002]流量服務(wù)器開關(guān)機(jī)測(cè)試(包括DC reboot測(cè)試和AC reboot測(cè)試)可借助于賢偉疲勞測(cè)試機(jī)控制完成,其控制原理為通過(guò)監(jiān)控被測(cè)節(jié)點(diǎn)主板的12V電壓值,判斷節(jié)點(diǎn)運(yùn)行狀態(tài),進(jìn)而改變服務(wù)器的供電輸入,實(shí)現(xiàn)開關(guān)機(jī)控制。疲勞測(cè)試機(jī)提供4個(gè)供電接口和I個(gè)控制接口,可同時(shí)為2臺(tái)雙路冗余電源的服務(wù)器供電,但由于只有一個(gè)控制接口,只能對(duì)一臺(tái)服務(wù)器進(jìn)行開關(guān)機(jī)控制測(cè)試。
[0003]SmartRack是基于天蝎規(guī)范開發(fā)的新形態(tài)的服務(wù)器產(chǎn)品,其特點(diǎn)為整機(jī)柜集中供電、集中散熱和集中管理,有單元功耗低、穩(wěn)定性高等優(yōu)點(diǎn)。所以其測(cè)試存在多節(jié)點(diǎn)并行測(cè)試的必要性,需要對(duì)上面提到的傳統(tǒng)開關(guān)機(jī)測(cè)試方法的局限性優(yōu)化和改進(jìn)下。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的技術(shù)任務(wù)是針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法。本測(cè)試方法借助于4U治具,同時(shí)對(duì)4個(gè)節(jié)點(diǎn)同時(shí)加電和管理,改變多節(jié)點(diǎn)的并行供電難題,通過(guò)改進(jìn)疲勞測(cè)試機(jī)的內(nèi)部線路。實(shí)現(xiàn)對(duì)多個(gè)節(jié)點(diǎn)同時(shí)控制。
[0005]本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:
一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法。本測(cè)試方法測(cè)試工具包括于賢偉疲勞測(cè)試機(jī)、4U治具,將操作系統(tǒng)下的延時(shí)關(guān)機(jī)的軟件ExitW.exe加到開機(jī)自啟動(dòng)程序里實(shí)現(xiàn)開機(jī)后延時(shí)關(guān)機(jī),將B1S下的Restore AC Power Loss選項(xiàng)打開實(shí)現(xiàn)服務(wù)器上電自開機(jī),測(cè)試中出現(xiàn)宕機(jī)等異常狀況疲勞測(cè)試機(jī)會(huì)報(bào)警,測(cè)試完成后,查看服務(wù)器節(jié)點(diǎn)的操作系統(tǒng)日志、BMC日志、RMC日志,查看是否有異常。
[0006]優(yōu)選的,于賢偉疲勞測(cè)試機(jī)包括開關(guān)機(jī)識(shí)別模塊、延時(shí)控制模塊、電源控制模塊、計(jì)數(shù)和軟件模塊,實(shí)現(xiàn)了自動(dòng)判斷被測(cè)節(jié)點(diǎn)的開關(guān)機(jī)狀態(tài)、延時(shí)上下電操作、計(jì)數(shù)等功能。
[0007]優(yōu)選的,4U治具包括機(jī)箱、電源模塊、散熱模塊、管理模塊、銅排。服務(wù)器節(jié)點(diǎn)通過(guò)銅排取電、通過(guò)管理模塊和散熱模塊自動(dòng)調(diào)速散熱。
[0008]優(yōu)選的,于賢偉疲勞測(cè)試機(jī)還包括12V電壓判斷模塊,通過(guò)4個(gè)繼電器分別對(duì)12V電壓判斷,將4個(gè)節(jié)點(diǎn)的12V電壓值做與的操作,實(shí)現(xiàn)只有4個(gè)節(jié)點(diǎn)的12V電壓均不在時(shí),被監(jiān)控的組合12V電壓不在。
[0009]本發(fā)明的一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法與現(xiàn)有技術(shù)相比,所產(chǎn)生的有益效果是,該方法通過(guò)疲勞測(cè)試機(jī)和4U治具對(duì)多節(jié)點(diǎn)進(jìn)行同時(shí)供電、分別判斷系統(tǒng)運(yùn)行狀態(tài),實(shí)現(xiàn)了多節(jié)點(diǎn)并行開關(guān)機(jī)測(cè)試的目的,在長(zhǎng)時(shí)間的穩(wěn)定性測(cè)試中實(shí)現(xiàn)了測(cè)試SmartRack服務(wù)器穩(wěn)定度的設(shè)計(jì)要求,提高了測(cè)試效率、降低了生產(chǎn)成本。
【附圖說(shuō)明】
[0010]附圖1為本發(fā)明的測(cè)試原理流程圖。
【具體實(shí)施方式】
[0011]下面結(jié)合附圖1對(duì)本發(fā)明的一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法作以下詳細(xì)地說(shuō)明。
[0012]—種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法,本測(cè)試方法測(cè)試工具包括于賢偉疲勞測(cè)試機(jī)、4U治具;于賢偉疲勞測(cè)試機(jī)包括4個(gè)輸入接口(220V市電直入)、4個(gè)輸出接口(為被測(cè)服務(wù)器供電、220V標(biāo)準(zhǔn)輸出)、I個(gè)控制接口(從控制單元引出,需連接到被測(cè)服務(wù)器的主板的12V檢測(cè)點(diǎn)上),其開關(guān)機(jī)識(shí)別模塊、延時(shí)控制模塊、電源控制模塊、計(jì)數(shù)和軟件模塊實(shí)現(xiàn)了自動(dòng)判斷被測(cè)節(jié)點(diǎn)的開關(guān)機(jī)狀態(tài)、延時(shí)上下電操作、計(jì)數(shù)等功能。4U治具由機(jī)箱、電源模塊、散熱模塊、管理模塊、銅排等部分組成,服務(wù)器節(jié)點(diǎn)通過(guò)銅排取電、通過(guò)管理模塊和散熱模塊自動(dòng)調(diào)速散熱。操作系統(tǒng)無(wú)限制,windows或Iinux均可,這里以windows server2008R2為例,測(cè)試需要將操作系統(tǒng)下的延時(shí)關(guān)機(jī)的軟件ExitW.exe加到開機(jī)自啟動(dòng)程序里,實(shí)現(xiàn)開機(jī)后延時(shí)關(guān)機(jī)。B1S設(shè)置:需要將B1S下的Restore AC Power Loss選項(xiàng)打開,實(shí)現(xiàn)服務(wù)器上電自開機(jī)。
[0013]開關(guān)機(jī)測(cè)試原理:疲勞測(cè)試機(jī)市電輸入,下文提到的12V電壓判斷模塊與疲勞測(cè)試機(jī)內(nèi)部的開關(guān)機(jī)識(shí)別模塊合作,通過(guò)監(jiān)控被測(cè)服務(wù)器的12V電壓值,判斷節(jié)點(diǎn)的運(yùn)行狀態(tài),調(diào)整對(duì)外輸出,進(jìn)而實(shí)現(xiàn)了開關(guān)機(jī)測(cè)試。
[0014]疲勞測(cè)試機(jī)輸出接口(220V標(biāo)準(zhǔn)輸出)連接到4U治具輸入上,為整個(gè)4U治具機(jī)箱供電。4U治具機(jī)箱中RMC模塊、風(fēng)扇窗、銅排分別從電源板取電;4個(gè)獨(dú)立的節(jié)點(diǎn)和節(jié)點(diǎn)中板通過(guò)銅排取電。
[0015]疲勞測(cè)試機(jī)的控制線連接到被測(cè)服務(wù)器主板的12V電壓監(jiān)測(cè)點(diǎn),將其電壓狀態(tài)發(fā)給疲勞測(cè)試機(jī)控制單元,控制單元通過(guò)繼電器控制疲勞測(cè)試機(jī)的供電輸出,其控制邏輯為服務(wù)器主板12V電壓存在,繼電器不做任何操作;服務(wù)器主板12V電壓不在,繼電器將疲勞測(cè)試機(jī)輸出斷開。
[0016]每個(gè)節(jié)點(diǎn)的12V電壓值可以被監(jiān)控,且可以作為單節(jié)點(diǎn)運(yùn)行狀態(tài)的判斷依據(jù)(12V電壓在表示節(jié)點(diǎn)處于正常工作狀態(tài),12V不在表示節(jié)點(diǎn)處于standby狀態(tài)),但多節(jié)點(diǎn)的ACreboot測(cè)試的斷電標(biāo)準(zhǔn)為4個(gè)節(jié)點(diǎn)同時(shí)進(jìn)入standby狀態(tài),如簡(jiǎn)單將4個(gè)節(jié)點(diǎn)的12V電壓監(jiān)測(cè)點(diǎn)連在一起作為12V電壓的檢測(cè)值會(huì)出現(xiàn)節(jié)點(diǎn)未同時(shí)進(jìn)入standby狀態(tài)時(shí),未關(guān)機(jī)的節(jié)點(diǎn)會(huì)有電流灌入到已關(guān)機(jī)的節(jié)點(diǎn)上,有燒主板的危險(xiǎn)。為解決此問(wèn)題,開發(fā)了 12V電壓判斷模塊,其原理為通過(guò)4個(gè)繼電器分別對(duì)12V電壓判斷,將4個(gè)節(jié)點(diǎn)的12V電壓值做與的操作,實(shí)現(xiàn)了只有4個(gè)節(jié)點(diǎn)的12V電壓均不在時(shí),被監(jiān)控的組合12V電壓不在的目的,滿足了設(shè)計(jì)要求。
[0017]測(cè)試環(huán)境搭建和執(zhí)行。
[0018]測(cè)試環(huán)境搭建。將測(cè)試中提到的疲勞測(cè)試機(jī)、4U治具、SmartRack單節(jié)點(diǎn)4個(gè),12V電壓判斷模塊等準(zhǔn)備齊全。按照如下方式連接起來(lái):市電220V接到疲勞測(cè)試機(jī)Inputl,疲勞測(cè)試機(jī)Outputl連接到4U機(jī)箱Input上;疲勞測(cè)試機(jī)控制接口信號(hào)線連接到12V電壓判斷模塊Output,4個(gè)節(jié)點(diǎn)的12V電壓監(jiān)測(cè)信號(hào)分別連接到12V電壓判斷模塊Inputl、Input2、Input3、Input4 上。
[0019]節(jié)點(diǎn)上電后安裝Windows server2008R2操作系統(tǒng),系統(tǒng)安裝成功后加載芯片組、網(wǎng)絡(luò)等驅(qū)動(dòng),拷貝延時(shí)關(guān)機(jī)軟件ExitW.exe并將其加入到操作系統(tǒng)的自啟動(dòng)列表中。
[0020]執(zhí)行。疲勞測(cè)試機(jī)設(shè)置開關(guān)機(jī)次數(shù)、延時(shí)啟動(dòng)時(shí)間、斷電測(cè)試開關(guān)打開,儀器啟動(dòng)工作;4個(gè)服務(wù)器節(jié)點(diǎn)開機(jī)分別啟動(dòng)進(jìn)入B1S SETUP下,將Restore AC Power Loss選項(xiàng)打開,實(shí)現(xiàn)服務(wù)器上電自開機(jī);節(jié)點(diǎn)進(jìn)入操作系統(tǒng)后設(shè)置延時(shí)關(guān)機(jī)軟件,設(shè)定延時(shí)時(shí)間與關(guān)機(jī)操作。
[0021]機(jī)器設(shè)置完畢,余下測(cè)試機(jī)器自動(dòng)完成,測(cè)試中出現(xiàn)宕機(jī)等異常狀況疲勞測(cè)試機(jī)會(huì)報(bào)警;如某節(jié)點(diǎn)出現(xiàn)問(wèn)題則會(huì)導(dǎo)致所有節(jié)點(diǎn)的開關(guān)機(jī)測(cè)試暫停,需要人為定為原因及繼續(xù)測(cè)試。
[0022]測(cè)試結(jié)果收集和分析。
[0023]測(cè)試完成后(預(yù)定次數(shù)的reboot測(cè)試執(zhí)行完畢),查看服務(wù)器節(jié)點(diǎn)的操作系統(tǒng)日志、BMC日志、RMC日志,查看是否有異常。
[0024]操作步驟可簡(jiǎn)要概括為測(cè)試環(huán)境搭建、測(cè)試執(zhí)行、測(cè)試結(jié)果收集和分析三部分組成,重點(diǎn)在于測(cè)試原理的理解和測(cè)試環(huán)境的設(shè)置,測(cè)試執(zhí)行具體步驟如下:
測(cè)試準(zhǔn)備和測(cè)試系統(tǒng)的連接,將測(cè)試所需工具一一準(zhǔn)備齊全、系統(tǒng)(包含疲勞測(cè)試機(jī)、4U治具、12V電壓判斷模塊、服務(wù)器節(jié)點(diǎn)等)連接正確。
[0025]測(cè)試環(huán)境的設(shè)置,系統(tǒng)供電正常后將疲勞測(cè)試機(jī)設(shè)置正確,B1S設(shè)置正確,操作系統(tǒng)安裝正確、延時(shí)軟件設(shè)置正確。
[0026]測(cè)試中斷時(shí)的故障分析及測(cè)試完成后的結(jié)果收集,在出現(xiàn)宕機(jī)、reboot測(cè)試中斷等異常狀況是需要人為定為下故障,測(cè)試完成后需要檢查所有l(wèi)og內(nèi)容,判斷是否有異常。
[0027]本方法借助于4U治具,可同時(shí)對(duì)4個(gè)節(jié)點(diǎn)同時(shí)加電和管理,改變了多節(jié)點(diǎn)的并行供電難題。同時(shí),通過(guò)改進(jìn)疲勞測(cè)試機(jī)的內(nèi)部線路,實(shí)現(xiàn)對(duì)多個(gè)節(jié)點(diǎn)同時(shí)控制。該測(cè)試方法執(zhí)行簡(jiǎn)單,便于操作,可在無(wú)人值守的情況下實(shí)現(xiàn)多節(jié)點(diǎn)并行開關(guān)機(jī)測(cè)試。
【主權(quán)項(xiàng)】
1.一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法,其特征在于,本測(cè)試方法測(cè)試工具包括于賢偉疲勞測(cè)試機(jī)、4U治具,將操作系統(tǒng)下的延時(shí)關(guān)機(jī)的軟件ExitW.exe加到開機(jī)自啟動(dòng)程序里實(shí)現(xiàn)開機(jī)后延時(shí)關(guān)機(jī),將B1S下的Restore ACPower Loss選項(xiàng)打開實(shí)現(xiàn)服務(wù)器上電自開機(jī),測(cè)試中出現(xiàn)宕機(jī)等異常狀況疲勞測(cè)試機(jī)會(huì)報(bào)警,測(cè)試完成后,查看服務(wù)器節(jié)點(diǎn)的操作系統(tǒng)日志、BMC日志、RMC日志,查看是否有異常。2.根據(jù)權(quán)利要求1所述的一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法,其特征在于,所述于賢偉疲勞測(cè)試機(jī)包括開關(guān)機(jī)識(shí)別模塊、延時(shí)控制模塊、電源控制模塊、計(jì)數(shù)和軟件模塊。3.根據(jù)權(quán)利要求1所述的一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法,其特征在于,所述4U治具包括機(jī)箱、電源模塊、散熱模塊、管理模塊、銅排。4.根據(jù)權(quán)利要求1所述的一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法,其特征在于,所述于賢偉疲勞測(cè)試機(jī)還包括12V電壓判斷模塊,通過(guò)4個(gè)繼電器分別對(duì)12V電壓判斷,將4個(gè)節(jié)點(diǎn)的12V電壓值做與的操作,實(shí)現(xiàn)只有4個(gè)節(jié)點(diǎn)的12V電壓均不在時(shí),被監(jiān)控的組合12V電壓不在。
【專利摘要】本發(fā)明提供一種基于疲勞測(cè)試機(jī)和4U治具的SmartRack多節(jié)點(diǎn)并行reboot測(cè)試的方法。本測(cè)試方法測(cè)試工具包括于賢偉疲勞測(cè)試機(jī)、4U治具,將操作系統(tǒng)下的延時(shí)關(guān)機(jī)的軟件ExitW.exe加到開機(jī)自啟動(dòng)程序里實(shí)現(xiàn)開機(jī)后延時(shí)關(guān)機(jī),將BIOS下的Restore?AC?Power?Loss選項(xiàng)打開實(shí)現(xiàn)服務(wù)器上電自開機(jī),測(cè)試中出現(xiàn)宕機(jī)等異常狀況疲勞測(cè)試機(jī)會(huì)報(bào)警,測(cè)試完成后,查看服務(wù)器節(jié)點(diǎn)的操作系統(tǒng)日志、BMC日志、RMC日志,查看是否有異常。本方法可同時(shí)對(duì)4個(gè)節(jié)點(diǎn)同時(shí)加電和管理,改變了多節(jié)點(diǎn)的并行供電難題并實(shí)現(xiàn)對(duì)多個(gè)節(jié)點(diǎn)同時(shí)控制。該測(cè)試方法執(zhí)行簡(jiǎn)單,可在無(wú)人值守的情況下實(shí)現(xiàn)多節(jié)點(diǎn)并行開關(guān)機(jī)測(cè)試。
【IPC分類】G06F11/22
【公開號(hào)】CN105138437
【申請(qǐng)?zhí)枴緾N201510526203
【發(fā)明人】張超, 車吉旭
【申請(qǐng)人】浪潮電子信息產(chǎn)業(yè)股份有限公司
【公開日】2015年12月9日
【申請(qǐng)日】2015年8月25日