亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

服務(wù)器reboot測試方法、服務(wù)器、控制器和系統(tǒng)的制作方法

文檔序號:10552794閱讀:622來源:國知局
服務(wù)器reboot測試方法、服務(wù)器、控制器和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了服務(wù)器reboot測試方法、服務(wù)器、控制器和系統(tǒng),該方法包括:通過交換機,建立服務(wù)器和控制器相互通信;服務(wù)器接收控制器發(fā)送的開機請求,進行開機啟動;判斷是否存在Ispci?tmp文件,如果是,則讀取設(shè)備信息,將設(shè)備信息寫入Ispci?$count文件,并比較Ispci?tmp文件和Ispci?$count文件是否一致,否則,為服務(wù)器的設(shè)備信息,生成Ispci?tmp文件;當Ispci?tmp文件和Ispci?$count文件一致時,發(fā)送啟動完成信息;創(chuàng)建gpu.txt文件和server.txt文件;接收控制器發(fā)送的關(guān)機請求,進行關(guān)機操作,實現(xiàn)了服務(wù)器穩(wěn)定性測試的自動化。
【專利說明】
服務(wù)器reboot測試方法、服務(wù)器、控制器和系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及服務(wù)器應(yīng)用技術(shù)領(lǐng)域,特別涉及服務(wù)器reboot測試方法、服務(wù)器、控制器和系統(tǒng)。
【背景技術(shù)】
[0002]隨著云計算服務(wù)的不斷發(fā)展,對服務(wù)器的穩(wěn)定性要求越來越高。目前服務(wù)器穩(wěn)定性測試的一種重要方法為reboot測試。
[0003]現(xiàn)有服務(wù)器的reboot測試方式主要是,在各個服務(wù)器節(jié)點安裝reboot腳本,通過人工的方式為各個服務(wù)器節(jié)點連通電源,手動開啟各個服務(wù)器節(jié)點,reboot腳本運行,并檢測開機過程是否正常,然后對服務(wù)器節(jié)點執(zhí)行關(guān)機操作,并需要人工依次對各個服務(wù)器節(jié)點進行斷開電源的操作,即現(xiàn)有的reboot測試方法只能通過人工參與的方式完成,而無法使服務(wù)器穩(wěn)定性測試自動進行。

【發(fā)明內(nèi)容】

[0004]本發(fā)明實施例提供了服務(wù)器reboot測試方法、服務(wù)器、控制器和系統(tǒng),實現(xiàn)服務(wù)器穩(wěn)定性測試的自動化。
[0005]服務(wù)器reboot測試方法,通過交換機,建立服務(wù)器和控制器之間相互通信;還包括:
[0006]當服務(wù)器接收到控制器發(fā)送的開機請求時,進行開機啟動;
[0007]服務(wù)器判斷本身是否存在Ispc1-tmp文件,如果是,則讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispc 1-$count文件,并比較Ispc1-tmp文件和I spc1-$count文件是否一致,否則,為服務(wù)器中的設(shè)備信息,生成Ispc1-tmp文件;
[0008]當所述Ispc1-tmp文件和所述Ispc1-$count文件一致時,發(fā)送啟動完成信息給控制器;
[0009]創(chuàng)建gpu.txt 文件和server.txt 文件;
[0010]接收控制器發(fā)送的關(guān)機請求,進行關(guān)機操作。
[0011 ] 優(yōu)選地,所述通過交換機,建立服務(wù)器和控制器之間相互通信,包括:
[0012]服務(wù)器通過OS網(wǎng)絡(luò)和BMC網(wǎng)絡(luò)連接到交換機;
[0013]控制器通過OS網(wǎng)絡(luò)連接到交換機。
[0014]優(yōu)選地,上述方法進一步包括:在服務(wù)器中設(shè)置第一計數(shù)器count;
[0015]在所述開機啟動之后,進一步包括:服務(wù)器判斷本身是否存在count文件,如果是,則將所述第一計數(shù)器count+Ι,存儲到所述count文件;否則,啟動所述第一計數(shù)器count,將所述第一計數(shù)器count+Ι,生成count文件,并將所述第一計數(shù)器count寫入服務(wù)器開機啟動項。
[0016]優(yōu)選地,所述服務(wù)器為Pcie-Switch服務(wù)器,該Pcie-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,所述server端插有一張retimer卡,通過該retimer卡及MiniSASHD線纜與所述資源服務(wù)器連接;
[0017]進一步包括:設(shè)置啟動時序;
[0018]所述開機啟動,包括:根據(jù)設(shè)置的啟動時序,順序啟動所述資源服務(wù)器和server端。
[0019]服務(wù)器reboot測試方法,應(yīng)用于控制器,在控制器中設(shè)置第二計數(shù)器count,并設(shè)置檢測閾值;還包括:
[°02°] Ml、控制器初始化所述第二計數(shù)器count ;
[0021]M2、接收服務(wù)器發(fā)送的啟動完成信息,判斷所述第二計數(shù)器count的計數(shù)是否小于檢測閾值,如果是,則檢測服務(wù)器中是否存在gpu.txt文件和server.txt文件,如果是,則調(diào)用服務(wù)器的關(guān)機函數(shù),控制服務(wù)器關(guān)機;
[0022]M3、向服務(wù)器發(fā)送開機請求,調(diào)用服務(wù)器的開機函數(shù),控制服務(wù)器開機啟動,并將第二計數(shù)器count+Ι,執(zhí)行M2。
[0023]優(yōu)選地,上述方法進一步包括:清除所述服務(wù)器中的操作系統(tǒng)日志。
[0024]優(yōu)選地,所述服務(wù)器為Pcie-Switch服務(wù)器,該Pcie-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,所述server端插有一張retimer卡,通過該retimer卡及MiniSASHD線纜與所述資源服務(wù)器連接;
[0025]所述控制服務(wù)器關(guān)機,包括:順序控制所述server端關(guān)機和所述資源服務(wù)器關(guān)機;
[0026]所述控制服務(wù)器開機啟動,包括:順序控制所述資源服務(wù)器開機啟動和所述server端開機啟動。
[0027]應(yīng)用于上述任一所述的服務(wù)器reboot測試方法的服務(wù)器,通過外設(shè)的交換機,與外設(shè)的控制器之間相互通信,包括:開關(guān)單元、第一判斷單元、讀取寫入單元和生成單元,其中,
[0028]所述開關(guān)單元,用于當接收到外設(shè)的控制器發(fā)送的開機請求時,進行開機啟動,并觸發(fā)所述第一判斷單元,當接收到外設(shè)的控制器發(fā)送的關(guān)機請求,進行關(guān)機操作;
[0029]所述第一判斷單元,用于接收到所述開機單元的觸發(fā)時,判斷是否存在Ispc1-tmp文件,如果是,則觸發(fā)所述讀取寫入單元;并比較Ispc1-tmp文件和Ispc1-$count文件是否一致,否則,觸發(fā)所述生成單元;
[0030]所述讀取寫入單元,用于讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispc1-$count文件,并當所述Ispc1-tmp文件和所述Ispc1-$count文件一致時,發(fā)送啟動完成信息給外設(shè)的控制器,并創(chuàng)建gpu.txt文件和server.txt文件;
[0031]所述生成單元,用于為各個設(shè)備信息,生成Ispc1-tmp文件。
[0032]優(yōu)選地,上述服務(wù)器,通過OS網(wǎng)絡(luò)和BMC網(wǎng)絡(luò)連接到外設(shè)的交換機。
[0033]優(yōu)選地,上述服務(wù)器,進一步包括:第二判斷單元和第一計數(shù)器,其中,
[0034]所述第二判斷單元,用于判斷是否存在count文件,如果是,則觸發(fā)所述第一計數(shù)器;否則,啟動所述第一計數(shù)器,生成count文件,并將所述第一計數(shù)器寫入服務(wù)器開機啟動項;
[0035]所述第一計數(shù)器,用于統(tǒng)計所述開關(guān)單元的開機啟動次數(shù),當所述開關(guān)單元進行開機啟動時,進行count+Ι,并將開機啟動次數(shù)存儲到所述count文件。
[0036]優(yōu)選地,上述服務(wù)器,為Pcie-Switch服務(wù)器,該Pcie-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,所述server端插有一張re timer卡,通過該re timer卡及Mini SASHD線纜與所述資源服務(wù)器連接。
[0037]應(yīng)用于上述任一所述的服務(wù)器reboot測試方法的控制器,包括:設(shè)置單元、第二計數(shù)器、檢測單元和調(diào)用控制單元,其中,
[0038]所述設(shè)置單元,用于設(shè)置檢測閾值;
[0039]所述檢測單元,用于判斷所述第二計數(shù)器的計數(shù)是否小于所述設(shè)置單元設(shè)置的檢測閾值,如果是,則檢測外設(shè)的服務(wù)器中是否存在gpu.txt文件和server.txt文件,如果是,則觸發(fā)所述調(diào)用控制單元;
[0040]所述調(diào)用控制單元,用于在接收到所述檢測單元的觸發(fā)時,調(diào)用外設(shè)的服務(wù)器的關(guān)機函數(shù),控制外設(shè)的服務(wù)器關(guān)機,向外設(shè)的服務(wù)器發(fā)送開機請求,調(diào)用外設(shè)的服務(wù)器的開機函數(shù),控制外設(shè)的服務(wù)器開機啟動,并將所述第二計數(shù)器的計數(shù)加I。
[0041]服務(wù)器reboot測試系統(tǒng),包括:至少一個上述任意一種服務(wù)器、交換機和上述任意一種控制器,其中,
[0042]所述至少一個服務(wù)器和所述控制器分別與所述交換機連接。
[0043]本發(fā)明實施例提供了服務(wù)器reboot測試方法、服務(wù)器、控制器和系統(tǒng),該方法,通過交換機,建立服務(wù)器和控制器之間相互通信;當服務(wù)器接收到控制器發(fā)送的開機請求時,進行開機啟動;服務(wù)器判斷本身是否存在Ispc1-tmp文件,如果是,則讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispc1-$count文件,并比較Ispc1-tmp文件和Ispc1-$count文件是否一致,否則,為服務(wù)器中的設(shè)備信息,生成Ispc1-tmp文件;當所述Ispc1-tmp文件和所述Ispc1-$count文件一致時,發(fā)送啟動完成信息給控制器;創(chuàng)建gpu.txt文件和server.txt文件;接收控制器發(fā)送的關(guān)機請求,進行關(guān)機操作,通過該方法,通過服務(wù)器判斷文件是否存在,并對比文件間的一致性,即可判斷出服務(wù)器啟動是否正常,另外,服務(wù)器的啟動和關(guān)機均可在控制器的控制下,自動進行,而無需人工參與進來,實現(xiàn)了服務(wù)器穩(wěn)定性測試的自動化。
【附圖說明】
[0044]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0045]圖1是本發(fā)明一個實施例提供的服務(wù)器reboot測試方法的流程圖;
[0046]圖2是本發(fā)明另一個實施例提供的服務(wù)器reboot測試方法的流程圖;
[0047]圖3是本發(fā)明又一個實施例提供的服務(wù)器reboot測試方法的流程圖;
[0048]圖4是本發(fā)明實施例提供的Pcie-Switch服務(wù)器的啟動/關(guān)機時序不意圖;
[0049]圖5是本發(fā)明一個實施例提供的服務(wù)器的結(jié)構(gòu)示意圖;
[0050]圖6是本發(fā)明一個實施例提供的控制器的結(jié)構(gòu)示意圖;
[0051]圖7是本發(fā)明一個實施例提供的服務(wù)器reboot測試系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實施方式】
[0052]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例,基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0053]如圖1所示,本發(fā)明實施例提供了一種服務(wù)器reboot測試方法,該方法可以包括以下步驟:
[0054]步驟101:通過交換機,建立服務(wù)器和控制器之間相互通信;
[0055]步驟102:當服務(wù)器接收到控制器發(fā)送的開機請求時,進行開機啟動;
[0056]步驟103:服務(wù)器判斷本身是否存在Ispc1-tmp文件,如果是,則執(zhí)行步驟104 ;否貝1J,執(zhí)行步驟105;
[0057]步驟104:讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispcilcount文件,并比較Ispc1-tmp文件和I spc1-$count文件是否一致,如果是,則執(zhí)行步驟106,否則,執(zhí)行步驟107;
[0058]步驟105:為服務(wù)器中的設(shè)備信息,生成Ispc1-tmp文件;
[0059]步驟106:發(fā)送啟動完成信息給控制器,并創(chuàng)建gpu.txt文件和server.txt文件,并執(zhí)行步驟108 ;
[0060]步驟107:提示錯誤信息,并結(jié)束當前流程;
[0061]步驟108:接收控制器發(fā)送的關(guān)機請求,進行關(guān)機操作。
[0062]通過交換機,建立服務(wù)器和控制器之間相互通信;當服務(wù)器接收到控制器發(fā)送的開機請求時,進行開機啟動;服務(wù)器判斷本身是否存在Ispc1-tmp文件,如果是,則讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispc1-$count文件,并比較Ispc1-tmp文件和Ispc1-$count文件是否一致,否則,為服務(wù)器中的設(shè)備信息,生成Ispc1-tmp文件;當所述Ispc1-tmp文件和所述Ispc1-$count文件一致時,發(fā)送啟動完成信息給控制器;創(chuàng)建gpu.txt文件和server.txt文件;接收控制器發(fā)送的關(guān)機請求,進行關(guān)機操作,通過該方法,通過服務(wù)器判斷文件是否存在,并對比文件間的一致性,即可判斷出服務(wù)器啟動是否正常,另外,服務(wù)器的啟動和關(guān)機均可在控制器的控制下,自動進行,而無需人工參與進來,實現(xiàn)了服務(wù)器穩(wěn)定性測試的自動化。
[0063]在本發(fā)明一個實施例中,為了保證服務(wù)器與控制器間的通信,步驟101的【具體實施方式】:服務(wù)器通過OS網(wǎng)絡(luò)和BMC網(wǎng)絡(luò)連接到交換機;控制器通過OS網(wǎng)絡(luò)連接到交換機。
[0064]在本發(fā)明一個實施例中,為了實現(xiàn)統(tǒng)計服務(wù)器啟動次數(shù),進一步包括:在服務(wù)器中設(shè)置第一計數(shù)器count;在步驟102之后,進一步包括:服務(wù)器判斷本身是否存在count文件,如果是,則將第一計數(shù)器count+Ι,存儲到count文件;否則,啟動第一計數(shù)器count,將第一計數(shù)器count+Ι,生成count文件,并將第一計數(shù)器count寫入服務(wù)器開機啟動項,通過將計數(shù)器寫入服務(wù)器開機啟動項,保證了啟動次數(shù)統(tǒng)計的準確性。
[0065]在本發(fā)明一個實施例中,所述服務(wù)器為Pcie-Switch服務(wù)器,該Pcie-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,所述server端插有一張re timer卡,通過該ret imer卡及MiniSASHD線纜與所述資源服務(wù)器連接;進一步包括:設(shè)置啟動時序;所述開機啟動,包括:根據(jù)設(shè)置的啟動時序,順序啟動所述資源服務(wù)器和server端,保證了 Pcie-Switch服務(wù)器自動的正常啟動。
[0066]如圖2所示,本發(fā)明實施例提供服務(wù)器reboot測試方法,應(yīng)用于控制器,可以包括如下步驟:
[0067]步驟201:在控制器中設(shè)置第二計數(shù)器count,并設(shè)置檢測閾值;
[0068]步驟202:控制器初始化第二計數(shù)器count ;
[0069]步驟203:接收服務(wù)器發(fā)送的啟動完成信息,判斷第二計數(shù)器count的計數(shù)是否小于檢測閾值,如果是,則執(zhí)行步驟204;否則,執(zhí)行步驟205;
[°07°] 步驟204:檢測服務(wù)器中是否存在gpu.txt文件和server.txt文件,如果是,則執(zhí)行步驟206 ;否則,執(zhí)行步驟207 ;
[0071]步驟205:關(guān)閉服務(wù)器,并退出控制服務(wù)器,并結(jié)束當前流程;
[0072]步驟206:調(diào)用服務(wù)器的關(guān)機函數(shù),控制服務(wù)器關(guān)機,并執(zhí)行步驟208;
[0073]步驟207:延遲一定時間,并返回執(zhí)行步驟203;
[0074]步驟208:向服務(wù)器發(fā)送開機請求,調(diào)用服務(wù)器的開機函數(shù),控制服務(wù)器開機啟動,并將第二計數(shù)器count+Ι,執(zhí)行步驟203。
[0075]在本發(fā)明一個實施例中,為了避免服務(wù)器中已經(jīng)執(zhí)行的操作對服務(wù)器啟動產(chǎn)生影響,該方法進一步包括:清除服務(wù)器中的操作系統(tǒng)日志。
[0076]在本發(fā)明一個實施例中,所述服務(wù)器為Pcie-Switch服務(wù)器,該Pcie-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,所述server端插有一張re timer卡,通過該ret imer卡及MiniSASHD線纜與所述資源服務(wù)器連接;所述控制服務(wù)器關(guān)機,包括:順序控制所述server端關(guān)機和所述資源服務(wù)器關(guān)機;所述控制服務(wù)器開機啟動,包括:順序控制所述資源服務(wù)器開機啟動和所述server端開機啟動,保證了 Pcie-Switch服務(wù)器的正常啟動,實現(xiàn)了對Pcie-Switch服務(wù)器的穩(wěn)定性測試的自動化。
[0077]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,結(jié)合服務(wù)器和控制器之間的交互過程,作進一步地詳細描述。
[0078]如圖3所示,本發(fā)明又一實施例提供了服務(wù)器reboot測試方法,該方法可以包括以下步驟:
[0079]步驟301:通過交換機,建立服務(wù)器和控制器之間相互通信;
[0080]在該步驟中,服務(wù)器通過OS網(wǎng)絡(luò)和BMC網(wǎng)絡(luò)連接到交換機;控制器通過OS網(wǎng)絡(luò)連接到交換機;當服務(wù)器為Pcie-Switch服務(wù)器時,該Pcie-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,資源服務(wù)器可包含多個GPU,server端插有一張retimer卡,通過該retimer卡及MiniSASHD線纜與資源服務(wù)器連接;資源服務(wù)器和server端通過OS網(wǎng)絡(luò)和BMC網(wǎng)絡(luò)連接到交換機。
[0081 ] 步驟302:在服務(wù)器中設(shè)置第一計數(shù)器count,在控制器中設(shè)置第二計數(shù)器count,并設(shè)置檢測閾值;
[0082]在該步驟中,當服務(wù)器為Pcie-Switch服務(wù)器時,可將第一計數(shù)器count設(shè)置在資源服務(wù)器。
[0083]步驟303:控制器初始化第二計數(shù)器count,清除服務(wù)器中的操作系統(tǒng)日志;
[0084]該步驟中,清除服務(wù)器中的操作系統(tǒng)日志,是為了避免服務(wù)器之前的操作對穩(wěn)定性測試造成影響。
[0085]步驟304:控制器向服務(wù)器發(fā)送開機請求,調(diào)用服務(wù)器的開機函數(shù),進行服務(wù)器開機啟動;
[0086]在該步驟中,當服務(wù)器為非熱插拔服務(wù)器如Pcie-Switch服務(wù)器等,可以進一步通過設(shè)置啟動時序,根據(jù)啟動時序啟動服務(wù)器,如圖4所示,本發(fā)明實施例為Pcie-Switch服務(wù)器設(shè)置的啟動/關(guān)機時序,由于Pcie-Switch服務(wù)器為非熱插拔,則需要首先啟動包含有GPU的資源服務(wù)器,當資源服務(wù)器啟東完成之后,再啟動server端;同時,在關(guān)機過程中,則首先關(guān)閉server端,再關(guān)閉資源服務(wù)器,從而避免服務(wù)器由于啟動時序問題造成的宕機。
[0087]步驟305:服務(wù)器判斷本身是否存在count文件,如果是,則執(zhí)行步驟306;否則執(zhí)行步驟307;
[0088]步驟306:將第一計數(shù)器count+Ι,存儲到count文件,并執(zhí)行步驟308;
[0089]步驟307:啟動第一計數(shù)器count,將第一計數(shù)器count+Ι,生成count文件,并將第一計數(shù)器count寫入服務(wù)器開機啟動項;
[0090]在步驟305至步驟307的過程,主要是服務(wù)器自身對其啟動次數(shù)的統(tǒng)計,該統(tǒng)計通過計數(shù)器自動完成,而無需人為的參與。
[0091 ]步驟308:服務(wù)器判斷本身是否存在Ispc1-tmp文件,如果是,則執(zhí)行步驟309;否則執(zhí)行步驟310;
[0092]步驟309:讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispcilcount文件,并比較Ispc1-tmp文件和Ispc1-$count文件是否一致,如果是,則執(zhí)行步驟311 ;否則執(zhí)行步驟312;
[0093]步驟310:為服務(wù)器中的設(shè)備信息,生成Ispc1-tmp文件;
[0094]步驟308至步驟310是對服務(wù)器中各個設(shè)備的信息的收集和對比,通過對設(shè)備信息的對比,判斷服務(wù)器是否啟動完全,例如:一個服務(wù)器中有GPUl和GPU2,在Ispc1-tmp文件則包含有GPUl和GPU2的信息,而Ispc1-$count文件中僅有GPUl的信息,則兩個文件不一致,說明服務(wù)器啟動并未完成。
[0095]步驟311:發(fā)送啟動完成信息給控制器,創(chuàng)建gpu.txt文件和server.txt文件,并執(zhí)行步驟313;
[0096]步驟312:提示錯誤信息,并結(jié)束當前流程;
[0097]步驟313:控制器接收服務(wù)器發(fā)送的啟動完成信息,判斷第二計數(shù)器count的計數(shù)是否小于檢測閾值,如果是,則執(zhí)行步驟314;否則,執(zhí)行步驟315;
[0098]例如:設(shè)置檢測閾值為1000,第二計數(shù)器count的計數(shù)為服務(wù)器啟動次數(shù),則當服務(wù)器啟動次數(shù)小于1000時,第二計數(shù)器count的計數(shù)小于1000。
[00"] 步驟314:檢測服務(wù)器中是否存在gpu.txt文件和server.txt文件,如果是,則執(zhí)行步驟316;否則,執(zhí)行步驟317;
[0100]在該步驟中,首先需要檢測服務(wù)器是否連接到交換機,即控制器能夠通過交換機連接到服務(wù)器,由于前面提及當服務(wù)器啟動完成后,將創(chuàng)建gpu.txt文件和server.txt文件,則通過控制器檢測服務(wù)器中是否存在gpu.txt文件和server.txt文件,來進一步確定服務(wù)器已經(jīng)啟動完成。
[0101]步驟315:關(guān)閉服務(wù)器,并退出控制服務(wù)器,并結(jié)束當前流程;
[0102]步驟316:調(diào)用服務(wù)器的關(guān)機函數(shù),控制服務(wù)器關(guān)機,并執(zhí)行步驟304;
[0?03] 在該步驟中,將第二計算器count+Ι,對于非熱插拔服務(wù)器如Pcie-Switch服務(wù)器等來說,能夠根據(jù)上面設(shè)置的時序,順序控制server端關(guān)機和資源服務(wù)器關(guān)機。
[0104]步驟317:延遲一定時間,并返回執(zhí)行步驟313。
[0105]如果沒檢測到gpu.txt文件和server.txt文件,可能由于服務(wù)器還沒啟動完成,那么可以通過延長一定時間如5s再重新接收服務(wù)器發(fā)送的啟動完成信息。
[0106]如圖5所示,本發(fā)明實施例提供應(yīng)用于上述任一所述的服務(wù)器reboot測試方法的服務(wù)器,該服務(wù)器通過外設(shè)的交換機,與外設(shè)的控制器之間相互通信,包括:開關(guān)單元501、第一判斷單元502、讀取寫入單元503和生成單元504,其中,
[0107]開關(guān)單元501,用于當接收到外設(shè)的控制器發(fā)送的開機請求時,進行開機啟動,并觸發(fā)第一判斷單元502,當接收到外設(shè)的控制器發(fā)送的關(guān)機請求,進行關(guān)機操作;
[0?08]第一判斷單元502,用于接收到開機單元501的觸發(fā)時,判斷是否存在Ispc1-tmp文件,如果是,則觸發(fā)讀取寫入單元503;并比較Ispc1-tmp文件和I spc1-$count文件是否一致,否則,觸發(fā)生成單元504;
[0109]讀取寫入單元503,用于讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispc1-$count文件,并當Ispc1-tmp文件和Ispc1-$count文件一致時,發(fā)送啟動完成信息給外設(shè)的控制器,并創(chuàng)建gpu.txt文件和server.txt文件;
[Ο??Ο]生成單元504,用于為各個設(shè)備信息,生成Ispc1-tmp文件。
[0111]在本發(fā)明另一實施例中,通過OS網(wǎng)絡(luò)和BMC網(wǎng)絡(luò)連接到外設(shè)的交換機。
[0112]在本發(fā)明又一實施例中,上述服務(wù)器進一步包括:第二判斷單元和第一計數(shù)器(圖中未示出),其中,
[0113]第二判斷單元,用于判斷是否存在count文件,如果是,則觸發(fā)第一計數(shù)器;否則,啟動第一計數(shù)器,生成count文件,并將第一計數(shù)器寫入服務(wù)器開機啟動項;
[0114]第一計數(shù)器,用于統(tǒng)計開關(guān)單元501的開機啟動次數(shù),當開關(guān)單元501進行開機啟動時,進行count+Ι,并將開機啟動次數(shù)存儲到count文件。
[ΟΙ15] 在本發(fā)明另一實施例中,上述服務(wù)器為Pcie-Switch服務(wù)器,該Pcie-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,server端插有一張ret imer卡,通過該retimer卡及MiniSASHD線纜與資源服務(wù)器連接。
[0116]如圖6所示,本發(fā)明實施例提供應(yīng)用于上述任一所述的服務(wù)器reboot測試方法的控制器,該控制器,包括:設(shè)置單元601、第二計數(shù)器602、檢測單元603和調(diào)用控制單元604,其中,
[0117]設(shè)置單元601,用于設(shè)置檢測閾值;
[0118]檢測單元603,用于判斷第二計數(shù)器602的計數(shù)是否小于設(shè)置單元601設(shè)置的檢測閾值,如果是,則檢測外設(shè)的服務(wù)器中是否存在gpu.txt文件和server.txt文件,如果是,則觸發(fā)調(diào)用控制單元604;
[0119]調(diào)用控制單元604,用于在接收到檢測單元603的觸發(fā)時,調(diào)用外設(shè)的服務(wù)器的關(guān)機函數(shù),控制外設(shè)的服務(wù)器關(guān)機,向外設(shè)的服務(wù)器發(fā)送開機請求,調(diào)用外設(shè)的服務(wù)器的開機函數(shù),控制外設(shè)的服務(wù)器開機啟動,并將第二計數(shù)器602的計數(shù)加I。
[0120]上述裝置內(nèi)的各單元之間的信息交互、執(zhí)行過程等內(nèi)容,由于與本發(fā)明方法實施例基于同一構(gòu)思,具體內(nèi)容可參見本發(fā)明方法實施例中的敘述,此處不再贅述。
[0121]如圖7所示,本發(fā)明實施例提供服務(wù)器reboot測試系統(tǒng),包括:至少一個上述任意一種服務(wù)器701、交換機702和控制器703,其中,
[0122]至少一個服務(wù)器701和控制器703分別與交換機702連接。
[0123]根據(jù)上述方案,本發(fā)明的各實施例所提供的服務(wù)器reboot測試方法、服務(wù)器、控制器和系統(tǒng),至少具有如下有益效果:
[0124]1.通過交換機,建立服務(wù)器和控制器之間相互通信;當服務(wù)器接收到控制器發(fā)送的開機請求時,進行開機啟動;服務(wù)器判斷本身是否存在I spc1-tmp文件,如果是,則讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispc1-$count文件,并比較Ispc1-tmp文件和Ispc1-$(3011111:文件是否一致,否則,為服務(wù)器中的設(shè)備信息,生成18口0;[-1:11^1文件;當所述18口(^-tmp文件和所述Ispc1-$count文件一致時,發(fā)送啟動完成信息給控制器;創(chuàng)建gpu.txt文件和server.txt文件;接收控制器發(fā)送的關(guān)機請求,進行關(guān)機操作,通過該方法,通過服務(wù)器判斷文件是否存在,并對比文件間的一致性,即可判斷出服務(wù)器啟動是否正常,另外,服務(wù)器的啟動和關(guān)機均可在控制器的控制下,自動進行,而無需人工參與進來,實現(xiàn)了服務(wù)器穩(wěn)定性測試的自動化。
[0125]2.服務(wù)器通過OS網(wǎng)絡(luò)和BMC網(wǎng)絡(luò)連接到交換機;控制器通過OS網(wǎng)絡(luò)連接到交換機;使得控制器能夠控制服務(wù)器的自動開關(guān)機,保證了服務(wù)器穩(wěn)定性測試的自動化,另外,通過設(shè)置啟動時序;根據(jù)設(shè)置的啟動時序,順序啟動Pcie-Switch服務(wù)器的資源服務(wù)器和server端,使得非熱插拔的Pcie-Switch服務(wù)器也能夠?qū)崿F(xiàn)穩(wěn)定性測試的自動化。
[0126]3.在服務(wù)器啟動完成之后,啟動完成信息給控制器,創(chuàng)建gpu.txt文件和server, txt文件,控制器在接收到啟動完成信息之后,還是會檢測服務(wù)器中是否存在gpu.txt文件和server, txt文件,保證了服務(wù)器啟動的準確性。
[0127]4.通過設(shè)置檢測閾值,只有當控制器中的第二計數(shù)器count的計數(shù)小于檢測閾值時,控制器才會調(diào)用開機/關(guān)機函數(shù),控制服務(wù)器的開機/關(guān)機,避免穩(wěn)定性測試進入死循環(huán),另外,控制器通過清除服務(wù)器中的操作系統(tǒng)日志,避免服務(wù)器中除開關(guān)機之外的操作對服務(wù)器穩(wěn)定性造成影響,進一步提高服務(wù)器穩(wěn)定性測試的準確性。
[0128]需要說明的是,在本文中,諸如第一和第二之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同因素。
[0129]本領(lǐng)域普通技術(shù)人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲在計算機可讀取的存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括:ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)中。
[0130]最后需要說明的是:以上所述僅為本發(fā)明的較佳實施例,僅用于說明本發(fā)明的技術(shù)方案,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi)所做的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍內(nèi)。
【主權(quán)項】
1.服務(wù)器reboot測試方法,其特征在于,通過交換機,建立服務(wù)器和控制器之間相互通信;還包括: 當服務(wù)器接收到控制器發(fā)送的開機請求時,進行開機啟動; 服務(wù)器判斷本身是否存在Ispc1-tmp文件,如果是,則讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispc1-$count文件,并比較Ispc1-tmp文件和Ispc1-$count文件是否一致,否貝IJ,為服務(wù)器中的設(shè)備信息,生成Ispc1-tmp文件; 當所述Ispc1-tmp文件和所述Ispc1-$count文件一致時,發(fā)送啟動完成信息給控制器; 創(chuàng)建gpu.txt文件和server.txt文件; 接收控制器發(fā)送的關(guān)機請求,進行關(guān)機操作。2.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述通過交換機,建立服務(wù)器和控制器之間相互通信,包括: 服務(wù)器通過OS網(wǎng)絡(luò)和BMC網(wǎng)絡(luò)連接到交換機; 控制器通過OS網(wǎng)絡(luò)連接到交換機; 和/或, 進一步包括:在服務(wù)器中設(shè)置第一計數(shù)器count; 在所述開機啟動之后,進一步包括:服務(wù)器判斷本身是否存在count文件,如果是,則將所述第一計數(shù)器count+Ι,存儲到所述count文件;否則,啟動所述第一計數(shù)器count,將所述第一計數(shù)器count+Ι,生成count文件,并將所述第一計數(shù)器count寫入服務(wù)器開機啟動項。3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于, 所述服務(wù)器為Pcie-Switch服務(wù)器,該Pcie-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,所述server端插有一張retimer卡,通過該retimer卡及MiniSASHD線纜與所述資源服務(wù)器連接; 進一步包括:設(shè)置啟動時序; 所述開機啟動,包括:根據(jù)設(shè)置的啟動時序,順序啟動所述資源服務(wù)器和server端。4.服務(wù)器reboot測試方法,其特征在于,應(yīng)用于控制器,在控制器中設(shè)置第二計數(shù)器count,并設(shè)置檢測閾值;還包括: Ml、控制器初始化所述第二計數(shù)器count ; M2、接收服務(wù)器發(fā)送的啟動完成信息,判斷所述第二計數(shù)器count的計數(shù)是否小于檢測閾值,如果是,則檢測服務(wù)器中是否存在gpu.txt文件和server.txt文件,如果是,則調(diào)用服務(wù)器的關(guān)機函數(shù),控制服務(wù)器關(guān)機; M3、向服務(wù)器發(fā)送開機請求,調(diào)用服務(wù)器的開機函數(shù),控制服務(wù)器開機啟動,并將第二計數(shù)器count+Ι,執(zhí)行M2。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,進一步包括:清除所述服務(wù)器中的操作系統(tǒng)曰志。6.根據(jù)權(quán)利要求4或5所述的方法,其特征在于,所述服務(wù)器為Pcie-Switch服務(wù)器,該Pci e-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,所述server端插有一張ret imer卡,通過該retimer卡及MiniSASHD線纜與所述資源服務(wù)器連接; 所述控制服務(wù)器關(guān)機,包括:順序控制所述server端關(guān)機和所述資源服務(wù)器關(guān)機; 所述控制服務(wù)器開機啟動,包括:順序控制所述資源服務(wù)器開機啟動和所述server端開機啟動。7.應(yīng)用于權(quán)利要求1至3任一所述的服務(wù)器reboot測試方法的服務(wù)器,通過外設(shè)的交換機,與外設(shè)的控制器之間相互通信,其特征在于,包括:開關(guān)單元、第一判斷單元、讀取寫入單元和生成單元,其中, 所述開關(guān)單元,用于當接收到外設(shè)的控制器發(fā)送的開機請求時,進行開機啟動,并觸發(fā)所述第一判斷單元,當接收到外設(shè)的控制器發(fā)送的關(guān)機請求,進行關(guān)機操作; 所述第一判斷單元,用于接收到所述開機單元的觸發(fā)時,判斷是否存在Ispc1-tmp文件,如果是,則觸發(fā)所述讀取寫入單元;并比較Ispc1-tmp文件和Ispc1-$count文件是否一致,否則,觸發(fā)所述生成單元; 所述讀取寫入單元,用于讀取服務(wù)器中的設(shè)備信息,將該設(shè)備信息寫入Ispc1-$c0unt文件,并當所述Ispc1-tmp文件和所述Ispc1-$count文件一致時,發(fā)送啟動完成信息給外設(shè)的控制器,并創(chuàng)建gpu.txt文件和server.txt文件; 所述生成單元,用于為各個設(shè)備信息,生成Ispc1-tmp文件。8.根據(jù)權(quán)利要求7所述的服務(wù)器,其特征在于, 通過OS網(wǎng)絡(luò)和BMC網(wǎng)絡(luò)連接到外設(shè)的交換機; 和/或, 進一步包括:第二判斷單元和第一計數(shù)器,其中, 所述第二判斷單元,用于判斷是否存在count文件,如果是,則觸發(fā)所述第一計數(shù)器;否則,啟動所述第一計數(shù)器,生成count文件,并將所述第一計數(shù)器寫入服務(wù)器開機啟動項; 所述第一計數(shù)器,用于統(tǒng)計所述開關(guān)單元的開機啟動次數(shù),當所述開關(guān)單元進行開機啟動時,進行count+Ι,并將開機啟動次數(shù)存儲到所述count文件; 和/或, 所述服務(wù)器為Pcie-Switch服務(wù)器,該Pcie-Switch服務(wù)器包括:資源服務(wù)器和server端,其中,所述server端插有一張ret imer卡,通過該ret imer卡及Mini SASHD線纜與所述資源服務(wù)器連接。9.應(yīng)用于權(quán)利要求4至6任一所述的服務(wù)器reboot測試方法的控制器,其特征在于,包括:設(shè)置單元、第二計數(shù)器、檢測單元和調(diào)用控制單元,其中, 所述設(shè)置單元,用于設(shè)置檢測閾值; 所述檢測單元,用于判斷所述第二計數(shù)器的計數(shù)是否小于所述設(shè)置單元設(shè)置的檢測閾值,如果是,則檢測外設(shè)的服務(wù)器中是否存在gpu.txt文件和server.txt文件,如果是,則觸發(fā)所述調(diào)用控制單元; 所述調(diào)用控制單元,用于在接收到所述檢測單元的觸發(fā)時,調(diào)用外設(shè)的服務(wù)器的關(guān)機函數(shù),控制外設(shè)的服務(wù)器關(guān)機,向外設(shè)的服務(wù)器發(fā)送開機請求,調(diào)用外設(shè)的服務(wù)器的開機函數(shù),控制外設(shè)的服務(wù)器開機啟動,并將所述第二計數(shù)器的計數(shù)加I。10.服務(wù)器reboot測試系統(tǒng),其特征在于,包括:至少一個權(quán)利要求7或8所述的服務(wù)器、交換機和權(quán)利要求9所述的控制器,其中, 所述至少一個服務(wù)器和所述控制器分別與所述交換機連接。
【文檔編號】G06F11/22GK105912431SQ201610202489
【公開日】2016年8月31日
【申請日】2016年4月1日
【發(fā)明人】肖歡, 鞏祥文
【申請人】浪潮電子信息產(chǎn)業(yè)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1