專利名稱:一種應(yīng)用于刀片服務(wù)器的智能散熱控制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種服務(wù)器散熱技術(shù)領(lǐng)域,具體地說是一種應(yīng)用于刀片服務(wù)器的智能散熱控制方法。
背景技術(shù):
隨著云計算技術(shù)的發(fā)展,人們對高密度計算的服務(wù)器的需求越來越強烈,而刀片服務(wù)器,作為一種小體積,高密度服務(wù)器架構(gòu),日益受到大型機房建造者們的歡迎,成為服務(wù)器應(yīng)用的主流機種,但是,高密度帶來系統(tǒng)散熱能力的需求日益增加,這樣對風(fēng)扇轉(zhuǎn)速和風(fēng)壓的要求也會隨之不斷增加,這種現(xiàn)象會帶來兩個負(fù)面 的問題。第一,風(fēng)扇轉(zhuǎn)速和風(fēng)壓的增加,必將會帶來風(fēng)扇功耗的增加,而作為高密度計算集群應(yīng)用的刀片服務(wù)器對電功率的要求本身就比較大,風(fēng)扇功耗的增大將會使刀片系統(tǒng)不得不犧牲一部分應(yīng)用或性能來保證刀片系統(tǒng)整體的電能供應(yīng)。第二,由于風(fēng)扇高轉(zhuǎn)速和高風(fēng)壓所帶來設(shè)計技術(shù)難度的增加,使得風(fēng)扇的故障率也趨于升高,而且一旦系統(tǒng)的一枚風(fēng)扇發(fā)生故障,所有的系統(tǒng)刀片都要進入保護狀態(tài),可能將造成整個服務(wù)器直接停機或低效能運行。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種應(yīng)用于刀片服務(wù)器的智能散熱控制方法。本發(fā)明的目的是按以下方式實現(xiàn)的,系統(tǒng)包括刀片計算節(jié)點,風(fēng)扇系統(tǒng)和系統(tǒng)管理中樞SMC,刀片節(jié)點與系統(tǒng)管理中樞SMC之間通過IPMI協(xié)議相連,系統(tǒng)管理中樞SMC通過IPMI協(xié)議從刀片節(jié)點讀取其當(dāng)前計算負(fù)載和溫度,或發(fā)送指令至刀片節(jié)點來調(diào)節(jié)其CPU和內(nèi)存的頻率控制刀片功耗;同時,每個風(fēng)扇也獨立的與系統(tǒng)管理中樞SMC通過12C協(xié)議相連,將轉(zhuǎn)速信息反饋給系統(tǒng)管理中樞SMC,或接收來自系統(tǒng)管理中樞SMC的指令來調(diào)節(jié)風(fēng)扇轉(zhuǎn)速;另外,各刀片與各風(fēng)扇均是以獨立地址與系統(tǒng)管理中樞SMC通訊,以保證在控制系統(tǒng)中的獨立性;具體控制步驟如下
1)每一枚風(fēng)扇對應(yīng)給兩片刀片散熱,當(dāng)各個刀片負(fù)載與溫度大致相同時,風(fēng)扇的轉(zhuǎn)速比較接近,而當(dāng)其中某一刀片節(jié)點的負(fù)載增大時,系統(tǒng)管理中樞SMC就會得到其負(fù)載和溫度變化的信息,之后系統(tǒng)管理中樞SMC會發(fā)出轉(zhuǎn)速增加指令到與刀片對應(yīng)的風(fēng)扇,使其提高風(fēng)量,而其他的刀片與風(fēng)扇則不受影響,當(dāng)某一刀片負(fù)載較小時,系統(tǒng)管理中樞SMC則會采取相反的動作,使其風(fēng)量減小,實現(xiàn)各個刀片對風(fēng)量的“各取所需”,最大的節(jié)約了風(fēng)扇的總功耗;
2)當(dāng)某一個風(fēng)扇發(fā)生故障時,系統(tǒng)管理中樞SMC將會讀取到該風(fēng)扇的轉(zhuǎn)速異常,當(dāng)連續(xù)幾次讀取均為異常后,系統(tǒng)管理中樞SMC將向該風(fēng)扇所對應(yīng)的刀片發(fā)出降低其負(fù)載的指令,刀片節(jié)點負(fù)載的降低,使其運行溫度也隨之降低,這樣就最大程度的保護了運行在刀片上的信息數(shù)據(jù)不會損失,等待系統(tǒng)管理員對數(shù)據(jù)進行備份,以及對風(fēng)扇的修復(fù),在這種情況下,其他的刀片節(jié)點并不受到影響,實現(xiàn)了風(fēng)扇的獨立故障處理。
本發(fā)明的有益效果是包含兩個方面的內(nèi)容
O同一刀片服務(wù)器系統(tǒng)的每一個風(fēng)扇都可以根據(jù)自己負(fù)責(zé)散熱的刀片計算節(jié)點的計算負(fù)載和運行溫度來調(diào)節(jié)自己的轉(zhuǎn)速,實現(xiàn)同一系統(tǒng)內(nèi)的各個風(fēng)扇的分區(qū)散熱控制;
2)當(dāng)某一個風(fēng)扇發(fā)生故障導(dǎo)致轉(zhuǎn)速不正常時,只有與其對應(yīng)散熱的刀片計算節(jié)點會通過降頻率,降電壓的方法降低刀片的負(fù)載,其他的刀片并不會受到影響,從而實現(xiàn)刀片過熱保護的獨立控制。
圖I是服務(wù)器風(fēng)扇正常散熱工況示意 圖2是根據(jù)刀片負(fù)載狀況調(diào)整散熱系統(tǒng)的工況示意圖;
圖3是風(fēng)扇出現(xiàn)故障時的系統(tǒng)散熱工況示意圖。
具體實施例方式本發(fā)明是一種應(yīng)用于刀片服務(wù)器的智能散熱控制管理方法,意在克服刀片服務(wù)器在風(fēng)扇和溫度管理上的各個難點,設(shè)計出一種適用于刀片服務(wù)器的智能散熱控制管理系統(tǒng),可以實現(xiàn)系統(tǒng)刀片散熱的分區(qū)風(fēng)扇控制和風(fēng)扇獨立故障處理。參照說明書附圖對本發(fā)明的方法作以下詳細(xì)地說明。(I)整個散熱控制方案主要由三部分組成,分別是刀片計算節(jié)點,風(fēng)扇系統(tǒng)和系統(tǒng)管理中樞(SMC),如圖I,刀片節(jié)點與SMC之間通過IPMI協(xié)議相連,SMC可以通過IPMI協(xié)議從刀片節(jié)點讀取其當(dāng)前計算負(fù)載和溫度,也可以發(fā)送指令至刀片節(jié)點來調(diào)節(jié)其CPU和內(nèi)存的頻率,控制刀片功耗。同時,每個風(fēng)扇也獨立的與SMC通過I2C協(xié)議相連,可以反饋轉(zhuǎn)速信息給SMC,也可以接收來自SMC的指令來調(diào)節(jié)風(fēng)扇轉(zhuǎn)速。另外,各刀片與各風(fēng)扇均是以獨立地址與SMC通訊,這樣可以保證它們在控制系統(tǒng)中的獨立性;
(2)現(xiàn)以單機箱20刀10風(fēng)扇的刀片服務(wù)器為例,每一枚風(fēng)扇對應(yīng)給兩片刀片散熱,如圖I所示,當(dāng)各個刀片負(fù)載與溫度大致相同時,風(fēng)扇的轉(zhuǎn)速比較接近,而當(dāng)其中某一刀片節(jié)點(比如刀片1,如圖2)的負(fù)載增大時,SMC就會得到其負(fù)載和溫度變化的信息,之后SMC會發(fā)出轉(zhuǎn)速增加指令到與刀片I對應(yīng)的風(fēng)扇0,使其提高風(fēng)量,而其他的刀片與風(fēng)扇則不受影響。當(dāng)某一刀片負(fù)載較小時,SMC則會采取相反的動作,使其風(fēng)量減小。總之,實現(xiàn)了各個刀片對風(fēng)量的“各取所需”,最大的節(jié)約了風(fēng)扇的總功耗;
(3)當(dāng)某一個風(fēng)扇(比如風(fēng)扇I,如圖3)發(fā)生故障時,SMC將會讀取到風(fēng)扇I的轉(zhuǎn)速異常,當(dāng)連續(xù)幾次讀取均為異常后,SMC將向風(fēng)扇I所對應(yīng)的刀片2和3發(fā)出降低其負(fù)載的指令,刀片節(jié)點負(fù)載的降低,使其運行溫度也隨之降低,這樣就最大程度的保護了運行在刀片
2、3上的信息數(shù)據(jù)不會損失,等待系統(tǒng)管理員對數(shù)據(jù)進行備份,以及對風(fēng)扇的修復(fù),在這種情況下,其他的刀片節(jié)點并不受到影響,實現(xiàn)了風(fēng)扇的獨立故障處理。除說明書所述的技術(shù)特征外,均為本專業(yè)技術(shù)人員的已知技術(shù)。
權(quán)利要求
1.一種應(yīng)用于刀片服務(wù)器的智能散熱控制方法,其特征在于系統(tǒng)包括刀片計算節(jié)點,風(fēng)扇系統(tǒng)和系統(tǒng)管理中樞SMC,刀片節(jié)點與系統(tǒng)管理中樞SMC之間通過IPMI協(xié)議相連,系統(tǒng)管理中樞SMC通過IPMI協(xié)議從刀片節(jié)點讀取其當(dāng)前計算負(fù)載和溫度,或發(fā)送指令至刀片節(jié)點來調(diào)節(jié)其CPU和內(nèi)存的頻率控制刀片功耗;同吋,每個風(fēng)扇也獨立的與系統(tǒng)管理中樞SMC通過I2C協(xié)議相連,將轉(zhuǎn)速信息反饋給系統(tǒng)管理中樞SMC,或接收來自系統(tǒng)管理中樞SMC的指令來調(diào)節(jié)風(fēng)扇轉(zhuǎn)速;另外,各刀片與各風(fēng)扇均是以獨立地址與系統(tǒng)管理中樞SMC通訊,以保證在控制系統(tǒng)中的獨立性;具體控制步驟如下 1)每一枚風(fēng)扇對應(yīng)給兩片刀片散熱,當(dāng)各個刀片負(fù)載與溫度大致相同時,風(fēng)扇的轉(zhuǎn)速比較接近,而當(dāng)其中某一刀片節(jié)點的負(fù)載增大時,系統(tǒng)管理中樞SMC就會得到其負(fù)載和溫度變化的信息,之后系統(tǒng)管理中樞SMC會發(fā)出轉(zhuǎn)速増加指令到與刀片對應(yīng)的風(fēng)扇,使其提高風(fēng)量,而其他的刀片與風(fēng)扇則不受影響,當(dāng)某一刀片負(fù)載較小吋,系統(tǒng)管理中樞SMC則會采取相反的動作,使其風(fēng)量減小,實現(xiàn)各個刀片對風(fēng)量的“各取所需”,最大的節(jié)約了風(fēng)扇的總功耗; 2)當(dāng)某ー個風(fēng)扇發(fā)生故障時,系統(tǒng)管理中樞SMC將會讀取到該風(fēng)扇的轉(zhuǎn)速異常,當(dāng)連續(xù)幾次讀取均為異常后,系統(tǒng)管理中樞SMC將向該風(fēng)扇所對應(yīng)的刀片發(fā)出降低其負(fù)載的指令,刀片節(jié)點負(fù)載的降低,使其運行溫度也隨之降低,這樣就最大程度的保護了運行在刀片上的信息數(shù)據(jù)不會損失,等待系統(tǒng)管理員對數(shù)據(jù)進行備份,以及對風(fēng)扇的修復(fù),在這種情況下,其他的刀片節(jié)點并不受到影響,實現(xiàn)了風(fēng)扇的獨立故障處理。
全文摘要
本發(fā)明提供一種應(yīng)用于刀片服務(wù)器的智能散熱控制方法,系統(tǒng)包括刀片計算節(jié)點,風(fēng)扇系統(tǒng)和系統(tǒng)管理中樞SMC,刀片節(jié)點與系統(tǒng)管理中樞SMC之間通過IPMI協(xié)議相連,系統(tǒng)管理中樞SMC通過IPMI協(xié)議從刀片節(jié)點讀取其當(dāng)前計算負(fù)載和溫度,或發(fā)送指令至刀片節(jié)點來調(diào)節(jié)其CPU和內(nèi)存的頻率控制刀片功耗;同時,每個風(fēng)扇也獨立的與系統(tǒng)管理中樞SMC通過I2C協(xié)議相連,將轉(zhuǎn)速信息反饋給系統(tǒng)管理中樞SMC,或接收來自系統(tǒng)管理中樞SMC的指令來調(diào)節(jié)風(fēng)扇轉(zhuǎn)速;另外,各刀片與各風(fēng)扇均是以獨立地址與系統(tǒng)管理中樞SMC通訊,以保證在控制系統(tǒng)中的獨立性。
文檔編號G06F1/20GK102662444SQ20121004045
公開日2012年9月12日 申請日期2012年2月22日 優(yōu)先權(quán)日2012年2月22日
發(fā)明者王歡 申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司