基于動態(tài)調(diào)頻調(diào)壓技術(shù)的數(shù)據(jù)中心節(jié)能調(diào)度方法
【專利摘要】本發(fā)明提供一種基于動態(tài)調(diào)頻調(diào)壓技術(shù)的數(shù)據(jù)中心任務(wù)調(diào)度方法。該方法首先對集群中的機器進行基于DVFS技術(shù)的性能模型與能耗模型的建模工作。其次利用該性能與能耗模型去預(yù)測任務(wù)調(diào)度后的能耗數(shù)據(jù)。最后利用其預(yù)測的能耗數(shù)據(jù)去指導(dǎo)在線任務(wù)在整個集群中的實時調(diào)度。本發(fā)明結(jié)合了傳統(tǒng)服務(wù)器單點動態(tài)調(diào)頻調(diào)壓技術(shù)與整個集群中的調(diào)度任務(wù),使得整個集群的中央管理節(jié)點能夠根據(jù)每個服務(wù)器的實時數(shù)據(jù)得出的分析結(jié)果,來對在線的任務(wù)做出更加利于節(jié)能的任務(wù)分發(fā),從而最終能夠節(jié)省整個數(shù)據(jù)中心的能耗。
【專利說明】基于動態(tài)調(diào)頻調(diào)壓技術(shù)的數(shù)據(jù)中心節(jié)能調(diào)度方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及在數(shù)據(jù)中心場景中任務(wù)調(diào)度方法,特別涉及一種基于動態(tài)調(diào)頻調(diào)壓技 術(shù)(Dynamic Voltage and Frequency Scaling, DVFS)的性能與能耗模型的任務(wù)調(diào)度方法。 該方法能夠在集群中分發(fā)當(dāng)前任務(wù)并為處理器設(shè)置合理的工作頻率,達到節(jié)能的目標(biāo)。
【背景技術(shù)】
[0002] 近年來數(shù)據(jù)中心的能耗問題已經(jīng)變得愈發(fā)嚴(yán)重。數(shù)據(jù)顯示:全球總能耗的百分之 一點五和全美總能耗的百分之二是被數(shù)據(jù)中心所消耗的,且這個百分比還在隨著大數(shù)據(jù)時 代的到來而逐漸上漲。其中,處理器(CPU)工作的能耗占據(jù)總能耗的近50%,提高處理器的 效率,成為降低能耗的重要方面?,F(xiàn)有的資源管理與調(diào)度系統(tǒng)關(guān)注于通過提高服務(wù)器資源 利用率來降低活躍機器數(shù)量,即通過減少處理器運行的數(shù)量來節(jié)省能源,并沒有關(guān)注處理 器的運行狀態(tài)。事實上,現(xiàn)代處理器都能工作于不同的頻率,工作頻率越高運行速度越快, 而相應(yīng)能耗就越高,因此合理的頻率設(shè)置能有效控制能耗。動態(tài)調(diào)頻調(diào)壓技術(shù)(Dynamic Voltage and Frequency Scaling, DVFS)是現(xiàn)代處理器高效電能利用的一種技術(shù),DVFS使 得處理器處于不同的頻率和電壓的設(shè)置,即不同的P狀態(tài)(Performance states),由當(dāng)前 的任務(wù)工作量來決定當(dāng)前的處理器(CPU)的頻率設(shè)置,從而達到節(jié)省處理器功耗的目的。目 前,基于DVFS技術(shù)的節(jié)能方面的研究工作圍繞著移動計算和嵌入式系統(tǒng)來展開,用于緩解 這些移動系統(tǒng)中有限的電能儲備。而在數(shù)據(jù)中心等高電能消耗的環(huán)境中,基于動態(tài)調(diào)頻壓 (DVFS)的節(jié)能調(diào)度技術(shù)尚未得到應(yīng)用,也無有效的基于DVFS的任務(wù)分配方法。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的主要提出了一種基于動態(tài)調(diào)頻調(diào)壓技術(shù)的數(shù)據(jù)中心任務(wù)調(diào)度方法,該方 法能夠有效的減少整個集群的能耗。
[0004] 本發(fā)明所述的基于動態(tài)調(diào)頻調(diào)壓技術(shù)的數(shù)據(jù)中心任務(wù)調(diào)度方法,數(shù)據(jù)中心包括前 端服務(wù)器、若干集群服務(wù)器,以及用于存儲執(zhí)行任務(wù)所需數(shù)據(jù)的網(wǎng)絡(luò)存儲數(shù)據(jù)庫,其中前端 服務(wù)器包括了任務(wù)接收模塊、任務(wù)調(diào)度模塊、集群數(shù)據(jù)管理模塊及前端通信模塊;每臺集群 服務(wù)器上設(shè)有信息獲取模塊,與前端通信模塊連接的后端通信模塊;任務(wù)調(diào)度方法的過程 為: 1) 當(dāng)用戶向前端服務(wù)器請求其所需求的服務(wù)時,首先根據(jù)任務(wù)在前端服務(wù)器上建立其 性能模型與能耗模型, 2) 每臺集群服務(wù)器通過信息獲取模塊實時獲取自身的數(shù)據(jù),包括當(dāng)前主頻與電壓的設(shè) 置,處理器的利用率,并通過前端及后端的通信模塊向前端服務(wù)器的集群數(shù)據(jù)管理模塊更 新實時數(shù)據(jù); 3) 由前端服務(wù)器的任務(wù)接收模塊收集任務(wù)的資源請求,再結(jié)合集群數(shù)據(jù)管理模塊中實 時集群數(shù)據(jù),以步驟1)中建立好的性能模型與能耗模型,以集群中每個服務(wù)器的單點性能 瓶頸作為限制條件,集群服務(wù)器的總能耗作為優(yōu)化目標(biāo)決定任務(wù)的最佳部署點,對任務(wù)進 行實時的調(diào)度。
[0005] 此外,還包括步驟4),在多任務(wù)狀態(tài)下,由于不同任務(wù)的集中,使得任務(wù)的實時資 源要求變化或者服務(wù)器發(fā)熱因素造成的變化,實時調(diào)節(jié)集群服務(wù)器的主頻電壓,造成的包 括處理器主頻、利用率主要數(shù)據(jù)指標(biāo)的更改,由集群服務(wù)器的實時信息獲取模塊獲取,然后 通過第一及第二通信模塊來更新集群服務(wù)器中的服務(wù)器實時數(shù)據(jù)以及已部署任務(wù)的資源 占有情況。
[0006] 上述步驟1)中性能模型的建立是,當(dāng)調(diào)節(jié)集群服務(wù)器中各服務(wù)器至不同的主頻設(shè) 置下,結(jié)合任務(wù)運行時主要考慮的性能指標(biāo),包括執(zhí)行時間,處理器占用率,根據(jù)這些數(shù)據(jù) 擬合出相應(yīng)的性能模型; 能耗模型的建立也是通過調(diào)節(jié)集群服務(wù)器中各服務(wù)器的主頻和電壓至不同 的組合,獲取功率與對應(yīng)主頻的數(shù)據(jù)信息,結(jié)合處理器功耗的理論公式進行數(shù)據(jù) 的擬合分析,建立相應(yīng)的能耗模型;上述處理器功耗的理論公式即處理器的能耗 F與處理器的主頻/和電壓F的關(guān)系:
【權(quán)利要求】
1. 一種基于動態(tài)調(diào)頻調(diào)壓技術(shù)的數(shù)據(jù)中心任務(wù)調(diào)度方法,數(shù)據(jù)中心包括前端服務(wù)器、 若干集群服務(wù)器,以及用于存儲執(zhí)行任務(wù)所需數(shù)據(jù)的網(wǎng)絡(luò)存儲數(shù)據(jù)庫,其中前端服務(wù)器包 括了任務(wù)接收模塊、任務(wù)調(diào)度模塊、集群數(shù)據(jù)管理模塊及前端通信模塊;每臺集群服務(wù)器上 設(shè)有信息獲取模塊,與前端通信模塊連接的后端通信模塊;其特征在于,任務(wù)調(diào)度方法的過 程為: 1) 當(dāng)用戶向前端服務(wù)器請求其所需求的服務(wù)時,首先根據(jù)任務(wù)在前端服務(wù)器上建立其 性能模型與能耗模型, 2) 每臺集群服務(wù)器通過信息獲取模塊實時獲取自身的數(shù)據(jù),包括當(dāng)前主頻與電壓的設(shè) 置,處理器的利用率,并通過前端及后端的通信模塊向前端服務(wù)器的集群數(shù)據(jù)管理模塊更 新實時數(shù)據(jù); 3) 由前端服務(wù)器的任務(wù)接收模塊收集任務(wù)的資源請求,再結(jié)合集群數(shù)據(jù)管理模塊中實 時集群數(shù)據(jù),以步驟1)中建立好的性能模型與能耗模型,以集群中每個服務(wù)器的單點性能 瓶頸作為限制條件,集群服務(wù)器的總能耗作為優(yōu)化目標(biāo)決定任務(wù)的最佳部署點,對任務(wù)進 行實時的調(diào)度。
2. 根據(jù)權(quán)利要求1所述的基于動態(tài)調(diào)頻調(diào)壓技術(shù)的數(shù)據(jù)中心任務(wù)調(diào)度方法,其特征在 于還包括步驟4),在多任務(wù)狀態(tài)下,由于不同任務(wù)的集中,使得任務(wù)的實時資源要求變化或 者服務(wù)器發(fā)熱因素造成的變化,實時調(diào)節(jié)集群服務(wù)器的主頻電壓,造成的包括處理器主頻、 利用率主要數(shù)據(jù)指標(biāo)的更改,由集群服務(wù)器的實時信息獲取模塊獲取,然后通過前端及后 端的通信模塊來更新集群服務(wù)器中的服務(wù)器實時數(shù)據(jù)以及已部署任務(wù)的資源占有情況。
3. 根據(jù)權(quán)利要求1或2所述的基于動態(tài)調(diào)頻調(diào)壓技術(shù)的數(shù)據(jù)中心任務(wù)調(diào)度方法,其特 征在于步驟1)中性能模型的建立是,當(dāng)調(diào)節(jié)集群服務(wù)器中各服務(wù)器至不同的主頻設(shè)置下, 結(jié)合任務(wù)運行時主要考慮的性能指標(biāo),包括執(zhí)行時間,處理器占用率,根據(jù)這些數(shù)據(jù)擬合出 相應(yīng)的性能模型; 能耗模型的建立也是通過調(diào)節(jié)集群服務(wù)器中各服務(wù)器的主頻和電壓至不同 的組合,獲取功率與對應(yīng)主頻的數(shù)據(jù)信息,結(jié)合處理器功耗的理論公式進行數(shù)據(jù) 的擬合分析,建立相應(yīng)的能耗模型;上述處理器功耗的理論公式即處理器的能耗 P與處理器的主頻/和電壓Γ的關(guān)系:
由于現(xiàn)代處理器的頻率電壓設(shè)置一般是離散的P狀態(tài),上述公式可以簡化為形如
的簡化公式, 其中a與聲為常量可由實際測量出的能耗P和主頻/進行數(shù)據(jù)擬合。
【文檔編號】G06F9/455GK104298536SQ201410526996
【公開日】2015年1月21日 申請日期:2014年10月9日 優(yōu)先權(quán)日:2014年10月9日
【發(fā)明者】懷偉城, 錢柱中, 陸桑璐, 陳道蓄 申請人:南京大學(xué)鎮(zhèn)江高新技術(shù)研究院