亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于服務(wù)器的流調(diào)度方法

文檔序號(hào):9790974閱讀:981來源:國(guó)知局
一種基于服務(wù)器的流調(diào)度方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明涉及數(shù)據(jù)中心網(wǎng)絡(luò)中TCP流調(diào)度技術(shù)和擁塞控制技術(shù)。
【背景技術(shù)】
[0002]最小化流完成時(shí)間(Flow Complet1n Times,簡(jiǎn)稱FCT)是數(shù)據(jù)中心網(wǎng)絡(luò)(DataCenter Networks,簡(jiǎn)稱DCN)中非常重要的一個(gè)問題。云服務(wù)往往在DCN中產(chǎn)生大量的TCP流,流的完成速度很大程度上決定了任務(wù)的完成時(shí)間。任何一個(gè)不能及時(shí)完成的流都會(huì)影響到任務(wù)最后的結(jié)果,降低用戶體驗(yàn)或帶來直接的經(jīng)濟(jì)損失。然而,在當(dāng)前的DCN中,流經(jīng)常需要很長(zhǎng)時(shí)間才能完成傳輸,甚至超過其理論完成時(shí)間的十倍。其主要原因是數(shù)據(jù)包擁塞在網(wǎng)絡(luò)中交換機(jī)的輸出端口上形成很長(zhǎng)的隊(duì)列,在傳輸中經(jīng)歷了太久的排隊(duì)時(shí)延。
[0003]學(xué)者們已經(jīng)提出了多種最小化FCT的方案,這些方法可以分為兩類:速率控制類和流調(diào)度類。速率控制類工作(如DCTCP、D2TCP和HULL)—般是在發(fā)送端感知網(wǎng)絡(luò)的擁塞狀況,不斷調(diào)整發(fā)送速率來保持網(wǎng)絡(luò)中交換機(jī)輸出端口隊(duì)列盡量短,以減小數(shù)據(jù)包在傳輸中經(jīng)歷的排隊(duì)時(shí)延。這類工作在一定程度上減少了排隊(duì)時(shí)延,并且較容易部署,因?yàn)樗鼈兌际腔诜?wù)器的。但這類工作會(huì)讓多個(gè)流同時(shí)傳輸,共享帶寬,無法最小化FCT ο最近的研究表明最小化FCT需要使用流調(diào)度的方法(如roQ,pFabric,PASE和PIAS),也就是按照流的優(yōu)先級(jí)順序從高到低(一般采用小流優(yōu)先的規(guī)則)讓流一個(gè)接一個(gè)地完成。pFabric是一種基于交換機(jī)的流調(diào)度方案,它是流調(diào)度類工作中做得最好的。它在交換機(jī)的輸出端口隊(duì)列中按照數(shù)據(jù)包的優(yōu)先級(jí)來推出數(shù)據(jù)包,使得小流中最慢的那個(gè)流都幾乎能以其理論傳輸時(shí)間完成。然而,由于pFabric根本性地改變了交換機(jī)輸出端口先進(jìn)先出的數(shù)據(jù)包推出方式,要實(shí)現(xiàn)pFabric,必須對(duì)交換機(jī)做硬件上的改動(dòng)。而DCN中有成千上萬個(gè)交換機(jī),部署pFabric可能會(huì)需要大量的費(fèi)用。

【發(fā)明內(nèi)容】

[0004]本發(fā)明所要解決的技術(shù)問題是,針對(duì)現(xiàn)有技術(shù)不足,提供一種基于服務(wù)器的流調(diào)度方法(Server-based Flow Scheduling,簡(jiǎn)稱SFS),既容易部署,又能在最小化FCT上取得和pFabric相似的效果。
[0005]為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:一種基于服務(wù)器的流調(diào)度方法,包括以下步驟:
1)在發(fā)送方,TCP流從應(yīng)用層獲得優(yōu)先級(jí),再將優(yōu)先級(jí)嵌入發(fā)送的SYN包和數(shù)據(jù)包中;在接收方,所述優(yōu)先級(jí)被拷貝到相應(yīng)的ACK包中;TCP的擁塞窗口固定為BDP,timeout值固定為500us,TCP的擁塞避免和快速重傳功能被關(guān)閉;網(wǎng)絡(luò)采用I比I收斂比的FatTree網(wǎng)絡(luò),并使用包噴射的路由方式將負(fù)載均勻地分配在多條等價(jià)路徑上;
2)在接收方的TCP/IP協(xié)議棧和網(wǎng)卡之間加入反向調(diào)度器,反向調(diào)度器通過釋放/捕獲ACK包來激活/暫停接收方收到的流來實(shí)現(xiàn)反向的流調(diào)度,同時(shí)通過釋放ACK包控制網(wǎng)絡(luò)中飛行的TCP數(shù)據(jù)包總量;反向調(diào)度器包含一個(gè)流表和一個(gè)流窗口,從TCP/IP協(xié)議棧傳來的ACK包被推入流表中,流表內(nèi)的流以優(yōu)先級(jí)高低排列,流窗口限制活動(dòng)的流數(shù),網(wǎng)卡從在流窗口內(nèi)的流表表項(xiàng)中抽取ACK包并發(fā)送到網(wǎng)絡(luò)中;
3)在發(fā)送方的TCP/IP協(xié)議棧和網(wǎng)卡之間加入正向調(diào)度器,正向調(diào)度器通過釋放/捕獲SYN包和數(shù)據(jù)包來激活/暫停其發(fā)送的流來實(shí)現(xiàn)正向的流調(diào)度;正向調(diào)度器包含一個(gè)流表,從TCP/IP協(xié)議棧傳來的SYN包和數(shù)據(jù)包被推入到流表中,流表內(nèi)的流以優(yōu)先級(jí)高低排列,網(wǎng)卡總是從當(dāng)前有數(shù)據(jù)包且優(yōu)先級(jí)最高的表項(xiàng)中抽取數(shù)據(jù)包并發(fā)送到網(wǎng)絡(luò)中;
4)在所述反向調(diào)度器和所述正向調(diào)度器中加入?yún)f(xié)調(diào)模塊,在發(fā)送方和接收方對(duì)于某個(gè)流的優(yōu)先級(jí)判斷不一致時(shí),協(xié)調(diào)發(fā)送者和接收方,填充鏈路帶寬。
[0006]所述協(xié)調(diào)模塊米用最熱流協(xié)調(diào)方法,最熱流協(xié)調(diào)方法包含以下二步,首先,當(dāng)接收方當(dāng)前接收的流被發(fā)送方中斷時(shí),發(fā)送方通知接收方當(dāng)前傳輸已中斷;然后,接收方激活最熱的流以填充鏈路接收方;最后,接收方方激活最熱的流轉(zhuǎn)變回激活最高優(yōu)先級(jí)的流。
[0007]接收方通過流的溫度來識(shí)別最熱的流,流的溫度用來衡量接收方在上一次收到此流的數(shù)據(jù)包后等待的時(shí)間,所述最熱的流就是最近傳輸過的流。
[0008]被接收方暫停住的流的發(fā)送方可以通過發(fā)送心跳包來刷新該暫停住的流在其接收方處的溫度,所述心跳包是指TCP超時(shí)事件產(chǎn)生的重傳包,如果所述暫停住的流在發(fā)送方有足夠的優(yōu)先級(jí),那么該暫停住的流的心跳包被釋放并刷新該暫停住的流在接收方處的溫度,反之,該暫停住的流在接收方處的溫度隨時(shí)間推移下降為零度。
[0009]若接收方收到發(fā)送方的傳輸中斷通知時(shí),接收方知道流窗口中的流已經(jīng)被發(fā)送方暫停了,則接收方額外開啟一個(gè)候選窗口來激活最熱的流。
[0010]接收方移動(dòng)所述候選窗口,將激活最熱的流向激活最高優(yōu)先級(jí)流轉(zhuǎn)化,這是因?yàn)榧せ钭顭岬牧骺梢杂行畛渚W(wǎng)絡(luò)鏈路,但無法最小化流完成時(shí)間;移動(dòng)過程為:在任意時(shí)亥Ij,如果接收方發(fā)現(xiàn)候選窗口左邊的表項(xiàng)的流剛被刷新為最高溫度時(shí),接收方將會(huì)把候選窗口移動(dòng)到這個(gè)流去,暫停原有的流,新激活了一個(gè)同溫度但優(yōu)先級(jí)更高的流。
[0011]當(dāng)接收方流窗口內(nèi)的被發(fā)送方中斷的流又開始傳輸時(shí),接收方關(guān)閉候選窗口。
[0012]與現(xiàn)有技術(shù)相比,本發(fā)明所具有的有益效果為:本發(fā)明可以通過軟件實(shí)現(xiàn)流調(diào)度;本發(fā)明能有效加快數(shù)據(jù)中心網(wǎng)絡(luò)中流的傳輸速度,與同樣是基于服務(wù)器的方案DCTCP相比,我們的小流的完成速度可達(dá)它的四倍。
【附圖說明】
[0013]圖1是SFS的基本架構(gòu);
圖2是接收方流調(diào)度的示例;
圖3是接收方基于窗口的流調(diào)度模塊的示意圖;
圖4是發(fā)送方流調(diào)度的示例;
圖5是發(fā)送方基于優(yōu)先級(jí)的流調(diào)度模塊的示意圖;
圖6(a)是優(yōu)先級(jí)不一致初始狀態(tài)圖;6(b)是優(yōu)先級(jí)不一致事件發(fā)生示意圖;
圖7(a)是最熱流協(xié)調(diào)技術(shù)初始狀態(tài)圖;圖7(b)是流溫度降低示意圖;圖7(c)是優(yōu)先級(jí)不一致時(shí)間發(fā)生時(shí),候選窗口開啟示意圖;圖7(d)為被激活的流收到發(fā)送方的響應(yīng)的示意圖;圖7(e)為優(yōu)先級(jí)不一致事件再次發(fā)生時(shí),候選窗口開啟示意圖;圖7(f)為被激活的流收到發(fā)送方的響應(yīng)的示意圖;圖7(g)為候選窗口移動(dòng)示意圖;圖7(h)為候選窗口關(guān)閉示意圖; 圖8(a)是SFS與DCTCP和pFabric在FatTree中采用網(wǎng)頁搜索負(fù)荷時(shí)的小流的平均FCT;圖8(b)是SFS與DCTCP和pFabric在FatTree中采用網(wǎng)頁搜索負(fù)載時(shí)的最慢的小流的FCT;圖8(c)是SFS與DCTCP和pFabric在FatTree中采用網(wǎng)頁搜索負(fù)載時(shí)的大流的FCT;
圖9(a)是SFS與DCTCP和pFabric在FatTree中采用數(shù)據(jù)挖掘負(fù)荷時(shí)的小流的平均FCT;圖9(b)是SFS與DCTCP和pFabric在FatTree中采用數(shù)據(jù)挖掘負(fù)載時(shí)的最慢的小流的FCT;圖9(c)是SFS與DCTCP和pFabric在FatTree中采用數(shù)據(jù)挖掘負(fù)載時(shí)的大流的FCT;
圖10(a)是在網(wǎng)絡(luò)重負(fù)載情況下使用SFS時(shí),網(wǎng)絡(luò)中下行鏈路的最大隊(duì)列長(zhǎng)度;圖10(b)是在網(wǎng)絡(luò)重負(fù)載情況下使用SFS時(shí),網(wǎng)絡(luò)中下行鏈路的平均隊(duì)列長(zhǎng)度。
【具體實(shí)施方式】
[0014]I)對(duì)服務(wù)器和網(wǎng)絡(luò)進(jìn)行配置,包含如下四個(gè)方面:
a)優(yōu)先級(jí)策略:在發(fā)送方,流從應(yīng)用層獲得當(dāng)前的優(yōu)先級(jí),這些優(yōu)先級(jí)被SYN包和數(shù)據(jù)包附帶著,以便發(fā)
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1