亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

延長InfiniBand網絡的實時到達的方法

文檔序號:7638722閱讀:457來源:國知局
專利名稱:延長InfiniBand網絡的實時到達的方法
技術領域
本發(fā)明涉及一種用于延長Infin氾and網絡的超出該InfiniBand結 構現(xiàn)有可能的實時到達的裝置,并且尤其是,允許InfiniBand分組 經本身不遵循InfiniBand結構的網絡被運送。這允許InfiniBand通信 量與以其它諸如網際協(xié)議版本6(IPv6)或者異步傳輸模式(ATM)單元 的標準協(xié)議共享物理網絡。此外,由于在該裝置中非常大的流量控 制緩存,伴隨著防止緩沖溢出的流量控制信用方案的使用,本發(fā)明 允許大量數(shù)據在廣域網(WAN)內被運輸,同時仍然確保數(shù)據分組會由于接收機上不充足的緩存資源而不被丟失。為了有助于確保數(shù)據 分組在WAN內不被丟棄,該裝置還可以包括許多的業(yè)務質量(QOS) 功能,其用于限制數(shù)據在響應背壓的過程中進入WAN的注入速 率。本發(fā)明還可以允許數(shù)據分組被以允許一個以上的裝置連接到 WAN這樣的一種方式路由,從而允許InfiniBand網絡使用最少的裝 置能夠擴展為兩個以上的物理位置。包含在該裝置內的處理器可以 操縱管理功能,諸如InfiniBand子網管理代理和設備管理。
背景技術
眾所周知,由于在InfiniBand結構內每個虛擬通道(VL)許可的信 用至多128KiB的限制,10Gbit InfiniBand僅僅能夠達到大約 10km。這種限制對可以立即傳輸?shù)臄?shù)據量設置了一個上限,因為標 準InfiniBand發(fā)射機沒有可資利用的信用而不能傳送。此外,眾所周知,限制可以傳輸?shù)臄?shù)據量小于網絡路徑的帶寬等待時間積將直 接限制可以獲得的最大數(shù)據傳送速率。例如,具有130微秒的往返行程等待時間的10Gbit InfiniBand鏈 路具有128KiB的帶寬等待時間積,其是一個InfiniBand鏈路內的單 個VL的所能準許的信用的最大量。典型地,InfiniBand鏈路將具有1個以上的入口和出口 VL(直至 15個),該InfiniBand結構指定必須每個被獨立地緩存,并且流量被 控制以防止線路的頭部堵塞以及流量控制停滯。在一些實施例中, 該InfiniBand接口包含附加的流量控制緩沖器單元從WAN時鐘域 轉換為InfiniBand時鐘域。由于物理上的限制,數(shù)據在光纖上以小于光速的速率傳輸。當 光纖被認為是攜帶比特的導管的時候,很明顯,整個的長的光纖可 以包含運送中的許多兆比特的數(shù)據。例如,如果在傳輸10Gbit數(shù)據 流的特定的光纖中光速是5ns/米,并且光纖是100km長,那么該光 纖在每個方向將包含5兆比特的數(shù)據。許多WAN路徑也包括來自 帶內設備增加的等待時間,諸如再生設備、光多路復用、增加/丟棄 多路轉換器、路由器、開關等等。這個額外的設備增加了附加的等 待時間,并且進一步延長路徑的帶寬等待時間積。正如InfiniBand結構所定義的,該InfiniBand電子和光信號協(xié)議 與傳統(tǒng)的WAN環(huán)境不兼容,或者不適用于傳統(tǒng)的WAN環(huán)境。典 型地,WAN環(huán)境在長距離光纖上使用同步光纖網(SONET)標準。此外,為了減輕InfiniBand網絡管理,正如InfiniBand結構所描 述的,所希望的是對InfiniBand數(shù)據分組執(zhí)行路由選擇。無需對所 有其它的參加者施加實質上的政策,路由選擇允許每個遠距離的站 點在較大InfiniBand網絡上的其所屬部分保持局部控制。發(fā)明內容當結合在一起的時候,光纖的物理限制,需要具有超過路徑的帶寬等待時間積的緩沖能力,以及在InfiniBand結構內的多個VL的 特點,都變得顯而易見,需要將其中較好管理的非常大的緩沖存儲 器的裝置由InfiniBand網絡延長到橫貫大陸的距離。例如,不考慮 任何額外的等待時間開銷,具有15個VL的實際5000km的距離將 需要894MiB的緩沖存儲器。該裝置的一部分功能是為了將在本地短InfiniBand鏈路上廣告的 信用(其典型地是8KiB)延長為更加適用于WAN的數(shù)字(其典型 地是每個VL 512MiB)。這是使用先入先出緩存器(FIFO)做到的, 當本地InfiniBand信用是可利用的時候將其排空,并且當輸入數(shù)據 抵達之時填滿。周期性地,該裝置經由用于每個有效的VL的信用 廣告數(shù)據分組通知其它的遠程裝置在FIFO內更多的空間是可利用 的,并且該遠程裝置使用這個信息以確保其除FIFO可以接受的之外 永不傳送更多的數(shù)據。這是相同的基本流控制機理(端到端信用信息 交換),其被以InfiniBand結構方式使用,但是,其被比例增大以操 縱緩存的十億字節(jié),并且更加適用于WAN環(huán)境。以這樣的方式, InfiniBand型流量控制語義被保持在很大的距離上,以確保數(shù)據分組 由于擁塞而不被丟棄。在另一個實施例中,大容量緩沖存儲器可以以所接收的數(shù)據分 組的不同次序的順序采用在多個FIFO結構以外的數(shù)據分組。如果在本地InfiniBand端口上存在信用缺乏,那么該FIFO將填 滿,但是由于信用數(shù)據分組在WAN上發(fā)送,在FIFO可以溢出之 前,該發(fā)射機將停止發(fā)送。信用數(shù)據分組可以插入進IPv6有效載荷結構中,或者替換地,他們可以嵌入在用于改善效率的IPv6延長頭 部中。信用信息或者數(shù)據被以在66/64b代碼中設置的順序編碼。 InfiniBand數(shù)據分組可以被設置在IPv6或者IPv4數(shù)據分組內傳輸?shù)?UDP或者DCCP數(shù)據包的有效載荷結構內。為了實現(xiàn)與WAN標準兼容,該InfiniBand數(shù)據分組由在其它的 協(xié)議內的裝置封裝,諸如,在SONET(POS)上在數(shù)據分組內的 IPv6,用于在WAN上傳輸。如在IBTA中闡述的,全雙工獨立傳輸 與接收數(shù)據路徑是由鏈路狀態(tài)機控制的。該InfiniBand物理鏈路狀 態(tài)機可以通過在WAN上交換非InfiniBand數(shù)據分組來保持,其中 這樣做建立一個存在于WAN中的端到端路徑,數(shù)據分組的交換包 括PPP LCP(根據RFC 1661)數(shù)據分組、以太網ARP(根據RFC 826 和RFC 2461(IPv6鄰居發(fā)現(xiàn)))交換,TCP對話初始化(根據RFC 793),建立ATM SVC(根據ATM論壇專用網網絡接口規(guī)范),或者 任何其它的對話啟動形式。在被封裝之后,該數(shù)據分組在WAN上傳輸,并且該接收裝置 執(zhí)行去封裝步驟,除去在封裝期間增加的數(shù)據,從而恢復原始 InfiniBand數(shù)據分組。這個封裝起到兩個作用,第一個是將光信號格式改變?yōu)榭梢栽?WAN連接上自然地運輸?shù)臇|西,諸如SONET。這允許該裝置直接 連接到SONET光學設備,其是較大的SONET拓撲結構的一部分, 并且被運輸直到單個遠程目的地。SONET協(xié)議,諸如通用成幀協(xié)議 (GFP)設計成用于這種封裝任務。該封裝部件能夠支持多個網絡,該 網絡包括IPv6、 IPv6的UDP、 IPv6的DCCP、 ATM AAL5或者 GFP的任何一個。這也允許該裝置與在WAN內的智能設備接口,其可以路由發(fā) 送特殊的數(shù)據分組或者單元。通過依靠WAN去執(zhí)行聚集、路由選 擇和/或切換許多的連接,這也允許InfiniBand業(yè)務與來自其它的信 源的業(yè)務共享WAN基礎結構。諸如ATM適配層5(AAL5)、在POS上的IPv6和在以太網上的 IPv6的協(xié)議被設計正是考慮于此。為了在WAN上建立和保持端到端路徑的目的,除了封裝的 InfiniBand數(shù)據分組之外,用于交換非InfiniBand數(shù)據分組的通信裝 置是必要的。許多的封裝通過該裝置是允許的,包括ATMAAL5、在POS上 的IPv6、在以太網上的IPv6、在IPv6中的DCCP、在IPv6中的 UDP、在通用多協(xié)議標記切換(GMPLS)上的IPv6、 GFP等等。類似 地,可以支持許多的WAN信令標準和速度,包括SONET、以太網 LAN-PHY和以太網WAN-PHY。單個裝置可以支持許多的封裝和信 令標準,并且用戶可以在安裝期間選擇使用哪一個。對于小于10km的較短的距離,該封裝被放棄,并且只是使用由 InfiniBand結構與非常大的流量控制緩存器結合而限定的光信號去延 長正常InfiniBand設備的到達,同時充分地遵循InfiniBand結構。在 這種情況下,該封裝過程被簡化為空封裝,并且發(fā)出不變的 InfiniBand數(shù)據分組。信用模塊的數(shù)目和/或信用模塊大小可以被增 加以延長范圍超出lOkm,同時仍然觀察到另外不變的InfiniBand通 信協(xié)議。多個裝置當該裝置使用一個封裝協(xié)議連接到智能WAN的時 候,其能夠尋址,有二個以上的裝置通信是可能的。這允許設置在許多的物理站點上的裝置去共享相同的WAN連接和相同的裝置, 同時延長和鏈接其InfiniBand網絡進入很大的網狀網絡之內。在這個操作模式中,該裝置需要去檢査每個進來的本地 InfiniBand數(shù)據分組,以確定其應該發(fā)送給哪個遠程裝置,然后形成 恰當?shù)姆庋b將其傳送。這可以通過檢査在InfiniBand數(shù)據分組內的 局部標識符(LID),并且使用由InfiniBand規(guī)范定義的切換基礎結 構,或者通過檢査在InfiniBand數(shù)據分組內的全局標識符(GID),并 且基于子網前綴的最長的前綴匹配的路由選擇來做到。每個裝置也必須保留其流量控制緩存器的單獨的部分用于每個 可允許的遠程裝置。這進一步增加N-l倍對緩沖存儲器的需要,這 里N是在該網狀網絡中裝置的數(shù)目。當接收到多點傳送InfiniBand數(shù)據分組的時候,該裝置或者將它 們映射到適宜的WAN多點傳送地址上,或者執(zhí)行數(shù)據分組復制以 將該數(shù)據分組的多個復制發(fā)送給預訂該多點傳送組的每個遠程裝 置。正如InfiniBand結構版本1.2所指定的,InfiniBand路由選擇操 作需要該裝置將128比特(bit) IPv6 GID變換為本地InfiniBand路 徑描述,16比特局部標識符(LID), 24比特分割鍵和4比特業(yè)務水 平,用于使用全球路由頭部(GRH)在本地InfiniBand網絡上傳輸。當該裝置在智能網絡上,而不是在點對點結構中使用的時候, 在智能網絡內的業(yè)務質量問題變?yōu)橹匾T撗b置僅僅確保InfiniBand 數(shù)據分組決不會由于不足的緩存而被丟棄,其沒有提供任何保證, 智能網絡不會由于內部擁塞或者其它因素而丟棄數(shù)據分組。這主要指的是將數(shù)據分組在網絡內的丟失減到最小是由該裝置來控制數(shù)據分組到網絡的注入速度。當它們被發(fā)送進WAN到接收 單元時,該裝置通過在數(shù)據分組之間插入延遲來完成這些。注入速度可以或者由用戶設置,或者通過相互作用和在裝置和 智能網絡之間的協(xié)議動態(tài)地控制。這種動態(tài)控制中包含有許多協(xié)議 和方法。第二種方法是利用該裝置來特別地標記數(shù)據分組,使得該智能 網絡可以將損失減到最小。這種方法可以與注入速度控制一起使 用。在該裝置的管理模塊內的管理軟件擔負運行任何的協(xié)議和方 法,其可以是使用通用的處理器經由WAN為建立服務質量保證所 必需的。附圖簡要說明

圖1至3是示出可以在一個系統(tǒng)內采用的路由分組的數(shù)據流程 圖。具有矩形邊角的每個方框表示緩存、變換的過程或者判定點。 大的圓角方框表示相關的功能組。箭頭示出數(shù)據分組流的方向。圖1是用于原型的裝置的數(shù)據流程圖。其示出用于本發(fā)明一個 實施例的主要的模塊。圖2是用于設計成能與許多的WAN信令標準和協(xié)議互操作的 特定的遠程實施例的數(shù)據流程圖。其共享在圖1中略述的許多的功 能塊。圖3是用于特定的減少特征短距的實施例的數(shù)據流程圖,其舉 例說明InfiniBand結構可以如何用作WAN協(xié)議。優(yōu)選實施例詳細說明本領域技術人員可以知道,各種各樣的標準和資源為常規(guī)的數(shù) 字數(shù)據成分所固有。在此處涉及的如該領域中已知的一些標準和操作原理可以參考以下找到 InfiniBand行業(yè)協(xié)會(2005)。 InfiniBand結構版本1.2(也稱為 "IBTA,,)。 Internet工程任務組(1998)。 RFC 2460-網際協(xié)議,版本6(IPv6)規(guī)范。 Internet工程任務組(1998)。在SONET/SDH上的RFC 2615-PPPo ATM論壇(1994)。 ATM用戶網絡接口規(guī)范版本3.1 。 魯國際電信聯(lián)盟。ITU-T推薦1.432.1 —般特性。 爭開放系統(tǒng)互連(OSI)—基準模型基本模型(1994)。 ISO 7498-1:1994參IEEE802.3ae條款49; 66/64b編碼方案參考圖1,描述了在樣機裝置內的數(shù)據流。該裝置包含六個主要 的模塊InfiniBand接口、管理模塊、分組路由選擇、封裝/去封裝 部件(ENCAP)、 Wan接口和大容量緩沖存儲器。存在可用于實現(xiàn)這 些模塊的每個的各種各樣的技術。這些模塊被確定為在數(shù)據流程圖 中的邏輯功能,特定的實施例可以選擇在不同的物理模塊之中傳播 這些邏輯功能以實現(xiàn)更加最佳的實施例。該裝置可以在每個方向同 時地保持大約每秒十億字節(jié)InfiniBand數(shù)據分組的傳送速率。該InfiniBand接口給本地IB構造提供LAN連接。為了清楚, 該InfiniBand接口包括二個小的流量控制緩存器以便從另一個附著 的模塊仲裁數(shù)據速率。該管理模塊提供了一個各種各樣的高級管理和控制協(xié)議的實施 方式,該各種各樣的高級管理和控制協(xié)議需要通過該裝置可以遵循的各種各樣的標準,例如,IB子網管理代理,用于在SONET上的 數(shù)據分組的一點對一點(PPP)協(xié)議,ATM操作和維護單元(OAM)以 及用于以太網的鄰近發(fā)現(xiàn)高速緩存/詢問的實施。典型地,這個模塊 將使用某種常規(guī)微處理器與用于任何低等待時間或者高頻管理數(shù)據 分組的專用的邏輯相結合的形式實現(xiàn),諸如某種OAM單元。該分組路由選擇模塊實現(xiàn)由多個裝置InfiniBand路由選擇需要的 功能以及如上所述的業(yè)務質量(QOS)性能。這也提供了如在距離延長 的背景下論述的WAN信用數(shù)據分組。該分組路由選擇模塊也能夠 識別將傳送給用于特殊處理的管理模塊的數(shù)據分組。該封裝/去封裝模塊實現(xiàn)在以上的協(xié)議封裝的背景下論述的封裝 過程。對于一個實施例,該協(xié)議是OSI 7層參考模型(如在ISO 7498-1:1994中定義的),并且是從由層l(物理)、層2(數(shù)據鏈路)、層3(網 絡)和層4(傳輸)組成的組中選擇出來的。該樣機的示意圖示出幾個可允許的不同的方案。該封裝模塊依 靠來自路由選擇模塊的附加的數(shù)據來確定封裝的準確的形式。去封 裝從封裝的數(shù)據中恢復原始IB數(shù)據分組。 一些數(shù)據分組可以路由到 管理模塊,并且如果他們被確定為管理數(shù)據分組,不經由去封裝模 塊發(fā)送。WAN接口是到WAN端口的通用接口。如這里所示,其包括一 個光學子系統(tǒng),但是,WAN接口是使用電信號可允許的。成幀器單 元或功能從封裝模塊提取數(shù)據分組數(shù)據,并且格式其以符合選擇的 WAN協(xié)議。例如,該以太網規(guī)范將該成幀器作為媒體訪問控制 (MAC)、物理編碼子層(PCS)和物理媒體附件(PMA)的組合引用。該成幀器也執(zhí)行反相,和從WAN接口提取數(shù)據分組以傳送給去封裝 模塊。支持的成幀格式包括SONET/SDH、 IOGBASE-R、 InfiniBand、 10GBASE-W和由IEEE 802.3ae條款49—10GBASE-R定義的66/64b編碼方案。大容量緩沖存儲器根據距離延長的描述實現(xiàn)信用管理單元。基 本的存儲器的準確的性質可以取決于實施例變化。圖2描述了在用于本發(fā)明的遠程的結構的優(yōu)選實施例內的數(shù)據 流程。本發(fā)明的這個實施例包括印刷電路板(PCB)組件,其包含在現(xiàn) 場可編程門陣列(FPGA)內實現(xiàn)的芯片上的系統(tǒng),CX4銅 4xInfmiBand連接器,SONET/以太網成幀器/映射器,注冊的雙數(shù)據 速率2(DDR2)同步的動態(tài)隨機存取存儲器(SDRAM)的2個時隙,網 絡搜索引擎,管理處理器支持元件和可換的WAN光學組件,其遵 循MSA-300規(guī)范。該FPGA提供用于該裝置的唯一的功能,同時該部件的剩余部 分是工業(yè)標準部分。該FPGA實現(xiàn)用于主數(shù)據路徑的四個電氣接 口, 2.5Gbit 4xInfmiBand—連接至U CX4連接器,266MHz DDR2 SDRAM-用于FIFO, SPI-4.2-連接到成幀器/映射器和LA-1-連接到 網絡搜索引擎。該FIFO緩存器是使用標準DDR2 SDRAM實現(xiàn)的。通過時分多 路復用訪問該存儲器用于提供一個具有10Gbit/秒以上的最大入口帶 寬的有效的雙口 RAM,而同時地保持一個10Gbit/秒以上的出口帶 寬。這允許廉價的商品存儲器用于該FIFO緩存器。在FPGA內的 控制邏輯將SDRAM分割為多個VL,并且操作SDRAM存儲器總線 去提供FIFO功能。使用遵循由光網際互連論壇(OIF)定義的規(guī)范的部件提供對 WAN訪問。特別地,SFI-4.1接口用于經由MSA-300規(guī)范定義的連 接器連接到一個光學組件。前述的接口還可以即時地轉換為IEEE 802.3ae XSBI接口,供10G以太網LAN PHY使用。取決于用戶需 求和安裝的光學組件,該可換的模塊允許該裝置在具有不同的發(fā)射 功率和接收機靈敏度的幾個種類的光纖上支持OC-192 SONET、 10G 以太網LANPHY禾B 10G以太網LANPHY。該裝置可以直接在光WAN上,或者間接地經由額外的標準聯(lián) 網設備通信,諸如,SONET/SDH多路復用器、光再生器、分組路 由器和單元開關。該SFI-4.1/XSBI接口連接到成幀器/映射器,其內部地操縱許多 方面,低電平通信協(xié)議(在以太網用語中的MAC/PCS/PMA功能)。 該FPGA經SPI-4.2接口與成幀器/映射器交換整個數(shù)據分組(或者在 ATM情形下的單元),該成幀器/映射器然后轉變成期望的WAN信 令協(xié)議。這個變換由國際電信聯(lián)盟(ITU)、 Internet工程任務組 (IETF)、 ATM論壇、電子和電氣工程師協(xié)會(IEEE)和光網際互連論 壇(OIF)出版的標準管理。最后的部件是LA-1連接的網絡搜索引擎(NSE)。 NSE用作 InfiniBand路由選擇特點的一部分,以將進來的IPv6尋址變換為本 地InfiniBand路徑描述。該FPGA將從WAN得到的數(shù)據分組中提 取IPv6數(shù)據分組,并且將其傳送給NSE,然后其將迅速地搜索內部 表以找到一個匹配,并且然后將相關數(shù)據(匹配的IB路徑)返回給 FPGA。根據需要,當其變?yōu)榭衫脮r,在FPGA內的管理處理器將 以新的數(shù)據更新NSE表。本發(fā)明的第二個實施例在圖3中示出。這個實施例是在圖2中 示出的其原型的裝置的成本降低版本。這個實施例的主要目的是使 用僅僅如由InfiniBand結構定義的四倍的數(shù)據速率(QDR) lxlnfm氾and允許距離延長直至10km。這個實施由FPGA、 CX4連接器、單個QDR SRAM芯片和XFP 光學組件構成。該FPGA直接與10Gbit 4x Infin舊and(本地)和10Gbit lx InfiniBand(WAN)兩者連接。象在遠程的實施例中一樣, 一個可換的模塊提供光WAN接 口。但是,代替MSA-300接口,這個模塊遵循XFP規(guī)范(如由XFP MSA組定義的),并且經10Gbit XFI總線直接與FPGA交換。這允 許用戶去選擇一個較好地適合其局部環(huán)境的XFP模塊。該FIFO緩存器是使用QDR(或者QDR2)SRAM實現(xiàn)的,其是最 佳地設計用于小的雙端口存儲器的存儲器的形式。在FPGA中的控 制器將存儲器分割為多個VL,并且管理FIFO的操作。
權利要求
1、一種在長距離連接上傳輸InfiniBand數(shù)據分組的方法,所述方法包括在另一個協(xié)議內封裝InfiniBand數(shù)據分組;在長距離連接WAN上傳送封裝的數(shù)據分組;通過除去封裝和恢復InfiniBand數(shù)據分組對InfiniBand數(shù)據分組去封裝;在WAN上保持InfiniBand物理鏈路狀態(tài)機;和在WAN上保持InfiniBand型流量控制。
2、 根據權利要求1所述的方法,其中,協(xié)議是OSI 7層參考模 型,并且選自由層l、層2、層3和層4組成的組。
3、 根據權利要求1或2所述的方法,其中,傳送封裝的 InfiniBand還包括將在WAN上的InfiniBand鏈路距離延長到大于大 約100km的距離。
4、 根據權利要求3所述的方法,其中,提高鏈路距離還包括將 在鏈路上廣告的InfiniBand信用提高超過每個VL大約12KiB。
5、 根據權利要求4所述的方法,其中,提高可利用的信用包括 提高每個廣告信用模塊字節(jié)的數(shù)目。
6、 根據權利要求4所述的方法,其中,提高可利用的信用包括提高每個廣告信用模塊的數(shù)目。
7、 根據權利要求4所述的方法,其中,提高可利用的信用包括提高信用模塊的數(shù)目和在每個廣告中每個模塊字節(jié)的數(shù)目。
8、 根據權利要求1 7任何一個所述的方法,其中,保持流量控 制語義包括發(fā)送單元在用于去封裝的InfiniBand數(shù)據分組的接收單 元上選擇出口 VL。
9、 根據權利要求1~8任何一個所述的方法,其中,保持 InfiniBand物理鏈路狀態(tài)機還包括在WAN上交換非InfiniBand數(shù)據 分組,其中這樣做建立一個存在于WAN中的端到端路徑,數(shù)據分 組的交換選自由PPP LCP數(shù)據分組、以太網ARP交換、TCP對話 初始化和建立ATM SVC組成的組。
10、 根據權利要求1~9任何一個所述的方法,其中,保持 InfiniBand型流量控制還包括在大于128KiB的緩沖存儲器中緩存在 WAN端口上接收的數(shù)據分組。
11、 一種由邏輯電路組成用于傳輸InfiniBand數(shù)據分組的裝置, 包括一個InfiniBand接口,其耦合到InfiniBand路由和QOS部件, 其中-所述InfiniBand路由和QOS部件的InfiniBand到WAN路徑被 耦合到封裝/去封裝部件(ENCAP);ENCAP部件的IB到WAN路徑被耦合到WAN接口 ; WAN接口的WAN到IB路徑被耦合到ENCAP部件; ENCAP部件的WAN到IB路徑被耦合到大容量緩沖存儲器; 大容量緩沖存儲器被耦合到InfiniBand接口的WAN到IB路徑;信用管理單元產生用于WAN的信用,并且產生施加到 InfiniBand接口上的背壓;ENCAP部件被耦合到用于封裝和去封裝信用數(shù)據的信用管理單 元;禾口管理模塊提供InfiniBand子網管理代理、WAN端到端協(xié)商和管 理業(yè)務。
12、 根據權利要求11所述的裝置,其中,該裝置能夠在每個方 向同時地保持大約每秒十億字節(jié)InfiniBand數(shù)據分組的傳送速率。
13、 根據權利要求11或者12所述的裝置,其中,InfiniBand接 口包含附加的流量控制緩沖器單元以便從WAN時鐘域轉換為 InfiniBand時鐘域。
14、 根據權利要求11、 12或者13所述的裝置,其中,ENCAP 部件能夠支持多個網絡,該網絡包括IPv6、 IPv6的UDP、 IPv6的 DCCP、 ATM AAL5或者GFP的任何一個。
15、 根據權利要求11 14任何一個所述的裝置,其中,該WAN 接口進一步包括能夠支持多個網絡格式的成幀器單元,包括SONET/SDH、 IOGBASE-R、 InfiniBand和IOGBASE畫W的任何一個;禾口能夠支持SONET/SDH、 10GBASE-R或者InfiniBand的任何一個的光學子系統(tǒng)。
16、 根據權利要求15所述的裝置,其中,光學子系統(tǒng)還能夠到 達大于由IBTA InfiniBand結構版本1.2單獨指定的距離,或者屆時 與其它諸如SONET/SDH多路復用器、光再生器、數(shù)據分組路由 器、單元開關或者其它設備耦合。
17、 根據權利要求11~16任何一個所述的裝置,其中,大容量緩沖存儲器能夠以所接收的數(shù)據分組的不同次序的順序采用在多個 FIFO結構以外的數(shù)據分組。
18、 根據權利要求11~17任何一個所述的裝置,其中,通過提 高信用模塊大小和/或提高每個廣告模塊的數(shù)目,信用管理單元廣告 比由InfiniBand規(guī)范定義的更多的信用。
19、 根據權利要求11~18任何一個所述的裝置,其中,權利要 求10的管理模塊還包括通用目的處理器;和在WAN和IB接口兩者上發(fā)送和接收數(shù)據分組的機構。
20、 根據權利要求11 19任何一個所述的裝置,其中,大容量 緩沖存儲器還包括多個DDR2存儲器模塊(DIMMS);其中控制邏輯在DDR2存儲器內保持多個FIFO結構;禾口 其中每個FIFO結構用于緩存WAN到InfiniBand VL;和 其中在存儲器以外的數(shù)據分組流被調節(jié)以確保數(shù)據分組由于在 InfiniBand接口上的擁塞而不被丟棄。
21、 根據權利要求11所述的裝置,用于在每個方向同時地保持 每秒十億字節(jié)InfiniBand數(shù)據分組的最大傳送率,還包括附加的流量控制緩沖器單元,以便從WAN時鐘域轉換為IB時 鐘域;其中ENCAP部件能夠支持多個網絡,該網絡包括IPv6、 IPv6 的UDP、 IPv6的DCCP、 ATM AAL5或者GFP的任何一個;能夠支持多個網絡格式的成幀器單元,包括SONET/SDH、 IOGBASE-R、 InfiniBand和10GBASE-W的任何一個;耦合的能夠支持SONET/SDH、 10GBASE-R或者InfiniBand的 任何一個的光學子系統(tǒng),其中光學子系統(tǒng)還能夠到達大于由IBTA InfiniBand結構版本 1.2單獨指定的距離,或者屆時與其它諸如SONET/SDH多路復用 器、光再生器、數(shù)據分組路由器、單元開關或者其它的設備耦合;其中大容量緩沖存儲器能夠以所接收的數(shù)據分組的不同次序的 順序采用在多個FIFO結構以外的數(shù)據分組,并且其中大容量緩沖存 儲器還包括多個DDR2存儲器模件(DIMMS);其中控制邏輯在DDR2存儲器內保持多個FIFO結構;禾口 其中每個FIFO結構用于緩存WAN到InfiniBand VL;和其中在存儲器以外的數(shù)據分組流被調節(jié)以確保數(shù)據分組由于在 InfiniBand接口上的擁塞不被丟棄,其中通過提高信用模塊大小和/或提高每個廣告模塊的數(shù)目,信 用管理單元廣告比由Infm舊and規(guī)范定義的更多的信用。其中管理模塊進一步包括 通用目的處理器;禾口在WAN和IB接口兩者上發(fā)送和接收數(shù)據分組的機構。
22、 根據權利要求11~21任何一個所述的裝置,其中,ENCAP 部件執(zhí)行空封裝,并且發(fā)出不變的InfiniBand數(shù)據分組。
23、 根據權利要求11 22任何一個所述的裝置,其中大容量緩 沖存儲器還包括多個SRAM存儲器芯片;其中控制邏輯在QDR存儲器內保持多個FIFO結構;和 其中每個FIFO結構用于緩存WAN到InfiniBand VL;和 其中在存儲器以外的分組流被調節(jié)以確保數(shù)據分組由于在 InfiniBand接口上的擁塞不被丟棄。
24、 根據權利要求23所述的裝置,其中,SRAM存儲器芯片是 QDR2 SRAM。
25、 根據權利要求21所述的裝置, 其中大容量緩沖存儲器包括多個SRAM存儲器芯片;和 其中控制邏輯在QDR存儲器內保持多個FIFO結構;和 其中每個FIFO結構用于緩存WAN到InfiniBand VL;禾口 其中在存儲器以外的分組流被調節(jié)以確保數(shù)據分組由于在InfiniBand接口上的擁塞不被丟棄。
26、 根據權利要求11 25任何一個所述的裝置,其中, InfiniBand數(shù)據分組被設置在IPv6數(shù)據分組的有效載荷結構內。
27、 根據權利要求11 26任何一個所述的裝置,其中,信用數(shù) 據被以延長頭部的方式在IPv6頭部內編碼。
28、 根據權利要求27所述的裝置,其中,信用數(shù)據被以延長頭 部的方式在IPv6頭部內編碼。
29、 根據權利要求11 28任何一個所述的裝置其中ENCAP部件以除與由IEEE 802.3ae條款49定義的66/64b 編碼方案兼容之外的方式成幀InfiniBand數(shù)據分組;和其中ENCAP部件可以除去條款49兼容的成幀,并且恢復原始 InfiniBand數(shù)據分組。
30、 根據權利要求29所述的裝置,其中,信用數(shù)據被以在 66/64b代碼中設置的順序編碼。
31、 根據權利要求11 30任何一個所述的裝置,其中, InfiniBand數(shù)據分組被設置在IPv6或者IPv4數(shù)據分組內傳輸?shù)腢DP 或者DCCP數(shù)據包的有效載荷結構內。
32、 根據權利要求11~30任何一個所述的裝置,其中, InfiniBand數(shù)據分組按照ATM適配層5(AAL5)被分段為ATM單 元。
33、 根據權利要求11~30任何一個所述的裝置,其中, InfiniBand數(shù)據分組被設置在通用成幀協(xié)議數(shù)據分組的有效載荷結構 內,和設置在SONET/SDH幀內。
34、 根據權利要求11~33任何一個所述的裝置,其中,信用數(shù) 據被已封裝的有效載荷結構編碼。
35、 一種系統(tǒng),包括 耦合到第一設備的第一 InfiniBand結構; 耦合到第二設備的第一設備; 耦合到第二 InfiniBand結構的第二設備; 其中,第一和第二設備還包括封裝和去封裝InfiniBand數(shù)據分組到另一個網絡協(xié)議的邏輯電 路;和緩存InfiniBand數(shù)據分組的邏輯電路;禾口 攜帶封裝的InfiniBand數(shù)據分組的網絡接口 。
36、 根據權利要求35所述的系統(tǒng),其中,第一設備和第二設備 還間接地耦合在延長的WAN網絡上,延長的WAN網絡包括 SONET/SDH多路復用器、光再生器、數(shù)據分組路由器和單元開關 的一個或多個。
37、 根據權利要求35或36所述的系統(tǒng),其中,基于在網絡或 者管理結構內速率小于或等于可允許的最大速率的條件,數(shù)據分組 進入ENCAP部件的流動速率可以受到設備限制。
38、 根據權利要求35、 36或37所述的系統(tǒng),其中,該系統(tǒng)還 包括數(shù)據分組或者單元切換的或者路由的網絡在二個設備之間退出;其中二個以上的設備能夠連接到這個網絡;和 其中每個終端設備能夠封裝和將數(shù)據分組尋址到一個以上的目的地設備。
39、 根據權利要求35~38任何一個所述的系統(tǒng),還包括權利要 求21的裝置。
40、 根據權利要求35~38任何一個所述的系統(tǒng),還包括權利要 求25的裝置。
41、 根據權利要求35 38任何一個所述的系統(tǒng),還包括 具有分離的LID地址空間和不同的子網前綴的二個Infin舊and結構;集成進設備的分組路由部件,其中邏輯電路通過在GRH中檢查目的地GID來確定給定的 InfiniBand數(shù)據分組的LID地址;和其中邏輯電路圖能夠使用來自GRH的信息代替LID、 SL、 VL 或者InfiniBand數(shù)據分組的其它的成分。9
全文摘要
本發(fā)明涉及一種用于延長InfiniBand網絡的實時到達的裝置的系統(tǒng)。方法和裝置可以將InfiniBand網絡連接到長距離連接(例如,WAN),同時保持完整的10Gbit InfiniBand速度,并且保留由InfiniBand結構(IBTA)指定的語義。該系統(tǒng)包括InfiniBand接口、管理模塊、分組路由、封裝/去封裝、大容量緩沖存儲器和WAN接口、邏輯和電路。本發(fā)明適用于有效地使用單個傳輸流在很大的距離上移動大量數(shù)據。
文檔編號H04L29/04GK101258719SQ200680026207
公開日2008年9月3日 申請日期2006年7月17日 優(yōu)先權日2005年7月17日
發(fā)明者克里斯多佛·耶斯克, 大衛(wèi)·托馬斯·索斯韋爾, 詹森·加里·貢特普 申請人:黑曜石研究有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1