專利名稱:一種交換網(wǎng)通信系統(tǒng)、實現(xiàn)方法及交換裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種交換網(wǎng)通信系統(tǒng)、實現(xiàn)方法及 交換裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)發(fā)展,流量的逐步增大,對于路由器、交換器、網(wǎng)關(guān)等網(wǎng)絡(luò) 設(shè)備的性能要求越來越高,需要處理的業(yè)務(wù)越來越復(fù)雜,因此目前的中高端 網(wǎng)絡(luò)設(shè)備交換網(wǎng) 一般采用數(shù)據(jù)承載平面和控制通道分離的方式,使通信設(shè)備 可以采用分布式轉(zhuǎn)發(fā)。如圖1所示的一種分步式網(wǎng)絡(luò)設(shè)備,包括主控板、線 卡板和交換板,虛線箭頭為控制通道,控制通道采用點對點的方式,每個線卡板的控制單元都和主控板控制單元進行通信;主控板的控制單元通常為 CPU (Central Processor Unit,中央處理器),線卡板的控制單元可以是CPU 或NP( Networks Processor,網(wǎng)纟備處理器)或ASIC( Application Specific Integrated Circuit,專用集成電^各);另外,線卡板、主控板通過交換器進行l(wèi)t據(jù)交換?,F(xiàn)有技術(shù)中承載數(shù)據(jù)平面的交換方式通?;贏TM (Asynchronous Transfer Mode,異步傳輸模式)或者以太網(wǎng)交換芯片實現(xiàn)。其中,基于ATM 交換方式的網(wǎng)絡(luò)設(shè)備,采用定長的分組交換,能夠很好的實現(xiàn)流量控制,較 高的轉(zhuǎn)發(fā)性能,能夠保證高質(zhì)量的服務(wù)質(zhì)量,但成本4艮高?;谝蕴W(wǎng)交換 芯片的網(wǎng)絡(luò)設(shè)備,由于以太網(wǎng)的交換芯片在交換機上使用非常多,價格較低, 但以太網(wǎng)在流量較大的情況下,必然會出現(xiàn)擁塞,而且也無法支持QoS( Quality of Service,服務(wù)質(zhì)量)、流量控制等;雖然現(xiàn)有技術(shù)也有試圖通過各種中心調(diào) 度、線卡板隊列管理等方式優(yōu)化基于以太網(wǎng)芯片的交換網(wǎng),但其復(fù)雜度和成 本非常高。因此,現(xiàn)有的交換網(wǎng)的通信設(shè)備要么成本很高且實現(xiàn)復(fù)雜,要么 無法滿足復(fù)雜的業(yè)務(wù)需求。發(fā)明內(nèi)容本發(fā)明實施例提供一種交換網(wǎng)通信系統(tǒng)、實現(xiàn)方法及交換裝置,以實現(xiàn) 交換網(wǎng)絡(luò)設(shè)備的低成本、高性能和高可靠性。為實現(xiàn)以上目的,本發(fā)明實施例提供了一種交換網(wǎng)通信系統(tǒng),包括主 控板、線卡板和交換裝置,所述交換裝置包括PC正交換單元,所述線卡板通 過所述PCIE交換單元進行數(shù)據(jù)平面通信。所述交換裝置還包括以太網(wǎng)交換單元,所述主控板和所述線卡板通過所 述以太網(wǎng)交換單元進行控制平面通信。所述主控板包括控制單元,所述控制單元具體包括CPU、 PCIE根聯(lián)合 體子單元和以太網(wǎng)々某體控制子單元;所述PC正根聯(lián)合體子單元,用于實現(xiàn)PCIE總線接口;所述以太網(wǎng)媒體控制子單元,用于實現(xiàn)以太網(wǎng)接口;數(shù)據(jù)平面配置;通過所述以太網(wǎng)Jf某體控制單元及以太網(wǎng)交換單元實現(xiàn)與線卡 板控制平面配置。所述線卡板包括控制單元,所述控制單元具體包括CPU、 PC正終端、 以太網(wǎng)i某體控制子單元和對外接口子單元;所述CPU控制PC正終端與主控板的PCIE纟艮聯(lián)合體子單元通信;并控制 以太網(wǎng)i某體控制子單元通過以太網(wǎng)交換單元與主控板進行控制平面通信;并 控制對外接口子單元與外部通信。所述PCIE終端和對外接口單元由網(wǎng)絡(luò)處理器實現(xiàn)或有專用集成電路芯 片實現(xiàn)。本發(fā)明實施例還提供了一種交換裝置,應(yīng)用于包括至少一個線卡板和主 控板的通信系統(tǒng),該交換裝置還包括PC正交換單元,所述線卡板通過所述 PC正交換單元進行數(shù)據(jù)平面通信。還包括以太網(wǎng)交換單元,所述主控板和所述線卡板通過所述以太網(wǎng)交換 單元進行控制平面通信。所述以太網(wǎng)交換單元還包括故障檢測子單元和切換子單元;所述故障檢測子單元,用于檢測到控制通道發(fā)生故障時,通知所述切換 子單元將控制平面通信切換到PCIE交換單元。所述PC正交換單元進一步包括最優(yōu)通道4僉測子單元、分類管理子單元和 數(shù)據(jù)轉(zhuǎn)發(fā)子單元,所述最優(yōu)通道^r測子單元,用于選取最優(yōu)的虛擬通道; 所述分類管理子單元,用于建立所述最優(yōu)虛擬通道與物理通道、線卡板、數(shù)據(jù)報文類型的映射關(guān)系;數(shù)據(jù)轉(zhuǎn)發(fā)子單元,用于根據(jù)所述映射關(guān)系進行數(shù)據(jù)轉(zhuǎn)發(fā)。 所述PC正交換單元還包括故障;險測子單元和切換子單元; 所述故障檢測子單元,用于^r測到數(shù)據(jù)通道發(fā)生故障時,通知所述切換子單元將數(shù)據(jù)平面通信切換到以太網(wǎng)交換單元。本發(fā)明實施例還提供了 一種交換網(wǎng)通信實現(xiàn)方法,包括以下步驟 主控板對PCIE交換單元和線卡板的PCIE總線進行空間配置; 所述線卡板通過所述PCIE交換單元進行數(shù)據(jù)平面通信。 所述主控板對線卡板進行配置后還包括主控板通過以太網(wǎng)交換單元對 線卡板進行路由轉(zhuǎn)發(fā)表維護和管理。所述主控板對PC正交換單元進行空間配置具體包括 選取最優(yōu)的虛擬通道;建立所述最優(yōu)虛擬通道與物理通道、線卡板、數(shù)據(jù)報文類型的映射關(guān)系。 所述線卡板根據(jù)所述映射關(guān)系進行數(shù)據(jù)平面通信。;險測到數(shù)據(jù)通道發(fā)生故障時,通知主控板和線卡板將數(shù)據(jù)平面通信切換 到以太網(wǎng)交換單元;檢測到控制通道發(fā)生故障時,通知主控板和線卡板將控 制平面通信切換到PCIE交換單元。與現(xiàn)有^l支術(shù)相比,本發(fā)明實施例具有以下優(yōu)點本發(fā)明的實施例中,使用基于PCIE總線的交換網(wǎng)作為數(shù)據(jù)承載平面,使 用基于以太網(wǎng)的交換網(wǎng)作為控制平面,提供一種低成本、高性能、高可靠性 的網(wǎng)絡(luò)設(shè)備。
圖1是現(xiàn)有技術(shù)中一種分布式網(wǎng)絡(luò)設(shè)備結(jié)構(gòu)圖;圖2是本發(fā)明實施例一種基于PC正總線和以太網(wǎng)的分布式交換網(wǎng)通信系 統(tǒng)結(jié)構(gòu)圖;圖3是本發(fā)明實施例中 一種主控板結(jié)構(gòu)圖; 圖4是本發(fā)明實施例中一種線卡板結(jié)構(gòu)圖; 圖5是本發(fā)明實施例中另 一種線卡板結(jié)構(gòu)圖; 圖6是本發(fā)明實施例中又一種線卡板結(jié)構(gòu)圖; 圖7是本發(fā)明實施例中 一典型交換網(wǎng)通信系統(tǒng)結(jié)構(gòu)圖; 圖8是本發(fā)明實施例中一種線卡板中的控制裝置不攜帶PC正接口功能的 通信系統(tǒng)結(jié)構(gòu)圖;圖9是本發(fā)明圖8實施例中線卡板的數(shù)據(jù)轉(zhuǎn)發(fā)流程圖;圖IO是本發(fā)明圖8實施例中適配裝置結(jié)構(gòu)圖;圖11是本發(fā)明圖8實施例中控制裝置發(fā)送報文格式結(jié)構(gòu)圖;圖12是本發(fā)明圖8實施例中對來源不同報文進入不同隊列示意圖;圖13是本發(fā)明圖8實施例報文轉(zhuǎn)換示意圖;圖14是本發(fā)明圖8實施例中PCIE報文格式圖;圖15是本發(fā)明圖8實施例中另一種基于PCIE交換網(wǎng)的通信系統(tǒng)總線適 配圖。
具體實施方式
本發(fā)明實施例提供了一種基于PCI Express (簡稱PC正)總線和以太網(wǎng)的 分布式交換網(wǎng)通信系統(tǒng),如圖2所示,包括主控板、線卡板和交換設(shè)備,其 中,交換設(shè)備包括PC正交換單元和以太網(wǎng)交換單元。PCIE交換單元提供多個 PCIE接口連接到主控板和線卡板的控制單元,主控板的控制單元通過PCIE總 線對PC正交換單元和線卡板的PC正的空間進行配置;以太網(wǎng)交換單元提供多 個以太網(wǎng)接口,連接到主控板和線卡板的控制單元,主控板的控制單元通過 以太網(wǎng)接口和線卡板的控制單元通信,對線卡板路由地址信息進行配置,確保不同的線卡板可以通過PCIE交換單元進行通信。其中,主控板的控制單元 為CPU,業(yè)務(wù)板的控制單元為CPU或NP或ASIC。正常情況下,由以太網(wǎng)交換單元構(gòu)成的控制平面主要是完成線卡板的配 置、路由轉(zhuǎn)發(fā)表的維護、管理等功能,不進行數(shù)據(jù)報文轉(zhuǎn)發(fā),需要的帶寬比 較小, 一般中高端通信設(shè)備使用千兆以太網(wǎng)就可以滿足,也可以采用快速以 太網(wǎng)或萬兆以太網(wǎng)等代替千兆以太網(wǎng)。PC正交換單元承載數(shù)據(jù)平面信息,在 主控板對PC正交換單元和線卡板的PCIE總線的空間配置后,各個線卡板直 接通過PC正交換單元完成數(shù)據(jù)的轉(zhuǎn)發(fā),無需通過主控板,這種分布式的轉(zhuǎn)發(fā) 使主控板只做控制平面的業(yè)務(wù),從而保證系統(tǒng)高效、可靠運行,尤其使用兩 個主控板互相作為備份后,系統(tǒng)的可靠性進一步得到加強。其中,PCIE交換單元進一步包括最優(yōu)通道檢測子單元,用于選取最優(yōu) 的虛擬通道,例如PCIE交換單元對于不同線路板的報文傳輸按照地址訪問 尋址方式,對于每個物理線路獲得不少于一個VC(Virtual Channel,虛擬通道) 和TC(Traffic Class,流量分類)通道,最優(yōu)的VC和TC的數(shù)量不少于系統(tǒng)支 持線卡板和主控板的數(shù)量;分類管理子單元,通過設(shè)置VC、 TC與不同物理 通道的對應(yīng)關(guān)系,或者與線卡板的映射關(guān)系,或者與數(shù)據(jù)^J:的映射關(guān)系, 實現(xiàn)分級分類處理不同線卡板的不同的數(shù)據(jù)報文和業(yè)務(wù)報文,實現(xiàn)不同的QoS (Quality of Service,服務(wù)質(zhì)量);數(shù)據(jù)轉(zhuǎn)發(fā)子單元,用于根據(jù)映射關(guān)系對不同 線卡板的數(shù)據(jù)直接進行轉(zhuǎn)發(fā),無需將數(shù)據(jù)發(fā)送到主控板。本發(fā)明實施例中,PC正交換單元和以太網(wǎng)交換單元還可以分別包括故障 ;險測子單元和切換子單元,PC正交換單元中的故障;險測子單元用于4企測到數(shù) 據(jù)通道發(fā)生故障時,通知切換子單元將數(shù)據(jù)平面通信切換到以太網(wǎng)交換單元; 以太網(wǎng)交換單元中的故障檢測子單元用于檢測到控制通道發(fā)生故障時,通知 切換子單元將控制平面通信切換到PCIE交換單元。PC正交換單元和以太網(wǎng) 交換單元連接到所有的線卡板和主控板,正常情況下,通過PCIE交換單元進 行數(shù)據(jù)轉(zhuǎn)發(fā),以太網(wǎng)交換單元進行控制通道信息轉(zhuǎn)發(fā);當(dāng)PCIE交換單元因出 現(xiàn)故障不能使用時,以太網(wǎng)交換單元(此時采用萬兆以太網(wǎng)交換單元尤佳) 可以承載所有的數(shù)據(jù)平面和控制平面的數(shù)據(jù),而且數(shù)據(jù)平面的轉(zhuǎn)發(fā)仍然可以做到分布式轉(zhuǎn)發(fā);當(dāng)以太網(wǎng)交換芯片不能使用時,PCIE交換單元可以承載所 有的數(shù)據(jù)平面和控制平面的業(yè)務(wù);為了保證實現(xiàn)的可靠性,防止數(shù)據(jù)平面業(yè) 務(wù)擁塞了控制平面數(shù)據(jù),這些種情況下,可以限制數(shù)據(jù)平面流量。另外,本發(fā)明實施例中可以增加備份主控板,當(dāng)主控板不能使用時,備 份主控板可以承擔(dān)主控板的任務(wù),當(dāng)備份主控板不存在或者也不起作用時, 可以使用其中的一個線卡板承擔(dān)主控板的任務(wù),切換為主控板的功能,最大 限度的保護整個設(shè)備的運行,保護網(wǎng)絡(luò)的正常。本發(fā)明實施例中,PCIE交換單元可以提供多個獨立的PCIE串行總線,這 些獨立的串行總線既可以獨立成為一個PCIE線路,也可以多個線路捆綁在一 個邏輯串行線路上,每個線卡板通過一個邏輯串行線路與交換單元連接。為 了滿足轉(zhuǎn)發(fā)性能,捆綁線路的數(shù)據(jù)依據(jù)系統(tǒng)需要提供的帶寬決定,如PCI Express l.O規(guī)范中,l個通道可以支持2.5Gbps, 4個通道可以支持10Gbps, 16 個通道可以支持40Gbps的帶寬;如PCIE2.0規(guī)范中,l個通道可以支持5Gbps, 4個通道可以支持20Gbps的帶寬,邏輯串行線路可以依據(jù)用戶的需求進行設(shè) 計。本發(fā)明實施例中,主控板如圖3所示,包括控制單元、RAM (Random-Access Memory,隨機存取存儲器)和FLASH (閃存),其中,控 制單元進一步包括CPU、 PCIE根聯(lián)合體子單元和以太網(wǎng)士某體控制子單元。 PCIE根聯(lián)合體(PCI Express Root complex)單元,提供PC正總線接口 ;以 太網(wǎng)i某體控制單元實現(xiàn)千兆以太網(wǎng)接口,用于提供以太網(wǎng)交換接口。 CPU通過PCIE根聯(lián)合體子單元及PCIE交換單元對線卡板數(shù)據(jù)平面配置;通過以太 網(wǎng)々某體控制單元及以太網(wǎng)交換單元實現(xiàn)對線卡板控制平面配置。上述控制單 元可以用帶以太網(wǎng)"l妾口功能和PCIE 口功能的SoC ( System on Chip )處理 器實現(xiàn),當(dāng)然SoC處理器也可以不帶PCIE總線接口和以太網(wǎng)接口,可以與提 供PCIE總線和以太網(wǎng)接口的外置北橋設(shè)備組合實現(xiàn)。但一般情況下集成PC正 根聯(lián)合體功能和以太網(wǎng)媒體控制接口功能的SoC芯片更便宜,性價比更優(yōu), 但處理效率相對低些。本發(fā)明實施例中,線卡板采用NP、 ASIC、 CPU或者多核CPU作為控制單元時,整個系統(tǒng)能達到很高的性能。因此,線卡板進一步包括控制單元、 RAM和FLASH,其中,控制單元具體包括CPU、 PC正終端、以太網(wǎng)媒體 控制子單元和對外接口子單元;CPU控制PC正終端與主控板的PC正根聯(lián)合 體子單元通信;并控制以太網(wǎng)媒體控制子單元通過以太網(wǎng)交換單元與主控板 進行控制平面通信;并控制對外接口子單元與外部通信。控制單元可以使用帶以太網(wǎng)接口功能和PCIE接口功能的SoC處理器實現(xiàn), 如圖4所示,CPU連接PC正終端(Endpoint)、以太網(wǎng)媒體控制子單元和對外信,以太網(wǎng)媒體控制子單元通過以太網(wǎng)交換單元的以太網(wǎng)接口與主控板進行 控制平面通信,對外接口子單元用于連接其它可選用戶接口,可以為SPI4接 口控制器、IOGE以太網(wǎng)接口控制器等,根據(jù)用戶需求可選的各種接口,提供 了線卡的對外接口。另外,這些接口通過專用的ASIC或FPGA ( Field Programmable Gate Array,現(xiàn)場可編程門陣列)芯片轉(zhuǎn)換后可以才是供幾乎所有 的通信i殳備的物理才妄口 ,如以太網(wǎng)、ATM、 POS (Packet Over SONET/SDH, SONET/SDH上的分組)等接口。圖4中來自以太網(wǎng)接口的控制報文用于配置 線卡板的路由轉(zhuǎn)發(fā)表、地址、緩沖描述等信息,CPU接收來自外部的報文, 查轉(zhuǎn)發(fā)表后,通過PCIE接口轉(zhuǎn)發(fā)到PC正交換單元,進而轉(zhuǎn)發(fā)到另外一個線卡 板。使用網(wǎng)絡(luò)處理器時,如圖5所示,控制單元可以為不帶以太網(wǎng)接口功能和 PCIE接口功能的CPU, CPU連接網(wǎng)絡(luò)處理器實現(xiàn)PCIE接口和對外4妻口功能。 網(wǎng)絡(luò)處理器中包括PCIE終端和報文處理引擎,PCIE終端用于連接PCIE根聯(lián)合 體或者PCIE交換單元、報文處理引擎用于連接其它可選用戶接口,如 ATM/POS/10GE等;SoC處理器通過以太網(wǎng)媒體控制器實現(xiàn)以太網(wǎng)接口 。圖中 單板CPlPf叉僅作為配置功能,進一步也可以集成在網(wǎng)絡(luò)處理器內(nèi)部,CPU接收 來自以太網(wǎng)接口的控制報文用于配置線卡板的轉(zhuǎn)發(fā)表、地址、緩沖描述等信 息,將其配置到網(wǎng)絡(luò)處理器的表中;網(wǎng)絡(luò)處理器接收來自外部的報文,查表 后,通過PCIE接口轉(zhuǎn)發(fā)到PCIE交換單元,進而轉(zhuǎn)發(fā)到另外一個線卡板。使用專用ASIC轉(zhuǎn)發(fā)引擎時,如圖6所示,線卡板結(jié)構(gòu)圖和使用網(wǎng)絡(luò)處理器的圖5基本相同,相比較網(wǎng)絡(luò)處理器的實現(xiàn)方式,成本可以做到很低,但性能可以做到很高。本發(fā)明一個典型應(yīng)用實例如圖7所示,包括主控板、交換板和業(yè)務(wù)板l、2.......N。主控板和業(yè)務(wù)板中都包括SoCCPU芯片、內(nèi)存、程序、邏輯單元;交換板包括PCIE交換器和千兆以太網(wǎng)交換芯片;業(yè)務(wù)板CPU芯片內(nèi)部集成 了PCIE控制器和千兆以太網(wǎng)控制器。在主控板上PCIE控制器可以配置為PCIE 根聯(lián)合體,在線卡板上可以配置為PCIE終端,PCIE作為數(shù)據(jù)承載平面。CPU 芯片集成了多個千兆以太網(wǎng)控制器,其中一個千兆以太網(wǎng)連接到交換板的千 兆以太網(wǎng)交換芯片,作為設(shè)備的控制平面。CPU芯片的其余的千兆以太網(wǎng)控 制器和其它功能控制器可以連接到設(shè)備的對外業(yè)務(wù)接口 。如果上述實施例中的CPU、 NP和ASIC等都不支持PCIE接口功能,則可以 通過在線卡板上增加適配裝置,達到在線卡板上使用不支持PCIE接口功能的 CPU、NP和ASIC等控制裝置,即PC正終端置于控制裝置的外部。該種基于PC正 交換網(wǎng)的通信系統(tǒng),如圖8,包括主控板、線卡板和PC正交換設(shè)備,該PC正 交換設(shè)備為圖2中只有PCIE交換單元的交換設(shè)備,線卡板包括控制裝置和適配 裝置,線卡板的控制裝置可以為CPU、 NP或ASIC芯片,芯片不提供PC正總線 接口 ,例如線卡板控制裝置的接口為SPI4 ( System Packet Interface Level 4,系 統(tǒng)包接口第4級)、XGMII (10G Media Independent Interface, IOG介質(zhì)無關(guān)接 口 )等總線,可以通過適配裝置完成控制裝置到PC正總線適配。主控板中的 控制裝置可以是提供PC正總線接口的CPU ( Central Processor Unit,中央處理 單元),也可以是不提供PCIE總線接口的CPU,當(dāng)使用不提供PCIE總線接口 的CPU時,系統(tǒng)性能比提供PC正總線接口的CPU時好,但需要增加適配裝置。 適配裝置可以由FPGA、 ASIC或其它軟件程序或硬件電路實現(xiàn),即通過CPU +北橋的方式實現(xiàn)。圖8中線卡板的數(shù)據(jù)轉(zhuǎn)發(fā)過程如圖9所示,線卡板的控制裝置接收到報 文后,查找轉(zhuǎn)發(fā)表,增加目標(biāo)線卡板地址信息和報文優(yōu)先級信息在當(dāng)前報文 的前面,構(gòu)成新的報文通過SPI4、 XGMII等接口發(fā)送到線卡板的適配裝置, 適配裝置從接收到的報文中提取目標(biāo)線卡板地址信息和報文優(yōu)先級信息后,刪除掉被線卡板控制裝置增加的信息,拆分為特定長度的報文,并依據(jù)提取 的目標(biāo)線卡板地址信息和報文優(yōu)先級等信息組成PCIE頭信息,加在報文前面,封裝為PCIE報文,通過PC正交換設(shè)備發(fā)送到另外一個線卡板,該另一 線卡板適配裝置接收到PC正報文后,去掉PCIE頭信息,再經(jīng)過組幀,提取 出來原來的報文,通過SPI4、 XGMII等接口轉(zhuǎn)發(fā)給該另一線卡板的控制裝置, 而后將報文轉(zhuǎn)發(fā)出去。對于線卡板控制裝置,發(fā)送出去是SPI4/XGMII報文, 接收到也是SPI4/XGMII報文,PCIE就像一個隧道,線卡板的控制裝置不關(guān) 心PC正交換設(shè)備如何實現(xiàn)流量控制、服務(wù)質(zhì)量保證等。適配裝置結(jié)構(gòu)如圖IO所示,具體包括上行適配單元和下行適配單元。上 行適配單元,將來自本線卡板控制裝置的報文轉(zhuǎn)換為PC正報文,通過PC正 交換設(shè)備發(fā)送到主控板或其它線卡板;下行適配單元,接收主控板或其它線 卡板通過PCIE交換設(shè)備發(fā)送來的PCIE報文,轉(zhuǎn)換為控制裝置適配的報文發(fā) 送給控制裝置。其中,上行適配單元具體包括物理層和鏈路層接收子單元l、拆分子單 元、PCIE頭封裝子單元及物理層和鏈路層發(fā)送子單元2;其中,物理層和鏈路 層接收子單元l,處理控制裝置發(fā)送出來的^JL的物理層和鏈路層,不同的控 制裝置接口需要不同的物理層和鏈路層處理子單元,如控制裝置是SPI4接口 , 則此物理層和鏈路層接收處理子單元1完成SPI4報文的識別,提取協(xié)議層報 文;如果控制裝置是XGMII接口,則物理層和鏈路層接收子單元1完成10GE 以太網(wǎng)"^艮文的物理層和鏈路層處理。拆分子單元用于將^J:拆分成多個PCIE 標(biāo)準(zhǔn)長度的報文。PC正頭封裝子單元,分別將多個PC正特定長度的報文加 PC正報文頭,生成一組PC正報文。物理層和鏈路層發(fā)送子單元2處理PC正接 口的物理層和鏈路層處理,并實現(xiàn)PCIE終端功能,將PC正才艮文發(fā)送到PC正交 換設(shè)備。下行適配單元具體包括物理層和鏈路層發(fā)送子單元1、組幀子單元、PC正 頭解封裝子單元及物理層和鏈路層接收子單元2。物理層和鏈路層發(fā)送子單元 l完成協(xié)議層報文的物理層和鏈路層封裝,發(fā)送到控制裝置的SPI4接口; PC正 頭解封裝子單元,將來自PC正交換設(shè)備的PCIE報文去掉PC正報文頭,獲得一組標(biāo)準(zhǔn)長度的PCIE報文;組幀子單元,將所述PCIE報文組裝成適配所述控制 裝置的報文,即依據(jù)攜帶在PCIE報文頭中的源ID (由發(fā)送端的總線號、設(shè)備 號、功能號組成)信息和地址信息重組報文。物理層和鏈路層接收子單元2處 理PC正接口的物理層和鏈路層,并實現(xiàn)PCIE終端功能,將適配所述控制裝置 的"R文發(fā)送給該控制裝置。上行適配單元還包括目標(biāo)線卡板地址獲取子單元,從所述控制裝置發(fā)送 的報文中獲取目標(biāo)線卡板地址,通過所述PC正頭封裝子單元封裝在PC正報 文頭中。由于適配裝置不識別控制裝置發(fā)送的報文,為了滿足PC正報文正確 在交換網(wǎng)轉(zhuǎn)發(fā),要求在控制裝置發(fā)送報文頭上攜帶一個目的地址,如圖11中 所示報文頭部增加了 PC正地址頭和保留字節(jié),此目的地址為基于PCIE交換 設(shè)備分配給目標(biāo)線卡板的地址(即把PC正的地址信息攜帶在控制裝置發(fā)送的 報文中,這個報文是非PCIE報文,本文中把地址信息放置到報文頭部,任何 調(diào)整地址位置,或者不違背這個原則的改動都是本專利保護的范圍),以便封 裝在發(fā)送到PCIE交換設(shè)備的PC正報文頭中,線卡板報文頭地址來自于系統(tǒng) 的控制平面。上行適配單元還包括優(yōu)先級分類單元,確定所述報文的優(yōu)先級級別,將 相應(yīng)的優(yōu)先級標(biāo)識通過所述PCIE頭封裝子單元封裝到所述PC正"t艮文頭中。 如圖11中所示,保留字節(jié)是為了保證字節(jié)對齊和兼容以后擴充功能,如擴充 QoS (Quality of Service,服務(wù)質(zhì)量)功能,控制報文優(yōu)先級等。如在擴充功 能中定義報文的優(yōu)先級,適配裝置把這個優(yōu)先級映射到PC正報文頭的TC (Tra伍c Class,流量分類),從而入交換網(wǎng)的不同虛擬通道VC(Virtual Channel, 虛擬通道),實現(xiàn)分級分類處理不同線路板的不同的數(shù)據(jù)報文和業(yè)務(wù)報文,實 現(xiàn)不同的QoS。下行適配單元還包括組幀檢測子單元,用于檢測從PC正交換設(shè)備發(fā)來的 PC正報文是否為一組完整報文。其中,檢測條件包括PC正報文頭中地址不 連續(xù)、報文長度小于標(biāo)準(zhǔn)長度或預(yù)設(shè)時間內(nèi)沒有收到下一個報文。為了保證組幀的正確性,要求來自同一個線卡板的報文在PC正交換網(wǎng)中 不能錯亂順序,接收線卡板需要識別來自交換設(shè)備的不同來源的報文,因此,接收線卡板下行適配單元要求包括多個隊列,如圖12所示,隊列的數(shù)量要求 不少于線卡板和主控4反的數(shù)量減1,每一個隊列對應(yīng)一個源ID,當(dāng)4妄收PC正 報文頭中的Requester ID字段和該隊列的源ID相同時,PCIE報文進入該隊列, 保證了組幀的完成。本發(fā)明還提供了一種交換網(wǎng)通信實現(xiàn)方法,包括以下步驟 步驟sl01,主控板對PCIE交換單元和線卡板的PCIE總線進行空間配置。 其中,PCIE交換單元提供多個PCIE接口連接到主控板和線卡板的控制單元, 主控板的控制單元通過PC正總線對PCIE交換單元和線卡板的PCIE的空間進 行配置;主控板的控制單元通過以太網(wǎng)接口和線卡板的控制單元通信,對線 卡板路由地址信息進行配置,確保不同的線卡板可以通過PC正交換單元進行 通信。其中,主控板的控制單元為CPU,業(yè)務(wù)板的控制單元為CPU或NP或 ASIC。另外,PC正交換單元對于不同線路板的報文傳輸按照地址訪問尋址方式, 對于每個物理線路獲得不少于一個VC和TC通道,最優(yōu)的VC和TC的數(shù)量 不少于系統(tǒng)支持線卡板和主控板的數(shù)量;并通過設(shè)置VC、 TC與不同物理通 道的對應(yīng)關(guān)系,或者與線卡板的映射關(guān)系,或者與數(shù)據(jù)^^艮文的映射關(guān)系,實 現(xiàn)分級分類處理不同線卡板的不同的數(shù)據(jù)^^文和業(yè)務(wù)才艮文,實現(xiàn)不同的QoS。步驟s102,線卡板通過PC正交換單元進行數(shù)據(jù)平面通信。PC正交換單 元承載數(shù)據(jù)平面信息,在主控板對PCIE交換單元和線卡板的PCIE總線的空 間配置后,各個線卡板直接通過PC正交換單元完成數(shù)據(jù)的轉(zhuǎn)發(fā),無需通過主 控板,這種分布式的轉(zhuǎn)發(fā)使主控板只做控制平面的業(yè)務(wù),從而保證系統(tǒng)高效、 可靠運行,尤其使用兩個主控板互相作為備份后,系統(tǒng)的可靠性進一步得到 加強。其中,線卡板進行數(shù)據(jù)平面通信可以分為兩個方向, 一個是上行方向 由線卡板向PCIE交換單元發(fā)送數(shù)據(jù);另一個是下行方向,由線卡板接收來自 PCIE交換單元的數(shù)據(jù)。在上行方向?qū)碜员揪€卡板控制裝置的報文轉(zhuǎn)換為 PC正報文,通過PCIE交換單元發(fā)送到主控板或其它線卡板。具體包括將 控制裝置發(fā)來的報文拆分成多個PCIE特定長度的報文,分別將多個PCIE報文加PC正報文頭,生成一組PCIE報文,發(fā)送到PCIE交換單元。PCIE報文 頭中包括控制裝置發(fā)送的報文中攜帶的目標(biāo)線卡板地址和優(yōu)先級信息。在下行方向接收主控板或其它線卡板通過PC正交換單元發(fā)送來的PCIE 報文,轉(zhuǎn)換為控制裝置適配的報文發(fā)送給控制裝置。具體包括將來自其它 線卡板和主控板的PC正報文分別存儲到不同的隊列中;將每個隊列中來自 PCIE交換單元的PCIE報文去掉PCIE報文頭,獲得一組標(biāo)準(zhǔn)長度的PCIE報 文;然后將PC正報文組裝成適配控制裝置的報文發(fā)送給控制裝置。由于PCIE標(biāo)準(zhǔn)規(guī)范規(guī)定,PCIE交換單元支持的最大報文長度為4K字節(jié), 報文長度從0到4K字節(jié)的范圍內(nèi)變動,報文突發(fā)變化比較大,對PCIE交換單元 的沖擊較大,很容易造成PCIE交換單元擁塞或效率低,因此,本發(fā)明實施例 中要求適配裝置對接收到的報文在進入PC正交換單元之前進行拆分,如拆分 為長度128字節(jié)或256字節(jié)等特定長度。拆分后的報文被添加了PCIE報文頭, 以便構(gòu)成標(biāo)準(zhǔn)的PCIE報文,能在PCIE交換單元中被識別和轉(zhuǎn)發(fā)。另外一方面, 封裝成PCIE報文被轉(zhuǎn)發(fā)到另外一個線卡板時,此線卡板適配裝置必須能識別 PCIE報文,并對拆分的報文進行組幀,組幀成原來的報文到相應(yīng)的控制裝置 中。為了筒化設(shè)計,同時為了降低總線適配器成本和滿足業(yè)務(wù)處理的質(zhì)量服 務(wù)保證,本發(fā)明實施例簡化了PCIE規(guī)范中定義的處理層數(shù)據(jù)報文路由方式, 只需要支持存儲器寫方式,這種方式能保證PCIE帶寬得到最優(yōu)的利用率,并對于控制裝置發(fā)送出來的處理層數(shù)據(jù)報文不做任何識別,只需要把^^艮文當(dāng)作 凈荷(Payload)處理,至到轉(zhuǎn)發(fā)到另外一個線卡板的控制裝置,PCIE交換單 元對于處理層報文就像一個隧道。下面以切片長度為256字節(jié)為例對報文拆分、PC正報文頭封裝過程,以及 PCIE報文組幀過程進行說明,如圖13所示。發(fā)送到PCIE交換單元的所有報文 (除了切片的最后一個報文)的凈荷都是256字節(jié),PC正報文頭中包含的地址 信息依次增加256, PC正交換單元接收到PC正報文后,依據(jù)報文的地址信息轉(zhuǎn) 發(fā)到相應(yīng)的線卡板上,線卡板接收到報文后,依據(jù)報文PCIE報文頭中攜帶的源ID (由發(fā)送端的總線號、設(shè)備號、功能號組成)入不同的隊列。適配裝置 可以根據(jù)如下三種措施來判斷是否一個完整的組幀PCIE報文頭中地址不是 連續(xù)增加256時,為一個組幀報文結(jié)束;PCIE報文長度小于256字節(jié)時,為一 個組幀報文結(jié)束;地址雖然連續(xù),報文長度為256字節(jié),但預(yù)定時間內(nèi)沒有接 收到下一個報文,為一個組幀報文結(jié)束。圖14是PC正標(biāo)準(zhǔn)規(guī)范定義的數(shù)據(jù)報文格式,圖ll和圖13的地址信息對應(yīng) 圖14的Address地址字段,Requester ID即為本端口的總線號、設(shè)備號、功能號 組成的數(shù)據(jù),以便在報文從PCIE交換單元出來,適配裝置根據(jù)報文不同來源 進入不同的隊列,便于組幀。更進一步,為了保證系統(tǒng)的向后擴展性,保護用戶的投資,本發(fā)明實施 例中適配裝置與控制裝置可以集成一體或分離。當(dāng)高性能的基于PCIE接口的 控制裝置出現(xiàn)時,在當(dāng)前的線卡板中使用帶PC正接口的擴展控制裝置。如圖 15左側(cè)兩個線卡板,通過使用帶擴展的控制裝置,可以兼容當(dāng)前系統(tǒng),該兩 了線卡板中分別使用擴展的控制裝置,該控制裝置集成了本發(fā)明中的控制裝 置和適配裝置的功能,支持PC正終端的物理層和鏈路層協(xié)議、具有完成報文 的切片和組幀功能,當(dāng)此線卡板要發(fā)送報文時,控制裝置把要發(fā)送的報文切 割為256字節(jié)大小,封裝PC正報文頭,并且同一個報文地址增加256,報文頭 中攜帶本單板的PC正源ID信息。而原來的線卡板為XGMII接口的以太網(wǎng)報文 進行拆分封裝通過交換網(wǎng)發(fā)送過來,控制裝置接收到報文后,依據(jù)PCIE報文 頭的地址和PCIE源ID信息,"t艮文存儲到不同的內(nèi)存空間中,通過軟件或者硬_ 件完成^艮文的組幀。另外,為了保證系統(tǒng)的穩(wěn)定性,當(dāng)檢測到數(shù)據(jù)通道發(fā)生故障時,通知主 控板和線卡板將數(shù)據(jù)平面通信切換到以太網(wǎng)交換單元;檢測到控制通道發(fā)生 故障時,通知主控板和線卡板將控制平面通信切換到PCIE交換單元。以上公開的僅為本發(fā)明的幾個具體實施例,但是,本發(fā)明并非局限于此, 任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本發(fā)明的保護范圍。
權(quán)利要求
1. 一種交換網(wǎng)通信系統(tǒng),包括主控板、線卡板和交換裝置,其特征在于,所述交換裝置包括PCIE交換單元,所述線卡板通過所述PCIE交換單元進行數(shù)據(jù)平面通信。
2、 如權(quán)利要求1所述交換網(wǎng)絡(luò)通信系統(tǒng),其特征在于,所述交換裝置還 包括以太網(wǎng)交換單元,所述主控板和所述線卡板通過所述以太網(wǎng)交換單元進 行控制平面通信。
3、 如權(quán)利要求1所述交換網(wǎng)絡(luò)通信系統(tǒng),其特征在于,所述主控板包括 控制單元,所述控制單元具體包括CPU、 PCIE才艮聯(lián)合體子單元和以太網(wǎng)々某 體控制子單元;所述PCIE根聯(lián)合體子單元,用于實現(xiàn)PCIE總線接口 ;所述以太網(wǎng)媒體控制子單元,用于實現(xiàn)以太網(wǎng)接口;所述CPU,通過所述PCIE根聯(lián)合體單元及PCIE交換單元與線卡板實現(xiàn)板控制平面配置。
4、 如權(quán)利要求1所述交換網(wǎng)絡(luò)通信系統(tǒng),其特征在于,所述線卡板包括 控制單元,所述控制單元具體包括CPU、 PC正終端、以太網(wǎng)媒體控制子單 元和對外接口子單元;所述CPU控制PC正終端與主控板的PCIE根聯(lián)合體子單元通信;并控制 以太網(wǎng)i某體控制子單元通過以太網(wǎng)交換單元與主控板進行控制平面通信;并 控制對外接口子單元與外部通信。
5、 如權(quán)利要求4所述交換網(wǎng)絡(luò)通信系統(tǒng),其特征在于,所述PCIE終端 和對外接口單元由網(wǎng)絡(luò)處理器實現(xiàn)或有專用集成電路芯片實現(xiàn)。
6、 一種交換裝置,應(yīng)用于包括至少一個線卡板和主控板的通信系統(tǒng),其 特征在于,所述交換裝置還包括PC正交換單元,所述線卡板通過所述PC正 交換單元進行數(shù)據(jù)平面通信。
7、 如權(quán)利要求6所述交換裝置,其特征在于,還包括以太網(wǎng)交換單元, 所述主控板和所述線卡板通過所述以太網(wǎng)交換單元進行控制平面通信。
8、 如權(quán)利要求7所述交換裝置,其特征在于,所述以太網(wǎng)交換單元還包括故障檢測子單元和切換子單元;所述故障檢測子單元,用于檢測到控制通道發(fā)生故障時,通知所述切換 子單元將控制平面通信切換到PC正交換單元。
9、 如權(quán)利要求6所述交換裝置,其特征在于,所述PCIE交換單元進一 步包括最優(yōu)通道檢測子單元、分類管理子單元和數(shù)據(jù)轉(zhuǎn)發(fā)子單元,所述最優(yōu)通道^r測子單元,用于選取最優(yōu)的虛擬通道; 所述分類管理子單元,用于建立所述最優(yōu)虛擬通道與物理通道、線卡板、 數(shù)據(jù)報文類型的映射關(guān)系;數(shù)據(jù)轉(zhuǎn)發(fā)子單元,用于根據(jù)所述映射關(guān)系進行數(shù)據(jù)轉(zhuǎn)發(fā)。
10、 如權(quán)利要求6所述交換裝置,其特征在于,所述PC正交換單元還包 括故障纟企測子單元和切換子單元;所述故障檢測子單元,用于檢測到數(shù)據(jù)通道發(fā)生故障時,通知所述切換 子單元將凄t據(jù)平面通信切換到以太網(wǎng)交換單元。
11、 一種交換網(wǎng)通信實現(xiàn)方法,其特征在于,包括以下步驟 主控板對PC正交換單元和線卡板的PC正總線進行空間配置; 所述線卡板通過所述PCIE交換單元進行數(shù)據(jù)平面通信。
12、 如權(quán)利要求11所述交換網(wǎng)通信實現(xiàn)方法,其特征在于,所述主控板 對線卡板進行配置后還包括主控板通過以太網(wǎng)交換單元對線卡板進行路由轉(zhuǎn)發(fā)表維護和管理。
13、 如權(quán)利要求11所述交換網(wǎng)通信實現(xiàn)方法,其特征在于,所述主控板 對PCIE交換單元進行空間配置具體包括選取最優(yōu)的虛擬通道;建立所述最優(yōu)虛擬通道與物理通道、線卡板、數(shù)據(jù)報文類型的映射關(guān)系。
14、 如權(quán)利要求13所述交換網(wǎng)通信實現(xiàn)方法,其特征在于,所述線卡板 根據(jù)所述映射關(guān)系進行數(shù)據(jù)平面通信。
15、 如權(quán)利要求11所述交換網(wǎng)通信實現(xiàn)方法,其特征在于,檢測到數(shù)據(jù) 通道發(fā)生故障時,通知主控板和線卡板將數(shù)據(jù)平面通信切換到以太網(wǎng)交換單 元;;險測到控制通道發(fā)生故障時,通知主控板和線卡板將控制平面通信切換到PC正交換單元。
全文摘要
本發(fā)明提供了一種交換網(wǎng)通信系統(tǒng),包括主控板、線卡板和交換裝置,所述交換裝置包括PCIE交換單元,所述線卡板通過所述PCIE交換單元進行數(shù)據(jù)平面通信。本發(fā)明還提供了一種交換網(wǎng)通信實現(xiàn)方法,包括以下步驟主控板對PCIE交換單元和線卡板的PCIE總線進行空間配置;所述線卡板通過所述PCIE交換單元進行數(shù)據(jù)平面通信。本發(fā)明還提供了一種交換裝置。本發(fā)明的實施例中,使用基于PCIE總線的交換網(wǎng)作為數(shù)據(jù)承載平面,使用基于以太網(wǎng)的交換網(wǎng)作為控制平面,提供一種低成本、高性能、高可靠性的網(wǎng)絡(luò)設(shè)備。
文檔編號H04L12/28GK101277195SQ20071009099
公開日2008年10月1日 申請日期2007年3月30日 優(yōu)先權(quán)日2007年3月30日
發(fā)明者武 楊 申請人:杭州華三通信技術(shù)有限公司