數(shù)據(jù)中心400G光模塊選擇

孫承恩
隨著移動互聯(lián)網(wǎng)以及物聯(lián)網(wǎng)的廣泛應(yīng)用,數(shù)據(jù)中心數(shù)據(jù)流量呈爆炸性的增長,根據(jù)思科發(fā)布的全球云指數(shù)報告,到2020年云計算的流量將占全球數(shù)據(jù)中心流量的92%,超大規(guī)模的數(shù)據(jù)中心將會占到全球數(shù)據(jù)中心流量的53%。

隨著移動互聯(lián)網(wǎng)以及物聯(lián)網(wǎng)的廣泛應(yīng)用,數(shù)據(jù)中心數(shù)據(jù)流量呈爆炸性的增長,根據(jù)思科發(fā)布的全球云指數(shù)報告,到2020年云計算的流量將占全球數(shù)據(jù)中心流量的92%,超大規(guī)模的數(shù)據(jù)中心將會占到全球數(shù)據(jù)中心流量的53%。

超大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò)帶寬的需求幾乎一年半至兩年翻一番,為了應(yīng)付數(shù)據(jù)中心東西流量的不斷增長,超大規(guī)模數(shù)據(jù)中心平均每三年對網(wǎng)絡(luò)系統(tǒng)進行升級,國內(nèi)的超大規(guī)模數(shù)據(jù)中心在2014年開始部署40G以太網(wǎng),2017年開始部署100G以太網(wǎng),按照這個進度, 國內(nèi)的超大規(guī)模數(shù)據(jù)中心預(yù)計于2020年開始部署400G以太網(wǎng),大約2022年400G以太網(wǎng)會進入大規(guī)模部署階段。

國內(nèi)超大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò)演進路徑

光模塊構(gòu)造

光模塊的主要功能是實現(xiàn)電-光(E-O)和光-電(O-E)信號的轉(zhuǎn)換。光模塊通常由光組件、電路、光接口、電接口組成,其中光組件(OSA)包括光接收組件(ROSA)、光發(fā)射組件(TOSA)、光發(fā)射接收組件(BOSA)。電路部分包含發(fā)射激光器驅(qū)動電路,接收器放大電路,溫度監(jiān)控/控制電路。

光發(fā)射組件(TOSA)主要實現(xiàn)電光轉(zhuǎn)換,包含激光驅(qū)動器LDD、激光器LD、TEC致冷器、隔離器、Mux合波器、耦合透鏡等器件。光接收組件(ROSA)主要實現(xiàn)光電轉(zhuǎn)換,包含PD光探測器、TIA跨阻放大器(配合探測器一起使用,用以放大信號)、Demux分波器、限幅放大器LA(主要把TIA放大的邏輯信號變?yōu)閿?shù)字信號)等組成。

電路除了實現(xiàn)對激光器(Tx部分)的直流驅(qū)動和信號調(diào)制,另外對接收器(Rx部分)的信號放大和處理以及通過MCU(主控制單元)實現(xiàn)對模塊的邏輯控制,MCU的功能包括時序、功率、溫度、告警等。

光模塊主要部件

光芯片和電芯片是光模塊中最關(guān)鍵的部分,占光模塊成本的80%左右,光芯片包含激光器芯片和探測器芯片。電芯片包括CDR(時鐘和數(shù)據(jù)恢復(fù))、TIA跨阻放大器、LA限幅放大器、LDD激光驅(qū)動器、MCU主控制器等。

激光芯片按照發(fā)射方式可分為:面發(fā)射器和邊發(fā)射激光器。面發(fā)射激光器目前市場上主要為VCSEL(垂直腔面發(fā)射)激光器,VCSEL激光器具有體積小、耦合效率高、功耗低、易集成、價格低等優(yōu)點,VCSEL激光器一般用于數(shù)據(jù)中心短距離應(yīng)用。邊發(fā)射激光器包括FP(法布里-珀羅)激光器和DFP(分布式反饋激光器)。FP激光器具有輸出功率較大、發(fā)散角小的優(yōu)點,一般用于低速、中程距離比如10km以內(nèi)的應(yīng)用。DFB(分布式反饋)激光器在FB激光器基礎(chǔ)上增加了衍射光柵,從而對特定波長進行篩選,可實現(xiàn)單一縱模輸出,DFB激光器具有輸出功率大、光譜窄、色散小、調(diào)制速率高、距離遠等優(yōu)點,一般用于高速的、40Km以內(nèi)距離應(yīng)用。

激光LD芯片按照調(diào)制方式可以分為,DML (直接調(diào)制) 激光器和EML(外部調(diào)制)激光器。DML激光器通過改變激光器注入的電流來控制激光器輸出的強度,DML激光器體積小,功耗低,但是消光比小、啁啾大,一般用于10km以內(nèi)的應(yīng)用。EML激光器在DML激光器基礎(chǔ)之上增加了EAM(電吸收調(diào)制器),通過電吸收效應(yīng)來調(diào)制信號強度,EML激光器調(diào)制速率高、抖動小、色散小、消光比大、啁啾小、眼圖裕量大, EML激光器比DML激光器功耗高,為了保證調(diào)制信號的穩(wěn)定,EML需要增加昂貴的制冷器TEC,因此EML成本較高,一般用于40km以內(nèi)的遠距離應(yīng)用。

激光器分類

探測器PD芯片的主要作用是把光信號轉(zhuǎn)換為電信號,有兩種類型的探測器,一種是光電二極管(PIN),另外一種是雪崩光電二極管(APD), PIN靈敏度相對較低,成本也較低,APD利用雪崩倍增效應(yīng)提高信號接收靈敏度,APD一般應(yīng)用于40km以上長距離的場景,APD成本遠高于PIN。

400G光模塊封裝方式

衡量數(shù)據(jù)中心光模塊的主要指標是密度、功耗、成本。熱容(Thermal Capacity)是衡量光模塊功耗的指標之一,熱容越大,表示光模塊能承受的功耗越大。400G光模塊按照封裝方式主要分為CDFP、CFP8、QSFP-DD、OSFP。CDFP和CFP8尺寸較大,熱容較高,主要用于電信市場。QSFP-DD向前兼容之前的QSFP-28,尺寸最小,密度較高,QSFP-DD更適用于短距離的數(shù)據(jù)中心使用,QSFP-DD 支持者比較眾多包括Facebook, Alibaba,Tencent等公司。OSFP MSA支持者包括Google、Arista,OSFP尺寸較QSFP-DD稍大,QSFP-28光模塊需要增加一個適配器才可以跟OSFP插座相互兼容,OSFP可以向后支持800G,OSFP自帶散熱器,能夠支持12w-15w熱容,OSFP更適用于電信市場。

400G光模塊封裝方式

400G光模塊命名規(guī)則

IEEE802.3工作組對光模塊的命名規(guī)則進行了定義,例如400G SR4.2的名稱中,400G代表速率是400Gbps,S代表數(shù)據(jù)中心內(nèi)部機柜之間互連,距離一般在150米以內(nèi),4代表光纖對數(shù),也就是8芯光纖,2代表每芯光纖上有2個波長。

IEEE光模塊命名方式

m代表物理介質(zhì)相關(guān)層(PMD), PMD主要實現(xiàn)將物理介質(zhì)連接層(PMA)傳來的信號轉(zhuǎn)換成特定的介質(zhì)(銅纜、單?;蛘叨嗄9饫|)中傳輸?shù)男盘?,主要有以下的PMD類型:

光模塊類型

數(shù)據(jù)中心400G解決方案比較

數(shù)據(jù)中心主要包含三種應(yīng)用場景,機柜內(nèi)ToR交換機和服務(wù)器互連,機柜間交換機互連和數(shù)據(jù)中心之間互連(DCI)。

數(shù)據(jù)中心應(yīng)用場景(來源:C-Link)

ToR交換機和服務(wù)器互連

ToR交換機和服務(wù)器互連有兩種方案,直連銅纜DAC和有源光纜AOC。DAC傳輸距離隨著網(wǎng)絡(luò)速率的提升而變短,DAC又可以分為ACC(有源銅纜)和PCC(無源銅纜)兩種,400G PCC無源銅纜距離最遠支持2.5米,400G ACC有源銅纜的距離最遠可達5米。

DAC的優(yōu)點是價格低,缺點也非常明顯,就是距離短,另外線纜笨重,理線困難,隨著數(shù)據(jù)中心服務(wù)器網(wǎng)絡(luò)速率的提升以及服務(wù)器密度的提高,DAC對于服務(wù)器機柜散熱是很大的挑戰(zhàn)。

AOC具有重量輕、距離遠、抗電磁干擾(EMI)、容易理線等優(yōu)點,AOC采用多模光纖理論上最大的傳輸距離150米,但是AOC由于兩邊帶模塊,不適于跨機柜列布放,AOC一般用于距離小于30米的場景。

交換機互連光模塊比較

數(shù)據(jù)中心Spine-Leaf交換機互連或者Leaf-ToR交換機互連目前有四種400G方案,400G SR16由于使用光纖芯數(shù)較多,大多數(shù)超大規(guī)模數(shù)據(jù)中心用戶表示不會采用,我們在這里不作討論。

首先,從光模塊的成本角度來看, 400G SR8方案采用目前市場上成熟的25G波特率 VCSEL激光芯片,信號采用PAM4脈沖幅度調(diào)制方式,25G波特率VCSEL激光芯片目前在市場上已經(jīng)非常成熟,因此400G SR8光模塊成本最低。

400G SR4.2光模塊采用雙波長的25G波特率VCSEL激光芯片,需要采用2:1 Mux合波器和1:2 Demux分波器,增加了光模塊的成本,另外400G SR4.2光模塊生態(tài)系統(tǒng)不是非常完善,光芯片供應(yīng)商只有一家,因此400G SR4.2光模塊成本明顯要高于400G SR8光模塊。

400G DR4光模塊采用較貴的DML激光器或者SiPh硅光技術(shù),硅光技術(shù)能夠?qū)鹘y(tǒng)的光器件例如調(diào)制器、探測器等通過互補金屬氧化物半導(dǎo)體(CMOS)工藝刻蝕在硅基底上,使光模塊功耗、體積和封裝成本大幅降低,但是硅光技術(shù)目前處于產(chǎn)業(yè)發(fā)展的早期,出貨量較低,因此無法形成規(guī)模效應(yīng),根據(jù)LightCounting最近的研究報告,目前基于硅光技術(shù)的模塊整體出貨量相比較傳統(tǒng)的基于磷化銦(InP)或者砷化鎵(GaAs)材料的光模塊低很多。

傳統(tǒng)光模塊和硅光模塊市場份額比較(來源:LightCounting)

目前主流交換機ASIC芯片采用25G波特率PAM-4信號,而400G DR4光模塊上采用50G波特率 PAM-4信號,也就是單波100Gbps,為了實現(xiàn)交換機電信號和光模塊電信號速率一致,400G DR4光模塊內(nèi)需要增加一個變速器(Gearbox)把8x50Gbps轉(zhuǎn)換成4x100Gbps,變速器會導(dǎo)致成本以及功耗的增加,所以400G DR4 光模塊在三種方案之中成本最高,400G DR4適用于交換機互連距離在150-500米的場景。

400G DR4變速器示意圖(來源:Arista)

從布線角度來看,400GDR4采用8芯單模光纖并行傳輸,光纖連接器采用APC(斜8度) MPO/MTP-12或者MPO/MTP-8,斜8度連接器能夠降低回波損耗,降低整體光纖鏈路損耗,保證誤碼率。 

400G SR4.2 采用8芯多模光纖并行傳輸,光纖連接器采用 MPO/MTP-12或者MPO/MTP-8 。400G SR8采用16芯多模光纖并行傳輸,為了減低回波損耗,光纖連接器采用斜8度APC端面的MPO/MTP-16光纖連接器。MPO-16光纖連接器鍵位采用了偏移設(shè)計,以防止和MPO/MTP-12或MPO/MTP-8混淆使用。

MPO/MTP-16光纖連接器(來源:US CONEC)

對于新建的數(shù)據(jù)中心,為了支持400G SR8光模塊,建議采用MPO/MTP-16光纖布線系統(tǒng),能夠直接支持400G SR8以太網(wǎng)。

新建數(shù)據(jù)中心支持400G SR8布線場景(來源:US CONEC)

對于目前已經(jīng)部署了MPO/MTP-12或者MPO/MTP-24布線的數(shù)據(jù)中心, 可以通過更換4x3 MPO/MTP轉(zhuǎn)換盒的方式來實現(xiàn)平滑升級到400G SR-8。

舊的數(shù)據(jù)中心支持400G SR8場景(來源:US CONEC)

從應(yīng)用角度來看,400GSR8 可以支持最多類型的扇出,包括4x100G,8x50G以及2x200G扇出,400G SR4.2和400G DR4都可以支持4x100G扇出。

交換機互連400G光模塊比較100-500m

數(shù)據(jù)中心網(wǎng)絡(luò)總體擁有成本包含了光模塊成本和布線成本, 400G SR-8雖然需要比較多的光纖芯數(shù),但是數(shù)據(jù)中心普遍采用模塊化設(shè)計,通常交換機互連距離一般在50米左右,因此布線成本的差異相比較光模塊成本差異低很多,另外400G SR-8生態(tài)系統(tǒng)最為完善,能夠供貨的光模塊的廠商最多,支持的扇出應(yīng)用最多,因此對于新部署的數(shù)據(jù)中心,在115m的距離以內(nèi)400GSR-8的整體擁有成本最低,400G SR-8是400G交換機互連性價比最高的解決方案。

數(shù)據(jù)中心交換機互連總體擁有成本比較(來源:Panduit)

數(shù)據(jù)中心互連光模塊比較2-10km

對于2km-10Km距離范圍內(nèi)的數(shù)據(jù)中心互連有四種方案,400G FR8需要8個DML激光器,為了降低光模塊激光器的數(shù)量和復(fù)雜程度,400G FR4 光模塊僅需要4個EML激光器,降低了器件成本和組裝成本。400G FR8采用LAN-WDM波分復(fù)用技術(shù),支持八個波長,每個波長傳輸50Gbps,400G FR4采用CWDM技術(shù),支持四個波長,單波長支持100Gbps,就目前的市場來說,單波長100Gbps意味著必須采用昂貴的50G 波特率光芯片和50G 波特率電芯片。

如下圖所示實現(xiàn)100GDR傳輸有三種方案,方案一采用4:1變速器,將交換機4x25bps電信號轉(zhuǎn)為光模塊1x100G bps電信號,光模塊功耗3.5W;方案二采用2:1變速器,將交換機4x25bps電信號轉(zhuǎn)為光模塊1x100G bps電信號,光模塊功耗2.5W;方案三采用單波100Gbps,光模塊不需要昂貴的變速器,另外功耗降低為1.5W。

100G DR不同方案功耗比較(來源:Arista)

單波100Gbps的好處是避免使用昂貴的變速器,降低器件成本,另外也會降低光模塊的功耗。因此,隨著芯片制造技術(shù)的改進和50G 波特率芯片出貨量的增加, 400G FR4在市場上最終會替代400G FR8 。

數(shù)據(jù)中心互連網(wǎng)絡(luò)演進路線圖(來源:Molex)

400G FR4采用20nm波長間隔,波長間隔越大,對于合波器Mux/分波器Demux要求越寬松,激光器無需致冷,光模塊成本越低。400G LR4波長間隔僅為5nm,所以需要增加致冷器TEC來控制溫度, 400G LR4光模塊成本較400G FR4高。因此在2km距離內(nèi),400G FR4是比較經(jīng)濟的解決方案。

數(shù)據(jù)中心互連光模塊比較2-10km

數(shù)據(jù)中心互連光模塊比較40km

對于距離在40km之內(nèi)的數(shù)據(jù)中心互連,可以采用400G ER8或400G ER4,400G ER8采用昂貴的EML激光器,以及昂貴的APD探測器,還需要采用Mux合波器和Demux分波器,此外EML激光器功耗比較高,為了保證調(diào)制信號穩(wěn)定,需要增加致冷器TEC,這些都導(dǎo)致400G ER8和400G ER4光模塊成本高居不下。400G ER4和400G ER8的區(qū)別是,400G ER4采用單波100Gbps,也就是采用昂貴的50G波特率EML激光芯片,400G ER8采用目前市場成熟的25G波特率EML激光芯片,另外400G ER4光模塊需要將在交換機一側(cè)的8X50Gbps電信號轉(zhuǎn)換為4x100Gbps電信號,因此400G ER4比400G ER8需要多加一個變速器(gearbox),因此400G ER4價格遠高于400G ER8。

數(shù)據(jù)中心互連光模塊比較80km

隨著網(wǎng)絡(luò)速率的不斷提高,基于簡單的開關(guān)鍵控(On Off Keying)幅度調(diào)制的傳統(tǒng)直接檢測方式會使光信號頻譜變寬,導(dǎo)致串?dāng)_的出現(xiàn),因而傳輸距離下降。

相干檢測通信正在從遠距離的通信場景滲入到數(shù)據(jù)中心互連場景,相干檢測是一種更復(fù)雜的、多維度的信號調(diào)制方式,它綜合了幅度調(diào)制、相位調(diào)制和偏振調(diào)制的方式,從而在一個波特里面承載更多的信息。

光互聯(lián)網(wǎng)絡(luò)論壇OIF(Optical Internetworking Forum)正在制定400G ZR的規(guī)范,該規(guī)范采用相干檢測和密集波分復(fù)用DWDM相結(jié)合的方案,400G ZR采用更復(fù)雜的偏振復(fù)用16級正交幅度調(diào)制(DP-16QAM)方式,能夠支持80km傳輸距離。400G ZR光模塊除了需要采用昂貴的ITLA集成可調(diào)諧激光器組件、IQM集成IQ相位調(diào)制器、高性能的DSP數(shù)字信號處理器(用來補償色散和偏振色散)、ICR集成相干接收機(用來檢測復(fù)雜的調(diào)制光信號), 400G ZR光模塊價格大約是400G ER4價格的兩倍。

數(shù)據(jù)中心互連光模塊比較80km

總結(jié)

最后總結(jié)一下數(shù)據(jù)中心400G光模塊的選擇

●不超過2.5米的ToR交換機到服務(wù)器互連場景,可以使用400G DAC

●不超過30米的ToR交換機到服務(wù)器互連場景,可以使用400G AOC

●不超過100米的Spine-Leaf交換機互連場景,宜使用400GBASE-SR8 QSFP-DD光模塊,布線采用MPO/MTP-16 OM4多模光纖

●不超過150米的Spine-Leaf交換機互連場景,可使用400GBASE-SR4.2 QSFP-DD光模塊,布線采用MPO/MTP-12 OM5多模光纖

●不超過500米的Spine-Leaf交換機互連場景,可使用400G DR4 QSFP-DD光模塊,布線采用MPO/MTP-12 OS1a單模光纖

●不超過2Km的數(shù)據(jù)中心互連場景,可使用400G FR8 QSFP-DD光模塊 OS2單模光纖

●不超過10Km的數(shù)據(jù)中心互連場景,可使用400G-LR8 OSFP光模塊OS2單模光纖

●不超過40km的數(shù)據(jù)中心互連場景,可使用 400G-ER8 OSFP光模塊 OS2單模光纖

●不超過120km的數(shù)據(jù)中心互連場景,可使用 400G-ZR CSFP2相干光模塊 OS2單模光纖

數(shù)據(jù)中心應(yīng)用場景及光模塊選擇

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論