今天,數(shù)據(jù)中心不再是一座孤立的機房,而是可以通過網(wǎng)絡(luò)互通互聯(lián)。
近年來,人工智能、虛擬/增強現(xiàn)實、物聯(lián)網(wǎng)等新興技術(shù)的涌現(xiàn)都離不開云計算的支持。云計算是數(shù)百萬臺分布在全球各地數(shù)據(jù)中心的服務(wù)器通過網(wǎng)絡(luò)連接在一起組成的大型分布式計算平臺。今天,數(shù)據(jù)中心不再是一座孤立的機房,而是一個建筑群。一個數(shù)據(jù)中心可以包含很多個分支數(shù)據(jù)中心,它們所處的位置不同,卻可以通過網(wǎng)絡(luò)互聯(lián)起來,共同完成相應(yīng)的業(yè)務(wù)部署。而實現(xiàn)這些數(shù)據(jù)中心間互通的紐帶就是——數(shù)據(jù)中心間互聯(lián)技術(shù)。
實現(xiàn)數(shù)據(jù)中心間互通的紐帶——DCI網(wǎng)絡(luò)
根據(jù)Cisco發(fā)布的云指數(shù)報告,過去五年,數(shù)據(jù)中心間的互聯(lián)帶寬保持了近33%的年增長率,互聯(lián)帶寬達到了~100Tb/s量級。
圖1 Cisco發(fā)布的數(shù)據(jù)中心年流量增長趨勢
當(dāng)把若干個數(shù)據(jù)中心用光纖連接起來,并且采用光通信技術(shù)承載他們之間相互的信息傳遞,這就組成了數(shù)據(jù)中心間互聯(lián)光網(wǎng)絡(luò)(后面簡稱DCI網(wǎng)絡(luò))。
圖片從不同角度分析,DCI網(wǎng)絡(luò)有一些明顯特征:
網(wǎng)絡(luò)拓撲以點到點和簡單組網(wǎng)為主,復(fù)雜度較低。
城域數(shù)據(jù)中心間互聯(lián)距離較短,單位傳輸成本的降低對數(shù)據(jù)中心很有吸引力。
更加關(guān)心網(wǎng)絡(luò)時延,小的設(shè)備時延可以減輕數(shù)據(jù)中心選址的困難。
互聯(lián)業(yè)務(wù)種類相對單一,以100G的以太網(wǎng)為主,電層設(shè)備復(fù)雜度較低。
結(jié)合流量的快速增長,模塊化的設(shè)備以及靈活可擴張的組網(wǎng)方式更受歡迎。
特殊的硬件要求,例如容納在服務(wù)器機柜中,滿足前后出風(fēng)、高壓直流供電方式等。
為了更好地建設(shè)和維護數(shù)據(jù)中心間互聯(lián)網(wǎng)絡(luò),適配快速增加的數(shù)據(jù)中心間流量,DCI技術(shù)應(yīng)運而生。
從黑盒封閉到開放解耦
在過去的網(wǎng)絡(luò)運營體系中,系統(tǒng)廠商提供整套解決方案,包括設(shè)備安裝、系統(tǒng)調(diào)試、運維支持等,系統(tǒng)整體類似于封閉的黑盒,不同廠家的硬件、軟件均不具備兼容互通的可能。
其次,成本問題。受益于相干光傳輸技術(shù)的不斷演進,單波速率從100Gb/s增長到了800Gb/s,由于電層設(shè)備的主要成本來自于光學(xué)器件,因此單波速率提高有利于降低單位成本。不過,過去10年,很少有一家系統(tǒng)廠家持續(xù)保持產(chǎn)品上的領(lǐng)先優(yōu)勢。這意味著,如果繼續(xù)采用封閉系統(tǒng)構(gòu)建網(wǎng)絡(luò),將無法第一時間享受到技術(shù)發(fā)展的紅利。
圖2電層單波速率和單纖容量的演化圖
另外,封閉系統(tǒng)中的私有網(wǎng)管軟件無法與用戶已有資源管理、權(quán)限管理、建設(shè)流程和日常維護系統(tǒng)打通,難以提升端到端的自動化水平,從而縮短業(yè)務(wù)開通時間。
DCI技術(shù)的第一個突破點就是打開封閉的系統(tǒng),讓用戶可以按需定制自己的網(wǎng)絡(luò),規(guī)避獨家綁定,確保供應(yīng)安全。
阿里云基礎(chǔ)設(shè)施光網(wǎng)絡(luò)團隊,研究提出開放解耦DCI技術(shù)的概念,并和行業(yè)合作伙伴一起推進了DCI技術(shù)生態(tài)的形成和壯大,突破了傳統(tǒng)封閉式的系統(tǒng)理念。
DCI網(wǎng)絡(luò)可以看成由底層硬件設(shè)備和上層管控軟件共同組成,其中設(shè)備分為光層設(shè)備和電層設(shè)備,兩者的角色類比于城市的交通設(shè)施,光層設(shè)備類似基礎(chǔ)道路,電層設(shè)備則是路上的交通工具。和電層技術(shù)的快速演化相比,光層設(shè)備屬于基礎(chǔ)設(shè)施中的基礎(chǔ)設(shè)施,技術(shù)演進相對較慢,往往都會超期服役。所以,解耦的第一刀就切在這里,把公路和交通工具分割開,把光層和電層解耦。光層設(shè)備和電層設(shè)備來自不同廠家,同時在一套光層設(shè)備組成的“公路”上,可以支持來自不同電層設(shè)備廠家的“交通工具”。
圖3日常生活中的道路上可以自由行駛來自不同廠家不同類型的交通工具,開放解耦DCI網(wǎng)絡(luò)也擁有類似的能力
同時,需要設(shè)備提供統(tǒng)一接口能力。軟件定義網(wǎng)絡(luò)(Software defined networks)的發(fā)展,Netconf協(xié)議得到了大多數(shù)設(shè)備廠家的共識。阿里巴巴也在早期加入了OpenConfig組織,參與光網(wǎng)絡(luò)相關(guān)的數(shù)據(jù)模型定義?;贜etconf協(xié)議和OpenConfig模型,可以采用第三方云軟件平臺直接對接廠家設(shè)備實現(xiàn)管控,這種完全解耦的系統(tǒng)減少了管控路徑上的環(huán)節(jié),對響應(yīng)新增網(wǎng)絡(luò)級功能需求提供更好的主動性和自由度。
圖4開放解耦的DCI網(wǎng)絡(luò)
靈活架構(gòu)支持網(wǎng)絡(luò)可擴張
封閉系統(tǒng)打開后,下一步就可選擇更合適的硬件來構(gòu)建可靈活擴張的DCI網(wǎng)絡(luò)。
在較長一段時間內(nèi),光層設(shè)備的合分波單元僅支持固定通道間隔,實際上,隨著單波速率不斷提升,電層設(shè)備需要的頻譜寬度也在不斷增加。為了兼容不斷發(fā)展的單波速率,固定間隔的合分波單元要升級到基于波長選擇開關(guān)(Wavelength Selective Switch,WSS)的靈活合分波單元。
圖5靈活合分波單元與靈活柵格頻譜,為了支持更多的上下路端口,需要將兩個WSS進行合并
在規(guī)模大的DCI網(wǎng)絡(luò)中,業(yè)務(wù)分布更復(fù)雜,需要考慮基于ROADM(Reconfigurable Optical Add Drop Multiplexer)的Mesh網(wǎng)絡(luò)架構(gòu)。在數(shù)據(jù)中心較為分散的城市,往往會采用星型架構(gòu)。如果主站不具備光層穿通能力,那么衛(wèi)星站之間的流量需要在主站進行光-電-光轉(zhuǎn)換,不僅增加額外成本,還會增加站點間的傳輸時延。當(dāng)主站是ROADM時,衛(wèi)星站之間的業(yè)務(wù)可以在主站穿通直達對端,并且穿通的波長和路由都可通過網(wǎng)管軟件進行配置,大大減少DCI網(wǎng)絡(luò)的人工運維成本,提升業(yè)務(wù)開通效率。
圖6 IP網(wǎng)絡(luò)與能夠支持ROADM的DCI網(wǎng)絡(luò)之間的協(xié)同
點到點場景下,光層在第一天就已經(jīng)建設(shè)完畢,光電解耦是合理的。在Mesh DCI網(wǎng)絡(luò)中,考慮到后續(xù)站點的增加和網(wǎng)絡(luò)規(guī)模的擴大,光層需要進一步解耦。我們推薦將ROADM按照方向進行解耦,同時確保光復(fù)用段(Optical Multiplex Section,OMS)內(nèi)的設(shè)備都來自于同一個廠家。
這樣的方式既可將DCI網(wǎng)絡(luò)中的光層部分有效切割,同時又避免陷入過多的設(shè)備之間協(xié)議的約定細節(jié)中。網(wǎng)絡(luò)建設(shè)的第一天只有站點A和B之間的連接,設(shè)備來自于供應(yīng)商M。第二天增加了一個新的站點C,那么站點C與站點B之間的連接,站點C與站點A之間的連接分別由供應(yīng)商T1和T2承建。
為了應(yīng)對不同廠商設(shè)備連接頭不同導(dǎo)致的無法互通的問題,我們設(shè)計了一款支持靈活插卡的萬能連纖盒,由全連接背板以及方向適配插卡組成。每個方向的適配板卡可以匹配廠家的接頭規(guī)格,并將廠家的線序“翻譯”成通用線序。這樣,任意兩個方向之間通過萬能連纖盒實現(xiàn)了全連接。可以說,萬能連纖盒以四兩撥千斤的方式實現(xiàn)了光層異構(gòu),為DCI網(wǎng)絡(luò)規(guī)模的擴大打開了自由之門。
圖7基于萬能連纖盒的異構(gòu)ROADM和光層解耦方案示意
管控自動化提升網(wǎng)絡(luò)效率
同IP數(shù)字通信系統(tǒng)相比,光網(wǎng)絡(luò)中依然保留了大量的模擬屬性,例如光功率如何調(diào)整,放大器的增益、斜率如何配置等。為了應(yīng)對這樣的挑戰(zhàn),需要能實現(xiàn)可供第三方使用的開放光網(wǎng)絡(luò)設(shè)計工具。通過抽象出多層級模型,描述不同廠家設(shè)備的行為和功能,廠家的差異性體現(xiàn)在模型的關(guān)鍵規(guī)格參數(shù)中。結(jié)合實際組網(wǎng)拓撲數(shù)據(jù)、業(yè)務(wù)資源數(shù)據(jù)等信息,規(guī)劃器求解端到端最優(yōu)化問題,可以計算獲得所有設(shè)備上的目標(biāo)配置值以及此時的性能余量。
在已有網(wǎng)絡(luò)中新增業(yè)務(wù)或者做配置優(yōu)化時,需要像一個攀巖高手一樣,小心地選擇從當(dāng)前配置到目標(biāo)配置的調(diào)節(jié)路徑。受限于光放大器非線性、光纖Kerr非線性以及受激拉曼散射效應(yīng)的影響,不僅當(dāng)前調(diào)節(jié)的業(yè)務(wù)通道需要關(guān)注,相鄰的通道以及附近相關(guān)OMS上的通道同樣需要監(jiān)測。在配置器中引入了實時狀態(tài)檢查單元,實時采集的設(shè)備性能數(shù)據(jù)經(jīng)過定制的檢查邏輯,判斷當(dāng)前調(diào)節(jié)路徑是否存在風(fēng)險,不斷更新。如此反復(fù),最終安全的實現(xiàn)預(yù)設(shè)的調(diào)節(jié)目標(biāo)。
圖8可供第三方使用的開放光網(wǎng)絡(luò)設(shè)計工具和自動化配置流程
發(fā)展和挑戰(zhàn)
不斷涌現(xiàn)的互聯(lián)網(wǎng)服務(wù)以及快速演進的云計算,推動了DCI網(wǎng)絡(luò)在過去的十年里蓬勃發(fā)展。開放解耦的系統(tǒng),簡單且靈活的架構(gòu)體系以及軟件自動化是DCI的主要創(chuàng)新點。在可預(yù)見的未來里,5G網(wǎng)絡(luò)、物聯(lián)網(wǎng)(IoT)、增強現(xiàn)實技術(shù)(AR)和虛擬現(xiàn)實(VR),以及邊緣云計算將繼續(xù)推動DCI網(wǎng)絡(luò)快速增長。一個開放的DCI生態(tài)將會更有利于新技術(shù)的發(fā)展和引入,推動技術(shù)創(chuàng)新和業(yè)界繁榮,更好地滿足客戶和業(yè)務(wù)的需求,并最終推動云計算邁向新的階段!