數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的問題與演進 — 傳統(tǒng)路由交換技術(shù)與三層網(wǎng)絡(luò)架構(gòu)

范桂颶
隨著云計算的到來,越來越豐富的業(yè)務(wù)對數(shù)據(jù)中心的流量模型產(chǎn)生了巨大的沖擊,如搜索、并行計算等業(yè)務(wù),需要大量的服務(wù)器組成集群系統(tǒng),協(xié)同完成工作,這導(dǎo)致服務(wù)器之間的流量變得非常大。

路由和交換

網(wǎng)絡(luò)的工作方式是使用兩種設(shè)備:交換機和路由器,來將計算機與外圍設(shè)備連接起來。這兩種工具使連接到網(wǎng)絡(luò)上的設(shè)備之間以及其它網(wǎng)絡(luò)相互通信。

雖然路由器和交換機看起來很像,但是它們在網(wǎng)絡(luò)中的功能卻截然不同:

交換機(Switch):主要用于將一棟大廈或一個校園里的多臺設(shè)備連接到同一個網(wǎng)絡(luò)上。例如,一臺交換機可以將您的多臺計算機、打印機和服務(wù)器連接起來,從而形成一個共享資源網(wǎng)絡(luò)。交換機相當于一個控制器,允許不同的設(shè)備共享信息并且彼此通信。通過共享信息和合理地分配資源,交換機可以幫助您節(jié)省資金,提高工作效率。交換機有兩種基本類型:非管理型和管理型。

非管理型交換機:拆箱即可投入使用,并且不允許進行任何更改。因此,家庭網(wǎng)絡(luò)設(shè)備通常使用非管理型交換機。

管理型交換機:則允許您對它進行編程。由此提供了更大的靈活性,因為您可以利用本地或遠程方式對其進行監(jiān)控和調(diào)整,進而控制網(wǎng)絡(luò)的通信流量及網(wǎng)絡(luò)用戶訪問權(quán)。管理性交換機的典型特征就是具有管理登錄 IP。

路由器(Router):主要用于將多個網(wǎng)絡(luò)連接起來。例如,您會用一臺路由器將聯(lián)網(wǎng)的計算機連接到互聯(lián)網(wǎng)上,從而使多名用戶共享一個互聯(lián)網(wǎng)連接。路由器相當于一個調(diào)度員,它會選擇最佳的路由路徑來傳送信息,以便您迅速收到信息。首先,路由器會分析網(wǎng)絡(luò)發(fā)送的數(shù)據(jù),改變數(shù)據(jù)的打包方式,然后將數(shù)據(jù)發(fā)送到另一個網(wǎng)絡(luò)上或者其他類型的網(wǎng)絡(luò)上。它們將貴公司與外界連接起來,保護信息不受安全威脅,甚至可以決定哪些計算機擁有更高的優(yōu)先級。根據(jù)貴公司的具體需求和網(wǎng)絡(luò)計劃,可以選擇具有不同功能的路由器:

防火墻(Firewalls):一種用于檢查接收的數(shù)據(jù)并且防止公司網(wǎng)絡(luò)受到攻擊的專業(yè)軟件。

虛擬專網(wǎng)(VPN):一種允許遠程員工從遠程地點安全訪問網(wǎng)絡(luò)的途徑。

IP 電話網(wǎng)絡(luò):利用語音和電話會議技術(shù)將貴公司的計算機和電話網(wǎng)絡(luò)集成在一起,從而簡化并統(tǒng)一公司的通信方式。

交換技術(shù)

交換技術(shù)是隨著電話通信的發(fā)展和使用而出現(xiàn)的通信技術(shù)。電話剛開始使用時,只能實現(xiàn)固定的兩個人之間的通話,隨著用戶的增加,人們開始研究如何構(gòu)建連接多個用戶的電話網(wǎng)絡(luò),以實現(xiàn)任意兩個用戶之間的通信。

傳統(tǒng)的 2 層交換技術(shù)

從廣義上講,任何數(shù)據(jù)的轉(zhuǎn)發(fā)都可以叫做交換(Switch)。但是,傳統(tǒng)的、狹義的第 2 層交換技術(shù),僅包括數(shù)據(jù)鏈路層的轉(zhuǎn)發(fā)。2 層交換機主要用在小型局域網(wǎng)中,計算機數(shù)量在二、三十臺以下,這樣的網(wǎng)絡(luò)環(huán)境下,廣播包影響不大,2 層交換機的快速交換功能、多個接入端口和低廉價格,為小型網(wǎng)絡(luò)用戶提供了完善的解決方案。交換式局域網(wǎng)技術(shù)使專用的帶寬為用戶所獨享,極大地提高了局域網(wǎng)傳輸?shù)男省?/p>

具有路由功能的 3 層交換技術(shù)

在大規(guī)模局域網(wǎng)中,為了減小廣播風(fēng)暴的危害,就必須把大型局域網(wǎng)按功能或地域等因素劃分成多個小局域網(wǎng)。與此同時,就出現(xiàn)了不同子網(wǎng)間的互訪需求,但這是 2 層交換技術(shù)無法實現(xiàn)的。為了從技術(shù)上解決這個問題,網(wǎng)絡(luò)廠商利用第 3 層交換技術(shù)開發(fā)了 3 層交換機,又稱路由交換機,它是傳統(tǒng)交換機與路由器的智能結(jié)合。簡單地說,可以處理網(wǎng)絡(luò)第 3 層數(shù)據(jù)轉(zhuǎn)發(fā)的交換技術(shù)就是第 3 層交換技術(shù)。

從硬件上看,在第 3 層交換機中,與路由器有關(guān)的第 3 層路由硬件模塊,也插接在高速背板/總線上。這種方式使得路由模塊可以與需要路由的其它模塊間,高速交換數(shù)據(jù)。3 層交換機是為 IP 設(shè)計的,接口類型簡單,擁有很強的 3 層包處理能力,價格又比相同速率的路由器低得多,非常適用于大規(guī)模局域網(wǎng)絡(luò)。

具有網(wǎng)絡(luò)服務(wù)功能的 7 層交換技術(shù)

第 7 層交換技術(shù)通過逐層解開數(shù)據(jù)包的每層封裝,并識別出應(yīng)用層的信息,以實現(xiàn)對數(shù)據(jù)內(nèi)容的理解??梢蕴幚砭W(wǎng)絡(luò)應(yīng)用層數(shù)據(jù)轉(zhuǎn)發(fā)的交換技術(shù)就是第 7 層交換技術(shù)。其主要目的是充分利用帶寬資源,對互聯(lián)網(wǎng)上的應(yīng)用、內(nèi)容進行管理,提高網(wǎng)絡(luò)服務(wù)水平,數(shù)據(jù)流優(yōu)化和智能負載均衡,完成互聯(lián)網(wǎng)向智能化的轉(zhuǎn)變。第 7 層交換技術(shù)通過應(yīng)用層交換機實現(xiàn)了所有高層網(wǎng)絡(luò)的功能,使網(wǎng)絡(luò)管理者能夠以更低的成本,更好地分配網(wǎng)絡(luò)資源。

從硬件上看,7 層交換機將所有功能集中在一個專用的特殊應(yīng)用集成電路或 ASIC(Application-specific Integrated Circuit,專用集成電路)上。ASIC 比傳統(tǒng)路由器的 CPU 便宜,而且通常分布在網(wǎng)絡(luò)端口上,在單一設(shè)備中包括了 50 個 ASIC,可以支持數(shù)以百計的接口。

路由技術(shù)

路由技術(shù)主要是指路由選擇算法、因特網(wǎng)的路由選擇協(xié)議的特點及分類。

路由選擇算法:

靜態(tài)路由選擇算法:是非自適應(yīng)路由選擇算法,這是一種不測量、不利用網(wǎng)絡(luò)狀態(tài)信息,僅僅按照某種固定規(guī)律進行決策得簡單得路由選擇算法。靜態(tài)路由選擇算法得特點是簡單和開銷小,但是不能適應(yīng)網(wǎng)絡(luò)狀態(tài)的變化。靜態(tài)路由選擇算法主要包括擴散法和固定路由表法。靜態(tài)路由是依靠手工輸入的信息來配置路由表的方法。優(yōu)點是減小了路由器的日常開銷。在小型互聯(lián)網(wǎng)上很容易配置??梢钥刂坡酚蛇x擇的更新。但是,靜態(tài)路由在網(wǎng)絡(luò)變化頻繁出現(xiàn)的環(huán)境中并不會很好的工作。在大型的和經(jīng)常變動的互聯(lián)網(wǎng),配置靜態(tài)路由是不現(xiàn)實。

動態(tài)路由選擇算法:是自適應(yīng)路由選擇算法,是依靠當前網(wǎng)絡(luò)的狀態(tài)信息進行決策,從而使路由選擇結(jié)果在一定程度上適應(yīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)和通信量的變化。特點是能較好的適應(yīng)網(wǎng)絡(luò)狀態(tài)的變化,但是實現(xiàn)起來較為復(fù)雜,開銷也比較大。動態(tài)路由選擇算法一般采用路由表法,主要包括分布式路由選擇算法和集中式路由選擇算法。分布式路由選擇算法是每一個節(jié)點通過定期得與相鄰節(jié)點交換路由選擇得狀態(tài)信息來修改各自的路由表,這樣使整個網(wǎng)絡(luò)的路由選擇經(jīng)常處于一種動態(tài)變化的狀況。集中式路由選擇算法是網(wǎng)絡(luò)中設(shè)置一個節(jié)點,專門收集各個節(jié)點定期發(fā)送得狀態(tài)信息,然后由該節(jié)點根據(jù)網(wǎng)絡(luò)狀態(tài)信息,動態(tài)的計算出每一個節(jié)點的路由表,再將新的路由表發(fā)送給各個節(jié)點。

路由選擇協(xié)議的特點:

自適應(yīng)

分布式

分層次(分自治系統(tǒng)內(nèi)部和自治系統(tǒng)外部)

路由選擇協(xié)議劃分為兩大類:

內(nèi)部網(wǎng)關(guān)協(xié)議(IGP,具體的協(xié)議有 RIP 和 OSPF 等)

外部網(wǎng)關(guān)協(xié)議(EGP,目前使用最多的是 BGP)

三層網(wǎng)絡(luò)架構(gòu)

三層網(wǎng)絡(luò)架構(gòu):是采用層次化模型設(shè)計的三層網(wǎng)絡(luò),Cisco 稱之為:分級的互連網(wǎng)絡(luò)模型(Hierarchical Inter-networking Model)。即將復(fù)雜的網(wǎng)絡(luò)設(shè)計分成幾個層次,每個層次著重于某些特定的功能,這樣就能夠使一個復(fù)雜的大問題變成許多簡單的小問題。三層網(wǎng)絡(luò)架構(gòu)設(shè)計的網(wǎng)絡(luò)有三個層次:

核心層(網(wǎng)絡(luò)的高速交換主干)

匯聚層(提供基于策略的連接)

接入層 (將工作站接入網(wǎng)絡(luò))

為了方便管理、提高網(wǎng)絡(luò)性能,大中型網(wǎng)絡(luò)應(yīng)按照標準的三層結(jié)構(gòu)設(shè)計。但是,對于網(wǎng)絡(luò)規(guī)模小,聯(lián)網(wǎng)距離較短的環(huán)境,可以采用 “收縮核心” 設(shè)計,忽略匯聚層。核心層設(shè)備可以直接連接接入層,這樣一定程度上可以省去部分匯聚層費用,還可以減輕維護負擔,更容易監(jiān)控網(wǎng)絡(luò)狀況。

核心層(Core Layer)

核心層:核心交換機為進出數(shù)據(jù)中心的包提供高速的轉(zhuǎn)發(fā),為多個匯聚層提供連接性,核心交換機為整個網(wǎng)絡(luò)提供一個彈性的 L3 路由網(wǎng)絡(luò)。

核心層是網(wǎng)絡(luò)的高速交換主干,對整個網(wǎng)絡(luò)的連通起到至關(guān)重要的作用。核心層應(yīng)該具有如下幾個特性:可靠性、高效性、冗余性、容錯性、可管理性、適應(yīng)性、低延時性等。在核心層中,應(yīng)該采用高帶寬的千兆以上交換機,因為核心層是網(wǎng)絡(luò)的樞紐中心,重要性突出。核心層設(shè)備采用雙機冗余熱備份是非常必要的,也可以使用負載均衡功能,來改善網(wǎng)絡(luò)性能。網(wǎng)絡(luò)的控制策略最好盡量少在核心層上實施。核心層一直被認為是所有外部網(wǎng)絡(luò)流量的最終承受者,所以對核心層的設(shè)計以及網(wǎng)絡(luò)設(shè)備的要求十分嚴格。核心層設(shè)備將占投資的主要部分。

匯聚層(Aggregation Layer)

匯聚層:匯聚交換機連接接入交換機,同時提供其他的服務(wù),例如:防火墻,SSL Offload,入侵檢測,網(wǎng)絡(luò)分析等。

匯聚層是網(wǎng)絡(luò)接入層和核心層的 “中介(中間層)”,就是在 Server 接入核心層前先做匯聚,以減輕核心層設(shè)備的負荷。匯聚層具有實施策略、安全、工作組接入、虛擬局域網(wǎng)(VLAN)之間的路由、源地址或目的地址過濾等多種功能。在匯聚層中,應(yīng)該選用支持三層交換技術(shù)和 VLAN 的交換機,以達到網(wǎng)絡(luò)隔離和分段的目的。

接入層(Access Layer)

接入層:接入交換機通常位于機架頂部,所以它們也被稱為ToR(Top of Rack)交換機,它們物理連接服務(wù)器。

接入層是直接面向用戶連接的部分,向本地網(wǎng)段提供工作站接入,主要解決了相鄰用戶之間的互訪需求。所以接入層可以選擇不支持 VLAN 和三層交換技術(shù)的普通交換機,接入層交換機具有低成本、高端口密度且即插即用的特性。接入層還應(yīng)當適當負責一些用戶管理功能(如:地址認證、用戶認證、計費管理等),以及用戶信息收集工作(如:用戶的 IP 地址、MAC 地址、訪問日志等)。

三層網(wǎng)絡(luò)架構(gòu)的設(shè)計原則

層次化設(shè)計:每個層可以看作為是一個具有特定角色和功能的、結(jié)構(gòu)定義良好的模塊,層次化的設(shè)計結(jié)構(gòu),易于擴展和維護,降低了設(shè)計的復(fù)雜度和難度。三層網(wǎng)絡(luò)架構(gòu)可以更好地控制網(wǎng)絡(luò)規(guī)模和網(wǎng)絡(luò)質(zhì)量,同時也方便網(wǎng)絡(luò)管理和維護。

模塊化設(shè)計:每個模塊對應(yīng)一個部門、功能或業(yè)務(wù)區(qū)域,可根據(jù)網(wǎng)絡(luò)規(guī)模靈活擴展,部門或區(qū)域內(nèi)部調(diào)整涉及范圍小,容易進行問題定位。

冗余設(shè)計:雙節(jié)點冗余性設(shè)計可以保證設(shè)備級可靠,適當?shù)娜哂嗵岣呖煽啃?,但過度的冗余也不便于運行維護。如果無法做好雙節(jié)點冗余設(shè)計,對框式的核心交換機或者出口路由器,可以考慮單板級的冗余,如雙主控板,雙交換網(wǎng)板。另外,關(guān)鍵鏈路可以采用 Eth-Trunk 鏈路實現(xiàn)鏈路級可靠性。

對稱性設(shè)計:網(wǎng)絡(luò)的對稱性便于業(yè)務(wù)部署,拓撲直觀,便于協(xié)議設(shè)計和分析。

三層網(wǎng)絡(luò)架構(gòu)的特點

通常情況下,匯聚交換機是 L2 和 L3 網(wǎng)絡(luò)的分界點,匯聚交換機以下的是 L2 網(wǎng)絡(luò),以上是 L3 網(wǎng)絡(luò)。每組匯聚交換機管理一個 POD(Point Of Delivery),每個 POD 內(nèi)都是獨立的 VLAN 網(wǎng)絡(luò)。服務(wù)器在 POD 內(nèi)移動不必修改 IP 地址和默認網(wǎng)關(guān),因為一個 POD 對應(yīng)一個 L2 廣播域。

匯聚交換機和接入交換機之間通常使用 STP(Spanning Tree Protocol,生成樹協(xié)議)。STP 使得對于一個 VLAN 網(wǎng)絡(luò)只有一個匯聚層交換機可用,其他的匯聚層交換機在當前使用的匯聚層交換機出現(xiàn)故障時才被使用(下圖中的虛線)。也就是說匯聚層是一個 Active-Passive 的 HA 模式。這樣在匯聚層,是做不到水平擴展的,因為就算加入多個匯聚層交換機,仍然只有一個在工作。一些私有的協(xié)議,例如 Cisco 的 vPC(Virtual Port Channel)可以提升匯聚層交換機的利用率。但是,一方面,這是私有協(xié)議,另一方面,vPC 也不能真正做到完全的水平擴展。上圖是一個匯聚層作為 L2/L3 分界線,且采用 vPC 的網(wǎng)絡(luò)架構(gòu)。

三層網(wǎng)絡(luò)架構(gòu)面臨的問題

STP 協(xié)議既是良方又是毒藥

生成樹協(xié)議(Spanning Tree Protocol,STP),是一種工作在 OSI 網(wǎng)絡(luò)模型中的第二層(數(shù)據(jù)鏈路層)的通信協(xié)議,基本應(yīng)用是防止交換機冗余鏈路產(chǎn)生的環(huán)路,用于確保以太網(wǎng)中無環(huán)路的邏輯拓撲結(jié)構(gòu),從而避免了廣播風(fēng)暴大量占用交換機的資源。

傳統(tǒng)的數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù),STP 是二層網(wǎng)絡(luò)中非常重要的一種協(xié)議。但是,在二層網(wǎng)絡(luò)中使用 STP 協(xié)議有一個相當矛盾的點,那就是 可靠性 和 安全性 的矛盾。

可靠性是指構(gòu)建二層網(wǎng)絡(luò)時,一般會采用會采用設(shè)備冗余和鏈路冗余的方式。

安全性是指二層交換機同處于一個廣播域,廣播報文在環(huán)路中會反復(fù)持續(xù)傳送,可能會形成廣播風(fēng)暴,所以必須防止形成環(huán)路。要想兩種同時達到,可以采用 STP(生成樹協(xié)議)自動控制,即冗余設(shè)備和冗余鏈路成備份,在正常情況下被阻塞掉,當出現(xiàn)鏈路故障時冗余的設(shè)備端口和鏈路才會被打開。

為什么二層交換網(wǎng)絡(luò)會產(chǎn)生物理環(huán)路?

鏈路冗余:交換機之間為了冗余、帶寬提升、或錯誤連接難免會產(chǎn)生一個封閉的物理環(huán)路,而以太網(wǎng)的轉(zhuǎn)發(fā)機制又決定了不能有物理環(huán)路,一有環(huán)路,那些發(fā)給所有主機的 Broadcast 、Unknown Unicast Frame 就會肆無忌憚在環(huán)路上永不停歇地繞圈圈。這些 Frame 永遠無法到達目的地,對交換機 CPU 是一個致命的打擊,如果有環(huán)路的發(fā)生,你可能無法本地、或遠程登錄你的交換機,只有重啟或拔線了。

二層交換機的轉(zhuǎn)發(fā)機制:交換機對于從一個 Port N 上 incoming 的 frame,學(xué)習(xí)其 Source MAC X,生成 MAC Address Table(MAC X: Port N)。這樣它就會生成 MAC 地址和 Port 的映射表,如果收到一個 Frame,就會通過 Frame 的 Destination MAC 與 MAC Address Table 進行匹配,繼而得出這個 Frame 應(yīng)該從哪一個 Port 發(fā)送出去。如果沒有匹配到,就認為是 unknown Unicast 或 broadcast,只好將它從所有 Port( 除了 incoming 口)發(fā)送出去,讓 Frame 到了其他的交換機上嘗試處理,于是這個 Frame 就有可能會一直在封閉的環(huán)路里無限的循環(huán)。

STP 協(xié)議的設(shè)計思路:人類的很多智慧來自于大自然,同學(xué)們仔細觀察一棵樹,會發(fā)現(xiàn)一棵樹,有根,樹干,樹杈,樹枝,葉子,水分通過根,源源不斷地輸送到主干,樹杈,然后到達葉子。水分在從根擴散到葉子的過程中,一直是單向的;而葉子因為光合作用產(chǎn)生的能量,再沿著葉子到達樹枝,樹杈,樹干,一直到根。水分和能量是相反方向的流量,如果定義根為上游,葉子為下游,則水是從上游流向下游;而能量則是由下游流向上游。無論是哪個方向的流量,都沒有在原地打轉(zhuǎn)的情況發(fā)生,那是因為樹的物理結(jié)構(gòu)是發(fā)散的,沒有樹干、樹杈、樹枝的物理交織,自然不會發(fā)生環(huán)路。網(wǎng)絡(luò)科學(xué)家發(fā)現(xiàn)了這個規(guī)律,有一個大膽設(shè)想,既然二層網(wǎng)絡(luò)里有物理環(huán)路,那用一種邏輯的方法將物理的環(huán)路斬斷,斬成一個發(fā)散的樹狀架構(gòu),是不是Frame就不會無限循環(huán)下去了?答案是肯定的,也是這么做的。如果把樹的拓撲結(jié)構(gòu)用于二層交換網(wǎng)絡(luò),在二層網(wǎng)絡(luò)里選擇一個根(Root Bridge),其它交換機當作樹的樹杈,每個樹杈自然有一個根末梢(Root Port),這個就是交換機的上游接口,除了根末梢,其它的接口都是下游接口,至于下游接口是暢通的、還是阻斷的,取決于到根的路徑成本(Cost),誰更接近根,誰就暢通(Forwarding) ,即常說的 Designated Port;誰遠離根,誰就需要被阻斷(Blocked),即常說的 Non Designated Port。通過這種仿生的機制,可以有效地避免網(wǎng)絡(luò)環(huán)路。

STP 協(xié)議的工作原理:任意一個交換機中如果到達根網(wǎng)橋有兩條或者兩條以上的鏈路,生成樹協(xié)議都根據(jù)算法把其中一條切斷,僅保留一條,從而保證任意兩個交換機之間只有一條單一的活動鏈路。因為這種生成的這種拓撲結(jié)構(gòu),很像是以根交換機為樹干的樹形結(jié)構(gòu),故為生成樹協(xié)議。

STP 的工作過程:首先進行根網(wǎng)橋的選舉,其依據(jù)是網(wǎng)橋優(yōu)先級(Bridge Priority)和 MAC 地址組合生成的橋 ID,橋 ID 最小的網(wǎng)橋?qū)⒊蔀榫W(wǎng)絡(luò)中的根橋(Root Bridge)。在此基礎(chǔ)上,計算每個節(jié)點到根橋的距離,并由這些路徑得到各冗余鏈路的代價,選擇最小的成為通信路徑(相應(yīng)的端口狀態(tài)變?yōu)?Forwarding),其它的就成為備份路徑(相應(yīng)的端口狀態(tài)變?yōu)?Blocking)。STP 生成過程中的通信任務(wù)由 BPDU 完成,這種數(shù)據(jù)包又分為包含配置信息的配置 BPDU(其大小不超過 35B)和包含拓撲變化信息的通知 BPDU(其長度不超過 4B)。

由于 STP 協(xié)議造成的逐層收斂的性能問題,一般情況下 STP 的網(wǎng)絡(luò)規(guī)模不會超過 100 臺交換機。STP 的這種機制導(dǎo)致了二層鏈路利用率不足,尤其是在網(wǎng)絡(luò)設(shè)備具有全連接拓撲關(guān)系時,這種缺陷尤為突出。如下圖所示,當采用全網(wǎng) STP 二層設(shè)計時,STP 將阻塞大多數(shù)鏈路,使接入到匯聚間帶寬降至 1/4,匯聚至核心間帶寬降至 1/8。這種缺陷造成越接近樹根的交換機,端口擁塞越嚴重,造成的帶寬資源浪費就越可觀。

云計算推動縱向流量向橫向流量的轉(zhuǎn)變

早期數(shù)據(jù)中心的流量有 80% 為橫向(east-west,南北)流量,隨著云計算、分布式架構(gòu)的發(fā)展,現(xiàn)在已經(jīng)轉(zhuǎn)變?yōu)?70% 為縱向(north-south,東西)流量。所謂縱向流量指的是從數(shù)據(jù)中心外部到內(nèi)部服務(wù)器之間交互的流量;橫向流量指的是數(shù)據(jù)中心內(nèi)部服務(wù)器之間交互的流量。

隨著云計算的到來,越來越豐富的業(yè)務(wù)對數(shù)據(jù)中心的流量模型產(chǎn)生了巨大的沖擊,如搜索、并行計算等業(yè)務(wù),需要大量的服務(wù)器組成集群系統(tǒng),協(xié)同完成工作,這導(dǎo)致服務(wù)器之間的流量變得非常大。比如搜索,用戶只是發(fā)出一個搜索指令,服務(wù)器集群就在海量數(shù)據(jù)面前進行搜索與計算,這個過程是非常復(fù)雜的,而只是將結(jié)果傳遞給用戶。早期數(shù)據(jù)中心主要滿足外部對數(shù)據(jù)中心的訪問,所以流量就以 “南北” 為主。這種流量模型受到了出口帶寬的限制,一般的數(shù)據(jù)中心訪問都會存在收斂比,即網(wǎng)絡(luò)接入帶寬比較大,而出口帶寬比較小,訪問的速度無法提升,在業(yè)務(wù)高峰期時,用戶訪問數(shù)據(jù)中心的體驗感下降,這種網(wǎng)絡(luò)模型已經(jīng)不適應(yīng)現(xiàn)今數(shù)據(jù)中心的發(fā)展需要。

服務(wù)器虛擬化帶來的虛擬機遷移問題

但隨著數(shù)據(jù)量的增長,數(shù)據(jù)中心運營者發(fā)現(xiàn)的服務(wù)器不夠了,當時最早做出反應(yīng)是服務(wù)器層面,服務(wù)器虛擬化趨勢越來越強,“提高服務(wù)器利用率”,“充分發(fā)揮計算資源效能”,成了當時最常聽到的聲音。隨之而來的就是服務(wù)器與網(wǎng)絡(luò)之間的關(guān)系改變了,原來網(wǎng)絡(luò)和操作系統(tǒng)緊耦合的關(guān)系被打破,變成了松耦合的關(guān)系,網(wǎng)絡(luò)不再能直接感知到操作系統(tǒng)了。而這種對應(yīng)關(guān)系上的變化又帶來了兩個層面的矛盾:

性能層面:單臺物理機上的應(yīng)用多了,或者說是虛擬機多了,單個網(wǎng)口上承載的數(shù)據(jù)流量大了,原來的鏈路不夠了;

功能層面:物理服務(wù)器不是真正的業(yè)務(wù)所在了,真正的業(yè)務(wù)在虛擬機上,但是虛擬機要在服務(wù)器上漂移,不能夠被固定在原先一個區(qū)域當中了;

在三層網(wǎng)絡(luò)架構(gòu)中,通常會將二層網(wǎng)絡(luò)的范圍限制在網(wǎng)絡(luò)接入層以下,避免出現(xiàn)大范圍的二層廣播域。這就導(dǎo)致了服務(wù)器不能隨便在不同二層域之間移動,一旦服務(wù)器遷移到其他二層域,就需要變更 IP 地址,伴隨著生產(chǎn)業(yè)務(wù)中斷。在具有網(wǎng)絡(luò)關(guān)聯(lián)性的服務(wù)器集群中甚至?xí)恳话l(fā)而動全身,相關(guān)的服務(wù)器也要跟著變更相應(yīng)的配置,影響巨大。

由于這般限制,傳統(tǒng)數(shù)據(jù)中心的三層網(wǎng)絡(luò)架構(gòu)設(shè)計根本無法滿足服務(wù)器虛擬化中更靈活的、可自定義的虛擬機遷移策略。服務(wù)器虛擬化從根本上改變了數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的需求,需求數(shù)據(jù)中心、甚至是跨數(shù)據(jù)中的網(wǎng)絡(luò)可以支持大范圍的二層域,二層網(wǎng)絡(luò)規(guī)模有多大,虛擬機才能調(diào)度、遷移有多遠。

參考文獻

https://www.cisco.com/c/zh_cn/solutions/small-business/products/routers-switches/routing-switching-primer.html

https://baike.baidu.com/item/三層網(wǎng)絡(luò)結(jié)構(gòu)

https://baike.baidu.com/item/交換技術(shù)/6335745

https://baike.baidu.com/item/路由技術(shù)

https://zh.wikipedia.org/wiki/生成樹協(xié)議

https://juejin.im/post/5c723943f265da2d943f69c1

https://www.zhihu.com/question/21327750

https://www.cnblogs.com/jmilkfan-fanguiju/p/10589744.html#_691

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論