“新基建”、“東數(shù)西算”、新型數(shù)據(jù)中心、“雙碳”戰(zhàn)略……從2020年至2021年,為匹配“十四五”期間以數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展推動(dòng)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展的總路線,一系列頂層設(shè)計(jì)相繼出臺(tái),將我國(guó)數(shù)據(jù)中心產(chǎn)業(yè)從高速發(fā)展推向了高質(zhì)量發(fā)展的新階段。相應(yīng)地,數(shù)據(jù)中心的建設(shè)模式也在發(fā)生急劇變化。
數(shù)據(jù)中心作為數(shù)字經(jīng)濟(jì)的核心基礎(chǔ)設(shè)施,隨著新一代信息技術(shù)快速發(fā)展并深度融入千行百業(yè)數(shù)字化轉(zhuǎn)型進(jìn)程,企業(yè)及組織數(shù)據(jù)資源存儲(chǔ)、計(jì)算和應(yīng)用的需求大幅提升,傳統(tǒng)數(shù)據(jù)中心正加速與云、網(wǎng)融合發(fā)展,加快向新型數(shù)據(jù)中心/一體化大數(shù)據(jù)中心演進(jìn)。
按照工信部《新型數(shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃(2021-2023年)》中的定義,新型數(shù)據(jù)中心是以支撐經(jīng)濟(jì)社會(huì)數(shù)字轉(zhuǎn)型、智能升級(jí)、融合創(chuàng)新為導(dǎo)向,以5G、工業(yè)互聯(lián)網(wǎng)、云計(jì)算、人工智能等應(yīng)用需求為牽引,匯聚多元數(shù)據(jù)資源、運(yùn)用綠色低碳技術(shù)、具備安全可靠能力、提供高效算力服務(wù)、賦能千行百業(yè)應(yīng)用的新型基礎(chǔ)設(shè)施,具有高技術(shù)、高算力、高能效、高安全的特征。
以終為始倒推,新時(shí)期的新型數(shù)據(jù)中心該怎么建設(shè)呢?在目前主流的兩種數(shù)據(jù)中心建設(shè)模式中,超融合模式的呼聲日漸升高。IDC的調(diào)查報(bào)告顯示,有67%的企業(yè)受訪者考慮或正在使用超融合構(gòu)建數(shù)據(jù)中心。Gartner的調(diào)研數(shù)據(jù)也顯示,2023年將有70%的政府和企業(yè)采納超融合基礎(chǔ)機(jī)構(gòu)。
數(shù)據(jù)中心兩種建設(shè)方式,超融合占據(jù)半壁江山
當(dāng)前,數(shù)據(jù)中心一般有兩種建設(shè)模式。
第一種是傳統(tǒng)模式,即計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)分層建設(shè)。這種模式的優(yōu)勢(shì)是架構(gòu)清晰,便于分開采購(gòu),避免廠商綁定。存在的問題是擴(kuò)展困難,運(yùn)維復(fù)雜,廠商間責(zé)任界面不清晰。特別是隨著企業(yè)業(yè)務(wù)上云加速數(shù)字化轉(zhuǎn)型后,這種模式的弊端更加凸顯。
第二種是超融合數(shù)據(jù)中心模式,即在同一套單元設(shè)備內(nèi)融合計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)等資源,模塊化橫向擴(kuò)展形成統(tǒng)一的資源池。超融合并非新的概念,十年前針對(duì)傳統(tǒng)數(shù)據(jù)中心建設(shè)中的種種問題,超融合模式就被提出來,并在應(yīng)用中不斷進(jìn)化。在這種模式下,硬件基礎(chǔ)設(shè)施的選擇和組合難度大幅下降,而且企業(yè)也不需要一開始就不現(xiàn)實(shí)地規(guī)劃3~5年的IT需求,而是可以以較小的投資開啟數(shù)據(jù)中心的建設(shè),后期根據(jù)需求逐步擴(kuò)展。
眼下,企業(yè)數(shù)字化轉(zhuǎn)型加速,業(yè)務(wù)的敏捷創(chuàng)新成為企業(yè)發(fā)展的關(guān)鍵,同時(shí)“雙碳”戰(zhàn)略下IT資源的集約化發(fā)展以及綠色節(jié)能成為強(qiáng)需求,超融合基礎(chǔ)設(shè)施憑借敏捷彈性、資源高效、管理極簡(jiǎn)等特征,越來越成為企業(yè)部署數(shù)據(jù)中心的重要選擇。
超融合不只適合中小數(shù)據(jù)中心,商業(yè)數(shù)據(jù)中心也是主戰(zhàn)場(chǎng)
提起超融合,大家可能有一個(gè)誤解,覺得它只能用于構(gòu)建中小數(shù)據(jù)中心,不適合建設(shè)大型數(shù)據(jù)中心。的確,對(duì)于中小數(shù)據(jù)中心,超融合是主流選擇,但這并不意味著超融合不能建設(shè)大型數(shù)據(jù)中心。
從技術(shù)架構(gòu)上看,超融合包含四個(gè)部分,即分布式存儲(chǔ)、計(jì)算虛擬化、網(wǎng)絡(luò)虛擬化和運(yùn)維管理平臺(tái)。這其中分布式存儲(chǔ)和計(jì)算虛擬化支持的規(guī)模取決與廠商的軟件能力,目前主流廠商提供上千節(jié)點(diǎn)的支持能力并不鮮見(VM的vSAN之所以限定在64節(jié)點(diǎn),更多的是一種商業(yè)考慮而非技術(shù)約束)。網(wǎng)絡(luò)虛擬化(SDN)則更是為大型數(shù)據(jù)中心所生,一般中小型數(shù)據(jù)中心反而很難應(yīng)用SDN的能力。唯一的瓶頸在于運(yùn)維管理平臺(tái),對(duì)于大型數(shù)據(jù)中心除了普通的設(shè)備管理和日常運(yùn)維,更重要的是服務(wù)提供,因而這部分能力隨著運(yùn)維管理平臺(tái)發(fā)展成為私有云管平臺(tái)也能得到解決。
既然超融合支持大型數(shù)據(jù)中心不是一個(gè)技術(shù)問題,那么為什么現(xiàn)實(shí)中確實(shí)不少大型數(shù)據(jù)中心沒有選擇超融合模式呢?本質(zhì)上是由于大型數(shù)據(jù)中心(除互聯(lián)網(wǎng)數(shù)據(jù)中心之外)大部分都是投資驅(qū)動(dòng),屬于筑巢引鳳的模式。這種模式下客戶最關(guān)注的反而不是業(yè)務(wù),而是采購(gòu)如何合規(guī),避免廠商綁定。計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)分層建設(shè)的傳統(tǒng)模式能夠很好的拆分出不同的標(biāo)包,更符合采購(gòu)的原則。
當(dāng)然,隨著企業(yè)數(shù)字化的迅猛發(fā)展,越來越多的商業(yè)組織開始構(gòu)建大型的數(shù)據(jù)中心。在商業(yè)組織的選項(xiàng)里,從中小數(shù)據(jù)中心逐步成長(zhǎng)出來大型數(shù)據(jù)中心自然是最符合業(yè)務(wù)邏輯的選擇,這也是為什么超融合數(shù)據(jù)中心在商業(yè)市場(chǎng)、關(guān)心性價(jià)比的市場(chǎng)更受歡迎的原因。Gartner在最新的報(bào)告中提出戰(zhàn)略預(yù)測(cè),到2027年60%的超融合將平均分布在托管數(shù)據(jù)中心、云端和邊緣,而2021年這一比例則不到30%。這表明,超融合將快速?gòu)闹行?shù)據(jù)中心擴(kuò)展到大型商業(yè)數(shù)據(jù)中心的更多場(chǎng)景。
“雙碳”疊加“東數(shù)西算”,超融合架構(gòu)迎來重大機(jī)遇
除了商業(yè)驅(qū)動(dòng)外,國(guó)家政策也為超融合架構(gòu)成為新型數(shù)據(jù)中心主流選擇“添了一把火”,使得地方政府在投資新型數(shù)據(jù)中心/一體化大數(shù)據(jù)中心時(shí),必須更加重視超融合架構(gòu)帶來的高能效、高安全等特性。
“30·60”碳目標(biāo)不僅是中國(guó)對(duì)世界的責(zé)任承諾,更是中國(guó)經(jīng)濟(jì)轉(zhuǎn)型升級(jí)的內(nèi)生邏輯。數(shù)據(jù)中心是電網(wǎng)大負(fù)載和能源大用戶,超大規(guī)模數(shù)據(jù)中心通常需要100-150兆瓦的電網(wǎng)容量,國(guó)際上正在建設(shè)的超大規(guī)模數(shù)據(jù)中心已經(jīng)達(dá)到300兆瓦,未來設(shè)施的平均容量還將繼續(xù)擴(kuò)大。2019年,全球數(shù)據(jù)中心和數(shù)據(jù)傳輸網(wǎng)絡(luò)用電量占全球用電量的2%左右,我國(guó)數(shù)據(jù)中心也占到全國(guó)用電量的2%左右,且這一比例還在繼續(xù)提高,面向未來綠色低碳勢(shì)在必行。
國(guó)家“東數(shù)西算”的提出,進(jìn)一步明確要在數(shù)據(jù)中心布局、網(wǎng)絡(luò)、電力、能耗、算力、數(shù)據(jù)等方面進(jìn)行統(tǒng)籌規(guī)劃,建設(shè)集約化的新型數(shù)據(jù)中心,提升數(shù)據(jù)中心的能效,構(gòu)建國(guó)家算力網(wǎng)絡(luò)體系,這不僅是助力雙碳目標(biāo)達(dá)成的重要舉措,也是對(duì)新型數(shù)據(jù)中心發(fā)展關(guān)鍵指標(biāo)提出的明確要求。
超融合架構(gòu)憑借在部署、管理和升級(jí)方面的極簡(jiǎn),在擴(kuò)展性、靈活性方面的先天優(yōu)勢(shì),以及繼承于企業(yè)存儲(chǔ)的高安全、高可靠能力,與新型數(shù)據(jù)中心要求的高技術(shù)、高算力、高能效、高安全特征高度匹配,使其成為新型數(shù)據(jù)中心建設(shè)的一種重要技術(shù)選擇,迎來重大發(fā)展機(jī)遇。
超融合“上位”大型數(shù)據(jù)中心,也面臨諸多挑戰(zhàn)
當(dāng)然不可否認(rèn)的是,“傳統(tǒng)”超融合在建設(shè)中大型數(shù)據(jù)中心也遇到了很多挑戰(zhàn)。
首先,超融合的建設(shè)模式,一般是整體建設(shè),計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)通過軟件集成為一整套解決方案,由單一廠商來提供。這在大型數(shù)據(jù)中心的采購(gòu)、建設(shè)中,往往會(huì)面臨著廠商綁定、采購(gòu)合規(guī)的質(zhì)疑。
其次,超融合節(jié)點(diǎn)一般選擇通用服務(wù)器,存算比是固定的,這樣就會(huì)出現(xiàn)在數(shù)據(jù)中心出現(xiàn)能力瓶頸需要擴(kuò)充時(shí)出現(xiàn)僵化浪費(fèi)現(xiàn)象。比如只需要擴(kuò)展算力時(shí),存儲(chǔ)也隨著擴(kuò)展;只需要擴(kuò)展存儲(chǔ)時(shí),算力也聯(lián)動(dòng)擴(kuò)展,由此帶來不必要的投資浪費(fèi)。
最后,超融合目前一般只支持塊存儲(chǔ),但是數(shù)據(jù)中心的存儲(chǔ)越來越多的需求來自于非結(jié)構(gòu)化的文件、對(duì)象和大數(shù)據(jù)存儲(chǔ)。此外一些新的技術(shù)應(yīng)用,如AI、大數(shù)據(jù)、容器、區(qū)塊鏈等,超融合的支持度也并不理想。
內(nèi)涵和外延全面升級(jí),超融合已然進(jìn)化
機(jī)遇與挑戰(zhàn)并存之下,面向中大型數(shù)據(jù)中心場(chǎng)景,適應(yīng)新型數(shù)據(jù)中心建設(shè)要求,超融合的內(nèi)涵和外延迎來全面升級(jí),計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、平臺(tái)、管理、架構(gòu)、節(jié)能各方面能力已然進(jìn)化。
首先,計(jì)算從單一的通用算力走向多樣化算力融合。應(yīng)用的多元化要求算力的多元化,傳統(tǒng)數(shù)據(jù)中心只支持通用x86算力,面向AI應(yīng)用,信創(chuàng)場(chǎng)景等,數(shù)據(jù)中心必須有多種算力并存,這要求新的超融合架構(gòu)應(yīng)該既能支持通用的x86超融合集群,又有支持AI場(chǎng)景的GPU超融合集群,還要有針對(duì)信創(chuàng)場(chǎng)景的全國(guó)產(chǎn)化的超融合集群,以滿足各種數(shù)據(jù)中心的應(yīng)用場(chǎng)景。
第二,存儲(chǔ)從結(jié)構(gòu)化塊走向海量的非結(jié)構(gòu)化數(shù)據(jù)。傳統(tǒng)超融合只支持分布式塊存儲(chǔ),隨著大數(shù)據(jù)時(shí)代的到來,非結(jié)構(gòu)化數(shù)據(jù)成為數(shù)據(jù)中心的主流,新一代超融合技術(shù)應(yīng)當(dāng)在當(dāng)前分布式塊的基礎(chǔ)上,增加分布式文件、對(duì)象和HDFS的能力,通過結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)共管甚至共池,一方面能夠更好的滿足數(shù)據(jù)中心的業(yè)務(wù)需求,另一方面也能通過統(tǒng)一存儲(chǔ)池,消除數(shù)據(jù)孤島,降低基礎(chǔ)設(shè)施建設(shè)成本。
第三,網(wǎng)絡(luò)從通用網(wǎng)絡(luò)走向高通量網(wǎng)絡(luò)。新型數(shù)據(jù)中心將越來越多的承載數(shù)據(jù)密集型應(yīng)用,這類應(yīng)用普遍具有單次任務(wù)涉及的數(shù)據(jù)量大,任務(wù)執(zhí)行過程中涉及的數(shù)據(jù)交互多,以及數(shù)據(jù)類型復(fù)雜,涉及大量非結(jié)構(gòu)化數(shù)據(jù)等特點(diǎn),傳統(tǒng)超融合的通用網(wǎng)絡(luò)已經(jīng)無法滿足。以高通量NoF+網(wǎng)絡(luò),數(shù)據(jù)直通技術(shù)和多協(xié)議互通技術(shù)為代表的網(wǎng)絡(luò)能力,成為對(duì)新一代超融合的關(guān)鍵要求。
第四,平臺(tái)從虛擬化平臺(tái)走向虛擬化、容器和裸金屬平臺(tái)共生。超融合自誕生之日就和虛擬化相伴,以至于在很多客戶心目中,選擇超融合就等于選擇了虛擬化。隨著容器技術(shù)的興起,虛擬化不再成為必選,很多客戶在構(gòu)建容器應(yīng)用時(shí)都選擇了直接基于裸金屬服務(wù)器部署。但是容器缺乏對(duì)于資源的良好管理,安全性始終是一個(gè)問題,尤其是大量有狀態(tài)應(yīng)用的容器化,數(shù)據(jù)需要進(jìn)行持久化。新一代超融合必須將虛擬化和容器的能力結(jié)合起來,既保持容器的輕量化和低資源消耗,又能利用虛擬化進(jìn)行計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)資源的管理能力。而且從長(zhǎng)遠(yuǎn)來看,傳統(tǒng)的基于虛機(jī)的應(yīng)用和新興的云原生的應(yīng)用在相當(dāng)長(zhǎng)的一段時(shí)間能仍然會(huì)并存。
第五,管理從一個(gè)中心走向多中心、中心和邊緣共管。數(shù)據(jù)中心越來越難以獨(dú)立的形式建設(shè),“東數(shù)西算”就是一個(gè)典型的多數(shù)據(jù)中心場(chǎng)景——東部的數(shù)據(jù)中心承擔(dān)實(shí)時(shí)的低時(shí)延業(yè)務(wù),西部的數(shù)據(jù)中心承接數(shù)據(jù)密集型的分析型業(yè)務(wù),數(shù)據(jù)要在數(shù)據(jù)中心之間流動(dòng),多個(gè)數(shù)據(jù)中心需要統(tǒng)一管理。因此,新一代的超融合數(shù)據(jù)中心,支持多數(shù)據(jù)中心、數(shù)據(jù)中心和分支的共管以及數(shù)據(jù)流動(dòng)將成為必然趨勢(shì)。
第六,架構(gòu)從以計(jì)算為中心走向以數(shù)據(jù)為中心的全融合架構(gòu)。超融合的硬件基礎(chǔ)設(shè)施是通用服務(wù)器,物理上存算配比是固定的,如果進(jìn)行水平擴(kuò)展的話,存在資源浪費(fèi),這要求超融合節(jié)點(diǎn)也應(yīng)當(dāng)區(qū)分計(jì)算密集型、存儲(chǔ)密集型和均衡型,按照業(yè)務(wù)需求來選擇不同類型的超融合節(jié)點(diǎn)。另外,虛擬化和分布式存儲(chǔ)軟件對(duì)于資源的額外占用一直為客戶詬病,因此通過DPU卡卸載虛擬化和存儲(chǔ)軟件,讓客戶真正能夠回歸業(yè)務(wù)本質(zhì),組合計(jì)算資源、存儲(chǔ)和網(wǎng)絡(luò)資源,實(shí)現(xiàn)以數(shù)據(jù)為中心的全融合,正成為新一代超融合架構(gòu)的選擇。
最后,節(jié)能從整體數(shù)據(jù)中心節(jié)能到單柜精準(zhǔn)節(jié)能。傳統(tǒng)的數(shù)據(jù)中心更多通過“加法”,即橫向堆積更多的機(jī)柜來提升數(shù)據(jù)中心的能力,帶來的結(jié)果是能耗隨著數(shù)據(jù)中心的規(guī)模增加而線性提升,降低能耗的唯一辦法只能是在環(huán)境上做文章,比如選擇氣溫更低,有冷卻水源的地點(diǎn)來建設(shè)數(shù)據(jù)中心。新一代超融合技術(shù)采用“乘法”的思路,即通過提升單機(jī)柜的能效,在相同資源下,能夠滿足更多算力需求,承載更多存儲(chǔ)需求,從而實(shí)現(xiàn)數(shù)據(jù)中心的能力躍升。比如,引入整柜液冷技術(shù),將傳統(tǒng)的數(shù)據(jù)中心級(jí)的液冷,精細(xì)化到單機(jī)柜的液冷,單柜內(nèi)的算力節(jié)點(diǎn)、網(wǎng)絡(luò)節(jié)點(diǎn)和存儲(chǔ)節(jié)點(diǎn)共享液冷技術(shù),通過智能調(diào)度實(shí)現(xiàn)單機(jī)柜的能效最高;又如,通過數(shù)據(jù)壓縮算法,以較少的資源,存儲(chǔ)更多的數(shù)據(jù),減少存儲(chǔ)的能耗;再如,通過引入更多閃存(同等容量的閃存盤的能耗是對(duì)應(yīng)磁盤的30%),可顯著提升存儲(chǔ)的能效。最終實(shí)現(xiàn)通過提升單機(jī)柜的能效比,實(shí)現(xiàn)整體數(shù)據(jù)中心能效比的提升。與此同時(shí),得益于高密算力節(jié)點(diǎn)和高密存儲(chǔ)節(jié)點(diǎn)的引入,數(shù)據(jù)中心的機(jī)柜數(shù)量也會(huì)大幅下降,使得數(shù)據(jù)中心建設(shè)成本以及對(duì)于自然環(huán)境的影響也會(huì)大幅下降。
綜上,通向新型數(shù)據(jù)中心的路也許有多條,但超融合一定是最重要的一條,也是技術(shù)最有優(yōu)勢(shì)的一條,值得廣大政企組織重點(diǎn)關(guān)注。特別對(duì)于傳統(tǒng)做托管數(shù)據(jù)中心的企業(yè)來說,超融合能夠做到極簡(jiǎn)運(yùn)維,易于擴(kuò)展,可使他們具備類似云商的IaaS服務(wù)能力,而不是像以前那樣就做一個(gè)“風(fēng)火水電”,把機(jī)架建好后只能通過租賃機(jī)架賺辛苦錢。同時(shí)對(duì)于那些想要搶抓“雙碳”和“東數(shù)西算”戰(zhàn)略機(jī)會(huì)的地方政府來說,超融合模式能做到單柜精準(zhǔn)的能效控制,以更細(xì)的顆粒度提升整體數(shù)據(jù)中心能效,無疑對(duì)電網(wǎng)、能源和環(huán)境都更加友好,更具成本效益。
毋庸諱言,今天的超融合已經(jīng)不再是以前的超融合,得益于計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、平臺(tái)、管理、架構(gòu)、節(jié)能等內(nèi)涵和外延的全方位提升,已經(jīng)具備了從邊緣、中小數(shù)據(jù)中心走向大型數(shù)據(jù)中心的能力,能夠服務(wù)于國(guó)家“東數(shù)西算”和“雙碳”戰(zhàn)略,引領(lǐng)新型數(shù)據(jù)中心建設(shè),并最終賦能千行百業(yè)的數(shù)字化轉(zhuǎn)型,推動(dòng)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展。