算力網(wǎng)絡(luò),后云計(jì)算時(shí)代的決勝局

隨著云計(jì)算在各行業(yè)和領(lǐng)域的持續(xù)深入,算力需求呈現(xiàn)“量質(zhì)并重”的態(tài)勢(shì),算力供給也從集中走向分散、從單一走向多元化。首先在需求側(cè),在產(chǎn)業(yè)數(shù)字化推動(dòng)的推動(dòng)下,對(duì)算力總量的需求呈現(xiàn)爆炸式增長(zhǎng)的態(tài)勢(shì),同時(shí)科研等、AI等專業(yè)化算力需求對(duì)算力的種類和品質(zhì)提出了更高的要求。

本文來(lái)自微信公眾號(hào)“twt企業(yè)IT社區(qū)”,作者/鄭金輝。

在技術(shù)和行業(yè)發(fā)展的推動(dòng)下,云計(jì)算基礎(chǔ)設(shè)施已經(jīng)深入到各行各業(yè),已經(jīng)形成了頗具規(guī)模的基礎(chǔ)算力。同時(shí),隨著應(yīng)用和數(shù)據(jù)的持續(xù)上云,我們也迎來(lái)了所謂的后云計(jì)算的時(shí)代。在這一時(shí)期,圍繞著算力,我們又需要面對(duì)各類棘手的問(wèn)題。近期有不少客戶都在關(guān)注算力網(wǎng)絡(luò)的問(wèn)題,我們?cè)囍治鲆幌隆?/p>

一、算力的發(fā)展變化與趨勢(shì)

1、算力發(fā)展的發(fā)展趨勢(shì)

近期隨著ChatGPT的火爆網(wǎng)絡(luò),普惠型的AI已經(jīng)到來(lái)。數(shù)據(jù)、算法、算力是智能時(shí)代的三要素,這三者已經(jīng)成為推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵驅(qū)動(dòng)力,三者相互促進(jìn)。其中,算力是支撐數(shù)字化時(shí)代發(fā)展的基礎(chǔ)與核心。隨著我們走入數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)、算法、算力已經(jīng)成為推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵驅(qū)動(dòng)力。數(shù)據(jù)、算法、算力缺一不可,相互驅(qū)動(dòng)。

隨著云計(jì)算在各行業(yè)和領(lǐng)域的持續(xù)深入,算力需求呈現(xiàn)“量質(zhì)并重”的態(tài)勢(shì),算力供給也從集中走向分散、從單一走向多元化。首先在需求側(cè),在產(chǎn)業(yè)數(shù)字化推動(dòng)的推動(dòng)下,對(duì)算力總量的需求呈現(xiàn)爆炸式增長(zhǎng)的態(tài)勢(shì),同時(shí)科研等、AI等專業(yè)化算力需求對(duì)算力的種類和品質(zhì)提出了更高的要求。在供給側(cè),傳統(tǒng)集中式的算力供給模式向“云、邊、端”分散布局的分布式和泛在化方向發(fā)展,同時(shí)也呈現(xiàn)出了從單一的算力種類向多種算力差異化融合發(fā)展的趨勢(shì)。

2、算力存在的問(wèn)題

1)融合管理難:在技術(shù)發(fā)展和政策推動(dòng)下,算力多樣性快速發(fā)展,導(dǎo)致算力融合管理困難;2)發(fā)展不均衡:在數(shù)字經(jīng)濟(jì)發(fā)展不均衡的總體趨勢(shì)下,導(dǎo)致數(shù)據(jù)和應(yīng)用的算力需求和算力供給的區(qū)域性不均衡;3)靈活彈性差:算力需求的場(chǎng)景愈加豐富,穩(wěn)態(tài)算力需求之外,敏態(tài)算力需求比例加大,但應(yīng)對(duì)之策尚未成熟;4)缺總體協(xié)同:算力布局缺少規(guī)劃,節(jié)點(diǎn)之間缺少協(xié)同與調(diào)度,穩(wěn)定性和安全性差,這一點(diǎn)不只是全行業(yè)性的算力問(wèn)題,也是不少大B的算力問(wèn)題。

基于以上問(wèn)題,為了實(shí)現(xiàn)算力的融合管理、跨域共享和調(diào)度、彈性按需靈活供給,算力網(wǎng)絡(luò)應(yīng)運(yùn)而生,成為算力資源健康發(fā)展的最優(yōu)解。

二、算力網(wǎng)絡(luò)的概念和認(rèn)知

算力網(wǎng)絡(luò)的目的是通過(guò)新型網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)分散算力資源的全連接,實(shí)現(xiàn)資源的狀態(tài)化和動(dòng)態(tài)感知,通過(guò)資源管理、編排調(diào)度術(shù)實(shí)現(xiàn)資源按照業(yè)務(wù)的智能統(tǒng)籌和分配。用戶的不同業(yè)務(wù)按照實(shí)際需求獲取不同的算力類型和服務(wù)等級(jí),用戶無(wú)需關(guān)心算力的位置和實(shí)際部署環(huán)境。

這是算力網(wǎng)絡(luò)的愿景,但是業(yè)內(nèi)尚未對(duì)算力網(wǎng)絡(luò)形成統(tǒng)一認(rèn)知,也沒(méi)有標(biāo)準(zhǔn)的定義。在業(yè)內(nèi),基本有兩種認(rèn)知:

第一種,算力網(wǎng)絡(luò)主要由算、網(wǎng)以及腦三部分組成。其中,計(jì)算、網(wǎng)絡(luò)屬于基礎(chǔ)設(shè)施,基礎(chǔ)計(jì)算設(shè)施負(fù)責(zé)提供計(jì)算資源,基礎(chǔ)網(wǎng)絡(luò)設(shè)施負(fù)責(zé)連接網(wǎng)絡(luò),而腦負(fù)責(zé)全域動(dòng)態(tài)感知、跨域協(xié)調(diào)調(diào)度、多域融合編排以及智能計(jì)算出最優(yōu)協(xié)同方案。

第二種,算力網(wǎng)絡(luò)由計(jì)算、連接和感知組成。計(jì)算是算力網(wǎng)絡(luò)的核心資源;連接是將分散、異構(gòu)、多層級(jí)、閑置的算力集合起來(lái);感知是對(duì)具體場(chǎng)景算力需求的感知及算力資源的感知。

仔細(xì)分析,其實(shí)這兩種觀點(diǎn),基本一致,我們甚至可以基本勾勒出算力網(wǎng)絡(luò)的基本框架。首先大家普遍認(rèn)為,計(jì)算資源應(yīng)該是算力網(wǎng)絡(luò)的核心和基本要素,是調(diào)度、編排和管理的對(duì)象。網(wǎng)絡(luò)依然是連接的手段,連接算力需求和算力供給,連接算力資源和算力管理,連接虛擬和物理。剩下的部分就是算力管理與調(diào)度,我們暫時(shí)稱之為算力大腦吧,主要負(fù)責(zé)算力的動(dòng)態(tài)感知、融合管理、智能編排和精準(zhǔn)調(diào)度。

根據(jù)以上分析,我們基本可以畫出算力網(wǎng)絡(luò)的整體框架,底層是我們的異構(gòu)泛在的多元化計(jì)算資源,首先是技術(shù)上的異構(gòu)和產(chǎn)品上的異構(gòu),然后是計(jì)算資源的空間和邏輯上的泛在化分布,構(gòu)成了我們的算力資源層;在連接側(cè)主要是確定性網(wǎng)絡(luò)的應(yīng)用,確定性網(wǎng)絡(luò)是相對(duì)于傳統(tǒng)的盡力而為網(wǎng)絡(luò)而言的,典型的盡力而為的網(wǎng)絡(luò)就是互聯(lián)網(wǎng)。確定性網(wǎng)絡(luò)目的是為算力提供帶寬保證、時(shí)延保證,并提供高可靠性和高穩(wěn)定性,主要技術(shù)包括FlexE,TSN,DetNet和DIP等等,再結(jié)合軟件定義層與應(yīng)用側(cè)對(duì)接,這就構(gòu)成了算力網(wǎng)絡(luò)層;再往上就是算力的管理與調(diào)度,在這里需要完成算力感知、算力標(biāo)識(shí)、算力路由、算力編排、算力調(diào)度,這些算是算力管理層,這里的算力管理不只是CMP云管那么簡(jiǎn)單,更是包括了編排和調(diào)度。然后除了算力管理,我們還需要關(guān)注算力運(yùn)營(yíng),比如算力計(jì)量、FinOps、算力運(yùn)營(yíng)、算力交易等等,算是算力運(yùn)營(yíng)層吧。套用上面的概念,算力資源層=算,算力網(wǎng)絡(luò)層=網(wǎng),算力管理層+算力運(yùn)營(yíng)層=腦,加上配套的安全體系和智能運(yùn)維體系,我們所說(shuō)的算力網(wǎng)絡(luò)框架就算齊活了。

從算力的演進(jìn)和發(fā)展來(lái)看,大致可以分成三個(gè)階段,第一階段是資源連接期,重點(diǎn)是建設(shè)異構(gòu)泛在的算力,在實(shí)現(xiàn)算力重分布的基礎(chǔ)上實(shí)現(xiàn)算力資源的異構(gòu)納管和連接;第二階段是融合運(yùn)營(yíng)期,實(shí)現(xiàn)以用戶需求和業(yè)務(wù)需求為中心的按需資源管理和運(yùn)營(yíng)體系的探索和建立;第三階段是算力的智能投送期,重點(diǎn)建設(shè)算力的智能編排和調(diào)度,實(shí)現(xiàn)算力智能投送,做到用戶和業(yè)務(wù)無(wú)感。

有人經(jīng)常讓我多畫點(diǎn)圖,我比較懶,你們自己畫吧,也許可以讓ChatGPT幫忙畫一下,哈哈哈。

三、算力網(wǎng)絡(luò)的價(jià)值

說(shuō)這么熱鬧,算力網(wǎng)絡(luò)的價(jià)值在哪兒呢?站在算力資源管理和運(yùn)營(yíng)的角度說(shuō),就是開源節(jié)流和降本增效。

首先是節(jié)流和降本,就是,算力網(wǎng)絡(luò)可以實(shí)現(xiàn)資源的跨域調(diào)度和流動(dòng),可以實(shí)現(xiàn)資源的有效利用,降低資源使用成本,進(jìn)而實(shí)現(xiàn)綠色低碳等等宏偉目標(biāo)。

然后是開源和增效,確定性網(wǎng)絡(luò)技術(shù)的使用,可以有效提升算力質(zhì)量,實(shí)現(xiàn)算力的低延時(shí)和確定性供給,這也將有效支撐產(chǎn)業(yè)側(cè)新需求和質(zhì)量算力的需求的滿足,并持續(xù)推動(dòng)產(chǎn)業(yè)側(cè)業(yè)務(wù)場(chǎng)景創(chuàng)新。

四、算力網(wǎng)絡(luò)面臨的問(wèn)題

目前階段算力網(wǎng)絡(luò)建設(shè)尚未形成統(tǒng)一的認(rèn)識(shí)和標(biāo)準(zhǔn),算力如何標(biāo)識(shí)、如何度量都沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),此二者是后續(xù)算力持續(xù)運(yùn)營(yíng)的關(guān)鍵和核心。在確定性網(wǎng)絡(luò)技術(shù)的落地和應(yīng)用上,也沒(méi)有完全實(shí)現(xiàn)商用,很多技術(shù)尚待進(jìn)一步驗(yàn)證,尚處在探索和驗(yàn)證階段。同時(shí),從多云納管到多云統(tǒng)一運(yùn)營(yíng)也需要一個(gè)實(shí)踐的過(guò)程,跨云的負(fù)載遷移和業(yè)務(wù)連續(xù)性建設(shè),也需要進(jìn)一步工程化實(shí)踐和完善。最關(guān)鍵的是,算力融合和算力編排,算力、網(wǎng)絡(luò)、應(yīng)用、調(diào)度幾個(gè)環(huán)節(jié)需要穿透,這個(gè)是一個(gè)難點(diǎn),需要場(chǎng)景化的行業(yè)需求來(lái)驗(yàn)證,需要“AI+大數(shù)據(jù)+行業(yè)經(jīng)驗(yàn)”幾個(gè)要素相結(jié)合,才能構(gòu)建與場(chǎng)景應(yīng)用相呼應(yīng)的算網(wǎng)編排體系。此外,安全和運(yùn)維方面的問(wèn)題和困難,就不在這里贅述了。

不管怎么說(shuō),算力網(wǎng)絡(luò)是算力基礎(chǔ)平臺(tái)建設(shè)的重要環(huán)節(jié),是實(shí)現(xiàn)云計(jì)算一統(tǒng)江湖的關(guān)鍵一戰(zhàn)。以運(yùn)營(yíng)商為核心的算力網(wǎng)絡(luò)生態(tài)建設(shè),是這里面的決定性因素,如何提煉和推進(jìn)業(yè)務(wù)需求與算力供給相融合的場(chǎng)景化解決方案是目前的當(dāng)務(wù)之急。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論