本文來自微信公眾號“云數(shù)智觀察”,作者/濤哥。
科技部新一代人工智能發(fā)展研究中心發(fā)布的《中國人工智能大模型地圖研究報告》顯示,我國已經(jīng)發(fā)布了79個參數(shù)規(guī)模超過10億的大模型,“百模大戰(zhàn)”一觸即發(fā)。大模型不僅帶來了新場景、新業(yè)態(tài),而且對算力提出了極高的要求,不僅要快,更要多樣化。為AI訓(xùn)練、AI推理、數(shù)值模擬等不同應(yīng)用提供不同的算力,實現(xiàn)多種計算類型的全覆蓋已是大勢所趨。
其實,大模型風暴只是算力革命的“冰山一角”。隨著企業(yè)數(shù)字化轉(zhuǎn)型逐步深入,以及云原生應(yīng)用的快速興起,應(yīng)用場景的多樣化直接推動了算力多元化不斷加劇升級,從虛擬化、云主機、裸金屬到容器再到Serverless……云基礎(chǔ)架構(gòu)的升級換代面臨前所未有的挑戰(zhàn)。
你是繼續(xù)容忍斷代式升級的方式,還是直接擁抱可進化的模式,這個問題變得像哈姆雷特喊出的“生存還是毀滅”一樣嚴峻和值得深思熟慮。
兼顧歷史,面向未來
回顧IT基礎(chǔ)架構(gòu)的演進,從上個世紀90年代開始的硬件單體架構(gòu)的徹底拆分,到之后x86架構(gòu)的虛擬化,再到云計算,在云原生之前,云上的算力基本比較單一。而在這之后,隨著以容器、Kubernetes等為代表的云原生的快速崛起,就像是為算力打開了一瀉千里的閘門,多元化、新興的算力層出不窮,金屬裸機、虛機、容器、Serverless、FaaS、大模型等算力并存、交織、共同演進。
算力發(fā)展的多元化主要表現(xiàn)為由計算場景多元化激發(fā)的算力需求多樣化、算力來源多樣化、算力品牌多樣化……由于質(zhì)的飛躍,在公有云上支持多元化算力可以說是水到渠成,不費吹灰之力。然而對于演進速度相對較慢的私有云來說,算力多元化卻還是橫亙在很多用戶面前的一道高門檻,平滑升級就是第一個難關(guān)。
舉例來說,以前我們在PC機上用的網(wǎng)銀,它就是基于微服務(wù)架構(gòu)開發(fā)的,而現(xiàn)在更多的人選擇手機銀行,這意味著應(yīng)用架構(gòu)要重新寫。如果給你一個選擇,在原來的微服務(wù)架構(gòu)基礎(chǔ)上修修補補,或是干脆采用全新的云原生架構(gòu)進行開發(fā),你會怎么選擇?雖然心知肚明,云原生是最理想的方式,但可能很多人還是會猶豫。為什么?
歷史的包袱真的想甩就能輕松甩掉嗎?傳統(tǒng)上,IT基礎(chǔ)架構(gòu)的構(gòu)建方式就是自上而下,根據(jù)應(yīng)用的需求匹配相應(yīng)的計算、存儲、網(wǎng)絡(luò)等資源,這樣在特定時間點、特定應(yīng)用需求下打造的架構(gòu)或系統(tǒng),注定是資源與應(yīng)用緊緊綁定的一個個“孤島”。
孤島是現(xiàn)實存在,只要傳統(tǒng)的系統(tǒng)構(gòu)建、部署和應(yīng)用方式不變,孤島就會一直延續(xù),而且會越積越多,直到積重難返。以前,在工作負載的種類、數(shù)量都相對較少的情況下,這種應(yīng)用與系統(tǒng)“1對1”的構(gòu)建方式還能比較快地滿足用戶上線新應(yīng)用的需求,但隨著工作負載越來越多,應(yīng)用上線的窗口期越來越短,用戶的資源供給能力和人力就會頻繁出現(xiàn)缺口。而且面對一個個的孤島,管理和統(tǒng)一操作也變得十分復(fù)雜,提升效率和降低成本都成了麻煩事。按照傳統(tǒng)方式,系統(tǒng)的擴展表面看上去會比較簡單,就是一個系統(tǒng)一個系統(tǒng)簡單地疊加。但是到后期,系統(tǒng)數(shù)量變成不可承受之重時,再想從底層架構(gòu)改起,難度可想而知,陣痛也會更強烈。
對于很多用戶來說,系統(tǒng)的擴展升級從來都不是一件易事。歷史上,每一次技術(shù)架構(gòu)的變遷都是一次“割接”,相當于推倒重來,包括從單體架構(gòu)到分布式、從分布式到微服務(wù)、從ON CLOUD到IN CLOUD的轉(zhuǎn)變,無一例外。這對于用戶業(yè)務(wù)的發(fā)展將產(chǎn)業(yè)重大的影響,必須妥善處置。
從大型機到x86的割接式改變,就是我們所說的斷代式的升級,但這畢竟是硬件上的一次“改頭換面”,斷代式升級雖是無奈之舉,但似乎也沒有其他更好的辦法。然而之后的從虛擬化到云再到云原生的升級,硬件已經(jīng)“統(tǒng)一”,軟件也有了可進化的持續(xù)平滑升級的可能性,如果再采用斷代式升級的方法,無異于走“回頭路”。
在算力多元化的背景下,云基礎(chǔ)架構(gòu)的升級是斷代式的,還是依托一個可持續(xù)進化的、一勞永逸的云平臺,不言自明。當今時代,在市場不確定性不斷增加的情況下,可進化的云平臺其實是為用戶提供了一個確定性的選擇。你或許不知道未來新技術(shù)會如何變化,算力還會有多少“花樣”,“兼顧歷史、面向未來”的可進化云平臺都能讓你泰然處之、持續(xù)前進。
統(tǒng)一平臺+均衡性設(shè)計
無論是老牌的虛擬化廠商VMware,還是新晉的私有云專家EasyStack,在云原生可進化這件事上思路不謀而合,先建立云原生的底座,然后在上面不斷增加服務(wù)。為滿足算力多元化的需求,云計算基礎(chǔ)架構(gòu)在用戶層面,要能實現(xiàn)應(yīng)用、管理與運維的統(tǒng)一,在產(chǎn)品層面,則要實現(xiàn)功能、場景和品控的統(tǒng)一,更重要的是,實現(xiàn)開發(fā)、測試、迭代升級的統(tǒng)一。
并不是每個廠商都能輕松滿足上述“三大統(tǒng)一”的要求。很多廠商只能單擺浮擱地為不同的場景提供相對應(yīng)的算力平臺,卻不具備均衡性架構(gòu)設(shè)計的能力,導(dǎo)致在可進化這個最核心的問題上會打折扣,或根本無法實現(xiàn)。
以EasyStack為例,它在提出可進化的數(shù)字化基礎(chǔ)設(shè)施之前,也曾經(jīng)歷過糾結(jié)掙扎、不斷的試錯,以及持續(xù)的演進。在如今的可進化架構(gòu)成型之前,僅大的核心級的升級EasyStack就有過4次。從硬件到虛擬化到容器,這是一個漸進的過程。EasyStack的平臺在V4、V5版時,最初只支持虛擬化,現(xiàn)在不僅CPU、GPU、NPU等全覆蓋,而且還提供封裝接口,從而更好地支持其上的各項云服務(wù)。更重要的是,在這個演進的過程中,EasyStack持續(xù)將開源技術(shù)的能力,通過工程化的方式,源源不斷地輸入和集成到現(xiàn)有的商用平臺上,為多元算力提供穩(wěn)定、可靠、安全的支撐。
EasyStack新一代可進化的云平臺,不僅可以同時支持裸金屬、云主機、Kubernetes容器集群以及多種容器的運行,而且可以提供與不同算力相適合的容量型或高性能的云存儲、統(tǒng)一的多VPC SDN網(wǎng)絡(luò),以及統(tǒng)一的監(jiān)控、日志和運維服務(wù)等。此即架構(gòu)的均衡性設(shè)計,就是在基礎(chǔ)架構(gòu)層面,計算、存儲、監(jiān)控、網(wǎng)絡(luò)、安全等各種能力不僅要全,更要均衡匹配,還要彼此打通,不會有“短板”,并且可以按需組合、隨需應(yīng)變,滿足當前和未來擴展的需要??梢韵胍?,針對單獨一種算力實現(xiàn)架構(gòu)的均衡性設(shè)計已經(jīng)很難,在算力多元化的情況下,工作量和復(fù)雜程度將是呈幾何級數(shù)增加的。
針對多元算力,EasyStack新一代可進化云平臺之所以能夠信手拈來,關(guān)鍵還在于其平臺與云服務(wù)的分離式設(shè)計。輕量級的統(tǒng)一的數(shù)字原生引擎EOS,與多樣化的云服務(wù)相結(jié)合,能夠靈活滿足從中小規(guī)模到超大規(guī)模云的私有化部署所需,無論是虛擬化、裸金屬算力,還是云原生、AI算力需求,都能無縫擴展響應(yīng),且無需采購多套平臺、多套軟件。
如今,“一云多芯”成了信創(chuàng)云的一個基本特征。而一云多芯本身就是算力多元化的一個典型。顧名思義,一云多芯就是基于一朵統(tǒng)一的云,同時支撐不同架構(gòu)的芯片。將這種“1對多”的模式推而廣之,“1”就代表一個可進化的平臺、云原生底座,而“多”代表多元化的算力。EasyStack要努力打造的就是這“1”個可進化的平臺。
可進化起步就是“全屋智能”
打比方來說,斷代式的升級就好像是人們對房屋進行裝修時,從毛坯房到精裝修的過程;而漸進式的升級,則像是在基本裝修的基礎(chǔ)之上,不斷增加一些帶有智能化功能的家居設(shè)備,只不過在增加的過程中,可能會受限于原有房屋的裝修風格,對比IT系統(tǒng)的演進,就是IT基礎(chǔ)架構(gòu)不變,只是在上面“零打碎敲”;而可進化的升級方式,起步就是全屋智能,無論未來再有任何新的變化,都能輕松融入整體氛圍和功能,實現(xiàn)智能化的不斷升級。
經(jīng)過上述對比,你可能會更清楚,在什么情況下,選擇何種升級方式才是最適合、最明智的??蛇M化的架構(gòu)所要作的就是彌補現(xiàn)代化應(yīng)用與IT基礎(chǔ)架構(gòu)發(fā)展不同步所產(chǎn)生的Gap。對于基礎(chǔ)架構(gòu)平臺廠商來說,支撐可進化,只擁有單一的技術(shù)強項是不行的,必須首先解決資源要素“全”的問題,既要有完整的技術(shù)堆棧,又能實現(xiàn)均衡設(shè)計,同時還要保持開放性,實現(xiàn)基礎(chǔ)架構(gòu)的完全解耦,這樣才能保持基礎(chǔ)架構(gòu)不斷向前演進,而且具有先進性。
每當有新的技術(shù)、新的需求出現(xiàn),在架構(gòu)和平臺不改變的情況,就能輕松支持、納管,這就是可進化架構(gòu)的核心價值所在。作為云操作系統(tǒng)廠商,EasyStack以純軟件定義的方案,提供統(tǒng)一的一套API,基于“小內(nèi)核+多組件”的理念和架構(gòu),實現(xiàn)了所有場景可編程、可靈活組合,充分詮釋了什么才是云平臺的可進化。EasyStack從始至終都專注于基礎(chǔ)設(shè)施,也就是基礎(chǔ)設(shè)施平臺及其相關(guān)聯(lián)的基礎(chǔ)能力,包括多元化的算力,以及云存儲、云網(wǎng)絡(luò)、API、安全、操作系統(tǒng)、自動化能力等。
針對中國企業(yè)客戶而言,新型算力不斷增加是常態(tài),穩(wěn)態(tài)業(yè)務(wù)與敏態(tài)業(yè)務(wù)長期共存是現(xiàn)實需求,只有可進化的架構(gòu),才能有效應(yīng)對多元化算力的爆發(fā)。