爭奪算力話語權(quán),云計算廠商迎來自研芯片“覺醒時刻”

近年來,以AI機器學(xué)習(xí)、大規(guī)模視頻處理、大規(guī)模數(shù)據(jù)處理等為首的高負(fù)載云計算應(yīng)用日益增多,其場景運算強度大、高并發(fā)、應(yīng)用復(fù)雜,對云計算廠商的服務(wù)質(zhì)量提出了前所未有的極高要求,并倒逼服務(wù)器芯片加速發(fā)展。

本文來自科技云報到。

近年來,以AI機器學(xué)習(xí)、大規(guī)模視頻處理、大規(guī)模數(shù)據(jù)處理等為首的高負(fù)載云計算應(yīng)用日益增多,其場景運算強度大、高并發(fā)、應(yīng)用復(fù)雜,對云計算廠商的服務(wù)質(zhì)量提出了前所未有的極高要求,并倒逼服務(wù)器芯片加速發(fā)展。

QQ截圖20221205112942.png

尤其是在“云原生”的概念提出后,傳統(tǒng)IT時代的云計算更多是為了適配當(dāng)前的IT架構(gòu),進而適配各類應(yīng)用。

可在云原生時代里,很多應(yīng)用本身就是生于云、長于云。

如何根據(jù)這些云原生應(yīng)用的需求打造更適宜其生長的土壤,成了云廠商技術(shù)變革的頭等大事。

“云土壤”的改造既涉及軟件、架構(gòu)、操作系統(tǒng),又涉及網(wǎng)絡(luò)、服務(wù)器、計算板卡,更會涉及最為核心的算力來源——芯片。

巨頭廠商扎堆云計算芯片

中國信息通信研究院發(fā)布的《云計算白皮書(2022年)》指出,隨著經(jīng)濟回暖,全球云計算市場所受影響逐步減弱,至2021年已基本恢復(fù)到疫情前的增長水平。

2021年,中國云計算總體處于快速發(fā)展階段,市場規(guī)模達(dá)3229億元,同比增長54.4%。

其中,公有云市場繼續(xù)保持較快發(fā)展,同比增長70.8%,達(dá)到2181億元,成為未來幾年中國云計算市場增長的主要動力;私有云市場突破千億元大關(guān),同比增長28.7%,增至1048億元。

QQ截圖20221205112942.png

云計算逐漸出現(xiàn)虹吸效應(yīng),并在安全性、網(wǎng)邊端形成新的服務(wù)方式。JP Morgan報告認(rèn)為,到2025年,數(shù)據(jù)中心的芯片市場價值將近180億美元。

隨著國家“十四五”規(guī)劃的推進以及新基建的投資,未來五年,中國服務(wù)器市場將保持健康穩(wěn)定的增長。

2021-2025年,中國服務(wù)器市場規(guī)模將由257.31億美元升至410.29億美元,保持12.5%的年復(fù)合增長率,服務(wù)器芯片也將迎來廣闊市場。

當(dāng)然,云計算中涉及的芯片種類繁多,各家側(cè)重點也有所不同。

比如,阿里的含光800、谷歌的TPU、以及芯片廠商英特爾的Habana Gaudi 2、英偉達(dá)的H100等,都是側(cè)重于人工智能應(yīng)用的計算芯片。

此外,近年間還有DPU、IPU、CIPU等新型數(shù)據(jù)中心處理器。

云計算芯片市場的老玩家——CPU自然也不會缺席。

目前,全球服務(wù)器芯片的架構(gòu)仍然以x86獨大,ARM與其他架構(gòu)份額較小。

根據(jù)JP Morgan的數(shù)據(jù)顯示,目前還沒有明顯跡象表明大量的數(shù)據(jù)中心開始從x86架構(gòu)轉(zhuǎn)移到ARM架構(gòu)。

預(yù)計到2025年,x86仍會是數(shù)據(jù)中心主要架構(gòu),預(yù)計仍會有90%市占率。

CPU架構(gòu)設(shè)計難度大、生態(tài)壁壘高,一直是芯片產(chǎn)業(yè)的集大成之作。然而,哪里有壟斷,哪里就有挑戰(zhàn)者。

從2008年開始,ARM就持續(xù)對服務(wù)器芯片市場發(fā)動了進攻,惠普、AMD、博通、高通等芯片設(shè)計公司都曾陸續(xù)推出相關(guān)產(chǎn)品,可惜大多折戟。

QQ截圖20221205112942.png

然而,市場并未因一時的失利而失去信心。

2018年,ARM發(fā)布ARM Neoverse計算平臺,瞄準(zhǔn)了云計算服務(wù)器、HPC、AI與機器學(xué)習(xí)加速這幾大場景。

隨后幾年里,AWS推出Graviton系列服務(wù)器CPU;Ampere Computing推出80核Ampere Altra和128核Ampere Altra Max服務(wù)器CPU;國內(nèi)廠商飛騰推出多款服務(wù)器CPU。

話語權(quán)不足

引各廠商自研芯片

由于晶圓代工及封測成本大增,AMD的EPYC服務(wù)器芯片或?qū)q價10%—30%,屆時服務(wù)器芯片的戰(zhàn)況將更趨白熱化。

無論是英特爾芯片的延遲發(fā)布,還是AMD可能的漲價,種種行為都在某種程度上剝奪著云服務(wù)廠商等下游企業(yè)的話語權(quán)和自身的發(fā)展節(jié)奏。

云廠商自研服務(wù)器芯片可以減輕對第三方供應(yīng)的依賴;另一方面是自研芯片可以降低成本,自研芯片能夠讓云服務(wù)商在每個業(yè)務(wù)流程中做到效率與成本的最優(yōu)化。

此外,自己的芯片更適合他們的某些需求,與英特爾、AMD等廠商提供的現(xiàn)成芯片相比,具有成本和性能優(yōu)勢。

構(gòu)建自家的芯片能夠在各種層次上進行更快的創(chuàng)新,提高安全性和靈活性,并提供更多價值。自研芯片可以控制項目的開始、進度和交付的進程;可以將硬件和軟件并行開發(fā),并使用大規(guī)模的云來進行構(gòu)建芯片所需的所有模擬。

在云服務(wù)上,自研芯片帶來的成本降低是巨大的。云服務(wù)頭部廠商基本定型之后,價格戰(zhàn)就成了拉攏新客戶留住老用戶的必經(jīng)之路,Arm服務(wù)器芯片帶來的高功效意味著他們可以推出定價更低的實例。

但設(shè)計能力、設(shè)計成本等多因素的取舍使得不少服務(wù)器芯片廠商開始選擇不同的技術(shù)路線,有的緊跟Arm Neoverse核心,有的則選擇了自研。

誠然是芯片獨立的需求,另一方面也來自用戶和技術(shù)。

定制自研芯片的核心目的并不是為了與傳統(tǒng)芯片廠商進行競爭,而是來自用戶自下而上的需求:性能和成本。

目前,對于計算場景的應(yīng)用復(fù)雜程度已經(jīng)倒逼芯片處理性能的提升。多重負(fù)載,尤其是在機器學(xué)習(xí)方面,芯片性能直接制約了算法的應(yīng)用。

非常規(guī)芯片正成為算力不斷變化和競爭壓力下的選擇,通用的CPU和GPU難以滿足。

因此不少云廠商選擇在與芯片廠商合作的同時,開始根據(jù)自己特定的需求自研芯片,以達(dá)到最高程度的適配,從而提升整體的競爭實力。

QQ截圖20221205112942.png

自研云計算芯片

成下一個爆發(fā)點

過去的十年間,信息的生成、處理和存儲方式發(fā)生了根本性的轉(zhuǎn)變。

面對互聯(lián)網(wǎng)高速發(fā)展的業(yè)務(wù),急劇增長的用戶,脈沖流量讓傳統(tǒng)的IOE(IBM小型機、Oracle數(shù)據(jù)庫、EMC存儲)技術(shù)架構(gòu)捉襟見肘,解決算力不足的問題幾乎只能靠擴大采購規(guī)模,搭建一套全新的技術(shù)架構(gòu)才是最優(yōu)解。

十多年前的云計算公司,最重要的任務(wù)是擴大數(shù)據(jù)中心的規(guī)模,自研芯片有些遙不可及。

但有遠(yuǎn)見和抱負(fù)的云計算公司,那時起就邁上了通過自研解決問題的長路,從自己擅長的操作系統(tǒng)起步。

如今,云計算巨頭們的核心目標(biāo)已經(jīng)不再是業(yè)務(wù)擴張的速度,深入底層技術(shù),提高更具性價比和滿足差異化的需求成為新的目標(biāo)。

此時,AWS、阿里云等全球領(lǐng)先的云計算巨頭們又不約而同地將目光投向了能夠提升云計算性價比的云原生CPU。

在2022杭州云棲大會上,阿里巴巴公布了自研算力體系新進展,其自研CPU倚天710已經(jīng)在數(shù)據(jù)中心大規(guī)模部署,并以云的形式服務(wù)阿里巴巴和多家互聯(lián)網(wǎng)科技公司,算力性價比提升超30%,單位算力功耗降低60%,成為中國首個云上大規(guī)模應(yīng)用的自研CPU,實現(xiàn)算力攻堅重大突破。

未來2年,阿里云20%的新增算力將使用自研CPU。

QQ截圖20221205112942.png

從芯片架構(gòu)來看,倚天710基于最新的ARMv9架構(gòu),內(nèi)含128核CPU,主頻最高達(dá)到3.2GHz,能夠同時兼顧性能和功耗。

基于倚天710的云計算實例在數(shù)據(jù)庫、大數(shù)據(jù)、視頻編解碼、AI推理等核心場景中的性價比提升30%以上,單位算力功耗(耗電量)降低了60%以上。

百度Apollo在近日舉行的Apollo Day技術(shù)開放日上,推出了新一代自研的云端通用芯片——昆侖芯二代AI芯片。

據(jù)了解,這顆芯片基于7nm工藝打造,配備GDDR6高速顯存,內(nèi)存帶寬可達(dá)512GB/s,采用新一代昆侖芯XPU-R架構(gòu),通用性和性能顯著提升。

目前,該芯片已完成無人駕駛場景端到端適配。

QQ截圖20221205112942.png

在2018年,亞馬遜云科技發(fā)布了Arm架構(gòu)的Amazon Graviton處理器。

這是亞馬遜云科技自研、為云計算而設(shè)計開發(fā)的芯片。

2020年Graviton2發(fā)布,性能比第一代提升了7倍;2021年推出了第三代,性能比二代提升四分之一,浮點計算性能提高了兩倍。

今年,在re:Invent 2022大會上,亞馬遜云科技發(fā)布了Graviton3E。

這是針對高性能計算優(yōu)化的版本,面向機器學(xué)習(xí)浮點和矢量數(shù)學(xué)計算做了優(yōu)化,在HPL基線測試中,工作負(fù)載的性能提高35%。

基于Graviton3E芯片,亞馬遜云科技推出了面向高性能計算的HPC7g,適用于天氣預(yù)報、生命科學(xué)、工程計算等高性能計算場景,最多可以提供64個vCPU和128GiB內(nèi)存。

QQ截圖20221205112942.png

亞馬遜云科技是云廠商自研芯片的重要代表,大型云服務(wù)商為了實現(xiàn)差異化基礎(chǔ)設(shè)施服務(wù),都在向上游延伸。

該公司還推出新一代Nitro網(wǎng)絡(luò)芯片和Inferentia2機器學(xué)習(xí)加速推理芯片,均為專用芯片:Nitro網(wǎng)絡(luò)芯片用途接近近年流行的“DPU(數(shù)據(jù)處理器)”,用于處理海量數(shù)據(jù);Inferentia2用于運行大型深度學(xué)習(xí)模型,滿足AI計算需求。

當(dāng)算力作為新生產(chǎn)力的確定性被不斷驗證,以阿里云、AWS為代表的云計算企業(yè),正努力將對算力的主動性,牢牢掌握在自己手中。

因為他們深知,隨著新一輪科技變革的深入發(fā)展,只有掌握了核心技術(shù),才能抓住未來技術(shù)的定義權(quán)。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論