本文來(lái)自半導(dǎo)體產(chǎn)業(yè)縱橫,由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)綜合。
2024年剩余時(shí)間有望成為數(shù)據(jù)中心芯片市場(chǎng)繁忙的一年,因?yàn)楦?jìng)爭(zhēng)對(duì)手芯片制造商都在準(zhǔn)備發(fā)布新處理器。
分析師表示,AMD和英特爾預(yù)計(jì)將推出新的競(jìng)爭(zhēng)性數(shù)據(jù)中心CPU,而包括超大規(guī)模廠商和初創(chuàng)公司在內(nèi)的其他芯片制造商計(jì)劃推出新的AI芯片,以滿(mǎn)足AI工作負(fù)載不斷飆升的需求。比如英特爾在本周二確認(rèn)其用于人工智能訓(xùn)練和推理的新型Gaudi 3人工智能加速器預(yù)計(jì)將于2024年第三季度全面上市,而Meta在周三宣布其下一代人工智能推理處理器現(xiàn)已投入生產(chǎn)并已在其數(shù)據(jù)中心使用。
Omdia數(shù)據(jù)中心IT首席分析師Manoj Sukumaran表示,雖然服務(wù)器銷(xiāo)量預(yù)計(jì)將增長(zhǎng)6%,從2023年的1080萬(wàn)臺(tái)服務(wù)器出貨量增長(zhǎng)到2024年的1150萬(wàn)臺(tái),但2024年服務(wù)器收入預(yù)計(jì)將同比增長(zhǎng)59%,這表明處理器仍然是一個(gè)熱門(mén)且不斷增長(zhǎng)的市場(chǎng)。事實(shí)上,在未來(lái)五年內(nèi),服務(wù)器收入預(yù)計(jì)將增加一倍以上,到2028年達(dá)到2700億美元。
“盡管單位出貨量沒(méi)有大幅增長(zhǎng),但收入增長(zhǎng)相當(dāng)快,因?yàn)檫@些服務(wù)器內(nèi)部裝有大量芯片,因此服務(wù)器價(jià)格大幅上漲,”Sukumaran告訴Data Center Knowledge。“這對(duì)芯片供應(yīng)商來(lái)說(shuō)是一個(gè)巨大的機(jī)會(huì)。”
協(xié)處理器是熱門(mén)商品
數(shù)據(jù)中心運(yùn)營(yíng)商對(duì)“協(xié)處理器”有很大的興趣——旨在補(bǔ)充和增強(qiáng)主處理器功能的微處理器。
Sukumaran表示,傳統(tǒng)上,數(shù)據(jù)中心服務(wù)器市場(chǎng)以CPU為中心,CPU是通用服務(wù)器中最昂貴的組件。他表示,2020年只有超過(guò)11%的服務(wù)器擁有協(xié)處理器,但到2028年,預(yù)計(jì)超過(guò)60%的服務(wù)器將配備協(xié)處理器,這不僅可以提高計(jì)算能力,還可以提高效率。
Nvidia H100和AMD MI300 GPU、谷歌云張量處理單元(TPU)等協(xié)處理器以及其他定制專(zhuān)用集成電路(ASIC)很受歡迎,因?yàn)樗鼈兡軌驅(qū)崿F(xiàn)AI訓(xùn)練、AI推理、數(shù)據(jù)庫(kù)加速、網(wǎng)絡(luò)卸載和安全功能和視頻轉(zhuǎn)碼,Sukumaran說(shuō)。
分析師指出,視頻轉(zhuǎn)碼是一個(gè)使Netflix、YouTube和其他流媒體能夠優(yōu)化從電視到智能手機(jī)等不同用戶(hù)設(shè)備的視頻質(zhì)量的過(guò)程。
AMD和Intel與ARM CPU的CPU市場(chǎng)仍然利潤(rùn)豐厚。英特爾仍然是市場(chǎng)份額的領(lǐng)先者,但來(lái)自初創(chuàng)公司Ampere和其他云服務(wù)提供商的AMD和基于Arm的CPU近年來(lái)已經(jīng)削弱了英特爾的主導(dǎo)地位。
Omdia的數(shù)據(jù)顯示,雖然英特爾擁有61%的CPU市場(chǎng)份額,但AMD已經(jīng)獲得了顯著的吸引力,從2020年服務(wù)器出貨量的不到10%增長(zhǎng)到2023年的27%。Arm CPU去年占據(jù)了9%的市場(chǎng)份額。
Sukumaran表示:“過(guò)去幾年,Arm軟件生態(tài)系統(tǒng)已經(jīng)相當(dāng)成熟,Arm CPU的低功耗和高核心密度對(duì)云服務(wù)提供商很有吸引力。”
事實(shí)上,谷歌云周二宣布其首款基于Arm的CPU(稱(chēng)為Google Axion處理器)將于今年晚些時(shí)候向客戶(hù)提供。
英特爾今年的目標(biāo)是通過(guò)發(fā)布下一代服務(wù)器處理器來(lái)重新在CPU市場(chǎng)站穩(wěn)腳跟。帶有E核的全新英特爾至強(qiáng)6處理器(之前代號(hào)為“Sierra Forest”)預(yù)計(jì)將于2024年第二季度上市,專(zhuān)為需要功效和性能的超大規(guī)模企業(yè)和云服務(wù)提供商而設(shè)計(jì)。
緊隨其后的是推出帶有P核的全新Intel Xeon 6處理器,以前的代號(hào)為Granite Rapids,主打高性能。然而,AMD并沒(méi)有坐以待斃,計(jì)劃發(fā)布名為T(mén)urin的第五代EPYC CPU。
Moor Insights&Strategy副總裁兼首席分析師馬特·金博爾(Matt Kimball)表示:“AMD毫無(wú)疑問(wèn)是性能領(lǐng)先者,并且在從英特爾手中奪取市場(chǎng)份額方面表現(xiàn)出色。”幾乎所有這些都已通過(guò)超大規(guī)模企業(yè)存儲(chǔ)在云端,AMD也希望進(jìn)一步擴(kuò)大其在本地企業(yè)中的收益。2024年,從性能角度來(lái)看,您將看到英特爾在服務(wù)器端CPU方面再次具有競(jìng)爭(zhēng)力。”
芯片制造商開(kāi)始關(guān)注人工智能推理
各個(gè)垂直領(lǐng)域的公司都在競(jìng)相構(gòu)建人工智能模型,因此人工智能培訓(xùn)的規(guī)模仍然很大。但Tirias Research創(chuàng)始人兼首席分析師Jim McGregor表示,到2024年,人工智能推理芯片市場(chǎng)將開(kāi)始出現(xiàn)。
“正在向推理處理轉(zhuǎn)變,”他說(shuō)。“我們看到大量人工智能工作負(fù)載和生成式人工智能工作負(fù)載的出現(xiàn)。他們已經(jīng)訓(xùn)練了模型。現(xiàn)在,他們需要一遍又一遍地運(yùn)行它們,并且希望盡可能高效地運(yùn)行這些工作負(fù)載。因此,期待看到供應(yīng)商推出新產(chǎn)品。”
McGregor表示,Nvidia憑借其GPU在人工智能領(lǐng)域占據(jù)主導(dǎo)地位,但AMD已于12月發(fā)布了用于人工智能訓(xùn)練和推理的Instinct MI300系列GPU,推出了可行的競(jìng)爭(zhēng)產(chǎn)品。
雖然GPU甚至CPU都用于訓(xùn)練和推理,但越來(lái)越多的公司(包括高通、Amazon Web Services(AWS)和Meta等超大規(guī)模企業(yè),以及Groq、Tenstorrent和Untether AI等AI芯片初創(chuàng)公司)已經(jīng)構(gòu)建或正在開(kāi)發(fā)專(zhuān)門(mén)用于人工智能推理的芯片。分析師還表示,這些芯片更加節(jié)能。
Kimball表示,當(dāng)組織部署Nvidia H100或AMD MI300時(shí),這些GPU非常適合訓(xùn)練,因?yàn)樗鼈兒艽?,具有大量?jī)?nèi)核,并且具有高帶寬內(nèi)存,具有高性能。
“推理是一項(xiàng)更輕量級(jí)的任務(wù)。他們不需要H100或MI300的強(qiáng)大功能,”他說(shuō)。
2024年頂級(jí)數(shù)據(jù)中心芯片
以下是預(yù)計(jì)將于2024年推出的處理器列表。
AMD
AMD首席執(zhí)行官蘇姿豐在2023年第四季度財(cái)報(bào)電話會(huì)議上表示AMD計(jì)劃在2024年下半年推出下一代服務(wù)器處理器Turin。Turin基于該公司新的Zen 5核心。
“Turin是現(xiàn)有第四代EPYC平臺(tái)的直接替代品,通過(guò)添加下一代Zen 5核心、新的內(nèi)存擴(kuò)展功能和更高的核心數(shù)量,擴(kuò)展了我們的性能、效率和TCO領(lǐng)先地位,”她在會(huì)上表示財(cái)報(bào)電話會(huì)議。
目前還沒(méi)有該產(chǎn)品的具體細(xì)節(jié)。但Moor Insights&Strategy分析師Kimball表示,這款產(chǎn)品將具有重要意義。他表示:“AMD將尋求從性能和每瓦性能的角度進(jìn)一步將自己與英特爾區(qū)分開(kāi)來(lái)。”自去年12月推出以來(lái),AMD也看到了對(duì)其Instinct MI300加速器(包括MI300X GPU)的巨大需求。蘇姿豐在財(cái)報(bào)電話會(huì)議上表示,該公司計(jì)劃今年為云、企業(yè)和超級(jí)計(jì)算客戶(hù)積極提高M(jìn)I300的產(chǎn)量。
英特爾
英特爾高管計(jì)劃今年發(fā)布幾款主要芯片:Gaudi 3 AI加速器和下一代Xeon服務(wù)器處理器。
Gaudi 3將用于AI訓(xùn)練和推理,瞄準(zhǔn)企業(yè)市場(chǎng)。它的設(shè)計(jì)目的是與Nvidia和AMD的GPU競(jìng)爭(zhēng)。英特爾表示這款A(yù)I芯片將比其前身Gaudi 2提供四倍的人工智能計(jì)算能力和1.5倍的內(nèi)存帶寬。
英特爾高管補(bǔ)充道,與Nvidia的H100 GPU相比,Gaudi 3預(yù)計(jì)訓(xùn)練和推理時(shí)間將加快50%,推理能效將提高40%。
分析師金博爾表示:“這將具有巨大的節(jié)能效果和更低的價(jià)格。”
至于下一代Intel Xeon 6處理器,Sierra Forest將包括一個(gè)具有288個(gè)核心的版本,這將是業(yè)界最大的核心數(shù)量。這也是該公司首款“E-core”服務(wù)器處理器,旨在平衡性能與能源效率。
Granite Rapids是一款“P核”服務(wù)器處理器,專(zhuān)為實(shí)現(xiàn)最佳性能而設(shè)計(jì)。該公司表示,與Sapphire Rapids相比,它將為AI工作負(fù)載提供兩到三倍的性能提升。
英特爾發(fā)言人表示,Gaudi 3將于2024年第二季度向OEM供應(yīng),預(yù)計(jì)在第三季度全面上市。Sierra Forest(現(xiàn)稱(chēng)為具有E核的英特爾至強(qiáng)6處理器)預(yù)計(jì)將于2024年第二季度上市。英特爾發(fā)言人表示,Granite Rapids(現(xiàn)在稱(chēng)為帶有P核的英特爾至強(qiáng)6處理器)預(yù)計(jì)將“很快”推出。
這一消息是在英特爾去年推出第五代至強(qiáng)CPU之后發(fā)布的。
英偉達(dá)
3月中旬,英偉達(dá)宣布將于今年晚些時(shí)候開(kāi)始出貨下一代Blackwell GPU,分析師表示,這將使這家芯片巨頭能夠繼續(xù)主導(dǎo)AI芯片市場(chǎng)。
Blackwell GPU的新系列專(zhuān)為云提供商和企業(yè)而設(shè)計(jì),在單個(gè)GPU上提供20 petaflops的AI性能,使組織能夠以四倍的速度訓(xùn)練AI模型,將AI推理性能提高30倍,并使用多達(dá)25高管們表示,能效比Nvidia上一代Hopper架構(gòu)芯片高出數(shù)倍。
Nvidia還將在2024年第二季度發(fā)貨基于Hopper的H200。該公司最近宣布了新的基準(zhǔn)測(cè)試,表明它是運(yùn)行生成式人工智能工作負(fù)載的最強(qiáng)大的平臺(tái)。該公司表示,在推理700億個(gè)參數(shù)的Llama 2模型時(shí),H200的性能比H100快45%。
Ampere
去年5月,這家由英特爾前總裁Renee James領(lǐng)導(dǎo)的初創(chuàng)公司宣布了一個(gè)新的定制設(shè)計(jì)、與Arm兼容的服務(wù)器處理器系列。具有多達(dá)192個(gè)核心。該公司高管表示,該處理器名為AmpereOne,專(zhuān)為云服務(wù)提供商而設(shè)計(jì),可同時(shí)提供高性能和高能效。
AWS
AWS是與Nvidia、AMD和Intel等大型芯片制造商合作的超大規(guī)模提供商之一,并使用他們的處理器為客戶(hù)提供云服務(wù)。但他們也發(fā)現(xiàn)構(gòu)建自己的定制芯片來(lái)為自己的數(shù)據(jù)中心供電并為客戶(hù)提供云服務(wù)是有利且具有成本效益的。
AWS今年將推出Graviton4,一種用于通用工作負(fù)載的基于Arm的CPU,以及用于人工智能訓(xùn)練的Tranium2。AWS安納普爾納實(shí)驗(yàn)室產(chǎn)品和業(yè)務(wù)開(kāi)發(fā)高級(jí)總監(jiān)Gadi Hutt表示,去年,該公司還推出了第二代人工智能推理芯片Inferentia2。
“我們的目標(biāo)是為客戶(hù)提供選擇的自由,并以顯著降低的成本為他們提供高性能,”赫特說(shuō)。
Tranium2的計(jì)算能力是其首款Tranium處理器的四倍,內(nèi)存是其三倍。Hutt表示,AWS在60,000個(gè)芯片集群中使用第一個(gè)Tranium芯片,而Tranium2將在100,000個(gè)芯片集群中使用。
微軟Azure
微軟最近發(fā)布了用于人工智能和生成式人工智能任務(wù)的Microsoft Azure Maia 100 AI加速器,以及用于通用計(jì)算工作負(fù)載的基于Arm的處理器Cobalt 100 CPU。
該公司去年11月表示,將于2024年初開(kāi)始推出這兩款處理器,最初為Microsoft Copilot和Azure OpenAI Service等微軟服務(wù)提供支持。
該公司表示,MaiaAI加速器專(zhuān)為AI訓(xùn)練和推理而設(shè)計(jì),而Cobalt CPU是一款節(jié)能芯片,旨在提供良好的每瓦性能。
谷歌云
Google Cloud是超大規(guī)模領(lǐng)域的開(kāi)拓者,于2013年首次推出了定制張量處理單元(TPU)。TPU專(zhuān)為人工智能訓(xùn)練和推理而設(shè)計(jì),可在Google Cloud上向客戶(hù)提供。這些處理器還支持Google服務(wù),例如搜索、YouTube、Gmail和Google地圖。
該公司去年年底推出了第五代TPU。該公司表示,Cloud TPU v5p訓(xùn)練模型的速度比其前身快2.8倍。
谷歌云周二宣布開(kāi)發(fā)出首款基于Arm的CPU,名為Google Axion處理器。使用Arm Neoverse V2 CPU構(gòu)建的新CPU將于今年晚些時(shí)候向Google Cloud客戶(hù)提供。
該公司表示,客戶(hù)將能夠在許多谷歌云服務(wù)中使用Axion,包括谷歌計(jì)算引擎、谷歌Kubernetes引擎、Dataproc、Dataflow和Cloud Batch。
分析師Kimball預(yù)計(jì),隨著谷歌云開(kāi)始為其客戶(hù)部署自己的CPU,AMD和英特爾的收入將受到打擊。
Meta
宣布,Meta今年已在其數(shù)據(jù)中心部署了用于人工智能推理的下一代定制芯片。
下一代人工智能推理芯片之前代號(hào)為Artemis,是該公司為Meta的人工智能工作負(fù)載設(shè)計(jì)的元訓(xùn)練和推理加速器(MTIA)系列定制芯片的一部分。
Meta去年推出了第一代人工智能推理芯片MTIA v1。該公司表示,與第一代芯片相比,新的下一代芯片的性能提高了三倍,每瓦性能提高了1.5倍。
Cerebras Systems
人工智能硬件初創(chuàng)公司Cerebras Systems于3月中旬推出了第三代人工智能處理器WSE-3。這款晶圓級(jí)芯片的性能是其前身的兩倍,并在高端人工智能訓(xùn)練市場(chǎng)與英偉達(dá)展開(kāi)競(jìng)爭(zhēng)。
該公司在三月中旬還與高通合作,為其客戶(hù)提供人工智能推理服務(wù)。在Cerebras硬件上訓(xùn)練的模型經(jīng)過(guò)優(yōu)化,可在Qualcomm Cloud A100 Ultra加速器上運(yùn)行推理。
Groq
Groq是一家位于加利福尼亞州山景城的人工智能芯片初創(chuàng)公司,它構(gòu)建了LPU推理引擎來(lái)運(yùn)行大型語(yǔ)言模型、生成式人工智能應(yīng)用程序和其他人工智能工作負(fù)載。
Groq于2020年發(fā)布了首款人工智能推理芯片,目標(biāo)客戶(hù)是超大規(guī)模企業(yè)、公共部門(mén)、人工智能初創(chuàng)公司和開(kāi)發(fā)商。公司發(fā)言人表示,該公司將于2025年發(fā)布下一代芯片。
Tenstorrent
Tenstorrent是一家總部位于多倫多的人工智能推理初創(chuàng)公司,有著悠久的歷史:其首席執(zhí)行官是Jim Keller,一位芯片架構(gòu)師,曾在蘋(píng)果、AMD、特斯拉和英特爾工作,幫助設(shè)計(jì)了AMD的Zen架構(gòu)以及早期蘋(píng)果iPad和iPhone的芯片。
Tenstorrent戰(zhàn)略和企業(yè)傳播副總裁Bob Grim表示,該公司今年已開(kāi)始接受Wormhole AI推理芯片的訂單,并將于今年晚些時(shí)候正式推出。
他說(shuō),Tenstorrent正在向企業(yè)、實(shí)驗(yàn)室和任何需要高性能計(jì)算的組織銷(xiāo)售由32個(gè)Wormhole芯片驅(qū)動(dòng)的服務(wù)器。Grim表示,Tenstorrent目前專(zhuān)注于人工智能推理,但其芯片也可以為人工智能訓(xùn)練提供支持,因此該公司計(jì)劃未來(lái)也支持人工智能訓(xùn)練。
Untether AI
Untether AI是一家總部位于多倫多的人工智能芯片初創(chuàng)公司,致力于打造節(jié)能人工智能推理芯片。
該公司發(fā)言人表示,該公司的總裁是前英特爾公司副總裁兼總經(jīng)理Chris Walker,該公司于2021年推出了首款產(chǎn)品,并計(jì)劃于今年推出第二代SpeedAI240芯片。
該發(fā)言人表示,Untether AI的芯片專(zhuān)為各種外形尺寸而設(shè)計(jì),從用于嵌入式應(yīng)用的單芯片設(shè)備到4芯片PCI-Express加速卡,因此其處理器可用于從邊緣到數(shù)據(jù)中心的各個(gè)環(huán)節(jié)。