本文來(lái)自微信公眾號(hào)“半導(dǎo)體行業(yè)觀察”。
英偉達(dá)主導(dǎo)的AI芯片大戰(zhàn)已經(jīng)轉(zhuǎn)向了一個(gè)新的戰(zhàn)線——一個(gè)規(guī)模更大但也更具競(jìng)爭(zhēng)力的戰(zhàn)線。
英偉達(dá)通過(guò)提供訓(xùn)練人工智能模型這一極其復(fù)雜的工作所必需的芯片,將自己打造成一家價(jià)值2萬(wàn)億美元的公司。隨著行業(yè)的快速發(fā)展,更大的機(jī)會(huì)將是銷(xiāo)售芯片使這些模型在訓(xùn)練后運(yùn)行的芯片,為快速增長(zhǎng)的實(shí)際使用生成式人工智能工具的公司和人們生產(chǎn)文本和圖像。
目前,這種轉(zhuǎn)變正在增加英偉達(dá)的銷(xiāo)量。首席財(cái)務(wù)官科萊特·克雷斯(Colette Kress)上周表示,去年Nvidia數(shù)據(jù)中心業(yè)務(wù)的40%以上(收入超過(guò)470億美元)用于部署人工智能推理系統(tǒng),而不是訓(xùn)練。這一百分比是轉(zhuǎn)變正在進(jìn)行的第一個(gè)重要跡象。
克雷斯的評(píng)論緩解了一些擔(dān)憂,即向部署人工智能系統(tǒng)的芯片(即執(zhí)行所謂“推理”工作的芯片)的轉(zhuǎn)變威脅到了英偉達(dá)的地位,因?yàn)榕c制造英偉達(dá)的芯片相比,這項(xiàng)工作可以使用功能更弱、成本更低的芯片來(lái)完成。
Melius Research分析師Ben Reitzes在給客戶的一份報(bào)告中表示:“人們認(rèn)為Nvidia在推理領(lǐng)域的份額將低于訓(xùn)練領(lǐng)域。”“這一發(fā)現(xiàn)有助于揭示其從即將到來(lái)的推理爆炸中受益的能力。”
許多競(jìng)爭(zhēng)對(duì)手認(rèn)為,隨著推理芯片變得更加重要,他們?cè)谌斯ぶ悄苁袌?chǎng)上擁有更好的機(jī)會(huì)。
生產(chǎn)數(shù)據(jù)中心中央處理器的英特爾公司相信,隨著客戶專(zhuān)注于降低人工智能模型的運(yùn)行成本,其芯片將越來(lái)越有吸引力。英特爾專(zhuān)門(mén)生產(chǎn)的芯片類(lèi)型已經(jīng)廣泛用于推理,在執(zhí)行該任務(wù)時(shí),擁有Nvidia的尖端且更昂貴的H100 AI芯片并不那么重要。
英特爾首席執(zhí)行官帕特·基辛格(Pat Gelsinger)在去年12月的一次采訪中表示:“推理的經(jīng)濟(jì)學(xué)是,我不會(huì)承受40,000美元的H100環(huán)境,因?yàn)樗鼤?huì)消耗太多電量,需要新的管理和安全模型以及新的IT基礎(chǔ)設(shè)施。”“如果我可以在標(biāo)準(zhǔn)[英特爾芯片]上運(yùn)行這些模型,那是理所當(dāng)然的。”
美國(guó)銀行分析師Vivek Arya表示,向推理的轉(zhuǎn)變可能是英偉達(dá)季度收益報(bào)告周三出現(xiàn)的最重要消息,該報(bào)告超出了華爾街的預(yù)期,導(dǎo)致其股價(jià)本周上漲8.5%,推動(dòng)該公司估值約為2萬(wàn)億美元。
Arya表示,隨著對(duì)人工智能模型的訓(xùn)練投資激增,焦點(diǎn)轉(zhuǎn)向從人工智能模型中創(chuàng)收,推理能力將會(huì)上升。與英偉達(dá)占據(jù)主導(dǎo)地位的人工智能訓(xùn)練相比,這可能更具競(jìng)爭(zhēng)力。
推理增長(zhǎng)的速度可能比之前預(yù)期的要快。今年早些時(shí)候,瑞銀分析師估計(jì)90%的芯片需求來(lái)自訓(xùn)練,而這一推論到明年只會(huì)推動(dòng)20%的市場(chǎng)份額。分析師在一份報(bào)告中表示,英偉達(dá)大約40%的數(shù)據(jù)中心收入來(lái)自推理,“這個(gè)數(shù)字比我們預(yù)期的要大”。
事實(shí)上,英偉達(dá)周三的財(cái)務(wù)業(yè)績(jī)表明,其在人工智能芯片領(lǐng)域超過(guò)80%的市場(chǎng)份額尚未受到嚴(yán)重挑戰(zhàn)。英偉達(dá)用于訓(xùn)練人工智能系統(tǒng)的芯片預(yù)計(jì)在可預(yù)見(jiàn)的未來(lái)仍將保持旺盛的需求。
在訓(xùn)練人工智能系統(tǒng)時(shí),公司通過(guò)模型運(yùn)行海量數(shù)據(jù),教它們以能夠?qū)崿F(xiàn)人類(lèi)發(fā)音表達(dá)的方式預(yù)測(cè)語(yǔ)言。這項(xiàng)工作需要強(qiáng)大的計(jì)算能力,非常適合Nvidia的圖形處理單元(GPU)。
推理工作是指這些模型被要求處理新的信息并做出響應(yīng)——更輕松的提升。
除了英特爾和AMD等Nvidia的老牌競(jìng)爭(zhēng)對(duì)手之外,隨著推理成為焦點(diǎn),許多人工智能芯片初創(chuàng)公司也可能獲得發(fā)展動(dòng)力。
“我們看到我們的推理用例呈爆炸式增長(zhǎng),”SambaNova的首席執(zhí)行官羅德里戈·梁(Rodrigo Liang)說(shuō),SambaNova是一家初創(chuàng)公司,將人工智能芯片和軟件相結(jié)合,可以進(jìn)行推理和訓(xùn)練。“人們開(kāi)始意識(shí)到80%以上的成本將用于推理,我需要尋找替代解決方案,”他說(shuō)。
Groq是一家由前谷歌人工智能芯片工程師喬納森·羅斯(Jonathan Ross)創(chuàng)立的初創(chuàng)公司,近幾個(gè)月來(lái),該公司主頁(yè)上的演示展示了其推理芯片可以如何快速地從大型語(yǔ)言模型中生成響應(yīng),因此引起了人們的興趣激增。羅斯表示,該公司預(yù)計(jì)今年將部署42,000個(gè)芯片,明年將部署100萬(wàn)個(gè)芯片,但正在探索將芯片總數(shù)今年增加到220,000個(gè),明年增加到150萬(wàn)個(gè)。
他說(shuō),推動(dòng)這一轉(zhuǎn)變的一個(gè)因素是,一些最先進(jìn)的人工智能系統(tǒng)正在被調(diào)整,以產(chǎn)生更好的響應(yīng),而無(wú)需重新訓(xùn)練它們,從而將更多的計(jì)算工作推向推理。他說(shuō),Groq的專(zhuān)業(yè)芯片比Nvidia或其他芯片公司的產(chǎn)品運(yùn)行速度更快、成本更低。
“據(jù)此推斷,你可以部署什么取決于成本,”他說(shuō)。“有很多模型可以在谷歌接受訓(xùn)練,但它們中大約80%沒(méi)有得到部署,因?yàn)樗鼈兲F了,無(wú)法投入生產(chǎn)。”
大型科技公司——包括Meta、微軟,谷歌和亞馬遜——一直致力于內(nèi)部開(kāi)發(fā)推理芯片,認(rèn)識(shí)到即將到來(lái)的轉(zhuǎn)變以及能夠更便宜地進(jìn)行推理的好處。
例如,亞馬遜自2018年以來(lái)就擁有推理芯片,該公司云計(jì)算部門(mén)數(shù)據(jù)和機(jī)器學(xué)習(xí)副總裁斯瓦米·西瓦蘇布拉馬尼安(Swami Sivasubramanian)去年表示,推理占其Alexa智能助手計(jì)算成本的40%。
就英偉達(dá)而言,它正在尋求在向推理過(guò)渡的過(guò)程中保持領(lǐng)先地位。去年,一款即將推出的芯片在一項(xiàng)關(guān)鍵的人工智能推理基準(zhǔn)測(cè)試中取得了行業(yè)領(lǐng)先的結(jié)果,延續(xù)了該公司多年來(lái)在競(jìng)爭(zhēng)中的主導(dǎo)地位。
去年12月,AMD推出了新的人工智能芯片,據(jù)稱(chēng)其推理能力優(yōu)于Nvidia的芯片后,Nvidia在一篇博客文章中予以回?fù)簦瑢?duì)這一說(shuō)法提出質(zhì)疑。英偉達(dá)表示,AMD在宣稱(chēng)其性能時(shí)并未使用優(yōu)化軟件,如果這樣做,英偉達(dá)的芯片速度將是原來(lái)的兩倍。