亚洲色婷婷婷婷五月基地,亚洲午夜片在线,五月天日韩av电影

AI芯片主戰(zhàn)場(chǎng)，變了

2024-02-26 11:18

半導(dǎo)體行業(yè)觀察

生產(chǎn)數(shù)據(jù)中心中央處理器的英特爾公司相信，隨著客戶專(zhuān)注于降低人工智能模型的運(yùn)行成本，其芯片將越來(lái)越有吸引力。英特爾專(zhuān)門(mén)生產(chǎn)的芯片類(lèi)型已經(jīng)廣泛用于推理，在執(zhí)行該任務(wù)時(shí)，擁有Nvidia的尖端且更昂貴的H100 AI芯片并不那么重要。

本文來(lái)自微信公眾號(hào)“半導(dǎo)體行業(yè)觀察”。

英偉達(dá)主導(dǎo)的AI芯片大戰(zhàn)已經(jīng)轉(zhuǎn)向了一個(gè)新的戰(zhàn)線——一個(gè)規(guī)模更大但也更具競(jìng)爭(zhēng)力的戰(zhàn)線。

英偉達(dá)通過(guò)提供訓(xùn)練人工智能模型這一極其復(fù)雜的工作所必需的芯片，將自己打造成一家價(jià)值2萬(wàn)億美元的公司。隨著行業(yè)的快速發(fā)展，更大的機(jī)會(huì)將是銷(xiāo)售芯片使這些模型在訓(xùn)練后運(yùn)行的芯片，為快速增長(zhǎng)的實(shí)際使用生成式人工智能工具的公司和人們生產(chǎn)文本和圖像。

目前，這種轉(zhuǎn)變正在增加英偉達(dá)的銷(xiāo)量。首席財(cái)務(wù)官科萊特·克雷斯(Colette Kress)上周表示，去年Nvidia數(shù)據(jù)中心業(yè)務(wù)的40%以上（收入超過(guò)470億美元）用于部署人工智能推理系統(tǒng)，而不是訓(xùn)練。這一百分比是轉(zhuǎn)變正在進(jìn)行的第一個(gè)重要跡象。

克雷斯的評(píng)論緩解了一些擔(dān)憂，即向部署人工智能系統(tǒng)的芯片（即執(zhí)行所謂“推理”工作的芯片）的轉(zhuǎn)變威脅到了英偉達(dá)的地位，因?yàn)榕c制造英偉達(dá)的芯片相比，這項(xiàng)工作可以使用功能更弱、成本更低的芯片來(lái)完成。

Melius Research分析師Ben Reitzes在給客戶的一份報(bào)告中表示：“人們認(rèn)為Nvidia在推理領(lǐng)域的份額將低于訓(xùn)練領(lǐng)域。”“這一發(fā)現(xiàn)有助于揭示其從即將到來(lái)的推理爆炸中受益的能力。”

許多競(jìng)爭(zhēng)對(duì)手認(rèn)為，隨著推理芯片變得更加重要，他們?cè)谌斯ぶ悄苁袌?chǎng)上擁有更好的機(jī)會(huì)。

英特爾首席執(zhí)行官帕特·基辛格(Pat Gelsinger)在去年12月的一次采訪中表示：“推理的經(jīng)濟(jì)學(xué)是，我不會(huì)承受40,000美元的H100環(huán)境，因?yàn)樗鼤?huì)消耗太多電量，需要新的管理和安全模型以及新的IT基礎(chǔ)設(shè)施。”“如果我可以在標(biāo)準(zhǔn)[英特爾芯片]上運(yùn)行這些模型，那是理所當(dāng)然的。”

美國(guó)銀行分析師Vivek Arya表示，向推理的轉(zhuǎn)變可能是英偉達(dá)季度收益報(bào)告周三出現(xiàn)的最重要消息，該報(bào)告超出了華爾街的預(yù)期，導(dǎo)致其股價(jià)本周上漲8.5%，推動(dòng)該公司估值約為2萬(wàn)億美元。

Arya表示，隨著對(duì)人工智能模型的訓(xùn)練投資激增，焦點(diǎn)轉(zhuǎn)向從人工智能模型中創(chuàng)收，推理能力將會(huì)上升。與英偉達(dá)占據(jù)主導(dǎo)地位的人工智能訓(xùn)練相比，這可能更具競(jìng)爭(zhēng)力。

推理增長(zhǎng)的速度可能比之前預(yù)期的要快。今年早些時(shí)候，瑞銀分析師估計(jì)90%的芯片需求來(lái)自訓(xùn)練，而這一推論到明年只會(huì)推動(dòng)20%的市場(chǎng)份額。分析師在一份報(bào)告中表示，英偉達(dá)大約40%的數(shù)據(jù)中心收入來(lái)自推理，“這個(gè)數(shù)字比我們預(yù)期的要大”。

事實(shí)上，英偉達(dá)周三的財(cái)務(wù)業(yè)績(jī)表明，其在人工智能芯片領(lǐng)域超過(guò)80%的市場(chǎng)份額尚未受到嚴(yán)重挑戰(zhàn)。英偉達(dá)用于訓(xùn)練人工智能系統(tǒng)的芯片預(yù)計(jì)在可預(yù)見(jiàn)的未來(lái)仍將保持旺盛的需求。

在訓(xùn)練人工智能系統(tǒng)時(shí)，公司通過(guò)模型運(yùn)行海量數(shù)據(jù)，教它們以能夠?qū)崿F(xiàn)人類(lèi)發(fā)音表達(dá)的方式預(yù)測(cè)語(yǔ)言。這項(xiàng)工作需要強(qiáng)大的計(jì)算能力，非常適合Nvidia的圖形處理單元（GPU）。

推理工作是指這些模型被要求處理新的信息并做出響應(yīng)——更輕松的提升。

除了英特爾和AMD等Nvidia的老牌競(jìng)爭(zhēng)對(duì)手之外，隨著推理成為焦點(diǎn)，許多人工智能芯片初創(chuàng)公司也可能獲得發(fā)展動(dòng)力。

“我們看到我們的推理用例呈爆炸式增長(zhǎng)，”SambaNova的首席執(zhí)行官羅德里戈·梁(Rodrigo Liang)說(shuō)，SambaNova是一家初創(chuàng)公司，將人工智能芯片和軟件相結(jié)合，可以進(jìn)行推理和訓(xùn)練。“人們開(kāi)始意識(shí)到80%以上的成本將用于推理，我需要尋找替代解決方案，”他說(shuō)。

Groq是一家由前谷歌人工智能芯片工程師喬納森·羅斯(Jonathan Ross)創(chuàng)立的初創(chuàng)公司，近幾個(gè)月來(lái)，該公司主頁(yè)上的演示展示了其推理芯片可以如何快速地從大型語(yǔ)言模型中生成響應(yīng)，因此引起了人們的興趣激增。羅斯表示，該公司預(yù)計(jì)今年將部署42,000個(gè)芯片，明年將部署100萬(wàn)個(gè)芯片，但正在探索將芯片總數(shù)今年增加到220,000個(gè)，明年增加到150萬(wàn)個(gè)。

他說(shuō)，推動(dòng)這一轉(zhuǎn)變的一個(gè)因素是，一些最先進(jìn)的人工智能系統(tǒng)正在被調(diào)整，以產(chǎn)生更好的響應(yīng)，而無(wú)需重新訓(xùn)練它們，從而將更多的計(jì)算工作推向推理。他說(shuō)，Groq的專(zhuān)業(yè)芯片比Nvidia或其他芯片公司的產(chǎn)品運(yùn)行速度更快、成本更低。

“據(jù)此推斷，你可以部署什么取決于成本，”他說(shuō)。“有很多模型可以在谷歌接受訓(xùn)練，但它們中大約80%沒(méi)有得到部署，因?yàn)樗鼈兲F了，無(wú)法投入生產(chǎn)。”

大型科技公司——包括Meta、微軟，谷歌和亞馬遜——一直致力于內(nèi)部開(kāi)發(fā)推理芯片，認(rèn)識(shí)到即將到來(lái)的轉(zhuǎn)變以及能夠更便宜地進(jìn)行推理的好處。

例如，亞馬遜自2018年以來(lái)就擁有推理芯片，該公司云計(jì)算部門(mén)數(shù)據(jù)和機(jī)器學(xué)習(xí)副總裁斯瓦米·西瓦蘇布拉馬尼安(Swami Sivasubramanian)去年表示，推理占其Alexa智能助手計(jì)算成本的40%。

就英偉達(dá)而言，它正在尋求在向推理過(guò)渡的過(guò)程中保持領(lǐng)先地位。去年，一款即將推出的芯片在一項(xiàng)關(guān)鍵的人工智能推理基準(zhǔn)測(cè)試中取得了行業(yè)領(lǐng)先的結(jié)果，延續(xù)了該公司多年來(lái)在競(jìng)爭(zhēng)中的主導(dǎo)地位。

去年12月，AMD推出了新的人工智能芯片，據(jù)稱(chēng)其推理能力優(yōu)于Nvidia的芯片后，Nvidia在一篇博客文章中予以回?fù)簦瑢?duì)這一說(shuō)法提出質(zhì)疑。英偉達(dá)表示，AMD在宣稱(chēng)其性能時(shí)并未使用優(yōu)化軟件，如果這樣做，英偉達(dá)的芯片速度將是原來(lái)的兩倍。

THEEND

免責(zé)聲明：凡注明為其它來(lái)源的信息均轉(zhuǎn)自其它平臺(tái)，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對(duì)此類(lèi)作品本站僅提供交流平臺(tái)，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益，請(qǐng)作者持權(quán)屬證明與本站聯(lián)系，我們將及時(shí)更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門(mén)

精選文章

熱點(diǎn)資訊

Sora“超級(jí)涌現(xiàn)力”將把AI引向何方

AI芯片主戰(zhàn)場(chǎng)，變了

2024 信息化觀察網(wǎng)

長(zhǎng)按掃描二維碼閱讀原文

AI芯片主戰(zhàn)場(chǎng)，變了

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

半導(dǎo)體領(lǐng)域不為人知的勝仗：又一個(gè)環(huán)節(jié)實(shí)現(xiàn)國(guó)產(chǎn)替代

2023百度十大科技前沿發(fā)明

《貴州省建設(shè)數(shù)字經(jīng)濟(jì)發(fā)展創(chuàng)新區(qū)2023年工作要點(diǎn)》發(fā)布

連續(xù)5個(gè)季度同比下滑：AI能否扭轉(zhuǎn)戴爾危局？

本月熱門(mén)

云計(jì)算的江湖，風(fēng)云再起

揭秘，IOTE國(guó)際物聯(lián)網(wǎng)展2025年巡展預(yù)告!

防勒索病毒攻擊關(guān)鍵措施

匯聚行業(yè)精英，探討前沿技術(shù) 第十九屆汽車(chē)涂裝工藝技術(shù)研討會(huì)即將啟幕!

網(wǎng)博會(huì)革新升級(jí)：“區(qū)域頻道”精準(zhǔn)選型引領(lǐng)，引領(lǐng)智能制造新風(fēng)潮

萬(wàn)億賽道!AI算力趨勢(shì)發(fā)展深度分析 2024

精選文章

交通運(yùn)輸行業(yè)該如何發(fā)揮數(shù)據(jù)要素×效益，加快發(fā)展新質(zhì)生產(chǎn)力？

顧瑋：SD-WAN技術(shù)賦能企業(yè)數(shù)字化轉(zhuǎn)型

“教育大腦”——智慧教育生態(tài)平臺(tái)

數(shù)字賦能，智造未來(lái)|七通智能2022年新戰(zhàn)略新產(chǎn)品發(fā)布會(huì)亮點(diǎn)紛呈

韓斐：數(shù)字時(shí)代網(wǎng)絡(luò)信任服務(wù)體系新思考

數(shù)博會(huì)重磅發(fā)布嘉城大數(shù)據(jù)產(chǎn)品首批測(cè)評(píng)通過(guò)!

熱點(diǎn)資訊

什么是 OSI 模型？OSI 模型的七層是哪些？

自動(dòng)化測(cè)試有哪些常見(jiàn)的挑戰(zhàn)和解決方案？

政策寶閃耀2024數(shù)智融合應(yīng)用論壇，榮獲“數(shù)智融合標(biāo)桿案例”

共筑數(shù)字未來(lái)|深度解析數(shù)字化轉(zhuǎn)型與建設(shè)的戰(zhàn)略指南

數(shù)據(jù)要素X政策寶：引領(lǐng)企業(yè)和政策數(shù)據(jù)服務(wù)的新浪潮

Sora“超級(jí)涌現(xiàn)力”將把AI引向何方

劇情反轉(zhuǎn)!LockBit死灰復(fù)燃，向FBI宣戰(zhàn)

AI芯片主戰(zhàn)場(chǎng)，變了

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

欄目推薦

半導(dǎo)體領(lǐng)域不為人知的勝仗：又一個(gè)環(huán)節(jié)實(shí)現(xiàn)國(guó)產(chǎn)替代

2023百度十大科技前沿發(fā)明

《貴州省建設(shè)數(shù)字經(jīng)濟(jì)發(fā)展創(chuàng)新區(qū)2023年工作要點(diǎn)》發(fā)布

連續(xù)5個(gè)季度同比下滑：AI能否扭轉(zhuǎn)戴爾危局？

本月熱門(mén)

精選文章

熱點(diǎn)資訊

Sora“超級(jí)涌現(xiàn)力”將把AI引向何方

劇情反轉(zhuǎn)!LockBit死灰復(fù)燃，向FBI宣戰(zhàn)

AI芯片主戰(zhàn)場(chǎng)，變了

連續(xù)5個(gè)季度同比下滑：AI能否扭轉(zhuǎn)戴爾危局？