本文來自微信公眾號(hào)“半導(dǎo)體產(chǎn)業(yè)縱橫”,作者/暢秋。
過去一年,用于AI服務(wù)器的GPU一直供不應(yīng)求,而從未來一年的發(fā)展態(tài)勢(shì)來看,相關(guān)產(chǎn)品的緊張程度有增無減。
據(jù)TrendForce(集邦咨詢)預(yù)測(cè),2024年全球服務(wù)器整機(jī)出貨量約1365.4萬臺(tái),年增長(zhǎng)率約2.05%。同時(shí),市場(chǎng)仍聚焦部署AI服務(wù)器,出貨占比約為12.1%。
從各大ODM出貨動(dòng)態(tài)來看,今年,增長(zhǎng)幅度最高的是Foxconn(富士康),預(yù)估出貨量年增約5%~7%,包含Dell 16G平臺(tái)、AWS Graviton 3與4、Google Genoa和Microsoft Gen9等訂單。AI服務(wù)器訂單方面,F(xiàn)oxconn今年已斬獲Oracle訂單,同時(shí)也承接了部分AWS訂單。
增長(zhǎng)幅度排名第二的是Inventec,預(yù)估出貨量年增約0~3%。AI服務(wù)器方面,除了北美CSP,中國(guó)客戶,如ByteDance需求最強(qiáng),預(yù)估今年Inventec的AI服務(wù)器出貨量年增長(zhǎng)率可達(dá)雙位數(shù),占比約10%~15%。
排在Inventec之后的是廣達(dá)和Supermicro,預(yù)計(jì)今年服務(wù)器出貨量年增長(zhǎng)率持平。
整體而言,各家ODM在2024年的出貨仍以AI服務(wù)器最為強(qiáng)勁,主要受惠于北美云端數(shù)據(jù)中心廠商訂單帶動(dòng),預(yù)計(jì)今年AI服務(wù)器出貨增長(zhǎng)率和占比都將達(dá)到兩位數(shù)百分比。就出貨種類而言,今年,搭載高端AI訓(xùn)練芯片(如英偉達(dá)H系列和AMD的MI系列產(chǎn)品)的機(jī)種出貨量有機(jī)會(huì)翻倍增長(zhǎng)。這對(duì)英偉達(dá)和AMD來說,意味著更大商機(jī)。
01
店大欺客?
目前,英偉達(dá)占據(jù)80%的AI服務(wù)器GPU芯片市場(chǎng)份額,AI系統(tǒng)和互聯(lián)網(wǎng)大廠都需要該公司的GPU,因此,英偉達(dá)在該市場(chǎng)擁有很大話語權(quán)。
最近,有外媒報(bào)道,英偉達(dá)可能刻意延后出貨,以限制競(jìng)爭(zhēng)對(duì)手接單。
報(bào)道稱,如果英偉達(dá)發(fā)現(xiàn)客戶正在尋求更好的業(yè)務(wù)機(jī)會(huì),則可能會(huì)拖延數(shù)據(jù)中心GPU的出貨。英偉達(dá)的競(jìng)爭(zhēng)對(duì)手、人工智能芯片創(chuàng)業(yè)公司Groq表示,由于客戶擔(dān)心英偉達(dá)報(bào)復(fù)性出貨延遲,都心存恐懼地對(duì)取得或設(shè)計(jì)人工智能技術(shù)保密。
Groq首席執(zhí)行官羅斯(Jonathan Ross)表示,由于潛在客戶擔(dān)心被英偉達(dá)發(fā)現(xiàn)與其它廠商討論接單,客戶們都會(huì)否認(rèn)自己曾與這些競(jìng)爭(zhēng)對(duì)手公司會(huì)面。實(shí)際上,這種情況在業(yè)界并不少見。羅斯說:“很多人都說,如果英偉達(dá)聽說客戶正在會(huì)面,它們會(huì)否認(rèn)這一點(diǎn)。問題是你必須提前一年向英偉達(dá)付款,可能會(huì)在一年內(nèi)得到硬件,也可能需要更長(zhǎng)時(shí)間。”
外媒甚至暗示,微軟、Google和亞馬遜等科技巨頭正打造自有人工智能加速器,但都堅(jiān)稱不打算成為英偉達(dá)的競(jìng)爭(zhēng)對(duì)手,因?yàn)橛ミ_(dá)在人工智能市場(chǎng)中占有主導(dǎo)地位。
針對(duì)羅斯的聲明,英偉達(dá)CEO黃仁勛告訴行業(yè)分析師,他試圖公平地向客戶分配GPU,并將避免向不立即使用加速器的公司出售產(chǎn)品。
在Groq指控英偉達(dá)使用延后出貨手段后,AMD前副總裁赫克爾曼(Scott Herkelman)表示,英偉達(dá)的確采取類似策略,他甚至稱英偉達(dá)為“GPU獨(dú)占集團(tuán)”。他在社交媒體X上發(fā)文寫道:“這種情況發(fā)生的次數(shù)比預(yù)期的要多。”
赫克爾曼的表態(tài)十分引人關(guān)注,因?yàn)樗麖?016年起負(fù)責(zé)AMD的圖形業(yè)務(wù)部門,該部門在消費(fèi)者和數(shù)據(jù)中心業(yè)務(wù)方面與英偉達(dá)競(jìng)爭(zhēng),直到2023年離開AMD。更重要的是,他在2012年9月~2015年5月間擔(dān)任英偉達(dá)GeForce業(yè)務(wù)總經(jīng)理。
不過,目前尚不清楚是否有證據(jù)證明英偉達(dá)確實(shí)有上述行為。
02
如何保持行業(yè)領(lǐng)導(dǎo)地位?
英偉達(dá)在占據(jù)AI服務(wù)器用GPU市場(chǎng)主動(dòng)地位的情況下,一定會(huì)想方設(shè)法實(shí)現(xiàn)利潤(rùn)最大化,具體措施方面,除了高定價(jià),保持客戶粘性是很重要的方式,在這方面的具體措施,包括技術(shù)性的,如用CUDA軟硬件生態(tài)系統(tǒng)牢牢地抓住廣大工程師,還有就是商業(yè)操作層面的,要盡量降低競(jìng)爭(zhēng)對(duì)手的獲客機(jī)會(huì)。
在當(dāng)前的AI服務(wù)器和相關(guān)GPU市場(chǎng)行情下,無論是GPU提供商,還是系統(tǒng)集成商或互聯(lián)網(wǎng)大廠,都越來越敏感了,特別是互聯(lián)網(wǎng)大廠,都在做兩手準(zhǔn)備,在向英偉達(dá)采購更多GPU的同時(shí),正在加緊自研相關(guān)芯片。對(duì)于英偉達(dá)的各種客戶而言,更多地接觸AMD和英特爾是必然。
微軟、Meta、亞馬遜等云服務(wù)提供商為了降低芯片成本,并使芯片供應(yīng)鏈多元化,減少對(duì)英偉達(dá)的依賴,不僅開始提升采購AMD的MI300系列產(chǎn)品數(shù)量,要求ODM廠設(shè)計(jì)專門采用MI300系列產(chǎn)品的AI服務(wù)器,還紛紛加強(qiáng)自研HPC芯片力度,爭(zhēng)取將更多自研芯片用于自家的互聯(lián)網(wǎng)和云計(jì)算系統(tǒng)。
AMD是英偉達(dá)最大的競(jìng)爭(zhēng)對(duì)手,由于受到越來越多英偉達(dá)客戶的關(guān)注,對(duì)AMD產(chǎn)品的采購量在增加,使得該GPU“二哥”的行業(yè)地位持續(xù)提升,這在資本市場(chǎng)上有越來越明顯的表現(xiàn)。最近,AMD股價(jià)漲幅超過9%至每股192.53美元,創(chuàng)造歷史新高,2月份累計(jì)上漲了14.8%,市值首度突破3000億美元。
根據(jù)道瓊斯市場(chǎng)數(shù)據(jù),AMD的市值達(dá)到了3110億美元。在近期的連續(xù)上漲之后,AMD股價(jià)越來越貴,其市盈率接近50倍,遠(yuǎn)高于英偉達(dá)的32倍。
這樣看來,雖然英偉達(dá)依然很風(fēng)光,但受限于先進(jìn)制程、封裝產(chǎn)能,以及來自各級(jí)別芯片對(duì)手的競(jìng)爭(zhēng),該公司的危機(jī)意識(shí)也在增加。
對(duì)于英偉達(dá)來說,要加快推出新品和優(yōu)化原有產(chǎn)品的節(jié)奏。
英偉達(dá)AI年度盛會(huì)“GTC 2024”將于3月18日在美國(guó)登場(chǎng),屆時(shí),黃仁勛將公布旗下最新的AI芯片、采用新一代Blackwell架構(gòu)的B100 GPU。據(jù)悉,該新品將由臺(tái)積電3nm制程代工生產(chǎn),最快今年第四季度出貨。
GTC大會(huì)不僅將世界各地的專業(yè)工程師、研究人員會(huì)聚一堂,還將邀請(qǐng)多位科技大老親自到場(chǎng),活動(dòng)預(yù)計(jì)將涌進(jìn)超過30萬人(線下和線上總參與人數(shù)),今年的GTC也被外界看作是觀察2024和2025年AI關(guān)鍵技術(shù)發(fā)展進(jìn)程的重要風(fēng)向標(biāo)。
英偉達(dá)即將發(fā)布的B100,與目前的H系列GPU相比,整體效能有大幅提升。其中,光是HBM內(nèi)存容量,就比H系列最強(qiáng)的H200芯片高出約40%的容量,使得B100能應(yīng)對(duì)高效能HPC或加速LLM的AI訓(xùn)練需求。據(jù)了解,B100芯片的AI效能,至少是Hopper架構(gòu)H200的兩倍,可以達(dá)到H100的4倍以上。
多家AI服務(wù)器系統(tǒng)大廠已經(jīng)開始爭(zhēng)奪B100,包括已成為英偉達(dá)B100模組供應(yīng)商的代工大廠緯創(chuàng),以及提供3nm或4nm制程技術(shù)的臺(tái)積電,還有現(xiàn)已開始接到來自英偉達(dá)B100 AI服務(wù)器水冷項(xiàng)目訂單的代工大廠英業(yè)達(dá)。英業(yè)達(dá)表示,今年的AI服務(wù)器市場(chǎng)仍以英偉達(dá)產(chǎn)品為主流,并以高端訓(xùn)練用的AI服務(wù)器產(chǎn)品為市場(chǎng)主力。
對(duì)于即將發(fā)布的新品B100,英偉達(dá)對(duì)所搭載的散熱技術(shù)也進(jìn)行了升級(jí),從原來的氣冷轉(zhuǎn)為水冷,對(duì)此,黃仁勛曾提到,自己堅(jiān)信浸沒式水冷技術(shù)是未來發(fā)展方向,將帶動(dòng)整個(gè)散熱市場(chǎng)迎來全面的革新。據(jù)悉,英偉達(dá)從B100開始,未來所有產(chǎn)品的散熱技術(shù),都將由氣冷轉(zhuǎn)為水冷。
03
中國(guó)市場(chǎng)給英偉達(dá)增添了更多危機(jī)感
英偉達(dá)對(duì)競(jìng)爭(zhēng)對(duì)手帶給它威脅的重視程度,從它對(duì)中國(guó)大陸市場(chǎng)及本土芯片企業(yè)的態(tài)度就可以看出來。
中國(guó)大陸市場(chǎng)占英偉達(dá)銷售額的20%左右,近兩年,該公司不得不多次改變GPU性能規(guī)格,以滿足美國(guó)政府的出口要求。
2022年8月,美國(guó)政府禁止向中國(guó)大陸出口英偉達(dá)的A100和H100芯片,因?yàn)檫@些芯片的通信帶寬達(dá)到了600GB/s或更高。針對(duì)中國(guó)大陸市場(chǎng),英偉達(dá)隨后推出了A800和H800處理器,通信帶寬都明顯低于600GB/s。
2023年10月,美國(guó)商務(wù)部工業(yè)與安全局(BIS)表示,將使用“性能密度”作為新參數(shù)對(duì)受限芯片進(jìn)行分類。根據(jù)新規(guī)定,英偉達(dá)的A800、H800、L40、L40S和RTX 4090相關(guān)產(chǎn)品被禁止銷往中國(guó)大陸。針對(duì)這項(xiàng)規(guī)定,英偉達(dá)又于去年11月推出了三款A(yù)I芯片——H20、L20和L2,但要到2024年第二季度才能量產(chǎn)交付。
針對(duì)RTX 4090在中國(guó)大陸銷售受限問題,英偉達(dá)開發(fā)出了RTX 4090 D顯卡,通過降低部份規(guī)格,以符合美國(guó)出口管制要求。據(jù)悉,RTX 4090 D滿足綜合運(yùn)算性能(TPP)4800限制,RTX 4090的TPP是5286。
最近,英偉達(dá)推出了最新版本的中國(guó)特供GPU和顯卡RTX 5880 Ada,符合4800 TPP的限制規(guī)定。英偉達(dá)將AD102芯片用于RTX 6000 Ada和RTX 5000 Ada,RTX 5880 Ada很可能使用相同芯片的變體。AD102擁有18,432個(gè)CUDA內(nèi)核。
隨著近幾年美國(guó)限制政策的出臺(tái),以及中國(guó)本土企業(yè)和產(chǎn)品競(jìng)爭(zhēng)力的提升,英偉達(dá)等廠商的技術(shù)和產(chǎn)品優(yōu)勢(shì)正在縮小。例如,H20在性能和效率上仍比中國(guó)本土AI芯片具有優(yōu)勢(shì),但這種優(yōu)勢(shì)正在縮小,因?yàn)槎嗉抑袊?guó)本土芯片廠商正在快速發(fā)展。
由于中國(guó)本土AI芯片與英偉達(dá)特供版產(chǎn)品之間的差距在縮小,進(jìn)入2024年以來,多家中國(guó)互聯(lián)網(wǎng)大廠和云服務(wù)提供商表示,今年下訂的英偉達(dá)H20等產(chǎn)品數(shù)量將遠(yuǎn)少于原本想買的,因?yàn)閬碜灾袊?guó)本土的相關(guān)芯片用量增加了。
測(cè)試結(jié)果顯示,H20能在多個(gè)處理器之間高效傳輸數(shù)據(jù),比中國(guó)本土相關(guān)芯片更適合AI計(jì)算應(yīng)用,但是,需要更多H20才能表現(xiàn)出英偉達(dá)常規(guī)GPU的算力,這就大幅提高了成本。相比之下,中國(guó)本土最先進(jìn)的AI芯片也能處理AI相關(guān)應(yīng)用,只是處理任務(wù)的復(fù)雜度低于英偉達(dá)的。知情人士表示,多家中國(guó)互聯(lián)網(wǎng)大廠和云服務(wù)提供商已經(jīng)把一些AI芯片訂單轉(zhuǎn)至本土廠商,以華為為例,據(jù)悉,該公司去年已從本土互聯(lián)網(wǎng)大廠手中拿到至少5000組Ascend 910B芯片訂單,預(yù)定今年交貨。
2月下旬,黃仁勛在接受外媒采訪時(shí)表示,如今,整個(gè)科技行業(yè)都在爭(zhēng)相開發(fā)和優(yōu)化自己的芯片技術(shù),無論是TPU團(tuán)隊(duì)、AWS Trainium和Interentia團(tuán)隊(duì),還是微軟的Maia項(xiàng)目,以及中國(guó)各大云服務(wù)提供商和初創(chuàng)公司,都在這一領(lǐng)域投入了大量的精力。這種競(jìng)爭(zhēng)態(tài)勢(shì)確實(shí)非常激烈。
對(duì)于中國(guó)大陸的競(jìng)爭(zhēng)對(duì)手,黃仁勛表示,華為是非常好的公司。盡管他們受到現(xiàn)有半導(dǎo)體制程技術(shù)的限制,但他們?nèi)匀豢梢酝ㄟ^將許多芯片聚集在一起來構(gòu)建非常強(qiáng)大的系統(tǒng)。為了與華為競(jìng)爭(zhēng),英偉達(dá)正在向客戶提供兩款專門針對(duì)中國(guó)市場(chǎng)的新AI芯片樣品。
這是英偉達(dá)首次公開將華為列為競(jìng)爭(zhēng)對(duì)手。此前,英偉達(dá)唯一一次公開提到華為是在2017年的一份財(cái)報(bào)中,當(dāng)時(shí),該公司表示,華為將使用英偉達(dá)的Volta HGX架構(gòu)為數(shù)據(jù)中心構(gòu)建AI系統(tǒng)。在那份報(bào)告中,英偉達(dá)還將華為列為其AI智慧城市平臺(tái)的合作伙伴,而現(xiàn)在,華為成為了英偉達(dá)不得不重視的競(jìng)爭(zhēng)對(duì)手。
04
結(jié)語
經(jīng)過2023年的火爆,2024年的AI服務(wù)器市場(chǎng)很可能會(huì)更加旺盛,這給相關(guān)高性能芯片、特別是GPU廠商提供了更多商機(jī)。
對(duì)于行業(yè)領(lǐng)導(dǎo)廠商而言,眾多競(jìng)爭(zhēng)對(duì)手,甚至包括客戶都虎視眈眈。站得越高,如果處理不好的話,摔得就會(huì)越慘,需要在技術(shù)、產(chǎn)品和商業(yè)推廣等多方面,充分發(fā)揮原有優(yōu)勢(shì),壓制競(jìng)爭(zhēng)對(duì)手,才能保持行業(yè)地位。
對(duì)于英偉達(dá)來說,2024年的AI服務(wù)器GPU市場(chǎng)依然會(huì)是它的天下。但在不斷變化、發(fā)展的高性能計(jì)算市場(chǎng),誰能斷定兩三年后的技術(shù)和產(chǎn)品市場(chǎng)會(huì)有多大變化呢?就像兩年前,誰能斷定華為能在2023年實(shí)現(xiàn)手機(jī)處理器制造突破一樣。