淺談GPU的國(guó)產(chǎn)替代之路

在軟件上,國(guó)產(chǎn)難題主要涉及驅(qū)動(dòng)開(kāi)發(fā)、算法及軟件生態(tài)。業(yè)內(nèi)人士指出,計(jì)算芯片最大的門(mén)檻其實(shí)不是硬件,而是軟件。目前業(yè)內(nèi)GPU特別是用于通用算力的GPGPU,主流的軟件架構(gòu)是英偉達(dá)的CUDA,此架構(gòu)在2006問(wèn)世以來(lái),與下游軟件、驅(qū)動(dòng)廠家已經(jīng)有了深度合作。

本文來(lái)自微信公眾號(hào)“信創(chuàng)專研社”。

GPU,Graphic Processing Unit,即圖形處理單元,是計(jì)算機(jī)顯卡的核心,主要用于處理眾多與圖形顯示相關(guān)的操作。而最早出現(xiàn)在上世紀(jì)80年代的GPU何以在近幾年迎來(lái)高光時(shí)刻?這要得益于它強(qiáng)大的并行化的計(jì)算能力,雖然GPU最初的用途是渲染圖形和圖像,但隨著計(jì)算機(jī)技術(shù)的不斷進(jìn)步,特別是NVIDIA通用并行計(jì)算架構(gòu)CUDA推出了GPGPU,其將GPU部分或全部圖形處理能力投入通用計(jì)算后,GPU越來(lái)越多地被用于各種需要大量“算力”的領(lǐng)域。

人工智能AI大模型的出現(xiàn),便是GPU需求的燃爆點(diǎn)。

1.png

國(guó)內(nèi)GPU市場(chǎng)現(xiàn)狀

最近,OpenAI公司CEO山姆奧特曼在一場(chǎng)非公開(kāi)會(huì)議上透露,GPU的嚴(yán)重短缺阻礙了ChatGPT的進(jìn)步,GPU市場(chǎng)有多火爆可見(jiàn)一斑。據(jù)統(tǒng)計(jì)資料顯示,2021年全球GPU市場(chǎng)規(guī)模335億元,2028年全球GPU市場(chǎng)規(guī)模有望達(dá)到4774億元,其中中國(guó)市場(chǎng)2020年規(guī)模47.39億美元,預(yù)計(jì)2027年市場(chǎng)規(guī)模將達(dá)345.57億美元。而全球GPU行業(yè)市場(chǎng)主要由英偉達(dá)NVIDIA和AMD兩家主導(dǎo),市場(chǎng)占比分別為84%和12%,尤其在AI大模型訓(xùn)練芯片市場(chǎng)中,NVIDIA憑借V100 NVLink、V100PCIe等系列產(chǎn)品占據(jù)了超過(guò)90%的市場(chǎng)份額。

1.png

在國(guó)內(nèi),GPU本就稀缺,加之美國(guó)為了限制和打壓中國(guó)芯片科技的發(fā)展,從2019年開(kāi)始就對(duì)我國(guó)高端GPU芯片進(jìn)口進(jìn)行限制和斷供,2022年NVIDIA兩款顯卡A100和H100被限制出口中國(guó),使得國(guó)內(nèi)GPU更加供不應(yīng)求。

龐大的市場(chǎng)需求和歐美的芯片封鎖,迫使得國(guó)產(chǎn)GPU被推到了聚光燈下,迎來(lái)了絕佳的發(fā)展期。有業(yè)內(nèi)人士稱:“國(guó)產(chǎn)GPU在信創(chuàng)方面已經(jīng)實(shí)現(xiàn)逐步替代,AI&數(shù)據(jù)中心、智能汽車(chē)、游戲等應(yīng)用領(lǐng)域的國(guó)產(chǎn)GPU需求量也有極大的提升,國(guó)產(chǎn)GPU迎來(lái)發(fā)展黃金期,我們看好國(guó)產(chǎn)GPU公司的發(fā)展與投資機(jī)遇。”

近日,國(guó)內(nèi)多個(gè)GPU廠商,從老牌的景嘉微,到初創(chuàng)的沐曦,都順應(yīng)市場(chǎng)需求,相繼推出了各自在GPU領(lǐng)域的最新拳頭產(chǎn)品。

中天恒星:6月15日在北京發(fā)布國(guó)產(chǎn)自主GPU架構(gòu)“天狼星”,擁有完全自主知識(shí)產(chǎn)權(quán),自研核心架構(gòu)確保產(chǎn)品迭代自主可控,同時(shí)擁有完備的交付能力,并已實(shí)現(xiàn)量產(chǎn)。

景嘉微:成功研發(fā)JM54系列、JM72系列、JM92系列三代GPU產(chǎn)品。應(yīng)用于臺(tái)式機(jī)、筆記本、一體機(jī)、服務(wù)器、工控機(jī)、自助終端等設(shè)備。

天數(shù)智芯:6月10日發(fā)布天垓100加速卡的算力集群,已經(jīng)具備支持百億級(jí)參數(shù)大模型訓(xùn)練的能力。是國(guó)內(nèi)第一款全自研、GPU架構(gòu)下的云端訓(xùn)練芯片,實(shí)現(xiàn)了我國(guó)通用GPU從0到1的重大突破。

芯動(dòng)科技:芯動(dòng)發(fā)布的“風(fēng)華2號(hào)”是一款集超低功耗、強(qiáng)渲染、4K高清三屏顯示、4K視頻解碼及智能AI計(jì)算于一體的桌面和筆記本GPU,實(shí)現(xiàn)了多個(gè)自研技術(shù)的創(chuàng)新突破。

摩爾線程:基于MUSA架構(gòu)打造了兩顆全功能GPU芯片“蘇堤”和“春曉”;面向信創(chuàng)市場(chǎng)推出了桌面級(jí)顯卡MTT S10、MTT S30和MTT S50。

沐曦:6月14日宣布曦云系列的最新產(chǎn)品MXC500成功點(diǎn)亮,產(chǎn)品直接對(duì)標(biāo)英偉達(dá)A100,采用通用GPU架構(gòu),兼容CUDA。

盡管?chē)?guó)產(chǎn)GPU的推出步伐不斷加快,其中也不乏一些對(duì)標(biāo)國(guó)際高端GPU的產(chǎn)品,但不得不承認(rèn),國(guó)產(chǎn)GPU要走向真正成熟可靠,實(shí)現(xiàn)完全國(guó)產(chǎn)替代還有很長(zhǎng)的距離。

01

GPU研發(fā)技術(shù)壁壘極高

GPU的研發(fā)是一項(xiàng)大型的系統(tǒng)工程,包含硬件架構(gòu)、算法、軟件生態(tài)等多個(gè)組成,缺一不可,壁壘極高。CPU巨頭Intel近二十年多次嘗試征服高端GPU領(lǐng)域,曾在前兩年專門(mén)成立加速計(jì)算系統(tǒng)與圖形事業(yè)部(AXG),試圖再度殺入高端GPU市場(chǎng),卻始終反響平平。甚至現(xiàn)在的GPU絕對(duì)霸主NVIDIA,從95年首款產(chǎn)品NV1正式誕生發(fā)展至今,也是在顯卡領(lǐng)域耕耘了20多年才有當(dāng)前的成績(jī)。足可見(jiàn)GPU產(chǎn)業(yè)的門(mén)檻之高。

在硬件上,國(guó)產(chǎn)最大的問(wèn)題就是IP,任何一款高端芯片的打造都離不開(kāi)IP。但是,GPU IP的自研開(kāi)發(fā)需要3-5年的周期,需要數(shù)百個(gè)專業(yè)領(lǐng)域的工程師。因此短時(shí)間內(nèi)在硬件上實(shí)現(xiàn)完全國(guó)產(chǎn)化并不容易,國(guó)內(nèi)GPU廠商如芯動(dòng)、摩爾線程等幾乎都是外購(gòu)IP加上部分的自主研發(fā)。中天恒星剛發(fā)布的“天狼星”雖然實(shí)現(xiàn)了國(guó)產(chǎn)自主GPU架構(gòu),100%IP屬于自主研發(fā),但真正要完善軟件生態(tài),穩(wěn)定商用,我想還需要很長(zhǎng)的一段時(shí)間。

在軟件上,國(guó)產(chǎn)難題主要涉及驅(qū)動(dòng)開(kāi)發(fā)、算法及軟件生態(tài)。業(yè)內(nèi)人士指出,計(jì)算芯片最大的門(mén)檻其實(shí)不是硬件,而是軟件。目前業(yè)內(nèi)GPU特別是用于通用算力的GPGPU,主流的軟件架構(gòu)是英偉達(dá)的CUDA,此架構(gòu)在2006問(wèn)世以來(lái),與下游軟件、驅(qū)動(dòng)廠家已經(jīng)有了深度合作。而且CUDA本身涵蓋了多個(gè)技術(shù)領(lǐng)域,其開(kāi)發(fā)與后續(xù)更新都與英偉達(dá)自家GPU高度綁定,從某種角度來(lái)看,英偉達(dá)在GPU領(lǐng)域的壟斷很大程度上是通過(guò)CUDA平臺(tái)上的軟件生態(tài)實(shí)現(xiàn)。因此國(guó)內(nèi)GPU廠商如果想真正對(duì)標(biāo)英偉達(dá),CUDA生態(tài)是繞不開(kāi)的一環(huán)。

02

國(guó)產(chǎn)GPU整個(gè)商業(yè)生態(tài)尚未成熟

在芯片“斷供”之前,國(guó)內(nèi)購(gòu)買(mǎi)海外高端GPU芯片之路暢通,很少有客戶在重大項(xiàng)目采購(gòu)時(shí)會(huì)考慮國(guó)產(chǎn)GPU,都普遍傾向海外最先進(jìn)、最穩(wěn)定的產(chǎn)品,以保證項(xiàng)目順利完成。究其原因有二,一是畢竟國(guó)產(chǎn)GPU的發(fā)展才剛剛起步,在性能和穩(wěn)定性方面尚未取得長(zhǎng)時(shí)間,多項(xiàng)目的驗(yàn)證,不少國(guó)產(chǎn)GPU在實(shí)際應(yīng)用中出現(xiàn)了工作負(fù)載低,芯片性能不穩(wěn)定,兼容性差的情況。二是軟件生態(tài)不夠完善,如果一個(gè)芯片沒(méi)有與之配套的軟件生態(tài),則很難真正形成大面積的應(yīng)用。

在當(dāng)下GPU應(yīng)用最火的AI大模型訓(xùn)練中,騰訊云新一代HCC(High-Performance Computing Cluster)高性能計(jì)算集群使用的是英偉達(dá)最新代次H800 GPU;阿里曾在2018-2019年采購(gòu)了上萬(wàn)塊英偉達(dá)的V100和T4 GPU用于近年來(lái)的云計(jì)算和大模型訓(xùn)練,其他字節(jié)、百度、美團(tuán)、B站等都清一色采購(gòu)英偉達(dá)的A100、H100 GPU或是去年禁令后英偉達(dá)專門(mén)推出的減配版A800、H800 GPU。

1.png

這使得國(guó)產(chǎn)GPU在國(guó)內(nèi)鮮有大企業(yè)應(yīng)用成功的案例,大部分還僅僅圍繞在PC、圖形渲染領(lǐng)域,或是應(yīng)用在專門(mén)的軍事、政府等部門(mén)。商業(yè)市場(chǎng)的大門(mén),只是開(kāi)了一條縫。

另外,國(guó)產(chǎn)GPU廠商的硬件架構(gòu),軟件API接口不盡相同,客戶基本只能多選一,兼容和替換都不夠靈活,比較難實(shí)現(xiàn)技術(shù)生態(tài)的統(tǒng)一。

03

短期難盈利

對(duì)于GPU創(chuàng)企而言,巨大的研發(fā)費(fèi)用和資本開(kāi)支是必需,但長(zhǎng)期、持續(xù)的利潤(rùn)支撐才是GPU跨代發(fā)展的強(qiáng)勁驅(qū)動(dòng)力。

盡管近幾年因?yàn)锳I人工智能的火爆,使得GPU創(chuàng)企的融資環(huán)境變得相對(duì)寬松,但由于國(guó)內(nèi)近幾年批量的GPU創(chuàng)企涌入,使得競(jìng)爭(zhēng)激烈,加上研發(fā)投入巨大,在規(guī)模市場(chǎng)打開(kāi)之前,GPU廠商在短期內(nèi)難以實(shí)現(xiàn)量產(chǎn)盈利,令一眾大VC和PE機(jī)構(gòu)望而卻步。

芯片市場(chǎng)上,OPPO上個(gè)月關(guān)停了手機(jī)芯片自研公司哲庫(kù),便是因?yàn)槎唐陔y盈利,倒在了黎明前。同樣,對(duì)于部分GPU創(chuàng)企來(lái)說(shuō),也面臨著資本市場(chǎng)洗牌的風(fēng)險(xiǎn)。

04

新技術(shù)替代的風(fēng)險(xiǎn)

還有一點(diǎn),編者認(rèn)為很少有人提及,但相信在不少國(guó)內(nèi)準(zhǔn)備或正在GPU領(lǐng)域大展拳腳的玩家一定會(huì)考慮到:那就是量子計(jì)算的突破。

1.png

量子計(jì)算具有超強(qiáng)并行計(jì)算能力,相比傳統(tǒng)計(jì)算機(jī)可以以百萬(wàn)倍計(jì),作為下一代算力提升的突破點(diǎn),量子計(jì)算極有可能成為下一輪科技革命的“主引擎”。這顛覆性的技術(shù)優(yōu)勢(shì)也讓越來(lái)越多的國(guó)家紛紛投入到量子計(jì)算領(lǐng)域的研發(fā)中。

在3月份的GTC開(kāi)發(fā)者大會(huì)上,英偉達(dá)就表示已經(jīng)在量子計(jì)算領(lǐng)域進(jìn)行研究,與以色列的Quantum Machines合作,在用AI芯片構(gòu)建的超級(jí)計(jì)算機(jī)上運(yùn)行量子物理學(xué)中使用的算法;同時(shí)與德國(guó)的于利希超級(jí)計(jì)算中心和ParTec公司合作,開(kāi)展一個(gè)經(jīng)典-量子混合計(jì)算實(shí)驗(yàn)室項(xiàng)目。

這樣一來(lái),問(wèn)題就顯然易見(jiàn)了,一邊是GPU研發(fā)周期長(zhǎng),投入大,短期難盈利;一邊則是量子計(jì)算的突破,如果在五年內(nèi)量子計(jì)算技術(shù)應(yīng)用落地,那么以算力火爆的GPU會(huì)不會(huì)很快被量子計(jì)算機(jī)所取代?這在科技發(fā)展迅猛的時(shí)代,確實(shí)值得深思。

縱觀科技發(fā)展的半個(gè)世紀(jì),沒(méi)有一個(gè)技術(shù)或產(chǎn)品是一蹴而就的。“寶劍鋒從磨礪出,梅花香自苦寒來(lái)",國(guó)產(chǎn)GPU的發(fā)展,需要企業(yè)靜下心來(lái)正視現(xiàn)存的問(wèn)題,持續(xù)打磨自身技術(shù)功底,勇于創(chuàng)新,踏踏實(shí)實(shí)服務(wù)客戶,服務(wù)市場(chǎng)。

相信國(guó)產(chǎn)GPU的成功最終會(huì)到來(lái)!

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論