對(duì)英特爾來說,“CPU巨頭”的標(biāo)簽已經(jīng)深入人心。不過,在最近兩個(gè)月,CPU在英特爾的關(guān)注度被軟件和獨(dú)立GPU搶了風(fēng)頭。不知從何時(shí)起,“軟件為先”和“XPU”已經(jīng)成為英特爾新的流行詞。同樣,英偉達(dá)對(duì)ARM的收購,以及AMD對(duì)賽靈思的收購,也昭示著芯片巨頭們與英特爾的“不謀而合”,它們紛紛將未來的布局瞄準(zhǔn)了同一個(gè)方向:異構(gòu)計(jì)算。
“通用”與“專用”相向而行
從20世紀(jì)60年代的字符終端時(shí)代到如今的智能計(jì)算時(shí)代,數(shù)據(jù)的量和質(zhì)都發(fā)生了顯著的變化。以文本、圖表為主的結(jié)構(gòu)化數(shù)據(jù)比例不斷下降,融媒體數(shù)據(jù)、實(shí)時(shí)處理的傳感級(jí)數(shù)據(jù)等非結(jié)構(gòu)數(shù)據(jù),以及深度學(xué)習(xí)的元數(shù)據(jù)的持續(xù)激增,將越來越多種類、精度的數(shù)據(jù)以更快的速度進(jìn)行傳輸和處理,并成為智能計(jì)算的剛需。
作為通用處理器的代表型廠商,英特爾已經(jīng)將異構(gòu)計(jì)算作為應(yīng)對(duì)AI時(shí)代算力挑戰(zhàn)的關(guān)鍵戰(zhàn)略。如果將數(shù)據(jù)看作食材,CPU就相當(dāng)于“瑞士軍刀”,適用于一切食材,卻不一定能將所有食材處理得又快又好。GPU、FPGA、DSP等專用處理器的加入,讓計(jì)算架構(gòu)能更有效地應(yīng)對(duì)場(chǎng)景化數(shù)據(jù)。
“異構(gòu)計(jì)算的產(chǎn)業(yè)的基礎(chǔ)是數(shù)據(jù)的爆炸式增長(zhǎng),這其實(shí)是我們發(fā)展異構(gòu)計(jì)算的主要驅(qū)動(dòng)力。”英特爾架構(gòu)、圖形和軟件集團(tuán)副總裁兼中國區(qū)總經(jīng)理謝曉清在接受《中國電子報(bào)》采訪時(shí)指出,“CPU提供的是通用型計(jì)算的能力,解決的問題很廣義。但是GPU、FPGA,或者AI加速芯片解決的是特定領(lǐng)域的問題?,F(xiàn)在很多數(shù)據(jù)的產(chǎn)生都有一定的特點(diǎn),以至于在CPU上的運(yùn)算效果不一定是最理想的,在GPU或者其他并行計(jì)算能力高的芯片上會(huì)跑得更好,這是異構(gòu)計(jì)算的主要驅(qū)動(dòng)力。”
作為專用處理器廠商,賽靈思從器件向異構(gòu)平臺(tái)的轉(zhuǎn)變也已開始。賽靈思大中華區(qū)核心市場(chǎng)業(yè)務(wù)發(fā)展總監(jiān)酆毅向《中國電子報(bào)》記者指出,智能駕駛正在從ADAS逐漸向全面自動(dòng)駕駛持續(xù)演進(jìn),傳感器數(shù)量的增多勢(shì)必會(huì)帶來爆炸式的數(shù)據(jù)增長(zhǎng),這就需要汽車具備強(qiáng)大的異構(gòu)計(jì)算平臺(tái)。在工業(yè)視覺領(lǐng)域,機(jī)器人技術(shù)、工業(yè)PC、I/O的模塊、智能傳感器、人機(jī)界面等都在產(chǎn)生不同類型的數(shù)據(jù)。在專業(yè)音視頻和廣播領(lǐng)域,從內(nèi)容采集到內(nèi)容消費(fèi)的全部過程也需要遠(yuǎn)程管理不同的服務(wù)器和計(jì)算平臺(tái)。
“單獨(dú)的計(jì)算架構(gòu),無法滿足越來越多樣的開發(fā)需求,因此,異構(gòu)計(jì)算是未來的發(fā)展之路。”酆毅指出,“伴隨工藝的進(jìn)步,F(xiàn)PGA也打破了傳統(tǒng)的應(yīng)用邊界,進(jìn)入到AI、數(shù)據(jù)中心、視頻處理、自動(dòng)駕駛、5G等新興領(lǐng)域中。而FPGA也通過集成標(biāo)量處理引擎、自適應(yīng)硬件引擎和智能引擎,完成了從器件到異構(gòu)平臺(tái)的轉(zhuǎn)變。”
引發(fā)芯片巨頭割據(jù)戰(zhàn)
在很長(zhǎng)一段時(shí)間里,處理器市場(chǎng)維持著英特爾、英偉達(dá)各自引領(lǐng)CPU和GPU的狀態(tài),且AMD在兩個(gè)市場(chǎng)均為第二。如今,這種局面正在被打破。通過一連串基于收購和自研的“補(bǔ)課”行為,三大處理器頭部廠商都在向CPU+GPU+FPGA/NPU的方向靠攏,為異構(gòu)計(jì)算儲(chǔ)備“彈藥”。
上個(gè)月,英特爾時(shí)隔22年重返獨(dú)顯市場(chǎng),正式發(fā)布獨(dú)立顯卡iRIS Xe Max。眾所周知,英特爾從2015年起,陸續(xù)收購了當(dāng)時(shí)第二大FPGA廠商Altera、自動(dòng)駕駛視覺處理公司Mobileye和云端AI推理芯片Habana Labs等一系列芯片廠商,充實(shí)了FPGA和AI專用芯片的產(chǎn)品線。獨(dú)立顯卡的發(fā)布,不僅讓英特爾彌補(bǔ)了PC產(chǎn)品線的關(guān)鍵零部件,也補(bǔ)齊了XPU異構(gòu)計(jì)算架構(gòu)的關(guān)鍵拼圖。
AMD對(duì)賽靈思的收購,也釋放出強(qiáng)化異構(gòu)計(jì)算布局的信號(hào)。在具備“CPU+GPU”計(jì)算架構(gòu)的基礎(chǔ)上,F(xiàn)PGA的可編程特質(zhì),能進(jìn)一步提升計(jì)算平臺(tái)的靈活性,從而適應(yīng)AI時(shí)代根據(jù)不同工作負(fù)載進(jìn)行加速的需求。同時(shí),賽靈思在異構(gòu)計(jì)算上也有所積累,已推出Versal ACAP異構(gòu)計(jì)算平臺(tái),以縮短車載多傳感器同步和融合所帶來的系統(tǒng)整體響應(yīng)時(shí)間。據(jù)酆毅介紹,賽靈思圍繞異構(gòu)計(jì)算的布局已在兩年前開始,包括智能駕駛、專業(yè)音視頻、工業(yè)等相關(guān)領(lǐng)域,都緊密圍繞著異構(gòu)計(jì)算的數(shù)據(jù)需求進(jìn)行開發(fā)。
對(duì)于英偉達(dá),收購ARM不僅彌補(bǔ)了缺乏CPU的短板,也將英偉達(dá)的AI計(jì)算平臺(tái)拓展到移動(dòng)生態(tài)。值得注意的是,ARM也在異構(gòu)計(jì)算有所著墨?;陂_源的開發(fā)框架ARM NN,開發(fā)者可以調(diào)動(dòng)ARM CPU、GPU及NPU,實(shí)現(xiàn)異構(gòu)AI開發(fā)。據(jù)悉,在去年舉辦的ISC 2019國際超算大會(huì)上,英偉達(dá)宣布,計(jì)劃利用其GPU與使用ARM架構(gòu)的CPU協(xié)作打造超級(jí)計(jì)算機(jī)。在宣布對(duì)ARM的收購計(jì)劃后,英偉達(dá)再次強(qiáng)調(diào)將建造搭載ARM CPU的AI超級(jí)計(jì)算機(jī)。“超算”有望成為英偉達(dá)與ARM合流異構(gòu)計(jì)算的第一個(gè)“練兵場(chǎng)”。
如何應(yīng)對(duì)“跨生態(tài)”挑戰(zhàn)
“軟件優(yōu)先。”談及異構(gòu)計(jì)算的布局思路,謝曉清向記者表示,“在設(shè)計(jì)硬件、芯片的時(shí)候,甚至在設(shè)計(jì)指令集的時(shí)候,我們會(huì)以軟件優(yōu)先的原則去做。”
異構(gòu)計(jì)算帶來的硬件復(fù)雜性,對(duì)編程人員提出了嚴(yán)苛的挑戰(zhàn)。如果異構(gòu)計(jì)算包含CPU、GPU、FPGA、ASIC四種硬件,就意味著編程人員必須掌握四種硬件的優(yōu)化代碼,才能編寫或遷移程序。屏蔽硬件復(fù)雜性的軟件平臺(tái)已經(jīng)成為異構(gòu)計(jì)算的必備工具。
oneAPI是英特爾為異構(gòu)計(jì)算架構(gòu)打造的開源軟件平臺(tái),使開發(fā)者可以選擇熟悉的語言、單一的代碼庫以及統(tǒng)一的編程模型,來開發(fā)跨架構(gòu)的應(yīng)用程序。
“我們希望生成一個(gè)軟件生態(tài),使應(yīng)用程序開發(fā)商基于統(tǒng)一、開放的規(guī)范進(jìn)行開發(fā)工作,不會(huì)因?yàn)檐浖腃PU遷移到GPU或者是FPGA而進(jìn)行任何的修改或重復(fù)投資。”謝曉清說。
英特爾不是唯一意識(shí)到異構(gòu)計(jì)算需要“軟硬兼施”的廠商。在軟件平臺(tái)方面,英偉達(dá)推出了CUDA,AMD推出了ROCm,華為也陸續(xù)推出了Atlas、CANN等面向異構(gòu)場(chǎng)景的平臺(tái)及架構(gòu)。
異構(gòu)計(jì)算的復(fù)雜性和融合性,意味著各大廠商一開始就從生態(tài)競(jìng)爭(zhēng)的維度進(jìn)行布局。那么,多種生態(tài)競(jìng)爭(zhēng)并存的關(guān)系,是否會(huì)讓開發(fā)者在免除跨架構(gòu)開發(fā)的麻煩后,又陷入“跨生態(tài)”開發(fā)的困難?
對(duì)此,謝曉清認(rèn)為,如果各家將中間平臺(tái)統(tǒng)一起來,形成相對(duì)統(tǒng)一的框架,可以在保持差異性的同時(shí)降低上層應(yīng)用的開發(fā)難度。
“如果各個(gè)芯片廠商都從最底層做軟件,重復(fù)投資會(huì)非常大。在理想情況下,應(yīng)當(dāng)有一個(gè)框架,在這個(gè)框架下每家做好自己的硬件優(yōu)化。對(duì)上層應(yīng)用開發(fā)者來說,硬件復(fù)雜性被屏蔽掉,且編譯器、庫函數(shù)、接口等均已定義好,在這個(gè)統(tǒng)一的框架下再開發(fā)編程即可。在運(yùn)行應(yīng)用的時(shí)候,負(fù)載會(huì)自動(dòng)流向最合適的硬件,這可能是未來異構(gòu)計(jì)算的理想情況。”謝曉清說。