AMD近日發(fā)布了旗下新一代GPU架構(gòu)CDNA,面向數(shù)據(jù)中心等高性能計算業(yè)務(wù)。英偉達則有望在3月22日線上舉行的GTC 2020大會中發(fā)布新一代GPU架構(gòu)Ampere。此外,更有消息稱英特爾將繼22年之后發(fā)布用于獨立顯卡的GPU架構(gòu)Xe。2020年,隨著人工智能深度學習對高性能計算的需求越來越迫切,GPU正在成為芯片大廠的角力焦點。
三方角力GPU市場
在近日舉行的“金融分析師日”活動上,AMD發(fā)布了針對數(shù)據(jù)中心工作負載優(yōu)化的新一代GPU架構(gòu)。據(jù)了解,CDNA架構(gòu)包含了第二代Infinity技術(shù),可增強GPU和CPU之間的連接,并針對機器學習和高性能計算應(yīng)用而優(yōu)化,可專注于計算/張量操作,從而加速機器學習計算,而且可以通過Infinity Fabric互連的靈活設(shè)計,支持增強的企業(yè)級RAS特性與虛擬化技術(shù)。此外,它還將提供更高的能效比。AMD首席執(zhí)行官Lisa Su表示,路線圖的發(fā)布意味著AMD可獲得收入上的加速增長,為股東帶來可觀的回報。
英偉達也于近日發(fā)布消息,由于擔心新冠病毒疫情,將原定于3月22日—26日舉行的GTC 2020大會改為網(wǎng)上舉辦??紤]到英偉達一直以來的慣例,在GTC大會上多會發(fā)布新一代計算型GPU。因此,業(yè)界預期還未露面的7nm Ampere有望面世。元大證券投資咨詢公司的一份報告指出,Ampere有望較英偉達當前采用的“圖靈”(Turing)架構(gòu)性能增加50%,同時功耗減半。Ampere GPU將面向數(shù)據(jù)中心業(yè)務(wù)。
GPU一向是英特爾的弱項,雖然不乏產(chǎn)品推出,卻一直被集成于系統(tǒng)芯片當中。然而,英特爾CFO首席財務(wù)官George Davis日前確認,2020年將會推出一款面向獨立顯卡的Xe架構(gòu)GPU。這是英特爾自1998年推出i740顯卡后,再次進軍獨顯市場。根據(jù)之前透露出來的信息,英特爾將要推出的獨立顯卡DG1,采用Xe架構(gòu),擁有96組EU執(zhí)行單元,基礎(chǔ)頻率1GHz,加速頻率1.5GHz,1MB二級緩存以及3GB顯存,TDP為25W。在DG1之后,英特爾還會發(fā)布針對高端市場的DG2獨立顯卡。
競爭人工智能大市場
英偉達、AMD與英特爾三大芯片之所以如此積極的推進GPU的發(fā)展,與數(shù)據(jù)中心對高性能計算的需求密不可分。有專家分析指出,數(shù)據(jù)中心是人工智能深度學習最重要工作平臺,快速完成對海量數(shù)據(jù)的多層次、多迭代模型分析處理是其一項關(guān)鍵性的工作。從2011年人工智能研究人員首次使用英偉達GPU為深度學習加速之后,GPU就在人工智能領(lǐng)域發(fā)揮著巨大作用。雖然許多廠商也在開發(fā)基于FPGA或者ASIC的人工智能芯片,但目前采用GPU加速的服務(wù)器仍是數(shù)據(jù)中心的主流。
這也就使得芯片大廠不得不重視GPU的開發(fā)。2017年,英偉達推出面向數(shù)據(jù)中心業(yè)務(wù)的GPU TeslaV100 GPU,受到業(yè)界的廣泛采用。此后英偉達繼續(xù)在人工智能數(shù)據(jù)中心云端發(fā)力,研發(fā)面向不同平臺的GPU加速解決方案,今年更將推出新一代GPU架構(gòu)Ampere。研觀天下報告指出,目前人工智能應(yīng)用領(lǐng)域的發(fā)展速度快于底層芯片的發(fā)展速度,GPU是目前發(fā)展最為完善的一類人工智能芯片,是現(xiàn)階段人工智能應(yīng)用開發(fā)的首選。英偉達憑借其GPU的先發(fā)優(yōu)勢在人工智能的前端推理應(yīng)用領(lǐng)域搶占了先機。
此前,AMD雖然也有很多GPU和顯卡產(chǎn)品,但采用的Vega核心本質(zhì)上還是一款游戲型GPU。此次,AMD發(fā)布CDNA架構(gòu),專門針對數(shù)據(jù)中心計算進行了優(yōu)化??梢钥闯?,AMD在GPU的策略上,也正在走專業(yè)化,將面向數(shù)據(jù)中心的GPU架構(gòu)與面向游戲優(yōu)化的RDNA架構(gòu)分開。
技術(shù)分析師Patrick Moorhead表示,數(shù)據(jù)中心GPU并不需要消費類顯卡的許多功能,比如顯示和像素引擎、光線追蹤等。計算型GPU通過刪除這些元素可以節(jié)省成本,同時又可添加更多有助數(shù)據(jù)中心性能提升的邏輯組件,比如張量計算單元等。不過在高性能數(shù)據(jù)中心部署CDNA 架構(gòu)GPU之前,AMD仍需在軟件上加大投入。
競爭從工藝到架構(gòu)
從技術(shù)趨勢上看,隨著數(shù)據(jù)中心深度學習對芯片處理能力以及低功耗需求的提高,GPU對制造工藝的選擇也越來越嚴苛。三大GPU公司目前基本上都選擇采用最先進的制造工藝。此前,英特爾財務(wù)官George Davis曾經(jīng)表示,針對14納米制程的產(chǎn)能不足問題,2020年將增加更多產(chǎn)能填補空缺。面對2020年陸續(xù)推出的新品,英特爾勢必要想辦法解決先進工藝產(chǎn)能的問題。近日有消息傳出,英特爾計劃將旗下獨立顯示GPU交由臺積電6納米工藝代工。更有消息稱2022年英特爾還將采用臺積電的3納米工藝來生產(chǎn)。有業(yè)內(nèi)人士分析,假如英特真的打算擴大外包代工份額,除了已經(jīng)部分外包的芯片組之外,首先可能就是GPU,因為GPU相對CPU來說制造工藝上更為簡單,而且以往臺積電與英偉達在GPU制造上有著大量的合作,因而更有經(jīng)驗。
至于AMD方面,CDNA架構(gòu)GPU預計會在今年年底到明年年初面世,繼續(xù)采用7nm工藝。AMD沒有透露第二代CDNA 2的具體工藝,只說是更先進的節(jié)點,因而有可能采用5nm工藝。GPU也是先進工藝的追逐者。
此外,GPU在計算架構(gòu)上的革新也十分關(guān)鍵。GPU+CPU異構(gòu)架構(gòu)成為面向人工智能服務(wù)器的主流架構(gòu)。研觀天下指出,隨著數(shù)據(jù)處理復雜度的逐步提升,服務(wù)器采用的處理系統(tǒng)并非只有采用GPU,或者只采用CPU。而是由CPU和GPU組合而成的異構(gòu)系統(tǒng),兩種處理器各取所長,密集的處理任務(wù)交給GPU,復雜的邏輯運算交給CPU,兩種處理器協(xié)同工作,提升系統(tǒng)的運算速率。
AMD是目前唯一一家同時擁有x86處理器和獨立顯卡的供應(yīng)商,這使其在CPU-GPU互連技術(shù)上具有優(yōu)勢。AMD在CPU和GPU之間采用Infinity Fabric技術(shù)進行連接,實現(xiàn)內(nèi)存的一致性,可以減輕許多編碼負擔。此次發(fā)布的CDNA架構(gòu)便采用了第二代Infinity技術(shù),增強了GPU和CPU之間的連接。AMD還透露第三代Infinity Fabric將具有更高的性能,包括更高帶寬、更低延遲的CPU-GPU互連,增強內(nèi)存一體性能,以簡化編程。