本文來自微信公眾號(hào)“電子發(fā)燒友網(wǎng)”,作者/李彎彎。
隨著人工智能技術(shù)的快速發(fā)展,GPU作為重要的算力支撐時(shí)常被提及。國(guó)內(nèi)外重要的GPU芯片公司也為人熟知,包括英偉達(dá)、AMD、英特爾,景嘉微、海光信息、天數(shù)智芯、摩爾線程等。
事實(shí)上,除此之外還有一些GPU IP公司也為GPU產(chǎn)業(yè)發(fā)展做出很大貢獻(xiàn),包括Imagination、Arm、芯原科技等。在當(dāng)前備受關(guān)注的大模型方面,這些公司的產(chǎn)品也起到一定支持作用。
Imagination
Imagination的GPU IP產(chǎn)品包括IMG A系列、IMG CXT、IMG DXT等多個(gè)系列,每個(gè)系列有不同的特點(diǎn)和應(yīng)用場(chǎng)景。IMG A系列,是Imagination有史以來性能最強(qiáng)大GPU IP產(chǎn)品,IMG A系列被設(shè)計(jì)為可應(yīng)用于與各種場(chǎng)景的GPU,是多種垂直應(yīng)用領(lǐng)域的終極解決方案。
該系列產(chǎn)品覆蓋從入門級(jí)市場(chǎng)的每時(shí)鐘周期處理1個(gè)像素(1 PPC)的組件,到高性能設(shè)備的速度高達(dá)每秒2萬億次浮點(diǎn)運(yùn)算(2 TFLOP)的內(nèi)核,以及針對(duì)云應(yīng)用的、速度超越該數(shù)值的多核解決方案。
IMG CXT,搭載首個(gè)針對(duì)移動(dòng)端優(yōu)化的PowerVR Photon光線追蹤架構(gòu),為移動(dòng)端游戲玩家和開發(fā)者提供桌面級(jí)光線追蹤功能的體驗(yàn)。實(shí)現(xiàn)了光線追蹤性能的大幅提升,支持在移動(dòng)設(shè)備中以高幀率實(shí)現(xiàn)逼真的光線追蹤陰影、反射、全局照明和環(huán)境遮蔽等效果。
IMG DXT是新一代面向移動(dòng)端的高性能GPU IP,為移動(dòng)設(shè)備用戶帶來先進(jìn)的圖形技術(shù)。提供三款配置,包括DXT-8-256、DXT-48-1536和DXT-72-2304,分別針對(duì)主流、高端和旗艦移動(dòng)設(shè)備。旗艦產(chǎn)品DXT-72-2304具有72 GTexels/s和2.5 TFLOP FP32算力,與上一代產(chǎn)品相比,其最大單核性能提升了50%。
Imagination的GPU IP產(chǎn)品廣泛應(yīng)用于移動(dòng)設(shè)備、汽車、數(shù)據(jù)中心、桌面和云游戲等多個(gè)領(lǐng)域。通過提供高性能的圖形渲染和數(shù)據(jù)處理能力,為各種應(yīng)用場(chǎng)景提供了強(qiáng)大的支持。
Imagination的GPU IP高性能、可擴(kuò)展性和低功耗的特性,使得在支持大模型的應(yīng)用上具有優(yōu)勢(shì)。如IMG DXD,其多核配置提供了強(qiáng)大的計(jì)算能力,5 TFLOPS FP32和144 GTexel/s,能夠在大模型的應(yīng)用上起到支持作用。
Arm
Arm的GPU IP產(chǎn)品系列主要包括Mali系列和Immortalis系列。Mali系列GPU IP是Arm的長(zhǎng)期主力產(chǎn)品,擁有從入門級(jí)到旗艦級(jí)的完整產(chǎn)品線。Mali系列包括Mali-G710、Mali-G610、Mali-G510、Mali-G310等多個(gè)型號(hào),分別定位于不同性能和價(jià)格的市場(chǎng)段。
Mali系列GPU基于Valhall GPU架構(gòu),并持續(xù)優(yōu)化和提升性能。例如,Mali-G710號(hào)稱綜合性能提升20%、機(jī)器學(xué)習(xí)性能提升35%、紋理性能提升50%、能效提升20%。
Immortalis系列是Arm在2022年推出的全新旗艦級(jí)GPU IP產(chǎn)品,旨在提供終極的移動(dòng)3D體驗(yàn)。Immortalis GPU基于Mali設(shè)計(jì),并引入了硬件光線追蹤功能,這是首款在移動(dòng)端支持此功能的GPU。
Immortalis GPU采用10-16核設(shè)計(jì),性能比上一代Mali GPU高15%。其光線追蹤單元旨在提高效率,只占用約4%的著色器核心面積,卻能帶來300%的性能提升。
目前,Immortalis系列已經(jīng)推出了Immortalis-G715和Immortalis-G720等型號(hào)。Immortalis-G720是Arm目前性能和能效表現(xiàn)最為出色的GPU,與上一代產(chǎn)品相比,其性能和能效分別提高了15%,系統(tǒng)級(jí)效率更躍升了40%。
Arm的GPU IP產(chǎn)品廣泛應(yīng)用于移動(dòng)設(shè)備、汽車、數(shù)據(jù)中心、桌面和云游戲等多個(gè)領(lǐng)域。它們能夠支持各種計(jì)算任務(wù),如圖形渲染、物理模擬、圖像處理、機(jī)器學(xué)習(xí)和人工智能等。
Arm的GPU IP高性能計(jì)算、能效優(yōu)化和生態(tài)系統(tǒng)支持方面特點(diǎn),使其在大模型的應(yīng)用方面具有優(yōu)勢(shì)。Arm的GPU IP,如Mali系列和Ethos系列,已被多家公司采用,并成功應(yīng)用于大模型訓(xùn)練和推理中。
在大模型訓(xùn)練方面,Arm的GPU IP被廣泛應(yīng)用于深度學(xué)習(xí)、自然語言處理等領(lǐng)域。通過與合作伙伴共同開發(fā)定制化的解決方案,Arm GPU IP為這些領(lǐng)域的研究者和開發(fā)者提供了強(qiáng)大的計(jì)算能力支持。
在云端推理方面,Arm的GPU IP同樣發(fā)揮了重要作用。通過提供高性能的云端計(jì)算資源,Arm GPU IP支持了多種大模型應(yīng)用的實(shí)時(shí)推理需求。
芯原股份
芯原股份的GPU IP系列產(chǎn)品,以其高性能、靈活性和廣泛的應(yīng)用范圍,成為市場(chǎng)上備受矚目的產(chǎn)品。芯原可擴(kuò)展的Vivante圖形處理器(GPU)IP系列應(yīng)用廣泛,包括從低功耗的小型物聯(lián)網(wǎng)MCU到面向汽車和計(jì)算機(jī)應(yīng)用的功能強(qiáng)大的SoC。設(shè)計(jì)可滿足各種芯片尺寸和功耗預(yù)算,是具成本效益的優(yōu)質(zhì)圖形處理器解決方案。
芯原科技此前還詳細(xì)介紹了其GPGPU-AI IP為核心的AI芯片定制解決方案。其以Tensor Core和GPGPU/GPU為主,提供了一個(gè)靈活的架構(gòu)。
芯原GPGPU-AI處理器上有芯原通用的軟件棧,在上層可以支持標(biāo)準(zhǔn)的應(yīng)用接口,下層可以適配芯原各種各樣的算力IP,算力IP有圖形處理器、并行計(jì)算處理器、神經(jīng)網(wǎng)絡(luò)處理器。芯原GPGPU-AI分幾個(gè)層次擴(kuò)展的算力,可以支持異構(gòu)計(jì)算,包括矢量計(jì)算、標(biāo)量計(jì)算和張量處理單元,還可以支持大模型,高帶寬計(jì)算需求,同時(shí)基于在AI領(lǐng)域有多年的積累,可對(duì)數(shù)據(jù)組織、數(shù)據(jù)搬移和計(jì)算有針對(duì)性的優(yōu)化,另外還有專門針對(duì)大模型的帶寬壓縮技術(shù)。
芯原的GPU IP已被廣泛應(yīng)用于桌面顯卡、車載信息娛樂、工業(yè)顯示、物聯(lián)網(wǎng)及可穿戴設(shè)備、大規(guī)模并行計(jì)算等領(lǐng)域。
寫在最后
可以看到,GPU IP在多個(gè)領(lǐng)域都有廣泛應(yīng)用,包括科學(xué)計(jì)算、大數(shù)據(jù)分析、深度學(xué)習(xí)和人工智能、游戲服務(wù)器、圖像處理、圖形渲染和動(dòng)畫制作、視頻處理和圖像識(shí)別等。
當(dāng)然,GPU IP也在不斷發(fā)展和演進(jìn)中,未來,專用加速IP與通用GPU的融合或許是GPU技術(shù)未來發(fā)展的一個(gè)亮點(diǎn),這種融合將使GPU更具多功能性,更好地處理特定工作負(fù)載。高速DRAM和緩存技術(shù)的不斷演進(jìn)也將推動(dòng)GPU的性能提升,使其能夠更有效地處理復(fù)雜的計(jì)算任務(wù),如支持大模型的訓(xùn)練和部署。