本文來自極客網(wǎng),作者:極客芯片。
AMD制造的AI芯片“幾乎”與業(yè)界領(lǐng)先的英偉達(dá)AI芯片一樣快。這是根據(jù)Databricks旗下的AI軟件開發(fā)商MosaicML的一項(xiàng)研究得出的結(jié)論。研究發(fā)現(xiàn),在訓(xùn)練大型語言模型和執(zhí)行其他AI密集型任務(wù)時(shí),AMD的AI芯片達(dá)到了英偉達(dá)同類產(chǎn)品的80%。
MosaicML將AMD MI250與Nvidia A100進(jìn)行了對(duì)比,并訓(xùn)練了不同大小的大型語言模型
英偉達(dá)的芯片目前在訓(xùn)練AI模型(例如用于運(yùn)行ChatGPT或Midjourney的模型)方面占據(jù)主導(dǎo)地位。這些產(chǎn)品的成功和對(duì)計(jì)算能力的需求將英偉達(dá)的估值推至1萬億美元,并引發(fā)了GPU的短缺。
MosaicML對(duì)比測試AMD的M1250 GPU與英偉達(dá)的A100 GPU
MosaicML最近將AMD的M1250 GPU與英偉達(dá)的A100 GPU進(jìn)行了對(duì)比測試。這兩款設(shè)備都比各自開發(fā)的頂級(jí)芯片落后一代,它們被用來訓(xùn)練大型語言模型,研究人員發(fā)現(xiàn),AMD和英偉達(dá)的芯片在訓(xùn)練模型時(shí)都能“開箱即用”,AMD M1250 GPU的性能約為英偉達(dá)A100 GPU的80%。
MosaicML訓(xùn)練了10億到130億個(gè)參數(shù)的模型,類似于企業(yè)中用于為大型公司數(shù)據(jù)集的搜索和匯總提供AI驅(qū)動(dòng)工具的模型。他們?cè)?個(gè)GPU的單個(gè)節(jié)點(diǎn)上進(jìn)行訓(xùn)練,發(fā)現(xiàn)MI250 GPU的吞吐量在A100 GPU的80%以內(nèi)。MI250在每秒浮點(diǎn)運(yùn)算和內(nèi)存方面略有優(yōu)勢,允許每個(gè)GPU訓(xùn)練更大的模型。
該公司計(jì)劃在更大的GPU集群上對(duì)更大的模型進(jìn)行分析,以確認(rèn)AMD系統(tǒng)是否可以在大規(guī)模下運(yùn)行,并正在與超大規(guī)模廠商合作。他們還計(jì)劃創(chuàng)建推理基準(zhǔn),并在兩個(gè)系統(tǒng)上使用擴(kuò)散模型等其他模型來測試更廣泛的選項(xiàng)。
雖然這兩款芯片并不是這兩家公司的頂級(jí)產(chǎn)品,但它們都被廣泛用于數(shù)據(jù)中心和訓(xùn)練AI模型。MosaicML表示,新的機(jī)器學(xué)習(xí)訓(xùn)練硬件對(duì)于在英偉達(dá)GPU供應(yīng)緊張的情況下提高計(jì)算可用性是必要的。
軟件驅(qū)動(dòng)的AMD
MosaicML表示,AMD的性能與該公司去年發(fā)布的新版本軟件有關(guān),該軟件與開源AI軟件PyTorch交互。MosaicML首席技術(shù)官Hanlin Tang表示,AMD對(duì)MI250 GPU的進(jìn)一步軟件更新將使其在今年年底之前達(dá)到英偉達(dá)A100 GPU的性能。
他表示,AMD在軟件優(yōu)化方面做得特別好,盡管在硬件性能方面存在差異,但仍能跟上英偉達(dá)的發(fā)展步伐。Tang表示,用戶并不需要更改代碼庫或重新編寫大型語言模型,就可以切換到采用AMD的產(chǎn)品。他表示,它們本質(zhì)上是可以互換的。
Tang表示,AMD并沒有委托MosaicML進(jìn)行這項(xiàng)研究。MosaicML開發(fā)的軟件旨在使企業(yè)更容易創(chuàng)建AI模型并在內(nèi)部進(jìn)行培訓(xùn),而不是依賴OpenAI或其他大型AI實(shí)驗(yàn)室的工具。他指出,這項(xiàng)研究是為了表明除了英偉達(dá)的芯片之外還有其他選擇。
他說,“總的來說,我們對(duì)AI訓(xùn)練硬件的未來市場非常樂觀,有更多的選擇意味著更多的計(jì)算供應(yīng),更低的市場價(jià)格,最終為想要訓(xùn)練自己的模型的用戶降低成本。”
Databricks透露,該公司近日已經(jīng)斥資13億美元收購MosaicML,這是該公司構(gòu)建企業(yè)級(jí)開源AI模型生態(tài)系統(tǒng)的更廣泛努力的一部分。這兩家公司都在開發(fā)軟件工具,使AI算法更小、更便宜地在大型數(shù)據(jù)集上運(yùn)行,但MosaicML軟件將用于增強(qiáng)Databricks的服務(wù)。
在這份報(bào)告發(fā)布之際,英特爾日前宣布了從2025年開始在AI芯片領(lǐng)域展開競爭的長期計(jì)劃。該公司正在轉(zhuǎn)變戰(zhàn)略,專注于制造與英偉達(dá)和AMD的硬件相抗衡的產(chǎn)品。
英特爾在上周宣布其FalconShores芯片將擁有288GB內(nèi)存,并支持8位浮點(diǎn)計(jì)算,這對(duì)于訓(xùn)練AI模型非常重要。英特爾還聲稱,其Ponte Vecchio AI芯片的性能優(yōu)于英偉達(dá)H100。雖然Vecchio AI芯片的供應(yīng)面臨延期,但將成為美國阿貢國家實(shí)驗(yàn)室最新超級(jí)計(jì)算機(jī)的核心,預(yù)計(jì)今年將完成發(fā)貨。