本文來自微信公眾號“與非網(wǎng)eefocus”,作者/劉浩然。
在追逐智能化的道路上,云端算力芯片扮演著不可或缺的角色。其強(qiáng)大的計(jì)算能力和無限的潛力,推動著科技的創(chuàng)新和進(jìn)步。隨著技術(shù)的不斷發(fā)展,我們有理由相信云端算力芯片將繼續(xù)引領(lǐng)人工智能的未來,為我們帶來更加智能、高效的世界。
自人類開采第一口油井開始,石油就深深融入進(jìn)了人類生活的方方面面。小到鍋碗瓢盆芯片,大到飛機(jī)火箭航母,沒有哪個環(huán)節(jié)離得開石油的參與。如果說石油是工業(yè)的血液,電力與網(wǎng)絡(luò)是信息時代社會的骨架,那么算力就是AI時代構(gòu)建萬物的基礎(chǔ)。
21世紀(jì)前后,人類逐漸從工業(yè)時代步入信息時代,當(dāng)下AI時代的大門又再度緩緩開啟。2023年以來,以ChatGPT為首的生成式AI逐漸滲透到了各行各業(yè)中,有人說,這或許又是一個IPhone時刻。AI起舞,算力搭臺,算力,或者說是算力芯片就是AI時代的石油、電力與網(wǎng)絡(luò)。
算力從哪來?如何理解算力?國產(chǎn)云端算力芯片如今怎么樣了。今天,與非網(wǎng)邀請到了多位企業(yè)專家,共同探討AI時代下云端算力芯片發(fā)展的挑戰(zhàn)和機(jī)遇。
AI時代,算力有多重要
算力,其本質(zhì)就是計(jì)算能力,它可以反映芯片對信息數(shù)據(jù)的收集、處理與輸出能力。計(jì)算本質(zhì)上是一種抽象概念,加減乘數(shù)是計(jì)算,三角運(yùn)算是計(jì)算,積分與微分也是計(jì)算。在如今的計(jì)算機(jī)時代,每一種復(fù)雜的計(jì)算都可以拆分成多個簡單的計(jì)算,現(xiàn)在通常用每秒鐘計(jì)算的浮點(diǎn)運(yùn)算次數(shù)作為評價算力的指標(biāo)。每秒計(jì)算1次就是1FLOPS。不過算力這個概念并不是芯片獨(dú)有的,我們?nèi)祟惖拇竽X也無時無刻不在進(jìn)行著計(jì)算,從買菜購物到數(shù)學(xué)考試,從雞兔同籠到多元微分,計(jì)算貫穿了人類的一生。
放眼人類的發(fā)展歷史,人類對于計(jì)算的渴求就一直在進(jìn)步。石器時代人類就開始結(jié)繩計(jì)數(shù),后來各類算籌、算盤等輔助計(jì)算技術(shù)誕生,讓人類擁有了更大規(guī)模的計(jì)算能力。如果這時算力能被計(jì)算出具體數(shù)值,那一根系滿繩結(jié)的繩子的算力會低于1FLOPS。
1946年,世界上第一臺計(jì)算機(jī)“埃尼阿克(ENIAC)”出現(xiàn),讓人類的計(jì)算能進(jìn)一步提升,計(jì)算速度也進(jìn)一步提升,其計(jì)算速度達(dá)到到了300FLOPS,也就是每秒鐘可以進(jìn)行300次浮點(diǎn)運(yùn)算,遠(yuǎn)超當(dāng)時任何人類與機(jī)械計(jì)算器的計(jì)算速度。
緊接著人類便進(jìn)入到了集成電路大發(fā)展時代。1978年,英特爾推出了跨時代的8086芯片,它包含29000個晶體管,主頻達(dá)到4.77MHz,其算力也達(dá)到了700000 FLOPS以上。此后,集成電路產(chǎn)業(yè)飛速發(fā)展,至今已經(jīng)形成英特爾、AMD、英偉達(dá)三家爭霸,還有TI、ST、瑞薩等MCU大廠緊隨其后,不同廠商不同種類的芯片用途五花八門,但其證明芯片性能的關(guān)鍵參數(shù)仍是“算力”。
不過,算力一詞用到頻率最高的領(lǐng)域仍舊是GPU。GPU起初是用來專門處理圖像的硬件,相比CPU,GPU具有更多計(jì)算核心,也更擅長進(jìn)行并行計(jì)算。如今世界上單芯片算力頂峰是英偉達(dá)的Thor芯片,其算力已經(jīng)達(dá)到200TOPS。TOPS即tera operations per second,1TOPS代表該芯片可以每秒計(jì)算1×1012次運(yùn)算。
AI時代,算力已經(jīng)不僅是一項(xiàng)描述芯片計(jì)算能力的參數(shù),它更像是一種資源,和石油與電力一樣,成為信息時代不可或缺的重要一環(huán)。而算力之所以如此重要,在于它對于AI來說的必要性。
AI模型,本質(zhì)上是算力與算法的結(jié)合。模型的“大”與“小”,其實(shí)就是算法規(guī)模量的區(qū)別,模型輸出的精度也與訓(xùn)練AI的數(shù)據(jù)量呈正相關(guān),然而計(jì)算機(jī)處理越大的數(shù)據(jù)量,它所需要的算力也呈指數(shù)上升。其原因是因?yàn)锳I算法可以理解為超大規(guī)模的矩陣運(yùn)算,矩陣的維度就是數(shù)據(jù)特征數(shù)量,也就是數(shù)據(jù)的參數(shù)量。矩陣維度越多,參數(shù)越多,模型越復(fù)雜,它輸出的數(shù)據(jù)準(zhǔn)確度越高,但所需求的算力也就越大。AI時代,算力已經(jīng)不僅是一項(xiàng)描述芯片計(jì)算能力的參數(shù),它更像是一種資源,和石油與電力一樣,成為信息時代不可或缺的重要一環(huán)。AI時代,也可以說是算力時代。
算力芯片也可以分為云端與終端兩種。云端算力芯片通常負(fù)責(zé)訓(xùn)練和推理兩種場景,可在不要求延時與高網(wǎng)絡(luò)帶寬下運(yùn)行幾乎全流程的AI算法。終端算力芯片通常用于自動駕駛、智能家居、智慧城市等AIOT場景中。通常來說,云算力芯片的難度更高,成本也更高,還需要用戶負(fù)擔(dān)額外的網(wǎng)絡(luò)通信費(fèi)用,那是不是云端就不重要了呢?
如果沒有云計(jì)算,企業(yè)在需要算力場景的時候就要搭建私有云,也就是自己的服務(wù)器。而為了應(yīng)對更加復(fù)雜的應(yīng)用,支撐更加穩(wěn)定的計(jì)算環(huán)境,企業(yè)就必須不停的升級采購新設(shè)備,例如服務(wù)器、存儲、帶寬等,還需要組建完整的運(yùn)維團(tuán)隊(duì)來保證這些設(shè)備的正常運(yùn)行。綜合計(jì)算下來,布置企業(yè)自身的算力中心花銷巨大。這對于中小微企業(yè)來說更是一筆難以承受的支出。
而云計(jì)算可以一勞永逸的解決上述問題,相當(dāng)于多個企業(yè)共享硬件設(shè)施,只有當(dāng)企業(yè)需要算力的時候才會購買,并不需要一直持有大量空閑算力。簡單來說,云計(jì)算就相當(dāng)于家庭用電,只有打開電燈,電表才會計(jì)數(shù)。
總的來說,云端+邊端能夠滿足AI時代下所有應(yīng)用場景的要求。如今AI大模型不斷涌現(xiàn),同時滿足訓(xùn)練與推理,還具有性價比優(yōu)勢的云算力芯片已經(jīng)成為AI大亂斗背景下的必爭之地。但在高需求刺激之下,極速涌入云端算力芯片的資本還面臨著更加嚴(yán)峻的問題,高門檻。
挑戰(zhàn)與變局
過去,云端算力芯片僅受到部分企業(yè)關(guān)注。普通人對于它的理解往往僅限于大型服務(wù)器,云計(jì)算,神威太湖之光等名詞上。2023年以來,ChatGPT的橫空出世讓普通人對AI的了解更進(jìn)一步。AI大模型爆火后,給全球AI芯片市場帶來了哪些影響?
摩爾線程專家認(rèn)為,大模型的火熱對芯片市場的影響,最直接的就是對算力基礎(chǔ)設(shè)施的需求猛增,GPU作為大模型背后的關(guān)鍵算力基礎(chǔ)設(shè)施,尤其受到追捧。與此同時,大模型全新的算法方式對傳統(tǒng)的芯片架構(gòu)提出了挑戰(zhàn)。
那,挑戰(zhàn)是什么呢?
隨著OpenAI的一聲炮響,全世界都被轟開了AI世界的大門。不過大規(guī)模計(jì)算所需要的高算力芯片挑戰(zhàn)頗多。摩爾線程專家認(rèn)為挑戰(zhàn)主要來自芯片的通用性、功耗墻與顯存墻上。
奇異摩爾聯(lián)合創(chuàng)始人兼產(chǎn)品及解決方案副總裁祝俊東認(rèn)為,目前云端算力芯片還面對著五大挑戰(zhàn):架構(gòu)、系統(tǒng)、場景、互聯(lián)以及快速迭代。
記者綜合分析得出:
從架構(gòu)上來說,運(yùn)算算力芯片對算力提升的需求與日俱增,但目前傳統(tǒng)SoC提升單芯片面積已經(jīng)達(dá)到瓶頸,摩爾定律極限在時刻限制芯片發(fā)展,內(nèi)存墻的限制也使得傳統(tǒng)架構(gòu)芯片難以提升,更讓芯片在散熱、功耗等方面處處掣肘。因此需要異構(gòu)計(jì)算架構(gòu)來尋求芯片新的突破,其中就包括繞開摩爾定律的more than more——異構(gòu)計(jì)算。
從系統(tǒng)角度來看,隨著大模型的廣泛運(yùn)用,模型參數(shù)與規(guī)模都呈現(xiàn)指數(shù)級增長,因此需要更大規(guī)模的整合計(jì)算系統(tǒng)來應(yīng)對大模型訓(xùn)練和計(jì)算的需求。換句話說,盡管芯片算力不斷增長,但仍舊需要軟件端配合才能更好的發(fā)揮硬件性能。畢竟兵器是否趁手得看使用者的功力高低。
從應(yīng)用場景來看,隨著ChatGPT爆火,AICG賽道上涌現(xiàn)了越來越多的玩家,未來AI領(lǐng)域還將出現(xiàn)更多應(yīng)用場景,這也意味著還會有新賽道出現(xiàn)。因此,作為“AI起舞的舞臺”,運(yùn)算算力芯片需要具備一定的通用性,也要有能力應(yīng)對當(dāng)今乃至未來日益多元化的專用計(jì)算場景。
從互聯(lián)來看,云端算力芯片需要高帶寬配合傳輸數(shù)據(jù)。未來大模型大算力應(yīng)用涌現(xiàn),云與端之間的快速交互,也將對帶寬和延時提出更高要求。
最后,AICG與算力芯片市場還處于快速變化階段,競爭者不斷入行,藍(lán)海可能一夜之間就變成紅海。因此企業(yè)必須快速迭代產(chǎn)品,尤其在云端算力芯片上,需要不斷調(diào)整產(chǎn)品策略來迎合未來產(chǎn)品的新需求,同時還要縮短TTM乃至量產(chǎn)時間。
總的來說云端算力芯片目前挑戰(zhàn)頗多,無論是從技術(shù)角度還是市場角度,國內(nèi)涌現(xiàn)的諸多AICG與算力芯片玩家都需要更多的突破。更重要的一點(diǎn)是,目前全球算力芯片絕大部分市場都在英偉達(dá)手中,國產(chǎn)算力芯片在市場上仍舊處于弱勢。但在新興市場中,有著強(qiáng)力GPU先發(fā)優(yōu)勢的英偉達(dá)面對的問題是什么呢?
除了AICG之外,目前自動駕駛技術(shù)同樣發(fā)展迅速,值得關(guān)注,這也激發(fā)出了全新的算力芯片需求。自動駕駛中,受限于延時與傳輸,對于雷達(dá)與攝像頭信號處理屬于邊或終端計(jì)算。但云計(jì)算對自動駕駛算法與系統(tǒng)的支持仍舊重要,云與端的結(jié)合成為更多汽車廠商的選擇,但新的挑戰(zhàn)也如期而至。英偉達(dá)技術(shù)專家在自動駕駛上的云端結(jié)合的挑戰(zhàn)上指出,云在用于自動駕駛汽車的人工智能軟件的開發(fā)中發(fā)揮著重要作用。數(shù)據(jù)被收集、整理、攝取、標(biāo)記并用于訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),從計(jì)算角度來看是一項(xiàng)艱巨的任務(wù)。這是一個增強(qiáng)人工智能模型的迭代過程。創(chuàng)建模型后,將使用模擬在云中對其進(jìn)行測試和驗(yàn)證。
英偉達(dá)的專家表示,自動駕駛汽車運(yùn)行時,不需要連接到云,但這是一個額外的好處,可以從交通、基礎(chǔ)設(shè)施和天氣等各種來源獲取信息,以實(shí)現(xiàn)安全駕駛操作。但自動駕駛汽車必須完全保持自主性,因此駕駛決策必須在車上做出,而不是在云端做出。連接到云的軟件定義汽車還為汽車制造商提供了新的商業(yè)模式和訂閱服務(wù)機(jī)會,同時為消費(fèi)者帶來價值。過去,汽車在購買時處于最佳狀態(tài),但隨后就會貶值。對于軟件定義的汽車來說,它處于最基本的銷售水平,隨著時間的推移,通過基于云,也就是云端算力芯片支持下的的軟件更新,它會變得更好、更安全。
在挑戰(zhàn)中育新機(jī),于變局中開新局
AI“躁動”的這幾年,也讓下游應(yīng)用場景百花齊放,這其中,AI與國產(chǎn)電動汽車全面崛起,讓AI駕駛,也就是自動駕駛技術(shù)成為資本寵兒。
針對自動駕駛領(lǐng)域的云端算力芯片機(jī)遇,??|認(rèn)為,受自動駕駛技術(shù)的快速發(fā)展驅(qū)動,大算力AI芯片正在汽車領(lǐng)域迎來廣闊的機(jī)遇和前景。通過高效的計(jì)算和深度學(xué)習(xí)算法,大算力AI芯片可以提供更精準(zhǔn)和可靠的駕駛決策,提升行車安全性和駕駛體驗(yàn)。而在云和端的結(jié)合中,最大的難點(diǎn)在于自動駕駛技術(shù)對實(shí)時性和低延遲要求非常高,將算力分布在云端和邊緣端之間會面臨數(shù)據(jù)傳輸和處理的挑戰(zhàn)。大量的傳感器數(shù)據(jù)和圖像到云端進(jìn)行處理可能會導(dǎo)致較高的網(wǎng)絡(luò)延遲和消耗大量的帶寬。
他認(rèn)為,異構(gòu)芯片可以將AI算力和邏輯算力集成在一起,在不同的計(jì)算場景中發(fā)揮不同的效用。這種集成能夠提供更高的計(jì)算性能和效率,滿足自動駕駛技術(shù)對算力的需求。同時,異構(gòu)集成高帶寬、低延時的互聯(lián)特性,也能有效幫助自動駕駛進(jìn)行云與端的交互,有效提升自動駕駛系統(tǒng)的性能和效率。
跳出應(yīng)用,回頭看云端算力芯片本身。GPU或GPGPU是云端算力算力芯片或AI芯片的主流形態(tài)。不過也有人認(rèn)為目前的AI芯片是過渡形態(tài),未來所有AI芯片還會向ASIC方向靠攏。這對這一觀點(diǎn),摩爾線程專家認(rèn)為,目前AI算法還在快速迭代和變化,在這個過程沒有放緩或停止之前,GPU仍具有特別強(qiáng)的優(yōu)勢。對于云端算力芯片未來的看法,摩爾線程專家認(rèn)為,云端基礎(chǔ)設(shè)施需要具備對未來技術(shù)的兼容性,GPU仍是首選。未來的變化,在摩爾線程看來主要包括幾個方面:工藝制程向前推進(jìn),算力、帶寬不斷上升;通過chiplet方案,進(jìn)一步提高芯片級別的計(jì)算密度和系統(tǒng)集成度3、云端AI芯片將不斷融合新算法所需的功能和加速模塊。
??|認(rèn)為,在AI芯片領(lǐng)域,作為通用芯片和專用芯片的代表,GPU和ASIC各有優(yōu)勢。但是專用芯片與通用芯片永遠(yuǎn)都不是互相替代的關(guān)系,二者必須協(xié)同工作才能發(fā)揮出最大的價值。通過異構(gòu)計(jì)算架構(gòu),可以把如GPU為代表的通用芯片與ASIC等專用芯片集合起來,兼顧通用性和專用性的雙重優(yōu)勢,提供更全面和高效的解決方案。異構(gòu)計(jì)算也有助于客戶根據(jù)AI任務(wù)的實(shí)際需求,調(diào)整通用芯片和專用芯片的比重,以滿足不斷變化的AI應(yīng)用領(lǐng)域的需求。
寫在最后
總的來說,云端算力芯片為AI時代的創(chuàng)新和應(yīng)用注入了無限活力,它已經(jīng)成為當(dāng)之無愧的“AI石油”。面臨挑戰(zhàn)與機(jī)遇,云端算力芯片未來還會不斷突破創(chuàng)新,驅(qū)動著智能化世界的前行。
在追逐智能化的道路上,云端算力芯片扮演著不可或缺的角色。以其強(qiáng)大的計(jì)算能力和無限的潛力,它推動著科技的創(chuàng)新和進(jìn)步。隨著技術(shù)的不斷發(fā)展,我們有理由相信云端算力芯片將繼續(xù)引領(lǐng)人工智能的未來,為我們帶來更加智能、高效的世界。
最后感謝摩爾線程、奇異摩爾以及英偉達(dá)三位專家或?qū)<医邮懿稍L。