本文來自微信公眾號“工信頭條”,作者/周倩。
在全球經(jīng)濟復(fù)蘇面臨較大不確定性的同時,數(shù)字經(jīng)濟依然保持強勁增長,算力已經(jīng)成為經(jīng)濟增長的重要驅(qū)動引擎。IDC(國際數(shù)據(jù)公司)從對全球多個行業(yè)的Top30企業(yè)的跟蹤研究中發(fā)現(xiàn),IT投入的增加會帶來不同程度的實際收益,IT每投入1美元,在互聯(lián)網(wǎng)行業(yè)可拉動22美元的營收額與2美元利潤產(chǎn)出,在制造行業(yè)可拉動45美元的營收額和6美元利潤產(chǎn)出。
AI技術(shù)不斷取得創(chuàng)新突破并得到更大范圍普及,催生了對算力的更大需求和更大焦慮。以前我們認為靠機器難以解決的很多問題,現(xiàn)在都有了可操作性較高的解決方法,比如自動駕駛、自然語言處理(NLP),甚至是內(nèi)容創(chuàng)作(AIGC),靠AI都可以實現(xiàn)。人類已經(jīng)從電力時代進入算力時代,數(shù)據(jù)是新的生產(chǎn)資料,算力是新的生產(chǎn)力??墒牵覈懔Φ奶嵘L期面臨著明顯瓶頸。
算力產(chǎn)業(yè)鏈的上下游可以分為前后兩端:前端是云計算廠商為企業(yè)提供算力服務(wù),設(shè)備廠商為云廠商提供服務(wù)器,全球市場只有美國和中國擁有規(guī)?;脑茝S商,美國是三大云廠商(亞馬遜AWS、微軟Azure、谷歌云)、中國是四大科技公司的云業(yè)務(wù)(阿里云、騰訊云、華為云、百度云),以及三大電信運營商云(移動云、天翼云、聯(lián)通云)。后端是芯片供應(yīng)商向服務(wù)器廠商銷售芯片,芯片制造商為芯片供應(yīng)商做代工,這就非??简炓粋€國家的半導(dǎo)體產(chǎn)業(yè)實力。中國的算力產(chǎn)業(yè)鏈在前端具備較強競爭力,后端則需要作出長期努力,我們還有很多短板需要補強。
近年來,因為AI需求驅(qū)動,諸多行業(yè)領(lǐng)域?qū)λ懔Φ男枨蟪手笖?shù)級增長,而算力的供給受限于高性能芯片的供給,只能做到線性增長,導(dǎo)致供不應(yīng)求,甚至“算力焦慮”。算力產(chǎn)業(yè)鏈的格局重塑已經(jīng)開始,國內(nèi)計算產(chǎn)業(yè)正在發(fā)生史無前例的重大變化。
重塑科技創(chuàng)新的一般范式
現(xiàn)今最重要的五個創(chuàng)新賽道,包括云計算、人工智能、元宇宙、量子計算、腦機融合,無疑都是由算力驅(qū)動的。近年不斷發(fā)展成熟的新能源電動車,也已不單純是一種動力設(shè)備,更多是一種算力驅(qū)動的信息產(chǎn)品。
根本上講,現(xiàn)代科技創(chuàng)新的一般范式就是提高計算能力和信息組織效率,調(diào)動能量,改變自然現(xiàn)象,滿足人的需求。信息調(diào)動能量的起點是能夠處理信息、能夠傳輸信息、能夠存儲信息。能夠處理、傳輸和存儲的信息總量,就是算力。發(fā)電量和算力被視作現(xiàn)代經(jīng)濟的硬指標,發(fā)電量的背后是一臺一臺的發(fā)電機,算力的背后是一臺一臺的服務(wù)器和不計其數(shù)的各類半導(dǎo)體芯片。
單位算力成本的不斷下降,正在并將繼續(xù)深度改變這個時代。1946年世界上第一臺計算機誕生,2016年AlphaGo下棋贏了柯潔,如果用1946年的算力來支持AlphaGo下這盤棋,就需要用上百萬個三峽水電站的發(fā)電量來實現(xiàn)。今天,我們只需消耗較少的能量就能實現(xiàn)過去難以想象的計算能力,可見算力的演進有多快。近年來算力的指數(shù)級提升,使得很多技術(shù)領(lǐng)域面臨的發(fā)展天花板被打開了。長期看來,算力產(chǎn)業(yè)鏈持續(xù)的技術(shù)升級是大勢所趨。就數(shù)字經(jīng)濟長遠發(fā)展所需要的算力結(jié)構(gòu)而言,可以作出以下算力分類。
通用算力
通用算力是由基于CPU芯片的服務(wù)器提供的算力,主要用于基礎(chǔ)通用計算,包括云計算、邊緣計算等。
云計算就是把計算任務(wù)從本地挪到遠程,往往是挪到一個大的計算中心。那里完成計算以后,再把計算結(jié)果返回本地。這樣,本地就不用部署很強的硬件搞計算了。云計算平臺提供的算力相當于插頭220V的交流電,你到哪里,帶上一個插頭插上就能用。當云計算平臺提供更多的算力時,企業(yè)、家庭都可以做各種各樣和計算相關(guān)的事情,企業(yè)和家庭的智能化程度也就變高了,社會的智能化隨之得到提高。
邊緣計算則是把一部分計算任務(wù)放在分散各處的本地去完成,這樣,可以減少云服務(wù)器的計算壓力,也能緩解傳輸帶寬上的壓力。邊緣計算特別適用于物聯(lián)網(wǎng)(IoT)、智能汽車等應(yīng)用場景。IoT現(xiàn)在處于起步階段,將來會越來越多,IoT的一個特殊應(yīng)用是車聯(lián)網(wǎng),里面涉及很多計算問題。比如公路上的自動駕駛汽車,操控車輛就要用到AI,不僅傳感器返回的信息需要大量的計算資源進行數(shù)據(jù)處理,更要馬上做出判斷、規(guī)劃相應(yīng)路徑等操作,這些都離不開可靠的算力支撐。
智能算力
智能算力是由基于GPU、FPGA、ASIC等AI芯片的加速計算平臺提供的算力,主要用于人工智能的訓練和推理計算,比如語音、圖像和視頻的處理。
過去,人們因為難以承受太高的算力成本,覺得AI不實用,如今隨著持續(xù)下降的單位算力成本,服務(wù)器計算能力越來越強大,使得AI的實用化、商用化的臨界點已經(jīng)到來。
為什么AI的創(chuàng)新發(fā)展如此消耗算力呢?根本原因是AI改變了解決問題的基本范式。比如我們解數(shù)學題,一般需要搞懂問題的基本原理,通過邏輯推理得到最終答案。但是AI重新踏出了一條解決問題的思路,不需要知道原理,依靠強大的計算能力把可能的答案都挨個進行試錯,也能找到正確答案。就像谷歌的圍棋人工智能AlphaGo,是自己跟自己下棋,進行無數(shù)次的試錯(也叫“暴力計算”),最后戰(zhàn)勝了人類頂尖棋手。
計算機不能自主產(chǎn)生智能和知識,但可以通過大量的計算來獲得數(shù)據(jù)背后的統(tǒng)計規(guī)律。包括語音識別、圖像識別、自然語言處理、用戶畫像等基礎(chǔ)AI技術(shù),完全不需要人類教會機器聲學、光學和電磁學原理,讓機器像人類工程師一樣工作。今天AI技術(shù)的創(chuàng)新只需要算法和數(shù)據(jù),好的算法會不斷產(chǎn)生有價值的數(shù)據(jù),有價值的數(shù)據(jù)又會推進算法的升級改進,這一切就是一輪輪高消耗的計算,但前提是擁有超強的計算能力。換句話說,只要算力足夠強大,很多問題都可以轉(zhuǎn)化為計算問題。
超算算力
超算算力是由超級計算機提供的算力,主要用于尖端科學領(lǐng)域的計算,比如行星模擬、藥物分子設(shè)計、基因分析等。
為什么你能感覺到現(xiàn)在的天氣預(yù)報比原來精準多了?以前天氣預(yù)報只能告訴你“局部地區(qū)有雨”,現(xiàn)在可以讓你隨時在手機APP上查看未來幾個小時精準的降雨云圖,這就是算力提升的結(jié)果。算力提升的好處也反應(yīng)在生物醫(yī)藥研究上,可以使新藥研發(fā)鑒定的周期從5000天縮短到100天。
目前只有少數(shù)幾家中國公司真正具備超算能力,就是有大型服務(wù)器、可以實現(xiàn)非常復(fù)雜的超級算力。國內(nèi)這幾家超算公司中多數(shù)擁有自研芯片,核心技術(shù)相對自主可控。沒有自研芯片的中國超算公司也有自己的特殊優(yōu)勢,就是更能通過國際合作的加持推動產(chǎn)品的廣泛商用。
面臨明顯短板
2022年12月,OpenAI推出對話AI ChatGPT。這種依靠AI大模型和AI算力訓練出來的生成式AI,正在重塑軟件、芯片產(chǎn)業(yè),甚至影響了很多傳統(tǒng)產(chǎn)業(yè)的智能化轉(zhuǎn)型,必然會觸發(fā)算力資源的緊張。除了IT行業(yè)本身,制造業(yè)(智慧工廠)也是算力消耗的大戶。
清華大學全球產(chǎn)業(yè)研究院已經(jīng)注意到算力在經(jīng)濟發(fā)展過程中能夠發(fā)揮倍增效應(yīng),對于“數(shù)實融合”有很強的促動和催化作用。相關(guān)數(shù)據(jù)顯示,2022年制造行業(yè)中算力投入規(guī)模達125.8億美元,同比增速為29.0%,制造業(yè)的算力水平已經(jīng)超過金融業(yè)排名第二。IT行業(yè)、制造業(yè),及金融業(yè)等各個行業(yè)領(lǐng)域都在推動智能化或者AI化,算力資源的供需之間出現(xiàn)了一道鴻溝。
ChatGPT和智慧工廠只是智能算力蓬勃發(fā)展的一個表象,其實質(zhì)是投入成本、技術(shù)門檻更高的智能算力將主導(dǎo)未來很長時間的算力擴張。管理咨詢機構(gòu)羅蘭貝格預(yù)測,從2018年到2030年,智能出行對算力的需求將增加390倍,智慧工廠需求將增長110倍,主要國家人均算力需求將從今天的不足500 GFLOPS(每秒10億次的浮點運算數(shù)),增加20倍,到2035年將達到10000 GFLOPS。算力結(jié)構(gòu)正在發(fā)生的重大轉(zhuǎn)變(智能算力的增長規(guī)模遠超通用算力),已經(jīng)明顯暴露我國算力產(chǎn)業(yè)鏈的短板。
“聰明的算力”很稀缺
為什么算力資源的供給短期難以出現(xiàn)更大的增長以跟上需求節(jié)奏?這還要從現(xiàn)在人工智能的技術(shù)路線說起。今天,幾乎所有AI的成果都來自于“以數(shù)量實現(xiàn)質(zhì)量”。ChatGPT和AlphaGo都是“以數(shù)量實現(xiàn)質(zhì)量”的代表,也就是大量數(shù)據(jù)+大計算量,算力為王。數(shù)據(jù)、算力和模型是當今人工智能的基礎(chǔ),算力最為基礎(chǔ)。
ChatGPT的前身是2020年誕生的一個NLP模型GPT-3,可以寫詩、寫劇本、寫產(chǎn)品說明書。GPT-3有1750億個參數(shù),要比競爭對手英偉達公司的語言模型Megatron(有80億個參數(shù))、微軟的“圖靈NLG”(有170億個參數(shù))都要多很多。就AI技術(shù)當前的發(fā)展階段來看,“大”就是一種創(chuàng)新,量變即質(zhì)變。
國內(nèi)很多科研院所、互聯(lián)網(wǎng)企業(yè)在AI領(lǐng)域有一定技術(shù)積累,也推出一些對標ChatGPT的大模型產(chǎn)品。這其中,算法和數(shù)據(jù)的差距可能不難追上,但算力的差距則是短期難以解決的。ChatGPT的底層技術(shù)是GPT-3.5語言大模型,包含近1800億個參數(shù)。盡管參數(shù)規(guī)模相比GPT-3增長不多,但美國市場研究機構(gòu)TrendForce經(jīng)過測算,處理1800億個參數(shù)的GPT-3.5大模型,需要的GPU芯片數(shù)量高達2萬枚。
這些參數(shù)在訓練過程中需要不斷調(diào)整和更新,沒有足夠高性能芯片支撐起的強大算力,就不能快速更新這些參數(shù)。如果要加快推進訓練進度,大模型往往還要采取分布式訓練,也就是將模型分布在多個計算節(jié)點上進行訓練,每個節(jié)點都需要足夠的算力(芯片)來完成自己的任務(wù)。這就是一個算力黑洞,多多益善。
在更早的2022年11月,微軟Azure云服務(wù)平臺上就部署了數(shù)萬枚英偉達A100/H100高性能芯片。運行ChatGPT至少需要一萬枚英偉達的A100芯片。然而,國內(nèi)GPU芯片持有量超過一萬枚的企業(yè)已經(jīng)屈指可數(shù)。時至今日,國內(nèi)企業(yè)和科研院所甚至已經(jīng)買不到A100/H100這等技術(shù)水平的芯片了。高性能GPU芯片代表著這個時代“頂級聰明的算力”,這個水平的芯片面臨缺貨,正在成為我國發(fā)展高水平AI技術(shù)的主要限制因素。
是否能得到“聰明的算力”
智算中心、超算中心,及云計算中心等各種計算中心,提供算力的核心是服務(wù)器,服務(wù)器的核心是半導(dǎo)體芯片。目前世界主流高性能芯片的工藝制程已經(jīng)達到7納米,甚至5納米的水平,而國內(nèi)的芯片制造精度短期內(nèi)還無法達到這一水平。芯片無疑是中國算力產(chǎn)業(yè)鏈的最大短板,不容忽視。沒有最好的芯片,是否還能得到“聰明的算力”?也許可以這樣理解:如果暫時無法得到“頂級聰明的算力”,能夠針對很多具體的應(yīng)用場景做到“恰當?shù)穆斆?rdquo;也不錯。
真正的算力競爭,并不是各個企業(yè)、科研院所單純比拼誰每秒計算多少次,而是針對每一個應(yīng)用場景的具體需求,看誰能夠?qū)崿F(xiàn)“恰當聰明的算力”,看誰成本更低,效果更好,表現(xiàn)更加穩(wěn)定,更好滿足一個一個具體的應(yīng)用需求。歸根到底,算力的布局和應(yīng)用都是針對很多小的細分市場。
比如,ChatGPT和AlphaGo智慧程度很高,背后有很強的算力支持,但是你無法讓ChatGPT下棋,也無法讓AlphaGo回答問題,即應(yīng)用場景受限。這沒關(guān)系,中國市場還處于AI算力、大模型商業(yè)化的起步期,國內(nèi)已經(jīng)有自動駕駛、金融等領(lǐng)域的少數(shù)企業(yè)開始采用AI算力。已經(jīng)有電動汽車制造商采用國內(nèi)的智算中心進行自動駕駛的模型訓練。國內(nèi)很多銀行的反欺詐中心通常只需要租賃使用數(shù)百枚性能較低的GPU優(yōu)化(反欺詐)模型。缺乏足夠的高性能GPU做大規(guī)模AI模型訓練,完全可以先針對各個細分行業(yè)做小模型(或者行業(yè)模型)。
另外,AI技術(shù)的創(chuàng)新突破,也需要從底層去重構(gòu)“根技術(shù)”。以深度學習為代表的AI技術(shù)所需要的智能算力和以馮·諾依曼架構(gòu)為核心的通用計算,存在很大不同。通用計算的很多能力(高精度計算、龐大的操作指令集)并不能給深度學習帶來太多助力,深度學習所需要的數(shù)據(jù)精度較低、計算相對簡單。
而深度學習真正需要的強大數(shù)據(jù)處理能力(一個大模型就包含數(shù)千億個參數(shù)),根本無法依靠哪個芯片、哪臺機器的獨立性能單獨完成任務(wù),而是需要以“異構(gòu)”的方式把多個算力單元疊加起來,共同完成任務(wù),此時大量芯片之間的通信能力也就更加重要了。由此看來,“根技術(shù)”的創(chuàng)新突破可能成為未來化解國內(nèi)算力產(chǎn)業(yè)鏈短板(缺乏高性能芯片)的一個契機。
突圍策略
縱觀全局,全球算力需求的急劇膨脹主要是結(jié)構(gòu)性的。算力本質(zhì)上由芯片決定,并不是所有地方、任何時候都是“芯片荒”。“芯片荒”很大部分原因是摩爾定律逐漸進入瓶頸,單芯片的算力已經(jīng)沒有多少提升空間了,成本越來越高。當然,影響算力資源可獲得性的關(guān)鍵要素,除了硬件瓶頸,網(wǎng)絡(luò)因素也是不可忽視的,構(gòu)建更大范圍的算力網(wǎng)絡(luò)就是正在探索中的可行思路。
算力網(wǎng)絡(luò)的特殊重要性,在于讓算力流動起來,更大程度釋放算力的利用率。IDC數(shù)據(jù)顯示,(全球主要經(jīng)濟體)企業(yè)分散的小算力利用率,目前僅為10%~15%,存在很大浪費。激活現(xiàn)有的算力資源,精準服務(wù)用戶,要比單純堆砌算力、死磕芯片制程更有價值。
其實,國家推動的“東數(shù)西算”工程,就是算力網(wǎng)絡(luò)理念的一次落地實踐。東部地區(qū)明顯對算力需求更高,西部地區(qū)因為制冷成本低(氣溫低),能源便宜(運輸成本低),算力成本自然更低。借助成熟可靠的通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施,將低時延要求的算力遷往西部地區(qū),全國統(tǒng)一資源調(diào)配,可以實現(xiàn)更好的算力性價比。
算力資源徹底“融入”通信網(wǎng)絡(luò)的最大好處,就是能以更加整體的形式、以最符合用戶需求的節(jié)奏提供算力資源服務(wù),就像我們家里的水、電和燃氣那樣。要真正做到這一點,需要有可持續(xù)的商業(yè)化驅(qū)動和體系化驅(qū)動。
商業(yè)化驅(qū)動:決定了算力網(wǎng)絡(luò)能否進入良性循環(huán)
構(gòu)建算力網(wǎng)絡(luò)的技術(shù)起點是云計算設(shè)施,特別巧合的是,算力產(chǎn)業(yè)鏈利潤最豐厚的部分目前也是云計算服務(wù),其次是服務(wù)器和通信設(shè)備。而特別尷尬的是,中國的云計算廠商整體上是不賺錢的。
2022年,美國三大云計算廠商亞馬遜AWS、微軟智能云和谷歌云掌握了全球66%的市場份額,營業(yè)利潤總和超過500億美元。而中國七大云計算廠商加起來,全球份額低于20%,年營業(yè)虧損總和超百億元。基于這個“戰(zhàn)略性虧損”的現(xiàn)狀,指望中國企業(yè)立足云計算基礎(chǔ)設(shè)施的有限資本支出投資智算集群、AI大模型,是不現(xiàn)實的。所以,中國本土企業(yè)面臨的最大壓力,是長期在全球算力產(chǎn)業(yè)鏈的價值分配中處于劣勢,使之難以進入商業(yè)可持續(xù)的良性循環(huán)。
我們需要看到,強大算力網(wǎng)絡(luò)的背后其實是強大的企業(yè)用戶集群和正向的技術(shù)、商業(yè)內(nèi)循環(huán)。以微軟自有的算力網(wǎng)絡(luò)為例,2022年,微軟在云計算基礎(chǔ)設(shè)施上的投入超過250億美元,當年微軟智能云的營業(yè)利潤就超過400億美元。微軟可以持續(xù)大規(guī)模投資智能算力、AI大模型業(yè)務(wù),與其財務(wù)狀況匹配。微軟的200多家核心客戶(包括制藥公司拜耳、審計公司畢馬威等),通常會在微軟云上租賃數(shù)千枚高性能GPU,進行AI模型訓練。微軟云已經(jīng)形成云+企業(yè)軟件+AI計算三條輪動增長曲線,2022年微軟公有云Azure營收增速超過30%,軟件業(yè)務(wù)營收增速超過50%,AI算力營收增速超過100%。
國外主要云計算廠商(微軟、亞馬遜)已經(jīng)有了成熟的商業(yè)模式和穩(wěn)定的利潤回報,自然能夠進行更高強度的研發(fā)投入,并獲得更大的技術(shù)優(yōu)勢,進入一個不斷自我強化的正循環(huán)。中國云計算廠商整體上還沒有進入這個正循環(huán)狀態(tài),仍處于探索和突圍之中。加上國內(nèi)的芯片制造精度與國際主流水平還有很大距離,致使國內(nèi)的算力產(chǎn)業(yè)鏈出現(xiàn)較多短板。
體系化驅(qū)動:讓千萬聰明人直面千萬個挑戰(zhàn)性問題
國內(nèi)希望通過構(gòu)建“一體化的算力網(wǎng)絡(luò)體系”(“東數(shù)西算”),反哺自主算力產(chǎn)業(yè)鏈,就像當年的高鐵、通信網(wǎng)絡(luò)也從產(chǎn)業(yè)鏈價值分配中的劣勢地位開始追趕,經(jīng)過統(tǒng)一調(diào)度和高強度研發(fā),實現(xiàn)了強勢崛起。然而,國內(nèi)算力產(chǎn)業(yè)鏈的實際情況比較特殊:一是各個云計算廠商的服務(wù)器、芯片、算法都有自己的一套標準,要把很多機器連在一起做事會很費勁;二是AI和云計算還處在技術(shù)快速迭代時期,統(tǒng)一調(diào)度會限制科技公司緊跟國際技術(shù)變革、推進創(chuàng)新突破的意愿。
歸根到底,算力產(chǎn)業(yè)鏈的進化迭代是一個系統(tǒng)工程。以上提到的算力網(wǎng)絡(luò)、異構(gòu)計算、行業(yè)(?。┠P投伎梢匀谌胱灾魉懔Ξa(chǎn)業(yè)鏈創(chuàng)新突圍的策略當中。這個過程不僅會創(chuàng)造一大批訂單,更重要的是會有一大批挑戰(zhàn)性的問題出現(xiàn)。
我國發(fā)展自主可靠的算力產(chǎn)業(yè)鏈的目標,可以被拆解成為一個一個非常具體的、細小的問題和需求,一些小的技術(shù)環(huán)節(jié)可能面臨瓶頸,一些核心零部件即使眼下還造不出來,但是目標清晰了,這個體系內(nèi)無數(shù)的聰明人都會知道該怎么奮斗。另外,沒有孤立存在的算力產(chǎn)業(yè)鏈,相關(guān)的周邊產(chǎn)業(yè)鏈(比如通信、電力等)在很多具體的要求下,也能快速成長,甚至能夠外溢到其他產(chǎn)業(yè)里去,促成中國工業(yè)體系整體性的創(chuàng)新崛起。
來源:中國工業(yè)和信息化