中國8萬億算力市場:花了錢算力卻難用,國產(chǎn)化舉步維艱

林志佳
實際上,算力既是信息基礎設施的重要組成部分,也是承載數(shù)據(jù)和運算運行的平臺,更是數(shù)字經(jīng)濟時代計算、存儲、網(wǎng)絡能力的一種綜合體現(xiàn)。

QQ截圖20220104093506.png

中國(杭州)算力小鎮(zhèn)/圖片來源@視覺中國

本文來自鈦媒體,作者/林志佳。

“算力”相關產(chǎn)業(yè)近期持續(xù)火爆。

據(jù)中國信息通信研究院測算,截至2021年底,中國算力核心產(chǎn)業(yè)規(guī)模超過1.5萬億元,關聯(lián)產(chǎn)業(yè)規(guī)模超過8萬億元。其中,云計算市場規(guī)模超過3000億元,互聯(lián)網(wǎng)數(shù)據(jù)中心(服務器)市場規(guī)模超過1500億元,AI核心產(chǎn)業(yè)規(guī)模超過4000億元。

同時,“算力”發(fā)展也受到了資本市場關注。數(shù)據(jù)顯示,自今年4月底起,A股算力相關概念板塊指數(shù)漲幅高達26%。

“算力已經(jīng)成為繼熱力、電力之后新的關鍵生產(chǎn)力。”工業(yè)和信息化部副部長張云明7月30日在中國首屆算力大會上表示,國內(nèi)算力產(chǎn)業(yè)近五年平均增速超過30%,算力規(guī)模超過150EFlops(每秒15000京次浮點運算次數(shù)),排名全球第二,第一是美國。

所謂“算力”,是指設備通過處理數(shù)據(jù),實現(xiàn)特定結果輸出的計算能力。2018年諾貝爾經(jīng)濟學獎獲得者William Nordhaus在《計算過程》一文中提出:“算力是設備根據(jù)內(nèi)部狀態(tài)的改變,每秒可處理的信息數(shù)據(jù)量。”

小至芯片、手機、PC,大到汽車、互聯(lián)網(wǎng)、人工智能(AI)、數(shù)據(jù)中心、比特幣、超級計算機、航天火箭,“元宇宙”概念以及48萬億元規(guī)模的中國數(shù)字經(jīng)濟等,“算力”都在其中發(fā)揮著基礎核心作用。沒有算力就沒有各種軟硬件的正常應用。

實際上,算力既是信息基礎設施的重要組成部分,也是承載數(shù)據(jù)和運算運行的平臺,更是數(shù)字經(jīng)濟時代計算、存儲、網(wǎng)絡能力的一種綜合體現(xiàn)。

目前,算力已經(jīng)成為拉動中國經(jīng)濟增長核心引擎之一。據(jù)信通院數(shù)據(jù)顯示,算力投入能顯著提升經(jīng)濟價值:每1元的算力投入,可以帶動3-4元的GDP(國內(nèi)生產(chǎn)總值)經(jīng)濟產(chǎn)出,實現(xiàn)經(jīng)濟增長的倍增效應。計算力指數(shù)越高對經(jīng)濟的拉動作用越顯著。

QQ截圖20220104093506.png

隨著今年國家推出“東數(shù)西算”工程,地方上也進一步加碼布局。發(fā)改委公布的數(shù)據(jù)顯示,今年以來,全國10個國家數(shù)據(jù)中心集群中,新開工項目25個,帶動各方面投資超過1900億元。預計“十四五”期間,大數(shù)據(jù)中心投資還將以每年超過20%的速度增長,累計帶動投資超過3萬億元。

算力還是中美未來科技競爭的關鍵因子。去年4月,美國商務部對中國國家超級計算濟南中心、深圳中心、無錫中心、鄭州中心等中國超算實體列入“實體清單”。有行業(yè)人士告訴鈦媒體App,“算力的重要性在于,它是國家競爭能力高低的核心指標,也是中長期的投資抓手。”

不過,中國算力產(chǎn)業(yè)依然面臨需求碎片化、國產(chǎn)基礎軟件生態(tài)和配套芯片不強、傳輸能力不足、無效算力增多、人才緊缺、難互通協(xié)同等諸多挑戰(zhàn)。正如中國工程院院士王恩東在算力大會上所說,中國算力產(chǎn)業(yè)未來要加強頂層規(guī)劃,規(guī)范產(chǎn)業(yè)發(fā)展,不能“躺平”,更要避免一哄而上、低水平重復的問題。

云岫資本合伙人兼CTO趙占祥接受鈦媒體App采訪時表示,服務器芯片“國產(chǎn)替代”需要長時間布局,有一個循序漸進的過程,同時還需要軟件生態(tài)、人才、芯片性能、客戶支持等資源整合,“這是一個全方位的工程(體系)。”

提升算力就是要“撒錢”堆服務器

2018年9月,臺風“山竹”到來之前,深圳市氣象臺發(fā)布了雷暴及大雨預警。一個小時后,深圳全城下起了大暴雨。

深圳氣象局能夠如此準確的公布降雨、雷暴等災害性天氣,主要來源于云計算、AI、5G等技術以及災害性天氣AI氣象預測模型,捕捉雷達、云圖等數(shù)據(jù)中的時空關系實現(xiàn)氣象預警。實際上,氣象AI預測模型背后擁有每年約300TB的數(shù)據(jù),那么就需要大量算力支撐,才能讓模型應用,AI技術實現(xiàn)產(chǎn)業(yè)落地。

而在浙江橫店,每年有大量的影視作品在后期制作時需要對動畫和特效進行渲染,而這類渲染工作就需用到大量的算力??紤]成本的情況下,這些后期工程文件會通過云平臺,將其上傳至貴州、內(nèi)蒙這些西部地區(qū)的數(shù)據(jù)中心進行計算。

這些算力應用背后,服務器的作用功不可沒。中國科學院院士鄔賀銓表示,算力產(chǎn)業(yè)鏈很長,數(shù)據(jù)中心是算力產(chǎn)業(yè)里突出的中心環(huán)節(jié)。

按應用領域劃分,算力包括兩種:計算量小的通用算力,以及數(shù)據(jù)中心、超級計算機等在內(nèi)的HPC(高性能計算)算力。

僅從算力經(jīng)濟來看,主要分為三個層次:

第一層次是算力的“基礎設施建設”。作為新型生產(chǎn)力,算力離不開工具和技術。而基礎設施是算力的工具,包括高性能芯片、數(shù)據(jù)中心、網(wǎng)絡等基礎設施建設為算力、應用以及產(chǎn)業(yè)發(fā)展提供可持續(xù)發(fā)展的保障。

第二個層次是算力應用。得益于基礎設施的進步、數(shù)據(jù)推動算力水平的不斷提升,云計算、大數(shù)據(jù)、AI、物聯(lián)網(wǎng)、5G等應用都將發(fā)展,從而帶來計算方法的革新,提高計算效率,拉動算力發(fā)展。

第三個層次是算力與實體經(jīng)濟產(chǎn)業(yè)的融合。工業(yè)互聯(lián)網(wǎng)、金融科技、自動駕駛、智慧醫(yī)療等產(chǎn)業(yè)數(shù)字化加速、新的需求以及產(chǎn)生的大量數(shù)據(jù),讓超大算力得以“施展才華”。

QQ截圖20220104093506.png

“算力”產(chǎn)業(yè)鏈邏輯關系框架(來源:鈦媒體App編輯整理)

相對于中國超14億人的算力應用和消費市場,數(shù)據(jù)中心、芯片半導體等算力基礎設施產(chǎn)業(yè)鏈,則是中國目前急需布局的重點領域之一。

作為算力的主要承載,數(shù)據(jù)中心就是一個容納核心計算服務和基礎設施的服務器機房(物理場所),可用于存儲和計算數(shù)據(jù)。

數(shù)據(jù)顯示,2019年,中國在用的數(shù)據(jù)中心數(shù)量達到2213個,其中超大型、大型數(shù)據(jù)中心數(shù)量占比12.7%。與之對比的是,美國超大型數(shù)據(jù)中心占到全球總量40%,國內(nèi)數(shù)據(jù)中心建設仍有較大空間。

2021年5月,中國提出“東數(shù)西算”工程,計劃在國內(nèi)8個地方啟動建設國家算力樞紐節(jié)點,規(guī)劃10個國家數(shù)據(jù)中心集群,將東部算力需求以及產(chǎn)生的數(shù)據(jù),通過網(wǎng)絡引導到中國西部地區(qū)的數(shù)據(jù)中心處理、計算和存儲。預計在2025年,中國將有望建成全國一體化數(shù)據(jù)中心系統(tǒng)。

借助“東數(shù)西算”東風,今年以來,阿里、華為、商湯、浪潮,以及國內(nèi)三大電信運營商——中國移動、中國聯(lián)通、中國電信等,在蘇州、呼和浩特、成都等地大量投資,建立及運營新的數(shù)據(jù)中心或計算中心。

中國移動副總經(jīng)理高同慶表示,預計2021年內(nèi),中國移動數(shù)據(jù)中心投產(chǎn)能力超過117萬架。2022年,中國移動算力網(wǎng)絡資本開支達數(shù)百億元,未來還將繼續(xù)在算力領域加大投入。目前中國移動長三角數(shù)據(jù)中心位于南京江北新區(qū),投資超200億元。

“國內(nèi)提出‘東數(shù)西算’,是利用西部比較充裕的能源,比較廉價的電費,以及有可能利用再生能源,更好滿足低碳的需要。”鄔賀銓表示。

不過鄔賀銓也質疑稱,“東數(shù)西算”工程難以互通,從而讓算力與存儲容量無法得到最佳利用。

他以廣東數(shù)據(jù)中心規(guī)劃為例,“他們設計省內(nèi)算力70%,省外算力30%。按理說,省外就是冷數(shù)據(jù),應該占比80%,那與省外算力30%差別很大,這是否意味著,80%是指存儲容量而非算力的比例?另外,在市場經(jīng)濟條件下,東部與西部并非固定配對,如何各自做到容量最佳利用?”

而作為AI技術三要素(數(shù)據(jù)、算力、算法)之一,算力在AI中也發(fā)揮了關鍵作用。商湯科技聯(lián)合創(chuàng)始人林達華告訴鈦媒體App,在青島市西海岸新區(qū),利用其AI大裝置算力以及算法技術支持下,商湯對千萬級海量遙感影像樣本數(shù)據(jù)進行深度學習,形成多種面向業(yè)務應用場景的算法模型。在城市違建治理、生態(tài)環(huán)境監(jiān)測、河湖四亂治理等方面實現(xiàn)了問題的高效發(fā)現(xiàn)和治理核查。

此外,當前中國的算力建設還受到碳中和、碳達峰目標的制約:一是工信部發(fā)布的《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》等政策,面對算力設施的建設方針和能耗管理趨于嚴格,如2023年新建大型及以上數(shù)據(jù)中心電能利用率(PUE)將被要求降到1.3;二是能耗“雙控”背景下,地方政府對于建設高能耗算力設施的積極性在降低。

因此,國內(nèi)外頭部IT企業(yè)也開始部署液冷技術。業(yè)內(nèi)人士告訴鈦媒體App,目前高功率服務器應用越來越多,其可在同等溫度下大幅提升數(shù)據(jù)中心的運算效率,為提升高功率服務器散熱需求,同時降低散熱能耗,業(yè)內(nèi)通常采用冷板、浸沒、噴淋三類液體冷卻服務器方案,通過將CPU(中央處理器)、GPU(圖形處理器)等服務器部件與冷板液冷的冷板緊密貼合,或與浸沒液冷直接接觸,提升服務器散熱系統(tǒng)換熱能力,實現(xiàn)高功率運算。

QQ截圖20220104093506.png

阿里云數(shù)據(jù)中心設施模型在2022中國算力大會展示。下面兩端物體是浸沒液冷的CDU,也叫冷源分配單元,它起到內(nèi)外換熱的作用,把吸收服務器熱量的液體收集后,在CDU內(nèi)部與外部冷源進行換熱,是一個中間裝置;上面兩端則是浸沒液冷的一種冷源形態(tài),圖中是給集裝箱內(nèi)的液冷tank進行散熱用,設備類型可能是冷塔、干冷器、冷機等(圖片來源:鈦媒體App編輯拍攝)

無錫數(shù)字經(jīng)濟研究院執(zhí)行院長吳琦表示,一些規(guī)模小、能耗大、技術更新緩慢的企業(yè)和設施將面臨淘汰,電能利用效率高的產(chǎn)品會是未來算力市場的主流。

政企花了錢,算力也難用

中國首屆算力大會上,中國工程院院士劉韻潔直言,目前不管是算力網(wǎng)絡,還是算力面臨著諸多挑戰(zhàn)。如果不能解決這些問題,算力網(wǎng)絡將難以構建(實現(xiàn))。

實際上,算力網(wǎng)絡是基于數(shù)據(jù)中心等算力基礎設施,將海量數(shù)據(jù)通過云、邊、端協(xié)同方式,實現(xiàn)智能計算與網(wǎng)絡連接。華為發(fā)布的《通信網(wǎng)絡2030》提到,算力網(wǎng)絡代表了從“面向人的認知”向“面向機器認知”(AI)的網(wǎng)絡設計理念的重要變化,聯(lián)接海量用戶數(shù)據(jù)與多級算力服務。

因此,劉韻潔的說法意味著,政府、企業(yè)花了大量的資金投入算力基礎建設,但如果算力網(wǎng)沒有構建好,算力也很難使用。

劉韻潔認為,目前算力網(wǎng)絡面臨三個主要挑戰(zhàn):

一是實時性嚴重缺乏,目前互聯(lián)網(wǎng)幾乎沒有實時性的能力,而實時性的能力,不論是工業(yè)、能源還是電力,都提出了確定性網(wǎng)絡的具體指標;二是帶寬的挑戰(zhàn),F(xiàn)AST(500米口徑球面射電望遠鏡)每天產(chǎn)生的數(shù)據(jù)大概超2000TB,這些數(shù)據(jù)與全球網(wǎng)絡共享,網(wǎng)絡帶寬的不確定性導致傳輸效率低;三是當前“煙囪化算力”難互聯(lián)、難協(xié)同,這就造成算力利用率低,使得算力成本增加,如何將“算力”和“網(wǎng)”深度融合在一起,也是一個非常大的挑戰(zhàn)。

以國有企業(yè)“寶武鋼鐵集團”為例。武鋼通信技術有限公司總工程師陳巍崴曾在2021年7月提到,寶武集團工廠存在大量非云化設備,且協(xié)議不開放、工業(yè)連接組模不豐富,對接耗費成本;再就是工控網(wǎng)、管理網(wǎng)和互聯(lián)網(wǎng)多網(wǎng)并存,網(wǎng)絡安全無法有效管控。傳統(tǒng)“盡力而為”的網(wǎng)絡已經(jīng)無法滿足寶武集團數(shù)字化及新業(yè)務。

QQ截圖20220104093506.png

華為的智能算力網(wǎng)絡生態(tài)(來源:鈦媒體App拍攝)

實際上,算力網(wǎng)絡、基礎設施的互聯(lián)互通、轉移新平臺設施一直是企業(yè)的核心難題——阿里云沒有騰訊云、華為云平臺接口,美國Oracle數(shù)據(jù)庫的信息資料沒辦法轉移等。

2021年3月,作為金融領域的國有企業(yè),中國郵政儲蓄銀行發(fā)布采購前公示,而且是單一來源采購,理由是:當前多個核心生產(chǎn)系統(tǒng)使用美國Oracle(甲骨文)數(shù)據(jù)庫進行數(shù)據(jù)存儲和處理,無法替換。隨后6月,郵儲銀行以1.45億元與甲骨文簽下續(xù)約合作。

那么,如何解決“全國算力一張網(wǎng)”的難點與挑戰(zhàn)?

劉韻潔院士提出,建立以“大帶寬、低時延、超低抖動、極高可靠”為主要特征的確定性網(wǎng)絡,支撐產(chǎn)業(yè)核心應用加速云化、線上化、智能化,將真正改變產(chǎn)業(yè)互聯(lián)網(wǎng)模式。“無論是智慧醫(yī)療、能源、交通,以及未來的元宇宙,沒有確定性的網(wǎng)絡會有問題。”

與此同時,中國也在努力逐步解決這一難題。今年6月15日,中國正式上線“中國算力網(wǎng)-智算網(wǎng)絡”,將整個算力網(wǎng)絡接入中央批準成立的鵬城實驗室的鵬城云腦、北京、杭州等9個算力中心,總算力超過2000PFlops(每秒200億億次浮點運算)。

華為公司副總裁、計算產(chǎn)品線總裁鄧泰華認為,中國算力網(wǎng)是一個大工程。目前中國有電力網(wǎng)、高鐵網(wǎng)、通信網(wǎng),未來有算力網(wǎng),尤其利用大型的算力資源連成一張網(wǎng)。

國產(chǎn)化依然難行

作為“算力”的極限領域,中國超級計算機一直受到美國超級電腦的壓制。

2016年,美國以擔心中國“天河二號”進行核子研究為由,禁止英特爾出口芯片給中國。隨后于2016年,利用上海高性能集成電路設計中心自研設計的SW26010處理器,中國自主研發(fā)出“神威·太湖之光”超級計算機,以93014.6TFlops問鼎世界第一。

不過,到了2018年6月,“神威·太湖之光”被美國IBM研發(fā)的Summit OLCF-4超級電腦所超越。

QQ截圖20220104093506.png

2021年4月起,美國商務部對多家中國超級計算機實體列入“實體清單”,其中包括天津飛騰信息技術有限公司、上海高性能集成電路設計中心、成都申威科技有限責任公司,以及中國國家超級計算濟南中心、深圳中心、無錫中心、鄭州中心等。更早之前,美國對華為海思、中芯國際、商湯等“算力”產(chǎn)業(yè)鏈相關企業(yè)進行制裁。

截止發(fā)稿前,Top500網(wǎng)站數(shù)據(jù)顯示,目前全球超算排名第一的是,美國能源部及芯片巨頭AMD、HPE慧與科技合作研發(fā)的Frontier(OLCF-5)全球首臺百億億次級計算機。而中國“神威·太湖之光”排名第六,“天河二號”則排名第八。

在中美博弈持續(xù)升級的大背景下,目前包括服務器芯片、軟件系統(tǒng)、數(shù)據(jù)庫等領域仍依賴于國外產(chǎn)品,“算力”產(chǎn)業(yè)的國產(chǎn)化依然難行。

其中在服務器整機市場方面,IDC數(shù)據(jù)顯示,2021年全球服務器市場出貨量和銷售額分別為1353.9萬臺和992.2億美元,其中中國銷售占比達25.3%。2022年第一季度,全球服務器市場份額排名前五,分別是美國戴爾(份額高達16%)、中國浪潮(10%)、美國惠普、美國AMD、中國聯(lián)想(不足5%)。

操作系統(tǒng)裝機量方面,數(shù)據(jù)顯示,盡管互聯(lián)網(wǎng)領域的服務器操作系統(tǒng),實現(xiàn)100%國產(chǎn)化,但通信、金融和政企領域依然有35%以上,仍依賴國外操作系統(tǒng),例如美國微軟的Windows、IBM的Redhat等。

算力數(shù)據(jù)庫方面,中國軟件協(xié)會數(shù)據(jù)顯示,國內(nèi)集中式數(shù)據(jù)庫市場,國外品牌仍占據(jù)90%以上;關系型數(shù)據(jù)庫領域,美國微軟(21.6%)、甲骨文(21.4%)和亞馬遜(8.5%)共占市場總份額的50%以上。

QQ截圖20220104093506.png

最重要的服務器芯片領域,無論是通用處理器還是加速處理器,英特爾(Intel)、AMD和英偉達占據(jù)國內(nèi)85%以上的服務器芯片市場,國產(chǎn)處理器及關鍵零部件份額較低。

“這其實還是一個軟件生態(tài)的問題,因為英偉達、英特爾等國外的軟件生態(tài)太強了,國內(nèi)企業(yè)想要追上來難度很大,需要投入很長時間與大量資源。”趙占祥對鈦媒體App表示,Windows等操作系統(tǒng)需要幾十萬開發(fā)者,而國內(nèi)很難調動這么多資源,因此國內(nèi)服務器需要長期依賴國外芯片企業(yè)。

7月31日結束的中國計算機學會(CCF)芯片大會上,清華大學教授魏少軍就表示,國產(chǎn)服務器芯片的產(chǎn)品能力不行,無法具有足夠的市場競爭力。例如,國內(nèi)芯片無法實現(xiàn)服務器中非常重要的配置并發(fā)多線程(SMT)能力,而國外芯片在這個問題上已經(jīng)全面突破,國產(chǎn)芯片技術依然落后。

“我們花了很多精力去建立AI平臺,實際上不可用,或者說它并沒有想象的那么好。說的更好聽一點,還沒有達到我們所需要的要求,仍需要時間等待。”魏少軍表示。

一家國產(chǎn)GPU芯片企業(yè)高管告訴鈦媒體App,很多國產(chǎn)服務器板卡都無法在客戶數(shù)據(jù)中心上“跑動”,因為適配度較差。

今年以來,阿里、騰訊、字節(jié)都紛紛開啟了“造芯”模式,均與服務器有關。但一位芯片行業(yè)人士對鈦媒體App表示,互聯(lián)網(wǎng)“造芯”無法從根本上解決國內(nèi)服務器依賴進口芯片的情況。

在趙占祥看來,這些互聯(lián)網(wǎng)企業(yè)“造芯”主要原因是自身服務器的降本增效。

目前,浪潮、阿里云、騰訊云等國內(nèi)廠商,仍大部分使用美國芯片企業(yè)的產(chǎn)品。其中,騰訊云的星星海處理器均為AMD、英特爾定制開發(fā);阿里云第七代云服務器ECS的CPU則采用英特爾第三代Xeon可擴展處理器;浪潮服務器所使用的芯片大部分來自英特爾、AMD、英偉達三家,部分服務器則使用寒武紀的AI芯片。

“算力建設的最大難點還是在于半導體與集成電路制造。而在服務器芯片領域,無論是通用處理器還是GPU芯片,對國外的依賴程度非常高,解決問題的難度也非常大。”王恩東認為,中國要集中力量打造國產(chǎn)CPU芯片,打破技術壁壘,不能煙囪林立。

張云明表示,下一步工信部將要加速推進高端芯片、核心算法等算力關鍵核心技術的研發(fā)突破,攻克關鍵技術,支持企業(yè)、科研機構開展聯(lián)合攻關,增強算力產(chǎn)業(yè)鏈、供應鏈自主可控能力,并在綠色低碳發(fā)展等方面發(fā)力。

“不能說芯片初創(chuàng)企業(yè)一旦虧損就不投資了。我認為,更多的民間資本應該要投資長期會虧損、對國家很重要的芯片企業(yè),而且政策上要鼓勵其早點上市,給這些虧損公司融資提供一個比較好的通道。”趙占祥說。

(本文首發(fā)鈦媒體App,作者|林志佳)

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論