高性能計(jì)算被視為計(jì)算機(jī)科學(xué)與工程的“皇冠”,各國(guó)近年來(lái)均頻繁從國(guó)家層面啟動(dòng)研制計(jì)劃。在中國(guó)多次上榜全球高性能計(jì)算TOP500后,美國(guó)自2015年起將多所中國(guó)高性能計(jì)算相關(guān)機(jī)構(gòu)或企業(yè)列入實(shí)體清單,而我國(guó)高性能計(jì)算整體實(shí)力和美國(guó)相比仍然有較大差距。因此,發(fā)展自主可控的高性能計(jì)算至關(guān)重要。
高性能計(jì)算機(jī)(HPC,High Performance Computer,又稱(chēng)超級(jí)計(jì)算機(jī))是國(guó)之重器。從核爆炸模擬、油藏模擬,到極端天氣預(yù)報(bào)等,高性能計(jì)算都守護(hù)著國(guó)家安全和安寧。因此,高性能計(jì)算也成為衡量國(guó)家之間綜合實(shí)力的基準(zhǔn)之一,被視為國(guó)家實(shí)力的象征。2020年以來(lái),十四五和新基建驅(qū)動(dòng)我國(guó)高性能計(jì)算中心建設(shè)進(jìn)入高速增長(zhǎng)期,多地地方政府和企事業(yè)單位都在積極建設(shè)和籌建高性能計(jì)算中心。
高性能計(jì)算是什么?
高性能計(jì)算是指將多個(gè)計(jì)算節(jié)點(diǎn)組織起來(lái),通過(guò)網(wǎng)絡(luò)連接在一起,進(jìn)行協(xié)同工作,組成一臺(tái)性能更強(qiáng)大的計(jì)算機(jī),通常指具有極快運(yùn)算速度、極大存儲(chǔ)容量、極高通信帶寬的一類(lèi)計(jì)算機(jī)。
高性能計(jì)算能夠讓整個(gè)計(jì)算機(jī)集群為同一個(gè)任務(wù)工作,以更快的速度來(lái)解決一個(gè)復(fù)雜問(wèn)題。一臺(tái)高性能計(jì)算上往往執(zhí)行一個(gè)任務(wù)(或者有限的幾個(gè)任務(wù))。全部的計(jì)算機(jī)資源都被傾注到同一個(gè)任務(wù)中。為了解決同一個(gè)問(wèn)題,集群的不同計(jì)算機(jī)之間要有非常好的溝通能力。
高性能計(jì)算近60年的演變路線可簡(jiǎn)單地分為2個(gè)階段:Cray時(shí)代和多計(jì)算機(jī)時(shí)代。
(1)Cray時(shí)代。從20世紀(jì)60—90年代初期的30年被稱(chēng)為“Cray時(shí)代”,以單一內(nèi)存向量機(jī)的技術(shù)革新為主導(dǎo),Cray定義和引領(lǐng)了前30年的高性能計(jì)算市場(chǎng)。第一個(gè)30年研制以“頂天”為主,僅服務(wù)于國(guó)家戰(zhàn)略部門(mén)。
(2)多計(jì)算機(jī)時(shí)代。從20世紀(jì)90年代迄今的后30年被稱(chēng)為“多計(jì)算機(jī)時(shí)代”,由于微處理器的出現(xiàn),以及大量工業(yè)標(biāo)準(zhǔn)硬件的普及,以大規(guī)?;ミB多個(gè)通用乃至商用的計(jì)算部件的可擴(kuò)展系統(tǒng)結(jié)構(gòu)的技術(shù)創(chuàng)新主導(dǎo)了迄今為止的高性能計(jì)算發(fā)展。后30年的高性能計(jì)算機(jī)在滿足國(guó)家戰(zhàn)略應(yīng)用對(duì)性能巔峰需求的同時(shí),“立地”成為發(fā)展的主要目標(biāo),市場(chǎng)驅(qū)動(dòng)、高性能計(jì)算應(yīng)用普及成為第二階段的顯著特點(diǎn)。
高性能計(jì)算為什么重要?
高性能計(jì)算是計(jì)算機(jī)技術(shù)的源頭之一?;ヂ?lián)網(wǎng)產(chǎn)業(yè)依賴的數(shù)據(jù)中心的核心技術(shù),諸如Hadoop等并行編程工具和RDMA等遠(yuǎn)程通信技術(shù)大多脫胎于此。因此,高性能計(jì)算機(jī)被視為計(jì)算機(jī)科學(xué)與工程的“皇冠”。
各國(guó)均頻繁從國(guó)家層面啟動(dòng)研制計(jì)劃。在中國(guó)多次上榜全球高性能計(jì)算TOP500后,美國(guó)自2015年起將多所中國(guó)高性能計(jì)算相關(guān)機(jī)構(gòu)或企業(yè)列入實(shí)體清單,包括國(guó)防科大、無(wú)錫江南計(jì)算技術(shù)研究所、曙光、申威等。而我國(guó)高性能計(jì)算整體實(shí)力和美國(guó)相比仍然有較大差距。因此,發(fā)展自主可控的高性能計(jì)算至關(guān)重要。
高性能計(jì)算在底層芯片性能要求上高于普通的數(shù)據(jù)中心和智算中心。算力中心有多種,大致可分為數(shù)據(jù)中心、高性能計(jì)算中心、智算中心等,而它們都可以用云的形式來(lái)提供服務(wù)。
以實(shí)現(xiàn)人工智能需求為例,推理、訓(xùn)練和模擬為AI的三類(lèi)主要任務(wù)。在此維度上,芯片的應(yīng)用上限由其底層構(gòu)造所決定,即使采用軟件優(yōu)化也無(wú)法再提升。從芯片層面來(lái)看,如果底層芯片采用的是CPU+專(zhuān)用AI芯片,那么其只能完成AI推理和訓(xùn)練任務(wù),而無(wú)法完成模擬。
因?yàn)锳I芯片無(wú)法實(shí)現(xiàn)雙精度浮點(diǎn)運(yùn)算,雙精度浮點(diǎn)運(yùn)算大量涉及線性代數(shù)方程求解,而自然界的很多問(wèn)題,包括科學(xué)問(wèn)題、社會(huì)問(wèn)題等,最后都可轉(zhuǎn)化為線性代數(shù)方程求解問(wèn)題。
芯片是高性能計(jì)算的重要組成部分,但不是高性能計(jì)算技術(shù)的全部。高性能計(jì)算不是簡(jiǎn)單的CPU堆砌,體系結(jié)構(gòu)設(shè)計(jì)、高速互聯(lián)網(wǎng)絡(luò)、并行文件系統(tǒng)、儲(chǔ)存列陣等方面如果有所欠缺,即使堆再多的CPU,高性能計(jì)算性能也無(wú)法提高。
隨著計(jì)算能力的增強(qiáng)、應(yīng)用課題規(guī)模和復(fù)雜度的增加,高性能計(jì)算機(jī)對(duì)并行文件系統(tǒng)等性能要求越來(lái)越高。高性能計(jì)算的技術(shù)溢出效益非常明顯。由于服務(wù)器可以平滑地采用高性能計(jì)算的互聯(lián)技術(shù)、CPU技術(shù)、操作系統(tǒng)技術(shù)和并行軟件設(shè)計(jì)等技術(shù),在高性能計(jì)算方面的積累能夠自然地溢出到服務(wù)器產(chǎn)業(yè)。
高性能計(jì)算適用于需要并行運(yùn)算的任務(wù),應(yīng)用場(chǎng)景持續(xù)拓展。高性能計(jì)算主要應(yīng)用場(chǎng)景分為兩類(lèi),一類(lèi)是飛行器設(shè)計(jì)、核模擬實(shí)驗(yàn)、星云模擬、解密碼等數(shù)值模擬場(chǎng)景;一類(lèi)是大數(shù)據(jù)分析、統(tǒng)計(jì)和人工智能等數(shù)據(jù)分析場(chǎng)景。由于飛行器等工程設(shè)計(jì)中很多情況無(wú)法實(shí)測(cè),只能進(jìn)行計(jì)算模擬,因此美國(guó)對(duì)出口高性能計(jì)算十分謹(jǐn)慎。
高性能計(jì)算應(yīng)用正在從過(guò)去的高精尖向更廣更寬的方向發(fā)展。隨著高性能計(jì)算的發(fā)展,尤其是使用成本的不斷下降,其應(yīng)用領(lǐng)域也從具有國(guó)家戰(zhàn)略意義的核武器研制、信息安全、石油勘探等科學(xué)計(jì)算領(lǐng)域向更廣泛的國(guó)民經(jīng)濟(jì)主戰(zhàn)場(chǎng)快速擴(kuò)張,比如制藥、基因測(cè)序、動(dòng)漫渲染、數(shù)據(jù)挖掘、金融分析以及互聯(lián)網(wǎng)服務(wù)等等。
從2021年11月中國(guó)高性能計(jì)算機(jī)TOP100中的行業(yè)應(yīng)用領(lǐng)域份額來(lái)看,算力服務(wù)、高性能計(jì)算中心、人工智能、科學(xué)計(jì)算等領(lǐng)域是高性能計(jì)算的主要用戶,互聯(lián)網(wǎng)大數(shù)據(jù)特別是AI領(lǐng)域增長(zhǎng)強(qiáng)勁。
高性能計(jì)算市場(chǎng)競(jìng)爭(zhēng)格局
從中國(guó)高性能計(jì)算TOP100中主要公司系統(tǒng)個(gè)數(shù)統(tǒng)計(jì)來(lái)看,2002年之前,TOP100主要是國(guó)外的HP、IBM為主,后期以中國(guó)的聯(lián)想、曙光和浪潮為主。中科曙光在1998年完成863項(xiàng)目“曙光2000”可擴(kuò)展機(jī)群體系結(jié)構(gòu)的超級(jí)服務(wù)器,2001年完成“曙光3000”超級(jí)服務(wù)器后,從2005年開(kāi)始,市場(chǎng)競(jìng)爭(zhēng)開(kāi)始有突出表現(xiàn),曙光2010-2019年連續(xù)10年按裝機(jī)臺(tái)數(shù)市場(chǎng)份額第一,2019年占到接近40%。
浪潮在2012年完成“863計(jì)劃”容錯(cuò)服務(wù)器項(xiàng)目后,2014年開(kāi)始有明顯起色。聯(lián)想公司通過(guò)2014年對(duì)IBM公司X86HPC產(chǎn)品線的并購(gòu),市場(chǎng)份額異軍突起,到2021年已實(shí)現(xiàn)TOP100裝機(jī)臺(tái)數(shù)份額第一。而聯(lián)想、浪潮、曙光中,只有曙光擁有從芯片等硬件到軟件系統(tǒng)的國(guó)產(chǎn)自主知識(shí)產(chǎn)權(quán)。
高性能計(jì)算的市場(chǎng)空間
我國(guó)高性能計(jì)算中心建設(shè)主要通過(guò)部?。ㄊ校┖献鲄f(xié)議確立高性能計(jì)算中心的建設(shè)計(jì)劃,國(guó)家科技部代表國(guó)家科技戰(zhàn)略對(duì)主機(jī)性能設(shè)定目標(biāo)。地方政府希望高性能計(jì)算中心能成為區(qū)域科技發(fā)展的功能載體,為其聚集人才、創(chuàng)新科技并推動(dòng)經(jīng)濟(jì)發(fā)展。
2021年3月,我國(guó)“十四五規(guī)劃”中明確提出,要“加快構(gòu)建全國(guó)一體化大數(shù)據(jù)中心體系,強(qiáng)化算力統(tǒng)籌智能調(diào)度,建設(shè)若干國(guó)家樞紐節(jié)點(diǎn)和大數(shù)據(jù)中心集群,建設(shè)E級(jí)和10E級(jí)超級(jí)計(jì)算中心。”
根據(jù)規(guī)劃,合肥、蘭州、廈門(mén)、太原等地多地都將陸續(xù)建立高性能計(jì)算中心。“東數(shù)西算”工程落地有望進(jìn)一步促進(jìn)西部地區(qū)發(fā)展高性能計(jì)算中心。2022年2月,國(guó)家發(fā)改委批復(fù)同意在京津冀、長(zhǎng)三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏等8地啟動(dòng)建設(shè)國(guó)家算力樞紐節(jié)點(diǎn),并規(guī)劃了10個(gè)國(guó)家數(shù)據(jù)中心集群。
至此,全國(guó)一體化大數(shù)據(jù)中心體系完成總體布局設(shè)計(jì),代表著“東數(shù)西算”工程正式全面啟動(dòng)。西部有風(fēng)力發(fā)電、光伏發(fā)電,能源豐富,而且年平均氣溫比較低,十分適合計(jì)算中心的生存,而高性能計(jì)算業(yè)務(wù)對(duì)實(shí)時(shí)通訊的需求不高,未來(lái)高性能計(jì)算中心有望成為優(yōu)化算力布局的重要載體。
2022年中國(guó)整體高性能計(jì)算市場(chǎng)規(guī)模將超400億元。除政府規(guī)劃外,阿里、騰訊等多家互聯(lián)網(wǎng)巨頭均積極布局高性能計(jì)算建設(shè)。以騰訊為例,其于2020年6月正式開(kāi)工的長(zhǎng)三角人工智能高性能計(jì)算中心投資超450億元,建成后將承擔(dān)各種大規(guī)模AI算法計(jì)算、機(jī)器學(xué)習(xí)、圖像處理、科學(xué)計(jì)算和工程計(jì)算任務(wù)。
此外,金融機(jī)構(gòu)、運(yùn)營(yíng)商等均在積極部署自己的高性能計(jì)算。根據(jù)觀研天下預(yù)測(cè),2022年中國(guó)高性能計(jì)算行業(yè)總體市場(chǎng)規(guī)模將超400億元,2021-2025年CAGR為13%左右。
參考資料:
20220405-東吳證券-被忽視的國(guó)之重器:高性能計(jì)算那些事兒
本報(bào)告由研究助理協(xié)助資料整理,由投資顧問(wèn)撰寫(xiě)。投資顧問(wèn):黃波(登記編號(hào):A0740620120007)