【案例】基于HPC&AI的高性能計(jì)算公共服務(wù)平臺

信息化觀察網(wǎng)
信息化觀察網(wǎng)
基于HPC&AI的高性能計(jì)算公共服務(wù)平臺以助推智慧城市建設(shè)、高科技產(chǎn)業(yè)發(fā)展為目標(biāo),建設(shè)和運(yùn)營區(qū)域超大規(guī)模高性能計(jì)算公共服務(wù)平臺。

基于HPC&AI的高性能計(jì)算公共服務(wù)平臺以助推智慧城市建設(shè)、高科技產(chǎn)業(yè)發(fā)展為目標(biāo),建設(shè)和運(yùn)營區(qū)域超大規(guī)模高性能計(jì)算公共服務(wù)平臺。平臺方案包括通用計(jì)算系統(tǒng)、人工智能加速計(jì)算系統(tǒng)、大數(shù)據(jù)存儲支撐系統(tǒng)、節(jié)點(diǎn)互聯(lián)網(wǎng)絡(luò)、基礎(chǔ)配套系統(tǒng)等5部分內(nèi)容,采用行業(yè)領(lǐng)先的人工智能、大數(shù)據(jù)、并行計(jì)算等軟硬件技術(shù)架構(gòu),平臺CPU+GPU合計(jì)的理論峰值計(jì)算能力可達(dá)到10PFlops(每秒運(yùn)算能力為一億億次),成為國際先進(jìn)、國內(nèi)領(lǐng)先的大規(guī)模高性能計(jì)算公共服務(wù)平臺。

高性能計(jì)算作為科學(xué)研究的三大手段之一,已經(jīng)滲透到科學(xué)研究、工業(yè)發(fā)展、社會生活的各個(gè)方面,在生物科技、石油勘探、氣象預(yù)報(bào)、國防技術(shù)、工業(yè)設(shè)計(jì)、金融證券等關(guān)鍵領(lǐng)域扮演著越來越重要的角色,高性能計(jì)算不僅成為驅(qū)動經(jīng)濟(jì)和社會發(fā)展的一種生存力,更成為衡量一個(gè)國家核心競爭力的重要指標(biāo)。本平臺著眼于通過利用高性能計(jì)算、人工智能、大數(shù)據(jù)、云計(jì)算等領(lǐng)先IT技術(shù),打造國內(nèi)領(lǐng)先的人工智能高性能平臺行業(yè)案例。

作為同方股份與清華大學(xué)在高性能計(jì)算系統(tǒng)的研究、建設(shè)與服務(wù)領(lǐng)域的合作成果,雙方聯(lián)合成立“清華大學(xué)-同方股份有限公司計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)聯(lián)合研究中心”。 提供先進(jìn)的高性能計(jì)算系統(tǒng)整體設(shè)計(jì)、建設(shè)方案和強(qiáng)大的服務(wù)、保障能力,致力于科技成果轉(zhuǎn)化和HPC應(yīng)用的行業(yè)普惠,形成了基于HPC & AI相結(jié)合的高性能計(jì)算平臺參考架構(gòu):

本平臺系統(tǒng)采用先進(jìn)成熟的軟硬件配備方案,兼具高可靠、高可用、高可維護(hù)、高可信、高通量特點(diǎn),同方高性能計(jì)算平臺技術(shù)架構(gòu)創(chuàng)新方面,取得了如下業(yè)界領(lǐng)先優(yōu)勢:

●采用同方自研新一代成熟x86架構(gòu)的雙路機(jī)架式服務(wù)器“超強(qiáng)?R628”,多項(xiàng)自研服務(wù)器專利技術(shù)為平臺提供全部的計(jì)算力支撐。

●人工智能加速計(jì)算節(jié)點(diǎn)采用同方新一代成熟CPU+GPU異構(gòu)架構(gòu)的GPU機(jī)架式服務(wù)器“超強(qiáng)?G858”,單臺服務(wù)器最多可支持10塊GPU加速卡,實(shí)現(xiàn)人工智能加速計(jì)算系統(tǒng)理論雙精度峰值計(jì)算能力支撐。

●采用傳統(tǒng)CPU節(jié)點(diǎn)和GPU AI加速節(jié)點(diǎn)混合的集群技術(shù),作為國內(nèi)最大規(guī)模的HPC & AI集群,為平臺提供10PFlops(每秒運(yùn)算能力為一億億次)聚集計(jì)算能力,滿足對人工智能計(jì)算場景的需求。

●集群網(wǎng)絡(luò)采用國內(nèi)領(lǐng)先的100Gb/s高速網(wǎng)絡(luò)架構(gòu),保障節(jié)點(diǎn)間數(shù)據(jù)通信延遲不高于0.65 us,支撐GPU Direct技術(shù),MPI in network fabric技術(shù)(單臺核心交換機(jī)交換能力320Tb/s,支持端口通信帶寬不少于200Gb/s);

●集群在線存儲系統(tǒng)可實(shí)現(xiàn)的聚合讀寫帶寬380GB/s的性能需求,存儲裸容量超過36PB;達(dá)到國內(nèi)領(lǐng)先水平。

●高性能計(jì)算系統(tǒng)軟件棧是平臺對業(yè)務(wù)應(yīng)用支撐的核心:通用計(jì)算和人工智能加速計(jì)算的統(tǒng)一集群操作系統(tǒng),將科學(xué)計(jì)算應(yīng)用和人工智能計(jì)算應(yīng)用場景設(shè)計(jì)為整合的機(jī)制,通過統(tǒng)一的操作系統(tǒng)鏡像,一致性地支持“裸金屬”計(jì)算,“容器”計(jì)算和“虛擬化”計(jì)算;作業(yè)調(diào)度、負(fù)載均衡和監(jiān)控軟件可統(tǒng)一調(diào)度、管理和監(jiān)控通用計(jì)算系統(tǒng)和人工智能加速計(jì)算系統(tǒng);豐富的編譯器、工具軟件及科學(xué)計(jì)算工具軟件,面向用戶端提供多種基于通用計(jì)算和人工智能的高性能計(jì)算工作軟件環(huán)境和人機(jī)交互。

●高性能計(jì)算公共服務(wù)平臺安全等級保護(hù)的建設(shè)采用統(tǒng)一規(guī)劃、統(tǒng)一布局、統(tǒng)一設(shè)計(jì)、規(guī)范標(biāo)準(zhǔn),滿足等級保護(hù)三級基本要求的標(biāo)準(zhǔn)。

●同方提供了首創(chuàng)的從平臺規(guī)劃、建設(shè)到運(yùn)營的一體化服務(wù)模式,作為高性能計(jì)算創(chuàng)新模式的參考。

同時(shí),基礎(chǔ)設(shè)施及配套工程作為高性能運(yùn)算設(shè)備的承載平臺,本方案從運(yùn)行環(huán)境的安全、穩(wěn)定、可靠角度出發(fā),對空間布局規(guī)劃、環(huán)境參數(shù)、動力配電、制冷、智能管理、消防等方面精細(xì)設(shè)計(jì)。采用了多項(xiàng)行業(yè)創(chuàng)新領(lǐng)先的數(shù)據(jù)中心節(jié)能降耗技術(shù),符合國內(nèi)最高節(jié)能標(biāo)準(zhǔn),滿足國家、地方及行業(yè)標(biāo)準(zhǔn),保證平臺安全高效運(yùn)行。

高性能公共服務(wù)平臺的建設(shè),對地區(qū)發(fā)展帶來綜合的效益,具體說明如下。

公共服務(wù)平臺項(xiàng)目一般由政府投資建設(shè),屬于政府投資建設(shè)的公共服務(wù)項(xiàng)目,項(xiàng)目運(yùn)營期間實(shí)現(xiàn)微利運(yùn)營。同時(shí),本項(xiàng)目為地區(qū)帶來的社會效益遠(yuǎn)高于經(jīng)濟(jì)效益:

●為各地方政府帶來經(jīng)濟(jì)效益

平臺的建設(shè)能夠?qū)崿F(xiàn)智慧城市建設(shè),實(shí)現(xiàn)地區(qū)智慧服務(wù)平臺建設(shè),能夠滿足政府部門關(guān)于智慧政府的建設(shè)和應(yīng)用,能夠提高地方各產(chǎn)業(yè)協(xié)同,計(jì)算力應(yīng)用于服務(wù),滿足政務(wù)服務(wù)的要求,為地方政府帶來長期可持續(xù)的經(jīng)濟(jì)增長。

●為行業(yè)帶來長遠(yuǎn)發(fā)展

平臺的建設(shè)能夠?qū)崿F(xiàn)企業(yè)發(fā)展規(guī)劃、行業(yè)引領(lǐng)。緊密聯(lián)系高技術(shù)產(chǎn)業(yè),促進(jìn)經(jīng)濟(jì)產(chǎn)業(yè)結(jié)構(gòu)變化。

●為相關(guān)企業(yè)、高校帶來的經(jīng)濟(jì)效益

平臺的建設(shè)能夠?yàn)榈貐^(qū)高校提供學(xué)術(shù)、科研領(lǐng)域的數(shù)據(jù)分析,能夠提升高校的學(xué)科設(shè)置,提升高校品牌形象,有助于高校學(xué)員的征收,可滿足高校優(yōu)質(zhì)、優(yōu)創(chuàng)的教學(xué)需求。對于企業(yè)而言,本項(xiàng)目的建設(shè)能夠?yàn)槠髽I(yè)提供相關(guān)的規(guī)劃發(fā)展計(jì)算力和數(shù)據(jù)支持,為企業(yè)的發(fā)展奠定堅(jiān)實(shí)的基礎(chǔ),能夠引導(dǎo)企業(yè)發(fā)展,實(shí)現(xiàn)經(jīng)濟(jì)創(chuàng)收。因此,平臺的建設(shè)可以為高校和企業(yè)帶來經(jīng)濟(jì)效益的提升。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論