美國國家科學基金會(National Science Foundation)的一系列超級計算獎項中的另一個已宣布,這是一項將在普渡大學(Purdue University)安裝的系統(tǒng)的1000萬美元資金,該系統(tǒng)將支持HPC和AI工作負載,并計劃于明年投入生產(chǎn)。
該系統(tǒng)被稱為Anvil,將與戴爾和AMD 合作制造,并將由1,000個128核AMD Epyc“ Milan”第三代7nm CPU組成,這些產(chǎn)品將于今年晚些時候推出。Purdue表示,該系統(tǒng)的峰值性能將達到5.3 petaflops,并將在5年內(nèi)為NSF的極限科學與工程發(fā)現(xiàn)環(huán)境(XSEDE)內(nèi)的研究人員提供超過10億個CPU核心小時。Anvil節(jié)點將與100 Gbps Mellanox HDR InfiniBand 互連,其生態(tài)系統(tǒng)還將包括32個大內(nèi)存節(jié)點,每個節(jié)點具有1 TB RAM,以及16個節(jié)點,每個節(jié)點具有四個Nvidia A100 Tensor Core GPU,可提供1.5 PF的單精度性能。
根據(jù)Purdue的說法,該系統(tǒng)將利用由10 PB以上的并行文件系統(tǒng)錨定并通過超過3 PB的閃存盤增強的多種塊和對象存儲技術集。進行中的項目和檔案數(shù)據(jù)的存儲將由Purdue的研究數(shù)據(jù)倉庫和堡壘文檔提供。
Anvil將包括旨在擴大訪問范圍的功能,例如交互式計算和可視化功能,以及到Anvil的軟件工具和計算節(jié)點的基于Web的集成式Open OnDemand網(wǎng)關??山M合子系統(tǒng)將使基于云和容器的工作流能夠與系統(tǒng)一起運行,并將支持科學應用,包括網(wǎng)關,數(shù)據(jù)庫,高通量數(shù)據(jù)提取管道和復雜的耦合建模工作流。它將提供通往Microsoft Azure云的途徑。
Anvil將與大學的社區(qū)集群超級計算機一起建造,其中包括為普渡大學校園建造的2020年“貝爾”系統(tǒng),它將利用學校的基礎設施,包括大容量存儲系統(tǒng),高速網(wǎng)絡和ITaP(普渡大學的信息技術)自2008年以來已部署14臺超級計算機的員工。
研究計算和該項目的共同PI的執(zhí)行董事Preston Smith說,Anvil將針對傳統(tǒng)并行計算進行優(yōu)化,以用于流體動力學和生物信息學等領域的研究,以及數(shù)據(jù)科學,人工智能和機器學習應用。
“ Anvil還將作為一個經(jīng)驗學習實驗室,讓學生獲得使用計算機科學知識的真實經(jīng)驗,并讓實習生與Anvil團隊合作進行建設和運營。我們將培訓未來的研究計算從業(yè)人員。”他說。
該項目由國家科學基金會(NSF)授予,編號為2005632。該項目的計算科學家和高級研究科學家Xiao Zhu,以及研究計算的數(shù)據(jù)科學家,軟件工程師和研究科學家Rajesh Kalyanam是該項目的聯(lián)合PI。