本文來自微信公眾號(hào)“中國(guó)教育網(wǎng)絡(luò)”。
近日,中共中央、國(guó)務(wù)院印發(fā)《數(shù)字中國(guó)建設(shè)整體布局規(guī)劃》,提出系統(tǒng)優(yōu)化算力基礎(chǔ)設(shè)施布局,促進(jìn)東西部算力高效互補(bǔ)和協(xié)同聯(lián)動(dòng),引導(dǎo)通用數(shù)據(jù)中心、超算中心、智能計(jì)算中心、邊緣數(shù)據(jù)中心等合理梯次布局;科技部啟動(dòng)國(guó)家超算互聯(lián)網(wǎng)部署工作,通過超算互聯(lián)網(wǎng)建設(shè)打造國(guó)家算力底座,促進(jìn)超算算力的一體化運(yùn)營(yíng),助力科技創(chuàng)新和經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展……
算力建設(shè),已成為夯實(shí)數(shù)字中國(guó)建設(shè)基礎(chǔ)、打通數(shù)字基礎(chǔ)設(shè)施大動(dòng)脈的重要手段。而作為科學(xué)研究和人才培養(yǎng)重地的高校,隨著科研、教學(xué)、管理對(duì)算力需求的不斷增加,也掀起了一股算力建設(shè)浪潮。
2023年4月,復(fù)旦大學(xué)透露,正與阿里云共建中國(guó)高校最大的科研算力平臺(tái),預(yù)計(jì)在6月正式上線試運(yùn)行;2021年12月,中國(guó)高校最強(qiáng)算力基座“思源一號(hào)”落戶上海交通大學(xué);2020年,南京航空航天大學(xué)成立校級(jí)高性能計(jì)算中心,在運(yùn)維管理、科研服務(wù)、課程開發(fā)等方面開展了一系列有益探索;2019年,西湖大學(xué)高性能計(jì)算中心成立,為學(xué)校“高起點(diǎn)、小而精、研究型”的辦學(xué)定位提供堅(jiān)實(shí)的高性能計(jì)算基礎(chǔ)支持……
在數(shù)字化轉(zhuǎn)型的大時(shí)代,高校算力服務(wù)發(fā)展也處在風(fēng)口。高校算力服務(wù)現(xiàn)狀如何?如何建設(shè)算力平臺(tái)?如何服務(wù)師生用戶?如何持續(xù)不斷發(fā)展?這些問題都有待探索和解答。
高校算力服務(wù)發(fā)展?fàn)顩r
近年來,我國(guó)高校算力服務(wù)得到了迅速發(fā)展和提升。許多高校紛紛建立了自己的算力中心,并且不斷擴(kuò)大硬件設(shè)施和軟件服務(wù)范圍。算力服務(wù)形式多樣,包括高性能計(jì)算集群、虛擬化技術(shù)支持的云計(jì)算平臺(tái)、自主研發(fā)的數(shù)據(jù)中心等各種形式,為高校師生用戶提供了大規(guī)模的計(jì)算存儲(chǔ)資源。
總體來看,目前許多重點(diǎn)高校已具備了成熟的建設(shè)和運(yùn)營(yíng)模式,二三線高校也正處于成長(zhǎng)期,不斷加大對(duì)算力的投入力度,增強(qiáng)計(jì)算能力。
據(jù)介紹,從算力建設(shè)來看,校級(jí)超算中心的通常規(guī)模在“百節(jié)點(diǎn)、萬核心”,日常使用率都達(dá)到80%以上。高校超算承擔(dān)著高校科研團(tuán)隊(duì)的學(xué)生教學(xué)培養(yǎng)和科研項(xiàng)目所需的中小規(guī)模計(jì)算任務(wù),成為我國(guó)新型算力網(wǎng)絡(luò)體系中不可或缺的組成部分。
從運(yùn)營(yíng)模式來看,目前大部分高校仍處于向校內(nèi)提供計(jì)算服務(wù)、幫助用戶學(xué)習(xí)使用超算的階段;部分頭部高校則已經(jīng)開始積極探索計(jì)算驅(qū)動(dòng)的交叉學(xué)科發(fā)展模式,推動(dòng)更多符合我國(guó)科研實(shí)際情況的自主可控超算軟件的研發(fā)。
但從整體來看,高校的算力儲(chǔ)備還很不足,算力使用也很不均衡。一項(xiàng)相關(guān)調(diào)研顯示,當(dāng)前,大約8.4%的高校已建設(shè)校級(jí)算力平臺(tái),校級(jí)算力平臺(tái)的運(yùn)算能力主要分布在250Tflops以下;存儲(chǔ)空間主要分布在500TB以下。[1]
在算力平臺(tái)運(yùn)營(yíng)過程中,高校也面臨諸多問題和挑戰(zhàn),如設(shè)備更新速度緩慢、平臺(tái)管理和運(yùn)維水平不高、人才團(tuán)隊(duì)建設(shè)受困于機(jī)制、算力儲(chǔ)備難以滿足科研數(shù)據(jù)增長(zhǎng)等。
此外,高校用戶對(duì)算力服務(wù)的需求也越來越高。除了大規(guī)模科研數(shù)據(jù)的處理分析和在線教學(xué)平臺(tái)支持,用戶還希望算力中心能提供“性價(jià)比高”“按需供給”“提供完整的解決方案”“安全可靠”“資源共享”“云計(jì)算”“免費(fèi)測(cè)試”等算力服務(wù)。
算力支撐高??蒲薪虒W(xué)管理
在高等教育領(lǐng)域,數(shù)字化轉(zhuǎn)型已成為推動(dòng)高等教育創(chuàng)新發(fā)展,培養(yǎng)適應(yīng)信息時(shí)代人才的大勢(shì)所趨。數(shù)字化轉(zhuǎn)型需要大量的計(jì)算資源和技術(shù)支撐,這就為算力服務(wù)提供了發(fā)展空間,讓算力服務(wù)成為高校數(shù)字化轉(zhuǎn)型中不可或缺的一部分。
通過算力服務(wù),高??梢钥焖佾@取必要的計(jì)算資源和技術(shù)支持,實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型的各種需求。在對(duì)高校算力中心的調(diào)查和采訪中,我們得知,算力服務(wù)對(duì)高校數(shù)字化轉(zhuǎn)型的支持主要體現(xiàn)在以下幾個(gè)方面:
一是科研支持
高??蒲行枰罅康挠?jì)算資源和數(shù)據(jù)存儲(chǔ)空間,而算力平臺(tái)可以為高校研究人員提供高效、可靠的科學(xué)研究環(huán)境。在科學(xué)研究中,算力服務(wù)可以為高校提供大量的計(jì)算資源,人們可以在云端進(jìn)行模擬、計(jì)算等處理,進(jìn)一步提高研究效率和研究成果。科研算力的提升和飛躍,使得研究人員將有機(jī)會(huì)探索和嘗試各種新事物,有助于加快解決人們面臨的各種棘手問題。
例如,南京航空航天大學(xué)高性能計(jì)算中心提供的科研服務(wù)包括科學(xué)計(jì)算和仿真計(jì)算,覆蓋學(xué)校所有理工科學(xué)院、科研技術(shù)部門和部分文科學(xué)院;對(duì)華中農(nóng)業(yè)大學(xué)作物遺傳改良全國(guó)重點(diǎn)實(shí)驗(yàn)室來說,計(jì)算平臺(tái)助力實(shí)驗(yàn)室完成生物學(xué)研究的重要手段基因組測(cè)序,并對(duì)測(cè)序的數(shù)據(jù)進(jìn)行存儲(chǔ)分析。
二是教學(xué)支持
通過算力服務(wù),高??焖俅罱ㄔ诰€教育平臺(tái),在云端構(gòu)建虛擬課堂、制定個(gè)性化教學(xué)方案、開展遠(yuǎn)程教學(xué)等活動(dòng)。而學(xué)生則可以通過網(wǎng)絡(luò)學(xué)習(xí)、在線交流和互動(dòng)學(xué)習(xí)等方式,獲取更加豐富和高效的學(xué)習(xí)體驗(yàn)。同時(shí),算力服務(wù)還可以為高校提供強(qiáng)大的課程管理系統(tǒng),幫助高校更好地管理和組織課程資源。
以上海交通大學(xué)為例,將計(jì)算深度融入教學(xué),是富有交大特色的定制教學(xué)模式。交大組建了專職教輔團(tuán)隊(duì),與專業(yè)課老師共同改造計(jì)算相關(guān)課程。交大還在教學(xué)支撐中使用最先進(jìn)的計(jì)算平臺(tái),免費(fèi)向校內(nèi)師生提供優(yōu)質(zhì)的計(jì)算服務(wù)。優(yōu)質(zhì)的計(jì)算資源為課程升級(jí)賦能,讓學(xué)生的使用體驗(yàn)、教師的教學(xué)成果都顯著提升。
三是管理支持
通過算力服務(wù)支撐,高校可以將教育教學(xué)、學(xué)生管理、課程管理等業(yè)務(wù)實(shí)現(xiàn)信息化、數(shù)字化,簡(jiǎn)化運(yùn)營(yíng)和管理過程,提高教學(xué)與管理效率。
算力作為數(shù)字時(shí)代新的生產(chǎn)力,正廣泛融合到社會(huì)生產(chǎn)生活的各個(gè)方面。在高校,算力作為一種重要的基礎(chǔ)設(shè)施,具有廣泛的應(yīng)用前景,其重要性和地位將不斷彰顯,為教育領(lǐng)域的數(shù)字化轉(zhuǎn)型提供有力的支撐和保障。
人工智能之火點(diǎn)燃算力需求
日前,ChatGPT和GPT-4等以大型語言模型(LLM)為代表的通用人工智能工具爆火,表明人工智能到了一個(gè)新的發(fā)展階段,可能成為推動(dòng)社會(huì)發(fā)展和科研創(chuàng)新的顛覆性工具。無論是計(jì)算分析還是人工智能領(lǐng)域的研究,都依賴于高質(zhì)量成規(guī)模的算力。
上海交通大學(xué)網(wǎng)絡(luò)信息中心副主任林新華認(rèn)為,GPT-4的出現(xiàn)引爆了算力危機(jī),但也引起民眾對(duì)算力的關(guān)注,讓算力對(duì)人工智能的重要性成為一種共識(shí)。
“這些需求投射至高等學(xué)校,就體現(xiàn)在對(duì)高校計(jì)算中心或超算中心建設(shè)的要求。”西湖大學(xué)超算中心技術(shù)主任李南表示。
高校作為基礎(chǔ)研究的主陣地,正扛起推進(jìn)AI研發(fā)和應(yīng)用的大旗,如何構(gòu)建AI所需的超高算力并加速科研成果轉(zhuǎn)化,也早已悄悄提上日程。北京大學(xué)高性能計(jì)算平臺(tái)主任工程師樊春表示,當(dāng)前有很多科研項(xiàng)目既需要超算算力,又需要智算算力,從應(yīng)用的需求上看就需要將這兩種算力融合。計(jì)算支撐部門則要順應(yīng)時(shí)代潮流,為學(xué)校人工智能發(fā)展提供更多的支撐服務(wù)。比起分別建設(shè)算力平臺(tái)和人工智能平臺(tái),高??梢钥紤]建立人工智能和超算的融合平臺(tái)。
進(jìn)一步推動(dòng)高校算力服務(wù)建設(shè)
面對(duì)未來,隨著GPU等協(xié)處理器技術(shù)、大數(shù)據(jù)、人工智能技術(shù)的發(fā)展,高校將越來越依賴于算力,算力平臺(tái)的建設(shè)也將越來越重要。下一步,高校算力服務(wù)建設(shè)應(yīng)該從哪方面發(fā)力?在調(diào)查和采訪中,我們總結(jié)出,進(jìn)一步推動(dòng)高校算力服務(wù)發(fā)展可以從以下幾方面布局:
第一,計(jì)算團(tuán)隊(duì)建設(shè)
超算的管理是非常專業(yè)的,需要專門的研究和管理團(tuán)隊(duì)。當(dāng)前,很多高校在超算的硬件設(shè)備投入上并不差,但超算中心能夠提供的服務(wù)往往受限于團(tuán)隊(duì)的規(guī)模和能力。
首先,除了計(jì)算機(jī)學(xué)科領(lǐng)域出身的人才,計(jì)算團(tuán)隊(duì)還需要應(yīng)用行業(yè)領(lǐng)域出身的人才,才能在提供計(jì)算服務(wù)中更好地溝通交流。在這方面,上海交通大學(xué)組建了具有“學(xué)科融合”特色的計(jì)算團(tuán)隊(duì),將計(jì)算思維培養(yǎng)融入專業(yè)課教學(xué)中,并讓科研團(tuán)隊(duì)專注于科研創(chuàng)新,讓算力服務(wù)充分支撐教學(xué)和科研。
其次,面對(duì)人才編制等方面的限制和要求,算力團(tuán)隊(duì)建設(shè)不應(yīng)局限于計(jì)算中心的有限范圍,要拓展思維,加強(qiáng)與其他部門的合作,設(shè)計(jì)好相應(yīng)的體制機(jī)制,打造建設(shè)、運(yùn)維、管理、宣傳的全鏈條人才團(tuán)隊(duì)。
此外,由于算力人才在互聯(lián)網(wǎng)和其他IT行業(yè)可能擁有廣泛的職業(yè)選擇和晉升機(jī)會(huì),因而高校需要特別關(guān)注人才待遇和職業(yè)規(guī)劃。在這方面,中國(guó)科學(xué)技術(shù)大學(xué)出臺(tái)了技術(shù)支撐績(jī)效管理辦法。績(jī)效以技術(shù)支撐學(xué)??蒲械馁|(zhì)量、貢獻(xiàn)和影響以及人才培養(yǎng)成效為導(dǎo)向,綜合考慮技術(shù)支撐工作者年度工作情況,建立了科學(xué)合理的評(píng)價(jià)標(biāo)準(zhǔn)。
第二,建設(shè)模式選擇
從校級(jí)算力平臺(tái)的所屬單位看,比起隸屬院系,或隸屬獨(dú)立的計(jì)算中心,將校級(jí)算力平臺(tái)放在網(wǎng)絡(luò)中心/信息中心可以更加專注于服務(wù),對(duì)各院系和學(xué)科更中立更公正。中國(guó)科學(xué)技術(shù)大學(xué)、上海交通大學(xué)的實(shí)踐表明,這種模式是很多學(xué)校在建設(shè)模式選擇時(shí)的最優(yōu)解。作為非科研單位,網(wǎng)絡(luò)中心工作人員的評(píng)價(jià)體系主要與建好平臺(tái)服務(wù)好用戶相關(guān),而不是自己發(fā)表多少論文等,人員可安心做好技術(shù)支持服務(wù),更好服務(wù)用戶。同時(shí),網(wǎng)絡(luò)中心已經(jīng)有行政、財(cái)務(wù)、技術(shù)等各種人員配置,可以對(duì)超算平臺(tái)進(jìn)行更好的統(tǒng)籌和管理。
第三,體制機(jī)制建設(shè)
“高校建設(shè)超算,如果只是買機(jī)器、買設(shè)備是遠(yuǎn)遠(yuǎn)不夠的。”林新華表示,“體制機(jī)制這種軟性層面的東西往往是高校算力服務(wù)發(fā)展的重要保障。”學(xué)校建設(shè)了校級(jí)超算平臺(tái)之后,是否還應(yīng)該允許院系建自己的平臺(tái)?就是體制機(jī)制問題的一種體現(xiàn)。院系分散建設(shè)有很多局限性,其計(jì)算資源難以共享,利用率低;運(yùn)維人員往往沒有崗位編制,水平也參差不齊。
在這方面,上海交通大學(xué)出臺(tái)政策,不允許院系自行購(gòu)買信息系統(tǒng)程序服務(wù)器。南京航空航天大學(xué)立項(xiàng)建設(shè)高性能計(jì)算平臺(tái)后,已不再批準(zhǔn)各單位自行建設(shè)高性能計(jì)算的相關(guān)采購(gòu),初步估算,節(jié)約建設(shè)經(jīng)費(fèi)累計(jì)約500萬元,節(jié)約計(jì)算費(fèi)累計(jì)近80萬元。
第四,軟件建設(shè)
隨著大量傳統(tǒng)學(xué)科紛紛開始在研究中使用算力,在此情況下,傳統(tǒng)的HPC軟件接入就顯得過于復(fù)雜,使用門檻過高。這就需要更多關(guān)注用戶的科研環(huán)境,提供更加精準(zhǔn)的科研環(huán)境和軟件,提高算力資源使用效率。
在這方面,北京大學(xué)自主研制的開源算力中心門戶和管理平臺(tái)SCOW(Super Computing On Web)通過簡(jiǎn)化集群軟件部署流程、統(tǒng)一平臺(tái)管理模式、提供圖形化操作界面、降低用戶使用門檻,實(shí)現(xiàn)算力中心資源易管理、易使用的目標(biāo),提高算力資源使用效率。
“未來的一流大學(xué),除了學(xué)科科研之外,誰對(duì)數(shù)字能力的把握更好,誰就能夠脫穎而出。我們需要用更大的格局、更高的戰(zhàn)略眼光來看待算力服務(wù),它有可能成為未來整個(gè)大學(xué)變革的巨大源泉。”相關(guān)人士指出。
總而言之,面向未來,高校算力建設(shè)的持續(xù)投入很關(guān)鍵,而創(chuàng)新是持續(xù)發(fā)展的前提。高校要更多地探索、發(fā)展國(guó)產(chǎn)計(jì)算技術(shù),在自主創(chuàng)新上更多“探路”,讓算力建設(shè)持續(xù)發(fā)展,更好地服務(wù)于高校數(shù)字化轉(zhuǎn)型。
[1]來源:賽爾網(wǎng)絡(luò)《高校網(wǎng)絡(luò)服務(wù)情況和教育信息化需求調(diào)研報(bào)告(2022年度)》
編撰:項(xiàng)陽