HPC需要為云而建,而不僅僅是在云上運(yùn)行

HPC作為一個(gè)增長(zhǎng)和創(chuàng)新引擎,隨著工作負(fù)載移動(dòng)到云,工程需要文化上的改變——與過去十年軟件開發(fā)的轉(zhuǎn)變相一致,從瀑布過程到敏捷編程,持續(xù)集成和持續(xù)交付。HPC的新功能和實(shí)踐也需要文化調(diào)整。

本文來自微信公眾號(hào)“開源云中文社區(qū)(ID:openstackcn)”。

隨著政府和私營部門越來越多地追求數(shù)字和云轉(zhuǎn)型戰(zhàn)略,這些組織和機(jī)構(gòu)內(nèi)部的工程和研發(fā)也在向云轉(zhuǎn)移。

工程和研發(fā)部門發(fā)現(xiàn),他們創(chuàng)新和創(chuàng)造新產(chǎn)品的能力受到傳統(tǒng)高性能計(jì)算(HPC)實(shí)踐的嚴(yán)重影響,這種轉(zhuǎn)變正在加速。隨著HPC成為工程和研發(fā)的動(dòng)力,對(duì)HPC資源的需求持續(xù)上升。僅僅將工作負(fù)載從內(nèi)部轉(zhuǎn)移到云端是不夠的。

這里牽涉到很多錢,所以正確處理非常重要。根據(jù)Grand View Research的數(shù)最大且增長(zhǎng)最快。數(shù)字化轉(zhuǎn)型工程和研發(fā)需要對(duì)HPC實(shí)踐進(jìn)行根本性的重新概念化。重點(diǎn)需要從優(yōu)化HPC硬件轉(zhuǎn)移到優(yōu)化研發(fā)吞吐量。

HPC作為一個(gè)增長(zhǎng)和創(chuàng)新引擎,隨著工作負(fù)載移動(dòng)到云,工程需要文化上的改變——與過去十年軟件開發(fā)的轉(zhuǎn)變相一致,從瀑布過程到敏捷編程,持續(xù)集成和持續(xù)交付。HPC的新功能和實(shí)踐也需要文化調(diào)整。

以下是推動(dòng)HPC走向云端的一些主要挑戰(zhàn):

1.供應(yīng)鏈問題繼續(xù)影響HPC供應(yīng)商履行客戶訂單的能力。

長(zhǎng)時(shí)間的延遲可能會(huì)持續(xù)很長(zhǎng)一段時(shí)間。因此,IT無法升級(jí)內(nèi)部HPC基礎(chǔ)設(shè)施以滿足不斷增長(zhǎng)的工程需求或任何特殊計(jì)算需求。這導(dǎo)致工程師的等待時(shí)間延長(zhǎng),以及項(xiàng)目延誤。

2.企業(yè)對(duì)HPC資源的需求正在加快。

隨著計(jì)算科學(xué)和工程方法被廣泛采用,HPC的需求也在增加。此外,使用模擬的組織正在加載新的工作負(fù)載,并采用其他技術(shù),如多物理和代理ML模型,進(jìn)一步推高了對(duì)HPC資源的需求。

3.HPC的人才短缺正在影響HPC供應(yīng)商和客戶。

許多企業(yè)發(fā)現(xiàn),他們沒有足夠的專業(yè)知識(shí)來實(shí)施新技術(shù),從而放慢了IT現(xiàn)代化的步伐。與此同時(shí),供應(yīng)商也沒有更好地提供幫助。

4.組織中分析孤島的擴(kuò)散。

由于傳統(tǒng)的HPC方法采用緊耦合的系統(tǒng),研發(fā)團(tuán)隊(duì)創(chuàng)建了專注于他們需求的特定于工作負(fù)載的技術(shù)堆棧,這些技術(shù)堆棧通常彼此斷開。結(jié)果是產(chǎn)品創(chuàng)新速度變慢,研發(fā)團(tuán)隊(duì)之間的合作減少。

5.支持日益分散的勞動(dòng)力。

組織已經(jīng)發(fā)現(xiàn),在疫情后的世界里,遠(yuǎn)程工作是可行的。對(duì)于工程和研發(fā),需要提供隨時(shí)隨地的訪問和更好的協(xié)作能力,以提供靈活性并吸引更多人才。

為什么改變HPC實(shí)踐在云中很重要?

今天的HPC實(shí)踐看起來很像20年前的軟件開發(fā)。公司采用瀑布式開發(fā)模型,使用單體和專有技術(shù)棧。云啟動(dòng)了開源工具的爆炸式發(fā)展,帶來了社交編碼、微服務(wù)和持續(xù)集成與交付。其結(jié)果是增強(qiáng)了開發(fā)人員的能力,并大大加速了新軟件服務(wù)的創(chuàng)新。Twitter、Airbnb和Uber等服務(wù)的成功都?xì)w功于這種云轉(zhuǎn)型。

HPC堆棧的云轉(zhuǎn)型來得較晚,因?yàn)槠鋸?fù)雜性、專業(yè)的計(jì)算硬件架構(gòu)和商業(yè)打包軟件的主導(dǎo)地位。如今,每一種專門的架構(gòu)都可以在云中使用,模擬軟件提供商也在采用云業(yè)務(wù)模型。

然而,僅僅在云端擁有硬件和軟件是不夠的。云轉(zhuǎn)型要求我們不只是“lift&shift”,而是從“為云構(gòu)建的方法”開始。

行業(yè)分析師的研究一致顯示,隨著云HPC的采用速度加快,對(duì)HPC的需求不斷增加。推動(dòng)云HPC的關(guān)鍵因素包括深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和人工智能方面的新工作負(fù)載,以及對(duì)更靈活架構(gòu)的需求,以便組織可以更輕松地在最高效的架構(gòu)上運(yùn)行新工作負(fù)載。

應(yīng)對(duì)這些挑戰(zhàn)意味著改變我們?cè)贖PC方面的做法——改變HPC的傳統(tǒng)宗旨,并將注意力集中在我們?cè)噲D實(shí)現(xiàn)的結(jié)果上(事實(shí)上,這就是我們?cè)谥匦抡{(diào)整規(guī)模時(shí)所做的工作)。

以下是迎接為云計(jì)算構(gòu)建HPC新時(shí)代的五個(gè)關(guān)鍵策略(與在云中運(yùn)行HPC相比)。參與HPC競(jìng)爭(zhēng)的組織需要從以下方面開始轉(zhuǎn)變:

1.從以硬件為中心到以用戶為中心。與軟件開發(fā)人員一樣,科學(xué)家和工程師越來越成為任何行業(yè)中最昂貴的產(chǎn)品。解決易用性問題,以優(yōu)化研究人員的工作效率。

2.從不靈活到無限。如果沒有工具和部署模型的廣泛可選,在任何HPC垂直領(lǐng)域保持競(jìng)爭(zhēng)力變得越來越不可能。

3.連接孤島。團(tuán)隊(duì)合作將成為任何HPC市場(chǎng)的賭注。統(tǒng)一分析孤島,實(shí)現(xiàn)多團(tuán)隊(duì)協(xié)作和最佳實(shí)踐共享。

4.從靜態(tài)到智能。組織將需要在現(xiàn)實(shí)世界的成本-性能權(quán)衡中做出更明智、更快的決策。云提供了無限的選擇。

5.手動(dòng)到自動(dòng)。實(shí)施基于政策的控制是2000年全球組織的一項(xiàng)要求。將其自動(dòng)化。確保安全性和合規(guī)性,同時(shí)賦予工程師權(quán)力。

原文鏈接:

https://thenewstack.io/hpc-needs-to-be-built-for-the-cloud-not-just-run-on-the-cloud/

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論