開放計(jì)算,數(shù)據(jù)中心界的Linux

云技術(shù)
盡在北極熊
從Linux到開放計(jì)算,ICT產(chǎn)業(yè)開放的邊界正變得越來越廣闊。彭震表示:未來產(chǎn)業(yè)會(huì)面臨越來越多的挑戰(zhàn),這些挑戰(zhàn)依靠一個(gè)廠商解決不了,所以,全球的開發(fā)者會(huì)聚集在一起開發(fā)解決方案,然后把成果以開源方式分享給所有人,迅速上規(guī)模,形成生態(tài)。

開放還是封閉,曾經(jīng)一度是IT行業(yè)爭(zhēng)論的焦點(diǎn)之一,而由Linus Torvalds發(fā)布的Linux借助開發(fā)的力量,改變了世界!

一、開放是IT行業(yè)不可阻擋的浪潮

(Linus Torvalds,1991)

1991年,芬蘭大學(xué)生LinusTorvalds發(fā)布了Linux的第一版0.02,至今已有近30年的歷史。在這快30年的時(shí)間里,Linux所搭建的開放生態(tài)迅猛生長(zhǎng)。

根據(jù)2019年的相關(guān)統(tǒng)計(jì):

全球TOP500超級(jí)計(jì)算機(jī)100%運(yùn)行的是Linux。

全球排名前25位的網(wǎng)站中有23個(gè)使用Linux。

全球排名前100萬的Web服務(wù)器中有96.3%在Linux上運(yùn)行。

全球90%的云基礎(chǔ)架構(gòu)都在Linux上運(yùn)行。

有54.1%的專業(yè)開發(fā)人員使用Linux作為平臺(tái)。

另外,根據(jù)2018年的統(tǒng)計(jì),安卓占據(jù)了移動(dòng)操作系統(tǒng)市場(chǎng)的75.16%,所有智能手機(jī)中有85%基于Linux。

Linux的強(qiáng)大在于一直堅(jiān)持開源開放,在這種思想的號(hào)召下,OpenStack、Kubernetes等軟件的流行,無不顯示出開源開放賦予IT產(chǎn)業(yè)的強(qiáng)大動(dòng)力。軟件領(lǐng)域的“車同軌、書同文、統(tǒng)一度量衡”也在影響著底層基礎(chǔ)架構(gòu)。在數(shù)據(jù)中心界,開放也成為加速產(chǎn)業(yè)發(fā)展的重要基石。

二、開放計(jì)算,數(shù)據(jù)中心界的Linux

一直以來,數(shù)據(jù)中心能耗,密度,綠色環(huán)保,基于業(yè)務(wù)的創(chuàng)新技術(shù)如AI、邊緣的快速落地是困擾數(shù)據(jù)中心建設(shè)者的重要因素。其中,數(shù)據(jù)中心最不缺乏的就是創(chuàng)新。比如在能耗方面,F(xiàn)acebook的數(shù)據(jù)中心PUE最低降到了1.07,也就是說每消耗1.07度電,有1度完全是由服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)等IT設(shè)備消耗的。但技術(shù)從創(chuàng)新到大規(guī)模應(yīng)用是很慢的,1.07只體現(xiàn)了Facebook的領(lǐng)先水平,同期中國(guó)數(shù)據(jù)中心PUE的平均值遠(yuǎn)超2.5。而隨著數(shù)字化轉(zhuǎn)型的加快,未來數(shù)據(jù)中心面對(duì)的挑戰(zhàn)不止是能耗,還會(huì)更多。

因此,2011年,F(xiàn)acebook聯(lián)合Intel、高盛等發(fā)起首個(gè)開放硬件組織,Open Compute Project(開放計(jì)算項(xiàng)目),旨在促進(jìn)為行業(yè)制定開放的標(biāo)準(zhǔn),讓新穎技術(shù)、最佳實(shí)踐能夠在產(chǎn)業(yè)中共享,隨后微軟、谷歌、IBM、浪潮等也紛紛加入其中,共同應(yīng)對(duì)未來數(shù)據(jù)中心的挑戰(zhàn)。

2012年,阿里巴巴、騰訊、百度、中國(guó)移動(dòng)、聯(lián)通、電信、浪潮等發(fā)起成立ODCC(開放數(shù)據(jù)中心委員會(huì))的前身天蝎組織,推動(dòng)了中國(guó)基礎(chǔ)設(shè)施標(biāo)準(zhǔn)化。

2016年底,LinkedIn又發(fā)起了OPEN19,只是OPEN19定義的是基于傳統(tǒng)技術(shù)標(biāo)準(zhǔn)19英寸寬的整機(jī)柜服務(wù)器,與OCP和ODCC面向大型CSP數(shù)據(jù)中心不同,OPEN19適合于任何規(guī)模的數(shù)據(jù)中心。

之后,開放計(jì)算進(jìn)展順利,所有頂級(jí)互聯(lián)網(wǎng)數(shù)據(jù)中心都已經(jīng)大規(guī)模落地了開放計(jì)算服務(wù)器,通信、金融、能源等關(guān)鍵領(lǐng)域的TOP企業(yè)也紛紛加入這些開源組織并在數(shù)據(jù)中心建設(shè)中加以實(shí)踐,開放計(jì)算似乎正在成為數(shù)據(jù)中心界的Linux。

三、機(jī)會(huì)總是留給有準(zhǔn)備的人

機(jī)會(huì)總是留給有準(zhǔn)備的人,我們不難發(fā)現(xiàn)開放計(jì)算組織中,那些積極推動(dòng)建立數(shù)據(jù)中心標(biāo)準(zhǔn),加快技術(shù)創(chuàng)新到產(chǎn)業(yè)生態(tài)的落地的早期成員,像谷歌,F(xiàn)acebook,微軟,阿里,騰訊,百度,浪潮,也正是在云計(jì)算十年中脫穎而出的企業(yè)。在這些掌握產(chǎn)業(yè)核心技術(shù)、主導(dǎo)數(shù)據(jù)中心及基礎(chǔ)架構(gòu)及技術(shù)創(chuàng)新的企業(yè)中,浪潮是唯一同時(shí)加入OCP、ODCC、OPEN19全球三大開放組織的核心成員。

不久前,在2020年浪潮云數(shù)據(jù)中心合作伙伴大會(huì)(IPF2020)上,浪潮集團(tuán)執(zhí)行總裁、浪潮首席科學(xué)家王恩東首次提出“智算中心”,指出智算中心是智慧時(shí)代社會(huì)經(jīng)濟(jì)運(yùn)行必不可少的基礎(chǔ)設(shè)施,開放計(jì)算和AI是智算中心重要發(fā)展方向,其中開放計(jì)算更是構(gòu)建智算中心的基石。

在隨后浪潮集團(tuán)高級(jí)副總裁彭震的演講中,這樣描繪智算中心:它就像一個(gè)大型電廠,基于開放計(jì)算的融合架構(gòu)、AI等創(chuàng)新技術(shù)是構(gòu)建電廠的關(guān)鍵技術(shù);數(shù)據(jù)是電廠最重要的原材料,經(jīng)過智算中心計(jì)算力加工后,就可以生成對(duì)外的智慧計(jì)算服務(wù)。浪潮智算中心的提出不僅為建設(shè)新一代算力基礎(chǔ)設(shè)施指明了方向,也為開放的產(chǎn)業(yè)生態(tài)構(gòu)建了一幅藍(lán)圖。

從Linux到開放計(jì)算,ICT產(chǎn)業(yè)開放的邊界正變得越來越廣闊。彭震表示:未來產(chǎn)業(yè)會(huì)面臨越來越多的挑戰(zhàn),這些挑戰(zhàn)依靠一個(gè)廠商解決不了,所以,全球的開發(fā)者會(huì)聚集在一起開發(fā)解決方案,然后把成果以開源方式分享給所有人,迅速上規(guī)模,形成生態(tài)。

浪潮將持續(xù)引領(lǐng)開放計(jì)算體系,打造智算中心基石,構(gòu)建從模式開放到技術(shù)開放、從產(chǎn)品開放到服務(wù)開放的開放計(jì)算體系。

首先,模式開放,就是以客戶場(chǎng)景為核心,與合作伙伴一起聯(lián)合規(guī)劃、協(xié)同設(shè)計(jì)、敏捷研發(fā)、快速交付。

其次,技術(shù)開放,無論是以液冷、循環(huán)利用為代表的冷卻技術(shù),還是以RISC-V、FPGA、CXL、智能網(wǎng)卡為代表的基礎(chǔ)技術(shù),堅(jiān)持技術(shù)領(lǐng)先。

再次,產(chǎn)品開放,即以開放架構(gòu)和開源為指導(dǎo),基于先進(jìn)的開放硬件架構(gòu),模塊化、標(biāo)準(zhǔn)化構(gòu)建MDC,并引領(lǐng)其發(fā)展方向。最后,基于先進(jìn)的開源軟件,打造標(biāo)準(zhǔn)、高效、敏捷的智算中心基礎(chǔ)軟件平臺(tái)和統(tǒng)一管理平臺(tái),并最終形成開放的云數(shù)智一體化服務(wù)。

四、創(chuàng)新不斷,征途不止

隨著人工智能計(jì)算的指數(shù)級(jí)增長(zhǎng),目前全球已有上百家公司投入新型AI芯片的研發(fā)與設(shè)計(jì),AI計(jì)算芯片多元化趨勢(shì)愈發(fā)明顯。但因?yàn)楦鲝S商在AI開發(fā)中采用了不同的技術(shù)路線,導(dǎo)致芯片的接口、互聯(lián)、協(xié)議上互不兼容,導(dǎo)致數(shù)據(jù)中心用戶在AI計(jì)算基礎(chǔ)設(shè)施建設(shè)中不得不面臨硬件分裂化和生態(tài)割裂化的重大挑戰(zhàn)。

IPF2020上,浪潮發(fā)布了全球首款A(yù)I開放加速系統(tǒng)MX1,符合OCP社區(qū)的OAI規(guī)范,可支持各類符合OAM規(guī)范的加速器,極大降低開發(fā)AI加速器技術(shù)門檻。

彭震表示:“浪潮致力于與業(yè)界領(lǐng)導(dǎo)者共同推進(jìn)AI行業(yè)規(guī)范的建立,希望通過推動(dòng)智算中心建設(shè),形成開放共識(shí)的AI基礎(chǔ)設(shè)施規(guī)范,促進(jìn)AI芯片乃至AI產(chǎn)業(yè)的良性發(fā)展,這一愿景也與全球開放計(jì)算OCP社區(qū)形成高度共識(shí)。MX1作為智算中心在AI算力生產(chǎn)領(lǐng)域的首個(gè)開放標(biāo)準(zhǔn)產(chǎn)品,將有力的推動(dòng)開放計(jì)算與人工智能的融合,加快多種AI芯片在智算中心落地,促進(jìn)產(chǎn)業(yè)AI的生態(tài)繁榮。”

MX1可在同一AI服務(wù)器上支持多種符合OAM(OCP Accelerator Module)規(guī)范的AI芯片,并支持構(gòu)建數(shù)量達(dá)32顆芯片的大型計(jì)算系統(tǒng),實(shí)現(xiàn)超大規(guī)模神經(jīng)網(wǎng)絡(luò)模型并行計(jì)算。

具體來看,MX1支持高速互聯(lián)技術(shù),搭載高速互聯(lián)AI芯片,當(dāng)前支持互聯(lián)帶寬可達(dá)224Gbps,理論支持互聯(lián)帶寬最高可達(dá)896Gbps,可擴(kuò)展構(gòu)建高達(dá)32顆芯片的大型計(jì)算系統(tǒng),實(shí)現(xiàn)超大規(guī)模神經(jīng)網(wǎng)絡(luò)模型并行計(jì)算,充分釋放算力。

除了MX1,浪潮還參與貢獻(xiàn)和開發(fā)了一系列開放計(jì)算產(chǎn)品和規(guī)范,貢獻(xiàn)第一款通過ODCC認(rèn)證的天蝎多節(jié)點(diǎn)服務(wù)器,首款面向云基礎(chǔ)架構(gòu)優(yōu)化的2U四路服務(wù)器全球參考設(shè)計(jì)NF8260M5,第一款符合OTII標(biāo)準(zhǔn)的邊緣計(jì)算服務(wù)器、開發(fā)OpenRMC標(biāo)準(zhǔn)等等。

參與開源組織,不斷貢獻(xiàn)產(chǎn)業(yè)核心的技術(shù)與標(biāo)準(zhǔn),與合作伙伴共同加速落地新穎技術(shù)一直是浪潮推進(jìn)智算中心發(fā)展的一面大旗,現(xiàn)在也逐漸成為眾多傳統(tǒng)企業(yè)加速數(shù)字化變革的重要戰(zhàn)略。隨著開源組織成員隊(duì)伍的不斷壯大,我們有理由期待,開放計(jì)算將成為數(shù)據(jù)中心界的Linux,激發(fā)整個(gè)產(chǎn)業(yè)生態(tài)成長(zhǎng)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論