新型數(shù)據(jù)中心,為新基建賦予新內(nèi)涵

中國軟件網(wǎng)
毫無疑問,數(shù)據(jù)中心等正在成為技術(shù)創(chuàng)新的制高點(diǎn)。同樣,在新型數(shù)據(jù)中心發(fā)展上,創(chuàng)新,涉及技術(shù)與運(yùn)營兩方面,將統(tǒng)領(lǐng)新型數(shù)據(jù)中心的發(fā)展。

2345截圖20210719174729.png

7月初,工信部正式發(fā)布了《新型數(shù)據(jù)中心發(fā)展三年行動計(jì)劃(2021-2023年)》,引發(fā)業(yè)界高度關(guān)注。

行動計(jì)劃從目標(biāo)到任務(wù),迎合應(yīng)用,貼合市場,符合國家戰(zhàn)略,意在為我國數(shù)字經(jīng)濟(jì)發(fā)展提供有效支撐。

早在2020年,數(shù)據(jù)中心就被列入國家“新型基礎(chǔ)設(shè)施”的范疇。“新基建”提速,數(shù)據(jù)中心受到了前所未有的關(guān)注。

其實(shí),在數(shù)據(jù)中心領(lǐng)域,高能耗、低算力等問題一直困擾著用戶,各個國家在數(shù)據(jù)中心發(fā)展上都面臨著淘汰舊技術(shù)、發(fā)展新技術(shù)等挑戰(zhàn)。

毫無疑問,數(shù)據(jù)中心等正在成為技術(shù)創(chuàng)新的制高點(diǎn)。同樣,在新型數(shù)據(jù)中心發(fā)展上,創(chuàng)新,涉及技術(shù)與運(yùn)營兩方面,將統(tǒng)領(lǐng)新型數(shù)據(jù)中心的發(fā)展。

2345截圖20210719174729.png

1、綠色低碳化,數(shù)據(jù)中心發(fā)展的根基

在數(shù)據(jù)中心發(fā)展上,面臨的首要挑戰(zhàn)就是綠色節(jié)能低碳。

根據(jù)國際能源機(jī)構(gòu)的數(shù)據(jù),數(shù)據(jù)中心每年消耗大約200兆瓦時的電力,占全球電力需求的近1%,占全球二氧化碳排放量的0.3%。據(jù)估計(jì),到2025年,數(shù)據(jù)中心和相關(guān)IT基礎(chǔ)設(shè)施將消耗全球4%以上的電力。

隨著大數(shù)據(jù)爆炸式增長和計(jì)算需求的迅速增長,預(yù)計(jì)這些數(shù)據(jù)在沒有采取積極措施降低能耗的情況下會大幅上升。

因此,我國“三年行動計(jì)劃”在綠色低碳發(fā)展行動中鼓勵應(yīng)用先進(jìn)的IT設(shè)備、制冷系統(tǒng)、供配電系統(tǒng)、高效輔助系統(tǒng),并列舉了液冷、高壓直流供電等在行業(yè)內(nèi)驗(yàn)證效果良好的解決方案。

數(shù)據(jù)中心能耗評價(jià)指標(biāo)——電能利用效率PUE正在不斷提高。

PUE是數(shù)據(jù)中心全年總耗電量與數(shù)據(jù)中心的IT設(shè)備全年耗電量比值,目前被國內(nèi)外數(shù)據(jù)中心行業(yè)廣泛使用。PUE是一個大于1的數(shù)值,PUE值越低,說明數(shù)據(jù)中心用于IT設(shè)備以外的能耗越低,越節(jié)能。

目前,最先進(jìn)的數(shù)據(jù)中心的PUE約為1.1,即DCIE(數(shù)據(jù)中心基礎(chǔ)設(shè)施效率)為90.9%。

國家和地方政府對新型數(shù)據(jù)中心PUE的要求不斷提高。2019年上海就提出新建數(shù)據(jù)中心PUE小于1.3。天津“新基建”建設(shè)方案明確優(yōu)先支持PUE小于1.3的數(shù)據(jù)中心項(xiàng)目。而國家三年行動計(jì)劃也提出PUE要低于1.3。

新技術(shù)的使用將使數(shù)據(jù)中心的能源使用效率越來越高,數(shù)據(jù)中心PUE越來越低。

2345截圖20210719174729.png

在綠色低碳方面,目前全球不同企業(yè)在數(shù)據(jù)中心創(chuàng)新技術(shù)有幾個方向:

一是采用新的冷卻系統(tǒng),降低數(shù)據(jù)中心能耗。

一項(xiàng)調(diào)查發(fā)現(xiàn),在數(shù)據(jù)中心超過半數(shù)的公司CPU的使用率只有20%-40%。正是這些使用不足、部分閑置的服務(wù)器繼續(xù)消耗大量能源,給企業(yè)帶來不必要的成本,并導(dǎo)致數(shù)千萬噸的二氧化碳排放。

解決此問題而實(shí)施的解決方案包括改進(jìn)冷卻系統(tǒng)。微軟已經(jīng)證明,通過將服務(wù)器架浸入專門設(shè)計(jì)的流體中,可以大幅降低冷卻成本,提高CPU使用率。

據(jù)賽迪顧問統(tǒng)計(jì),從市場需求和銷售額來看,風(fēng)冷型制冷仍是目前機(jī)房空調(diào)中的主流機(jī)型,但冷凍水型制冷呈現(xiàn)較快增長趨勢。

目前,液冷數(shù)據(jù)中心對傳統(tǒng)市場,包括風(fēng)冷的機(jī)房空調(diào)市場、服務(wù)器市場以及數(shù)據(jù)中心基礎(chǔ)設(shè)施(機(jī)柜、CDU、冷卻塔等)開始進(jìn)行替代。

目前,國內(nèi)已有中科曙光、綠色云圖、聯(lián)想、浪潮和華為等涉足液冷領(lǐng)域。2019年,華為、阿里等廠商對液冷數(shù)據(jù)中心替代傳統(tǒng)市場比例估計(jì)為15-20%左右,到2025年,專家估計(jì)這一比例有望達(dá)到25%。

由于適應(yīng)場景、冷卻液價(jià)格和改造成本等限制,液冷技術(shù)并未大面積普及。未來隨著GPU運(yùn)算占比的增加和服務(wù)器密度的不斷增加,液冷將是代替風(fēng)冷的必然選擇。

二是采用新能源技術(shù),降低數(shù)據(jù)中心能耗。

新加坡一家通信中心正尋求氫氣渦輪機(jī)作為綠化其數(shù)據(jù)中心的一種方式。如果成功,用于為渦輪機(jī)提供燃料的氫氣將利用蒸汽甲烷改造(SMR)工藝從化石燃料中提取,因此碳捕獲和儲存技術(shù)將用于防止二氧化碳進(jìn)入大氣層,確保該過程是碳中和的。

燃燒時,氫能產(chǎn)生零溫室氣體排放,并且足夠靈活,可用于現(xiàn)有的天然氣發(fā)電廠,可以轉(zhuǎn)化為燃燒氫氣。氫氣將成為全球脫碳努力中的關(guān)鍵能源載體。

同樣,世界科技和商業(yè)巨頭,包括蘋果、微軟和eBay正在使用燃料電池,用于數(shù)據(jù)中心發(fā)電嘗試,可以在需要時產(chǎn)生可靠的電力。

微軟在西雅圖數(shù)據(jù)中心率先推出天然氣動力燃料電池,取代了傳統(tǒng)的電動設(shè)備。該系統(tǒng)可以在降低成本和提高可靠性的同時,將能效提高一倍。

三是熱與電相結(jié)合循環(huán)應(yīng)用。

由于加熱和冷卻是數(shù)據(jù)中心能源利用的主要形式,因此不少數(shù)據(jù)中心在冷卻水預(yù)熱再利用方面做出了有益的創(chuàng)始。

騰訊天津?yàn)I海數(shù)據(jù)中心余熱回收項(xiàng)目于2019年10月落地,歷時一年半時間,經(jīng)歷2020與2021兩個采暖季,項(xiàng)目實(shí)現(xiàn)園區(qū)9000平米的辦公樓區(qū)域市政0采暖費(fèi)目標(biāo)。

四是擴(kuò)大再生能源的利用。

可再生能源將在未來的能源部門發(fā)揮重要作用。但由于間歇性問題與數(shù)據(jù)中心對"始終打開"電源的需求不相容,因此再生能源目前很少是首選。

不過在利用可再生能源方面,許多供應(yīng)商進(jìn)行了有益的嘗試。亞馬遜最近成為全球最大的可再生能源企業(yè)采購商,每年都新增風(fēng)能和太陽能項(xiàng)目,而谷歌和微軟等其他科技巨頭也緊隨其后。

谷歌正在投資風(fēng)力發(fā)電場和太陽能公園,并將之與數(shù)據(jù)中心的存儲設(shè)施相結(jié)合。它還在開發(fā)算法,使其中心在產(chǎn)生更多可再生電力時,可以承擔(dān)更多任務(wù)。

微軟利用現(xiàn)有的潛艇技術(shù),測試了一個以波浪和潮汐能為動力的可持續(xù)水下數(shù)據(jù)中心,該中心可以在未來幾年內(nèi)迅速部署,以提供基于云的數(shù)據(jù)服務(wù)。

2、算力多樣化、效能化,提升數(shù)據(jù)中心核心能力

IDC的報(bào)告顯示,全球信息數(shù)據(jù)總量中接近90%產(chǎn)生于近幾年,到2020年已經(jīng)達(dá)到44ZB。巨大的數(shù)據(jù)增量將會對算力提出了更多的要求,成為新型數(shù)據(jù)中心發(fā)展的根本動力。

據(jù)相關(guān)研究,截止到2019年年底,我國數(shù)據(jù)中心總算力(含通用算力和高性能算力)為79.74 EFLOPS(FP32)。綜合通用計(jì)算能力和高性能計(jì)算能力的算效,全國數(shù)據(jù)中心的總體算效達(dá)到18.16 GFLOPS/W(FP32)。

專家認(rèn)為,《行動計(jì)劃》首次提出了算力指標(biāo),是數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展從注重規(guī)模,向著注重質(zhì)量邁進(jìn)的一個標(biāo)志。

隨著數(shù)據(jù)中心整體規(guī)模的提升,我國的總算力必然會有更大的增長,但是如何實(shí)現(xiàn)大算力和高算效呢?

2345截圖20210719174729.png

多樣算力既是數(shù)據(jù)中心發(fā)展的核心,也是產(chǎn)業(yè)競爭的焦點(diǎn)。

與生物多樣性是生態(tài)系統(tǒng)穩(wěn)定性的基本保障,成為地球生物繁衍生生不息的關(guān)鍵一樣,多樣性算力構(gòu)建起穩(wěn)定的算力生態(tài)體系,成為支撐全球數(shù)字化的基石。

通過多樣性算力的創(chuàng)新與部署,構(gòu)建多樣算力平臺,實(shí)現(xiàn)算力特點(diǎn)和業(yè)務(wù)特點(diǎn)的更好匹配,達(dá)到更高的業(yè)務(wù)質(zhì)量和風(fēng)險(xiǎn)防護(hù)標(biāo)準(zhǔn),滿足不同用戶的數(shù)字化轉(zhuǎn)型算力需求。

數(shù)據(jù)中心的新處理器是算力多樣化的核心。在不增加能耗的情況下提高計(jì)算能力,芯片制造商之間正在進(jìn)行的"競賽",預(yù)示著能源計(jì)算比率的不斷提高。

在服務(wù)器核心的CPU芯片方面,市場主要有x86、ARM、MIPS、Power、Alpha幾種。目前英特爾、AMD主導(dǎo)的x86架構(gòu),正在遭遇Arm、RISC-V和IBM POWER指令集所形成的巨大生態(tài)力量的挑戰(zhàn)。

CPU國外代表廠商有Intel、AMD、IBM、ARM等。國內(nèi)活躍的有MIPS架構(gòu)的龍芯,Alpha架構(gòu)的申威,ARM架構(gòu)的飛騰、海思、華芯通等。

除普通的運(yùn)算任務(wù)外,服務(wù)器有時也會處理圖像相關(guān)的任務(wù),一般依靠GPU芯片。GPU生產(chǎn)企業(yè)主要有Nvidia和AMD,AMD已量產(chǎn)7nm制程的GPU,NVIDIA工藝仍然基于14nm。國內(nèi)企業(yè)屈指可數(shù),有景嘉微、長沙韶光等。

BMC芯片也是服務(wù)器常用一個部件。BMC系統(tǒng)通過監(jiān)視系統(tǒng)的溫度、電壓、風(fēng)扇、電源等,以保證系統(tǒng)處于健康的狀態(tài)。

BMC芯片廠商主要有信驊科技(ASPEED),占據(jù)著BMC芯片的龍頭位置。BMC固件方面,則有AMI、中電昆侖、卓易信息等公司。

數(shù)據(jù)中心技術(shù)架構(gòu)不斷迭代和升級。

為了適應(yīng)海量服務(wù)器快速、低成本的部署和運(yùn)營要求,數(shù)據(jù)中心架構(gòu)也不斷演進(jìn)。

雖然不同的企業(yè)推出不同的方案,但其核心都包括模塊化、一體化、定制化、智能化等。

早在2012年,騰訊就推出了第三代數(shù)據(jù)中心架構(gòu)——微模塊架構(gòu),經(jīng)過不斷應(yīng)用實(shí)踐和優(yōu)化完善,已經(jīng)發(fā)展成為數(shù)據(jù)中心行業(yè)的主流技術(shù)。

而騰訊第四代數(shù)據(jù)中心的T-block技術(shù),以標(biāo)準(zhǔn)化、產(chǎn)品化形式,實(shí)現(xiàn)數(shù)據(jù)中心像樂高搭積木一起快速建設(shè)交付。T-block涵蓋了中壓、低壓、柴發(fā)、IT、空調(diào)、辦公等功能模塊,支持邊成長邊投資,也可以根據(jù)用戶需求來靈活按需配置,并通過騰訊智維平臺實(shí)現(xiàn)自動化高效運(yùn)營,實(shí)現(xiàn)平均PUE1.2X,最低可低至1.1X。

由于T-block技術(shù)降低了對機(jī)房土建條件的依賴和約束,通過更加綠色環(huán)保的裝配式鋼結(jié)構(gòu)形式實(shí)現(xiàn)主體建筑的低成本快速建設(shè),土建建設(shè)周期縮短50%。

更得益于T-block高度模塊化、標(biāo)準(zhǔn)化的設(shè)計(jì)理念,通過工廠預(yù)制、現(xiàn)場拼裝,機(jī)電交付周期縮短40%,土建機(jī)電整體交付周期只需12個月,可分期按需擴(kuò)展,初期投資下降30%以上。

華為模塊化數(shù)據(jù)中心和核心產(chǎn)品模塊化UPS應(yīng)用廣泛。全新的華為智能微模塊3.1 AI解決方案,在硬件方面讓數(shù)據(jù)中心更簡單、更靈活。

華為推出的智能母線,取代了傳統(tǒng)的配電柜,不僅大大降低了空間占用,也降低了運(yùn)維的難度。與此同時,智能母線的應(yīng)用,還可以實(shí)現(xiàn)未來功率的靈活擴(kuò)容,并且可以做到對電壓、電流、電量,以及所有節(jié)點(diǎn)溫度、濕度的監(jiān)測,確保了供電的安全可靠。不僅如此,主干供電的施行,也降低了線路的損耗,降低了數(shù)據(jù)中心的PUE,從而使數(shù)據(jù)中心更加節(jié)能、綠色。

另外,數(shù)據(jù)中心算力水平、機(jī)架規(guī)模與使用效率密切相關(guān)。數(shù)據(jù)中心機(jī)架規(guī)模越大,表明數(shù)據(jù)中心能夠提供的理論算力越高;數(shù)據(jù)中心的使用效率越高,說明當(dāng)前提供的實(shí)際算力更多。目前,超大規(guī)模數(shù)據(jù)中心發(fā)展勢頭迅猛。

3、智能化,體現(xiàn)在計(jì)算和運(yùn)維多個方面

數(shù)據(jù)中心融合人工智能(AI)技術(shù)大勢所趨。在數(shù)據(jù)中心的不同領(lǐng)域、不同層級,都可能應(yīng)用到AI技術(shù),所以AI應(yīng)用的潛力巨大,創(chuàng)新成效顯著。

智能運(yùn)維是數(shù)據(jù)中心AI應(yīng)用主要戰(zhàn)場。

智能運(yùn)維是利用“數(shù)據(jù)智能”替換或強(qiáng)化“人工經(jīng)驗(yàn)”,可以從無人值守到無人管理。運(yùn)用“智能機(jī)器人+智能傳感器”的人工智能組合,打造獨(dú)立診斷、自動排障、防御升級的監(jiān)控模式,解放運(yùn)維人力。

通過基于AI的數(shù)據(jù)分析和挖掘,可以提前預(yù)測服務(wù)器、交換機(jī)以及SSD故障,減少數(shù)據(jù)中心的宕機(jī)風(fēng)險(xiǎn)。

引入深度學(xué)習(xí),實(shí)現(xiàn)數(shù)據(jù)中心節(jié)能。采用人工智能建模分析、預(yù)測數(shù)據(jù)中心資源利用率,結(jié)合虛擬機(jī)遷移功能,根據(jù)業(yè)務(wù)需求合理地調(diào)度數(shù)據(jù)中心資源,以最大限度地挖掘節(jié)能潛力。

在數(shù)據(jù)中心基礎(chǔ)設(shè)施層面,通過采集和分析監(jiān)測點(diǎn)的溫濕度和空氣流動模型,自動調(diào)節(jié)制冷設(shè)備和配電設(shè)備的輸出,使能源獲得更高效的利用。

Google就將DeepMind的機(jī)器學(xué)習(xí)應(yīng)用到數(shù)據(jù)中心中,成功地將用于冷卻的能量減少了40%。

借助智能化技術(shù)對數(shù)據(jù)中心的供電系統(tǒng)、溫控系統(tǒng)、營維和架構(gòu)進(jìn)行創(chuàng)新重構(gòu),從而降低能耗、提升資源利用率,加速綠色數(shù)據(jù)中心的實(shí)現(xiàn)。

數(shù)據(jù)中心的AI計(jì)算能力不斷提高。

在通用計(jì)算CPU橫行天下多年之后,GPU主導(dǎo)的并行計(jì)算因?yàn)锳I應(yīng)用開始變得流行,讓通用計(jì)算與AI計(jì)算共同發(fā)展。

AI/ML數(shù)據(jù)通常存儲在龐大的數(shù)據(jù)池中,而配備加速器的專用服務(wù)器,如GPU,非常適合處理AI/ML任務(wù)。數(shù)據(jù)中心網(wǎng)絡(luò)正在增加帶寬,為這些系統(tǒng)提供足夠大的數(shù)據(jù)管道,從而實(shí)現(xiàn)經(jīng)濟(jì)且高效的AI工具的開發(fā)。

在AI計(jì)算方面,參與者越來越多。在AI服務(wù)器上,中國服務(wù)器和云計(jì)算公司浪潮在性能和市場份額上都有上佳的表現(xiàn)。

在IDC公布的中國AI加速計(jì)算報(bào)告中,浪潮AI服務(wù)器連續(xù)多年穩(wěn)居AI服務(wù)器首位。

2018年華為正式發(fā)布兩款A(yù)I芯片:采用7nm工藝制程的昇騰910,以及12nm工藝制程的昇騰310。

2019年,華為又推出了全場景AI計(jì)算框架MindSpore。這些AI基礎(chǔ)軟件平臺實(shí)現(xiàn)了極簡易用、極致性能。這讓小的傳統(tǒng)企業(yè)能夠基于華為的全棧平臺,能以少代碼,甚至不開發(fā)代碼也能充分利用AI能力。

2018年阿里巴巴達(dá)摩院發(fā)布了一種名為Ali-NPU的AI芯片,該芯片將通過其公共云供任何人使用。此舉旨在增強(qiáng)阿里云的AI實(shí)力,促進(jìn)行業(yè)AI應(yīng)用的發(fā)展。

未來,老舊、落后、高耗能的數(shù)據(jù)中心將會逐漸被改造提升,或者被新型數(shù)據(jù)中心淘汰和替代。在新型數(shù)據(jù)中心的發(fā)展中,服務(wù)數(shù)字經(jīng)濟(jì)發(fā)展是動力,創(chuàng)新是方向。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論