隨著我國“雙碳”目標的提出,數(shù)據(jù)中心的節(jié)能降耗成為社會關注焦點。
在過去幾年,一座座數(shù)據(jù)中心拔地而起,大規(guī)模的服務器串聯(lián)而成的計算系統(tǒng)支撐了海量的數(shù)據(jù)處理和運算。數(shù)據(jù)中心機架數(shù)量由2016年的124萬架上升至2019年的227萬架,四年間上漲了83.1%。
這些數(shù)據(jù)中心耗電量大,功率密度高達30-50kW,有些甚至已經(jīng)升級為100kW的機架,是名副其實的“電老虎”。
然而,在“碳中和”的時代命題下,數(shù)據(jù)中心必須走向節(jié)能減排、降本增效。
無論是國家發(fā)展改革委等四部門印發(fā)的《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實施方案》,還是工信部發(fā)布的《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》,均對加強綠色數(shù)據(jù)中心建設、提升節(jié)能降耗水平提出要求,強調提高綠色技術產(chǎn)品應用、提升能源高效清潔利用水平和優(yōu)化數(shù)據(jù)中心綠色管理能力的路徑。
那么,綠色數(shù)據(jù)中心到底要如何實現(xiàn)?
AI提高能源利用率的范本
PUE(Power Usage Effectiveness),即電源使用效率,是一項衡量數(shù)據(jù)中心運營、管理水平的關鍵指標,也是數(shù)據(jù)中心綠色、節(jié)能、環(huán)保程度的代名詞。
根據(jù)國際正常運行時間協(xié)會2014年的數(shù)據(jù)中心調查,全球大型數(shù)據(jù)中心PUE的合理值界于1.6-2.0之間,PUE平均值為1.7。而國內數(shù)據(jù)中心同期PUE為2.5-3.0,IDC行業(yè)整體處于粗放式的發(fā)展階段。
在傳統(tǒng)大型數(shù)椐中心機房中,IT設備僅占用電耗能的46%,另有40%以上用在了泵、冷卻器和冷卻塔等大型工業(yè)制冷設備上。為了維持機房恒定溫度,數(shù)據(jù)中心通常把進風溫度控制在20-25度。
從【PUE=數(shù)據(jù)中心總耗電/IT設備耗電】的計算公式不難看出,制冷環(huán)節(jié)是導致數(shù)據(jù)中心能耗飆升的主要元兇,也是PUE居高不下的原因。
如今,行業(yè)級的AI智能解決方案,正以提高能源利用效率的方式,推進數(shù)據(jù)中心的建設和升級。
作為數(shù)據(jù)中心節(jié)能領域的佼佼者——Google,基于AI為數(shù)據(jù)中心節(jié)省能耗,成為IDC行業(yè)用智能技術“武裝”自己的學習范本。
2016年,Google為已經(jīng)很節(jié)能高效的15座數(shù)據(jù)中心,節(jié)省了40%以上的冷卻耗能,約占數(shù)據(jù)中心用電總成本的15%,PUE降低至1.12。
在這個過程中,基于通用智能框架的AI派上了用場,由Google數(shù)據(jù)中心部門和Deepmind來操刀,他們認為用類神經(jīng)網(wǎng)絡可以提高Google數(shù)據(jù)中心的效率。
為期12個月的開發(fā)階段中,AI預測PUE的精準度被優(yōu)化到了99.6%。為了讓模型準確預測數(shù)據(jù)中心的效率,算法從數(shù)千個傳感器中提取出數(shù)據(jù)中心冷卻系統(tǒng)的快照,輸入到深層神經(jīng)網(wǎng)絡;然后根據(jù)不同組合預測潛在行為對能源消耗的影響,幫助Google決定何時清理熱交換器,從而提高設備冷卻性能。
Google每個數(shù)據(jù)中心都有各自的供電和冷卻設施,而且分布在不同的氣候區(qū)。雖然季節(jié)性天氣變化也會影響PUE值,但對于谷歌遍布世界各地的所有數(shù)據(jù)中心,都已成功地把PUE值保持到一個較低的水平,即使在濕熱的亞特蘭大夏季也不例外。
2018年前后,Google完成了這套AI系統(tǒng)的升級,不需要人工干預即可直接控制數(shù)據(jù)中心的制冷系統(tǒng),而且可以被數(shù)據(jù)中心的操作專家有效監(jiān)控。同時,這套基于云端的AI控制系統(tǒng)已經(jīng)為Google多家數(shù)據(jù)中心應用,節(jié)約了大量的能源。
中國綠色數(shù)據(jù)中心的AI探索
按照中國工信部的要求,2022年新建大型、超大型數(shù)據(jù)中心PUE必須達到1.4以下。如何運用新技術、新架構降低能源損耗、實現(xiàn)數(shù)據(jù)中心的綠色發(fā)展,成為IDC行業(yè)的關注熱點。
如今,中國各大互聯(lián)網(wǎng)和IDC巨頭,已開啟了AI推進中國數(shù)據(jù)中心建設和升級的探索之路。
以華為烏蘭察布云數(shù)據(jù)中心為例,采用間接蒸發(fā)冷卻解決方案和iCooling能效優(yōu)化技術,年均PUE降低至1.15。與傳統(tǒng)冷凍水解決方案相比,該數(shù)據(jù)中心每年可節(jié)省耗電量超過1600萬度,每年減少二氧化碳排放量約8140噸。
貴安華為云數(shù)據(jù)中心在2021年9月投入使用時,對外宣布的PUE是1.12,相當于大部分的電力資源都在數(shù)據(jù)中心中被利用起來,基本與Google數(shù)據(jù)中心的能耗持平。
這其中,AI和大數(shù)據(jù)分析技術起到了削峰平谷的作用,服務器可根據(jù)業(yè)務功率變化實時調整制冷功率,提升能效和運維效率。滿負荷運行情況下,理論上每年可節(jié)省10.1億度電和81萬噸的碳排放。
同樣引入AI技術的,還有百度陽泉數(shù)據(jù)中心。其深度學習模型根據(jù)室外天氣濕度、溫度和負荷,自主判斷并切換制冷模式、預冷模式和節(jié)約模式這三種冷水機組運行模式。
此外,陽泉數(shù)據(jù)中心的AI智能預警功能,可以根據(jù)負載預判設備的運行情況,然后給出維護策略。單體數(shù)據(jù)中心的年均PUE最高可降至1.08,PUE明顯優(yōu)于1.59的全球平均水平。
在綠色數(shù)據(jù)中心方面,阿里云以低碳選址、清潔能源、液冷技術等融合AI應用,加速綠色節(jié)能技術創(chuàng)新及迭代升級,做到“少用電、用好電、用綠電”。
在這屆冬奧會上,阿里提供的奧運云數(shù)據(jù)中心大量采用了風能、太陽能等清潔能源,并采用AI技術,使得奧運地數(shù)據(jù)中心的能耗比傳統(tǒng)的數(shù)據(jù)中心下降了70%,PUE能耗比達到1.09,核算下來每年可以節(jié)約8萬噸煤。
2020年9月-2021年8月間,萬國數(shù)據(jù)北京六號數(shù)據(jù)中心在投運僅一年多且年均負荷未達較理想狀態(tài)下的平均PUE值為1.25,年應用風電量超過1000萬千瓦時,2021年全年預計碳減排量超過2200噸,在PUE值、減排量、可再生能源利用等方面均屬行業(yè)領先水平。
針對IT、制冷及供配電等主要耗能設備,萬國數(shù)據(jù)使用了大量主流的綠色節(jié)能技術,包括通過將AI植入BA系統(tǒng),實現(xiàn)年節(jié)約用電量約17萬千瓦時,利用萬國數(shù)據(jù)運維升級版水處理智能化改造方案實現(xiàn)每年降低2%左右耗電量。
結語
可以看到的是,AI技術在數(shù)據(jù)中心節(jié)能減排過程中已效果初顯,且正在引爆更多可能。AI技術在數(shù)據(jù)中心中還可以實現(xiàn)更多應用,如:運維、故障診斷、預警等,使得數(shù)據(jù)中心全方位實現(xiàn)智能化運行。
不可否認,智能化的底座正在給IDC行業(yè)帶來從追趕到超越的更多信心。