阿里巴巴是在數(shù)據(jù)中心布局上起步的科技企業(yè),作為國(guó)內(nèi)最大的云計(jì)算廠商之一,阿里巴巴建設(shè)數(shù)據(jù)中心的歷史可以追溯到2016年9月正式啟用的張北數(shù)據(jù)中心。自那時(shí)起,這座位于河北省張家口市張北縣的數(shù)據(jù)中心,已經(jīng)成為承擔(dān)雙11、云計(jì)算等各項(xiàng)核心業(yè)務(wù)的支柱。
2017年,阿里宣布在南通、杭州和烏蘭察布落地三座超級(jí)數(shù)據(jù)中心,新增超百萬(wàn)臺(tái)服務(wù)器,輻射京津冀、長(zhǎng)三角、粵港澳三大經(jīng)濟(jì)帶。
2018年,阿里巴巴烏蘭察布、南通、杭州、河源一期數(shù)據(jù)中心同步開啟建設(shè),到2020年在新基建政策頻出的背景下,張北、南通、杭州、河源、烏蘭察布五大國(guó)內(nèi)超級(jí)數(shù)據(jù)中心終于建成,形成了自己的數(shù)據(jù)中心生態(tài)。
總的來(lái)說(shuō),阿里云目前已經(jīng)在全球22個(gè)地域部署了上百個(gè)云數(shù)據(jù)中心,不久的未來(lái)還將在國(guó)內(nèi)再建10座超級(jí)數(shù)據(jù)中心,并根據(jù)業(yè)務(wù)發(fā)展規(guī)劃在全球的數(shù)據(jù)中心布局。
阿里巴巴數(shù)據(jù)中心技術(shù)突破
在多年的數(shù)據(jù)中心建設(shè)過(guò)程中,阿里也有了一些技術(shù)上的積淀和突破。
圖片圖片來(lái)源:阿里云
阿里云介紹,相比于傳統(tǒng)數(shù)據(jù)中心,張北、南通、杭州、河源、烏蘭察布這五大國(guó)內(nèi)超級(jí)數(shù)據(jù)中心全面應(yīng)用了阿里巴巴自研核心技術(shù),采用機(jī)架式服務(wù)器,形態(tài)從1U 2U 4U不等,從SKL一代,阿里巴巴數(shù)據(jù)中心就開始推進(jìn)全自研服務(wù)器,并已經(jīng)在新開服中心廣泛應(yīng)用,包括自研的神龍?jiān)品?wù)器,達(dá)摩院、平頭哥等最新研究成果,以及自研AI芯片含光800等。
在張北數(shù)據(jù)中心,阿里采用的直通風(fēng)風(fēng)側(cè)自然冷卻技術(shù),是全國(guó)數(shù)據(jù)中心領(lǐng)域最大規(guī)模應(yīng)用;杭州浸沒式液冷技術(shù)部署,也是全球互聯(lián)網(wǎng)行業(yè)最大規(guī)模;河源數(shù)據(jù)中心通過(guò)萬(wàn)綠湖湖水冷卻應(yīng)用,也是少有數(shù)據(jù)中心能夠做到的成果;以及巴拿馬電源系統(tǒng)在阿里新基地項(xiàng)目全量應(yīng)用,主要從供配電鏈路和整流模塊拓?fù)鋬蓚€(gè)維度,對(duì)傳統(tǒng)配電系統(tǒng)進(jìn)行優(yōu)化設(shè)計(jì),進(jìn)一步降低電源成本,提升系統(tǒng)效率和可靠性。
見證國(guó)內(nèi)數(shù)據(jù)中心變革
作為國(guó)內(nèi)較早部署數(shù)據(jù)中心的科技企業(yè)之一,阿里巴巴在可以說(shuō)是國(guó)內(nèi)數(shù)據(jù)中心技術(shù)變革的一個(gè)見證者。在阿里巴巴看來(lái),在數(shù)十年中,國(guó)內(nèi)的數(shù)據(jù)中心建設(shè)出現(xiàn)了一些新的現(xiàn)象,比如大廠紛紛開始布局自研服務(wù)器,競(jìng)爭(zhēng)從云計(jì)算延伸至數(shù)據(jù)中心領(lǐng)域。現(xiàn)在看來(lái),通過(guò)建設(shè)自家數(shù)據(jù)中心搶占新基建高地,已經(jīng)成為各大廠的通用做法。
而聚焦到數(shù)據(jù)中心本身,計(jì)算機(jī)的單機(jī)柜功率越來(lái)越大,整機(jī)柜的交付也越來(lái)越快;在供電方面,目前的數(shù)據(jù)中心則以自建110Kv或220Kv變電站為主,這樣在輸配電環(huán)節(jié)可以最大化地減少損耗。
這些都意味著,數(shù)據(jù)中心技術(shù)趨于成熟,交付計(jì)算的能力越來(lái)越強(qiáng)。
液冷技術(shù)正在普及
在大型數(shù)據(jù)中心中,制冷系統(tǒng)占了很大比重。無(wú)論是從體量還是耗能上,制冷的問(wèn)題都是數(shù)據(jù)中心的頭等大事。
目前,我國(guó)數(shù)據(jù)中心的能耗85%在PUE1.5-2.0之間,照此趨勢(shì),ODCC預(yù)計(jì)到2030年,我國(guó)數(shù)據(jù)中心的能耗將從2018年的1609億千瓦時(shí),增長(zhǎng)到2030年的4115億千瓦時(shí)。
這是什么概念?以2019年的數(shù)據(jù)為基準(zhǔn),2030年國(guó)內(nèi)數(shù)據(jù)中心的能耗將遠(yuǎn)遠(yuǎn)超出三峽和葛洲壩全年的發(fā)電量!
而要想解決數(shù)據(jù)中心可怕的能耗問(wèn)題,現(xiàn)在數(shù)據(jù)中心已經(jīng)從傳統(tǒng)風(fēng)冷和水冷空調(diào)散熱方式轉(zhuǎn)向液冷技術(shù)。
《中國(guó)液冷數(shù)據(jù)中心發(fā)展白皮書》也指出,用特制液體取代空氣作為冷媒為發(fā)熱部件進(jìn)行散熱的液冷技術(shù),以及基于該技術(shù)的液冷服務(wù)器,為數(shù)據(jù)中心的綠色化提供了新的解決思路。
為了加深對(duì)數(shù)據(jù)中心的了解,我們有必要探索一下液冷技術(shù)的概念,以及這項(xiàng)技術(shù)在降低能耗上表現(xiàn)突出的原理。
從概念上說(shuō),液冷技術(shù)是指將大部分熱量通過(guò)液體循環(huán)介質(zhì)帶走的一種散熱降溫技術(shù),也就是通過(guò)液體來(lái)替代空氣,把CPU、內(nèi)存條、芯片組、擴(kuò)展卡等器件在運(yùn)行時(shí)所產(chǎn)生的熱量帶走。與傳統(tǒng)風(fēng)冷技術(shù)相比,液冷系統(tǒng)可節(jié)省電量30%-50%,應(yīng)用液冷技術(shù)的數(shù)據(jù)中心,機(jī)房整體能效將得到30%提升。
根據(jù)目前技術(shù)研究的進(jìn)程,液冷可分為水冷和冷媒冷卻兩種,可用冷媒包括水、礦物油、電子氟化液等。而按照冷卻原理,液冷又可分為冷板式液冷(安裝在芯片等部件上散熱)、浸沒式液冷(將板卡浸泡在液體中)和噴淋式三種方法,比如曙光公司專門為深度學(xué)習(xí)高性能計(jì)算機(jī)設(shè)計(jì)的浸沒式液冷方案,可以使單機(jī)柜密度達(dá)到100kW。
雖然液冷技術(shù)是突破數(shù)據(jù)中心節(jié)能瓶頸的“最佳捷徑”,但由于目前液冷技術(shù)仍然面臨著巨大挑戰(zhàn),其還未在全球數(shù)據(jù)中心中成為主流技術(shù)。這些挑戰(zhàn)包括浸沒式、噴淋式液冷雖然散熱效率更高,但冷卻液直接接觸發(fā)熱器件,是否會(huì)影響IT部件的功能和壽命尚無(wú)明確結(jié)論;且由于使用冷卻液較多,需要考慮機(jī)房承重,使用和維護(hù)成本也較高。而水冷冷板方案雖然不直接接觸發(fā)熱器件,但采用非絕緣體的水作為冷媒,若發(fā)生泄漏會(huì)對(duì)HPC系統(tǒng)造成致命損害,存在安全隱患。
可見液冷在技術(shù)上確實(shí)還有很多進(jìn)步的空間,但其在節(jié)能和經(jīng)濟(jì)上的價(jià)值卻被廣泛認(rèn)可。據(jù)賽迪顧問(wèn)預(yù)測(cè),液冷的應(yīng)用前景廣闊,2025年中國(guó)液冷數(shù)據(jù)中心市場(chǎng)規(guī)?;?qū)⒊|元。
阿里巴巴也非常重視液冷技術(shù)在數(shù)據(jù)中心的應(yīng)用,比如杭州數(shù)據(jù)中心就是全球規(guī)模最大的全浸沒液冷數(shù)據(jù)中心。據(jù)估算,相比傳統(tǒng)數(shù)據(jù)中心,阿里云杭州數(shù)據(jù)中心PUE可達(dá)到1.09,每年可節(jié)電7000萬(wàn)度。
圖片圖片圖片阿里云液冷服務(wù)器阿里云供圖
不僅是阿里,全球范圍內(nèi)的科技企業(yè)的數(shù)據(jù)中心早已開始布局液冷技術(shù),比如谷歌、英特爾、HPE等多家巨頭公司,國(guó)內(nèi)的騰訊、華為、綠色云圖、中科曙光、浪潮、英維克等廠商也在加緊布局。
圖片來(lái)源:《中國(guó)液冷數(shù)據(jù)中心發(fā)展白皮書》
正如阿里巴巴所希望的那樣,相信在技術(shù)進(jìn)步下,液冷技術(shù)將會(huì)在國(guó)內(nèi)的數(shù)據(jù)中心普及開來(lái),減少能耗。
新變化下,數(shù)據(jù)中心的攻堅(jiān)方向
隨著AI、5G、區(qū)塊鏈等新興技術(shù)的出現(xiàn)和成熟,勢(shì)必會(huì)對(duì)數(shù)據(jù)中心產(chǎn)生巨大影響,比如利用AI等相關(guān)技術(shù),數(shù)據(jù)中心可以在大集群服務(wù)管理中進(jìn)行異常日志自動(dòng)發(fā)現(xiàn)、備品備件預(yù)測(cè)、批量問(wèn)題發(fā)現(xiàn)等,實(shí)現(xiàn)完全自動(dòng)化運(yùn)維,就像是數(shù)據(jù)中心的“無(wú)人自動(dòng)駕駛”;針對(duì)5G新商業(yè)應(yīng)用的邊緣數(shù)據(jù)中心基礎(chǔ)設(shè)施,也將得以快速發(fā)展,為智慧交通、遠(yuǎn)程醫(yī)療、智能制造等提供技術(shù)支撐。
變化所在之處,即機(jī)遇與挑戰(zhàn)并存之所,數(shù)據(jù)中心也面臨著需要解決的挑戰(zhàn)和攻堅(jiān)方向,大規(guī)模數(shù)據(jù)中心園區(qū)用水資源的可靠性供應(yīng)及節(jié)水方案,數(shù)據(jù)中心排熱回收再利用等,都是數(shù)據(jù)中心有著巨大進(jìn)步空間的突破口。
“創(chuàng)新越來(lái)越重要,一個(gè)微小的創(chuàng)新都會(huì)帶來(lái)巨大的價(jià)值”,這幾乎是所有相關(guān)企業(yè)對(duì)數(shù)據(jù)中心發(fā)展前景達(dá)成的共識(shí)。期待未來(lái),國(guó)內(nèi)有更多數(shù)據(jù)中心拔地而起,撐起新基建算力的底座!