谷歌放大招!用AI來管理數(shù)據(jù)中心的制冷,越用越省電!

數(shù)據(jù)中心能耗和性能
數(shù)據(jù)中心服務(wù)器數(shù)量一般都在萬級規(guī)模,在保障服務(wù)的性能之外,產(chǎn)生了巨大的能耗成本。比如,現(xiàn)在大規(guī)模數(shù)據(jù)中心為了減少制冷的用電量,甚至?xí)诒鶏u或者海底建立數(shù)據(jù)中心,不可謂不瘋狂。
  數(shù)據(jù)中心服務(wù)器數(shù)量一般都在萬級規(guī)模,在保障服務(wù)的性能之外,產(chǎn)生了巨大的能耗成本。比如,現(xiàn)在大規(guī)模數(shù)據(jù)中心為了減少制冷的用電量,甚至?xí)诒鶏u或者海底建立數(shù)據(jù)中心,不可謂不瘋狂。
 
  2016年時,DeepMind和谷歌聯(lián)手開發(fā)了一個基于AI的動作推薦系統(tǒng),向負(fù)責(zé)維護、調(diào)節(jié)冷卻系統(tǒng)的數(shù)據(jù)中心運營人員推薦不同狀況下的應(yīng)對方法,它讓谷歌當(dāng)時已經(jīng)具有很高能源效率的推薦系統(tǒng)數(shù)據(jù)中心向前更進了一步。他們的出發(fā)點也很簡單,為了應(yīng)對全球氣候變化,大型能耗場所的一點點小改進也能在在減少能源消耗、減少二氧化碳排放方面有重大影響。這個工作其實早期并沒有受到太大關(guān)注,當(dāng)時看論文也沒發(fā)現(xiàn)有DeepMind這個團隊,作者就一個人:Jim Gao??梢詤⒖颊撐模篗achine Learning Applications for Data Center Optimization
 
  最近,DeepMind把這個系統(tǒng)升級到了一個全新的級別上:不再像原來的系統(tǒng)那樣向人類推薦一些動作,然后由人類去完成,AI系統(tǒng)現(xiàn)在會直接控制數(shù)據(jù)中心的冷卻系統(tǒng),當(dāng)然了它也仍然受到數(shù)據(jù)中心運營人員的專業(yè)監(jiān)控。這是首個基于云的控制系統(tǒng),已經(jīng)在多個谷歌的數(shù)據(jù)中心中安靜地運行、持續(xù)地節(jié)省能源。它的工作流程大致如下:每隔5分鐘,這個基于云的AI會從數(shù)據(jù)中心的數(shù)千個傳感器中采集數(shù)據(jù),獲得數(shù)據(jù)中心冷卻系統(tǒng)的狀態(tài)快照,然后把它輸入深度神經(jīng)網(wǎng)絡(luò)。這個網(wǎng)絡(luò)會預(yù)測各種可能的操作的不同組合會如何影響數(shù)據(jù)中心的能量消耗。然后AI就會就會在滿足魯棒安全性限制的條件下判斷出一組能夠最小化能源消耗的動作。這些動作的判斷結(jié)果接下來會被發(fā)回給數(shù)據(jù)中心,由本地的控制系統(tǒng)驗證并執(zhí)行。
 
  雖然只上線了幾個月時間,這個系統(tǒng)已經(jīng)可以穩(wěn)定地節(jié)約平均30%左右的能源,而且他們還期待系統(tǒng)未來可以改善更多。這是因為隨著數(shù)據(jù)更多,系統(tǒng)的優(yōu)化判斷能力也會變得更強,如下圖。
 
 
  藍(lán)色可以理解為訓(xùn)練時間,綠色為制冷用電量
 
  隨著技術(shù)越來越成熟,DeepMind和谷歌的研究人員未來也會把系統(tǒng)的優(yōu)化邊界設(shè)置得寬松一些,來達(dá)到更好的能源節(jié)約效果。這個AI直接控制的系統(tǒng)時不時找到一些新的方法管理冷卻系統(tǒng),有一些方法甚至讓數(shù)據(jù)庫操作人員覺得驚訝。與這個系統(tǒng)緊密協(xié)作的一位谷歌數(shù)據(jù)中心運營人員就驚訝道:「這個AI會利用冬天外面比較冷的特點,產(chǎn)生比平時更冷的冷卻水,然后減少了給數(shù)據(jù)中心降溫所需的能源消耗。規(guī)則是不會自己變得越來越好的,但是AI可以啊?!?。缺少解釋性,但就是有用,也是AI的霸道之處。
THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論