整理|鄭麗媛
頭圖|下載于視覺(jué)中國(guó)
出品|CSDN(ID:CSDNnews)
上個(gè)月,歐洲云服務(wù)巨頭OVH數(shù)據(jù)中心起火,導(dǎo)致大量網(wǎng)站癱瘓,甚至部分客戶(hù)數(shù)據(jù)完全丟失且無(wú)法恢復(fù)。
彼時(shí),有關(guān)數(shù)據(jù)中心保護(hù)的話(huà)題一度引起熱議,其中“散熱”更一直是數(shù)據(jù)中心面臨的一大難題,國(guó)內(nèi)外大廠(chǎng)也各出奇招:阿里利用湖水制冷技術(shù)在千島湖設(shè)立數(shù)據(jù)中心;Facebook將數(shù)據(jù)中心建在接近北極圈的瑞典,用風(fēng)扇引入極地冷風(fēng);騰訊云貴安七星數(shù)據(jù)中心也設(shè)立在貴州陰涼的山洞之中......
而此前直接把數(shù)據(jù)中心放進(jìn)大海的微軟,更是得到了意外的收獲:水下數(shù)據(jù)中心的服務(wù)器故障率比傳統(tǒng)數(shù)據(jù)中心更低。
或許是以此為靈感,微軟最近又開(kāi)始搗鼓新的散熱方式了:將服務(wù)器侵入“液體浴池”。
(圖片來(lái)自微軟)
1、空氣冷卻還不夠
近年來(lái),大部分?jǐn)?shù)據(jù)中心都在采用空氣冷卻的方法使其降溫,即利用外部空氣,通過(guò)蒸發(fā)將溫度降至35攝氏度以下。
然而隨著芯片的發(fā)展,更多的晶體管封裝到相同尺寸的芯片上,計(jì)算機(jī)處理器的運(yùn)行速度幾乎每?jī)赡攴环瑢?duì)人工智能等高性能應(yīng)用的更快計(jì)算機(jī)處理器的需求也正在加速增長(zhǎng)。
因此,為了滿(mǎn)足性能需求,計(jì)算機(jī)行業(yè)已經(jīng)轉(zhuǎn)向可以處理更多電能的芯片架構(gòu)。例如,中央處理單元(CPU)已從每個(gè)芯片150瓦增加到300瓦以上;圖形處理單元(GPU)已增加到每個(gè)芯片700瓦以上。
通過(guò)處理器輸送的功率越高,芯片的散熱越多,而為了避免芯片過(guò)熱產(chǎn)生故障,冷卻要求也隨之提高。
對(duì)此,位于雷德蒙德的微軟數(shù)據(jù)中心高級(jí)開(kāi)發(fā)小組的工程師兼副總裁Christian Belady表示:“空氣冷卻還不夠。這就是促使我們采用浸入式冷卻的原因,我們可以在其中直接蒸發(fā)掉芯片表面的熱量。”他指出,液體的傳熱效率比空氣高幾個(gè)數(shù)量級(jí)。
由此,微軟開(kāi)始采用液體冷卻方式:將服務(wù)器浸泡在液體中。
2、兩相浸入式冷卻:即“浴缸”
把計(jì)算機(jī)配件浸入液體中,乍一聽(tīng)似是天方夜譚,但對(duì)早已將數(shù)據(jù)中心沉入大海的微軟而言不過(guò)是家常便飯了。
探索水下數(shù)據(jù)中心潛力的Natick項(xiàng)目使微軟取得了不小的收獲,項(xiàng)目負(fù)責(zé)人Ben Cutler發(fā)現(xiàn):“數(shù)據(jù)中心在水中的故障率是在陸地上的八分之一。”通過(guò)初步分析,出現(xiàn)這種結(jié)果的主要原因是處于水下的數(shù)據(jù)中心沒(méi)有濕度和氧氣的腐蝕干擾。
因此,微軟目前選擇直接將服務(wù)器的硬件浸泡在液體中,微軟數(shù)據(jù)中心高級(jí)開(kāi)發(fā)團(tuán)隊(duì)的首席硬件工程師Husam Alissa解釋道:“我們將海引入了服務(wù)器,而不是將數(shù)據(jù)中心置于海底。”
微軟稱(chēng)這種散熱方法為兩相浸入式冷卻,浸泡的液體用的是3M公司特別設(shè)計(jì)的不導(dǎo)電液體。工作原理是:這種液體以氟碳為基礎(chǔ),當(dāng)它直接接觸到服務(wù)器組件時(shí),吸收熱量易達(dá)到較低的沸點(diǎn)——50攝氏度,蒸汽遇到冷凝器就自動(dòng)液化為液體落回服務(wù)器中,從而形成一個(gè)閉環(huán)冷卻系統(tǒng),并且由于不需要額外的能量讓液體流動(dòng),冷凝器也不需要冷卻器,大幅降低了成本。
(圖片來(lái)自微軟)
Belady在接受The Verge的采訪(fǎng)時(shí),將其形象形容為:“這實(shí)際上是一個(gè)浴缸。”他比喻道:“架子將躺在浴缸內(nèi),你所看到的沸騰現(xiàn)象,就像在鍋?zhàn)永锓序v一樣。只不過(guò),你鍋中的沸騰溫度為100攝氏度,而我們是為50攝氏度。”
微軟技術(shù)研究員兼公司副總裁Marcus Fontoura也對(duì)這種方法十分看好。他認(rèn)為,向兩相浸入式冷卻轉(zhuǎn)變可以提高靈活性,從而有效地管理云資源。例如,管理云資源的軟件可以將數(shù)據(jù)中心計(jì)算需求中突發(fā)的峰值分配給液冷儲(chǔ)罐中的服務(wù)器。因?yàn)檫@些服務(wù)器可以在較高的功率下運(yùn)行(即超頻),而沒(méi)有過(guò)熱的風(fēng)險(xiǎn)。
3、緩解水資源短缺
在提到這種方法的靈感啟發(fā)時(shí),微軟明確指出是受到了近年來(lái)加密貨幣礦場(chǎng)使用這種液體冷卻技術(shù)來(lái)輔助開(kāi)采加密貨幣的影響。因而過(guò)去幾年微軟試用這種技術(shù)以應(yīng)對(duì)未來(lái)更高強(qiáng)度的密集型工作負(fù)載。
除此之外,液體冷卻技術(shù)的采用也與去年微軟表示“將解決水資源短缺的問(wèn)題”的承諾有關(guān):到2030年,其收集的水量要超過(guò)其全球運(yùn)營(yíng)所使用的水量。目前微軟已經(jīng)在其辦公室使用雨水收集系統(tǒng),并收集空調(diào)和工廠(chǎng)的冷凝水。
但由于微軟的用水量不斷增加,按計(jì)劃達(dá)成目標(biāo)變得愈發(fā)具有挑戰(zhàn)性,此時(shí)兩相浸入式冷卻的推廣使用會(huì)有很大幫助。
相較于普遍利用降低空氣溫度的沼澤冷卻的耗水量,微軟利用液體冷卻的兩相浸入式冷卻技術(shù)極大程度地減少了用水量。微軟Azure的首席軟件工程師Ioannis Manousakis說(shuō):“如果采取正確措施,兩相浸入式冷卻將同時(shí)滿(mǎn)足我們對(duì)成本、可靠性和性能的要求,而與空氣冷卻相比,其能源消耗幾乎是零頭。”
其實(shí),這種沉浸式工藝在行業(yè)中已出現(xiàn)了幾年,不過(guò)微軟聲稱(chēng)它是“第一家在生產(chǎn)環(huán)境中運(yùn)行兩相浸入式冷卻的云提供商。”但不論如何,微軟對(duì)數(shù)據(jù)中心的散熱可謂是十分上心,各種看似怪誕實(shí)則可行的方法都一一嘗試,力爭(zhēng)選出最合適的散熱途徑。
或許這次讓服務(wù)器浸沒(méi)在“浴缸”中的方法未來(lái)也會(huì)普及?對(duì)此你有什么看法嗎,歡迎評(píng)論區(qū)留言!
參考鏈接:
https://news.microsoft.com/innovation-stories/datacenter-liquid-cooling/
https://www.theverge.com/2021/4/6/22369609/microsoft-server-cooling-liquid-immersion-cloud-racks-data-centers