隨著芯片熱設(shè)計(jì)功耗(TDP)的增加,很多組織需要通過(guò)高性能計(jì)算(HPC)支持人工智能和數(shù)據(jù)分析等高功率負(fù)載的需求,以及在降低總體擁有成本(TCO)的同時(shí)提高效率,數(shù)據(jù)中心運(yùn)營(yíng)商或所有者正在考慮采用新的方法來(lái)冷卻其數(shù)據(jù)中心設(shè)施。盡管直接液體冷卻技術(shù)并不是一個(gè)新概念,但發(fā)展迅速,已經(jīng)成為高性能計(jì)算(HPC)領(lǐng)域廣泛接受的冷卻方法,并且是注重效率和降低運(yùn)營(yíng)成本的企業(yè)數(shù)據(jù)中心都在認(rèn)真考慮的一種制冷解決方案?,F(xiàn)在,幾乎所有主要的服務(wù)器原始設(shè)備制造商(OEM)都提供液冷服務(wù)器,并為該技術(shù)的快速采用做出了貢獻(xiàn)。
了解直接液體冷卻的好處是確定其是否符合組織數(shù)據(jù)中心運(yùn)營(yíng)策略的關(guān)鍵。以下是直接液體冷卻技術(shù)為數(shù)據(jù)中心及其長(zhǎng)期計(jì)算路線圖提供的主要優(yōu)勢(shì)。
(1)提高功率密度
對(duì)數(shù)據(jù)中心計(jì)算能力的需求促使提高功率密度,這是數(shù)據(jù)中心運(yùn)營(yíng)者在規(guī)劃部署時(shí)面臨的難題。由于采用空氣冷卻技術(shù)的每個(gè)數(shù)據(jù)中心機(jī)架的最大功率為20kW~30kW,直接液體冷卻技術(shù)可以將每個(gè)機(jī)架的功率提高到100kW以上,從而使新的數(shù)據(jù)中心可以在更小的空間內(nèi)提供更強(qiáng)大的處理能力。
(2)提高能源效率和降低總體擁有成本
空氣冷卻設(shè)施需要采用大量的電力才能運(yùn)行,直接液體冷卻技術(shù)可以為服務(wù)器提供足夠的冷卻。更低的能源費(fèi)用、更低的維護(hù)成本和更高的可靠性可以降低數(shù)據(jù)中心設(shè)施的成本。與以往的空氣冷卻系統(tǒng)相比,大多數(shù)直接液體冷卻系統(tǒng)獲得回報(bào)的周期為一年或更短,并且隨著時(shí)間的推移可以節(jié)省大量成本。
(3)提高性能
數(shù)據(jù)中心需要非常一致且精確的冷卻,才能滿足以最高性能運(yùn)行Intel、AMD和Nvidia公司最新芯片的需求。對(duì)于采用空氣冷卻技術(shù)的數(shù)據(jù)中心,經(jīng)常會(huì)出現(xiàn)熱點(diǎn)和過(guò)熱停機(jī)現(xiàn)象,直接液體冷卻可以保持?jǐn)?shù)據(jù)中心平穩(wěn)運(yùn)行。
(4)可維護(hù)性
與空氣冷卻系統(tǒng)的維護(hù)工作相比,直接液體冷卻非常簡(jiǎn)單。服務(wù)器級(jí)別的組件(例如CPU和內(nèi)存)可以輕松并快速訪問(wèn)。與數(shù)據(jù)中心運(yùn)維人員可以簡(jiǎn)單地將服務(wù)器安裝到機(jī)架而無(wú)需進(jìn)行其他連接一樣,也可以簡(jiǎn)單地連接液體冷卻的服務(wù)器。
(5)降低噪音
采用直接液冷技術(shù)的數(shù)據(jù)中心更加安靜。工作人員可以在數(shù)據(jù)中心長(zhǎng)時(shí)間工作,而不會(huì)忍受數(shù)以千計(jì)的服務(wù)器風(fēng)扇更大的噪音。
(6)熱能再利用
專注于能源效率的數(shù)據(jù)中心設(shè)施可以通過(guò)熱能再利用計(jì)劃進(jìn)一步擴(kuò)大收益??梢詫⒎?wù)器產(chǎn)生的熱量引導(dǎo)到建筑物的供暖系統(tǒng),并進(jìn)一步減少建筑物的運(yùn)營(yíng)成本。
(7)使用現(xiàn)有的基礎(chǔ)設(shè)施
浸沒(méi)式液體冷卻技術(shù)使用定制的儲(chǔ)液罐來(lái)容納冷卻數(shù)據(jù)中心機(jī)架和專有冷卻液,直接液體冷卻技術(shù)則可以與現(xiàn)有的數(shù)據(jù)中心機(jī)架和基礎(chǔ)設(shè)施配合使用。在已經(jīng)將行內(nèi)或后門(mén)熱交換器連接到數(shù)據(jù)中心設(shè)施水冷設(shè)施中,直接液體冷卻技術(shù)可以采用現(xiàn)有的管道網(wǎng)絡(luò)。
(8)通信
直接液冷技術(shù)通過(guò)Modbus、SNMP或Web界面與現(xiàn)有的BMI網(wǎng)絡(luò)集成。數(shù)據(jù)中心運(yùn)營(yíng)商可以對(duì)冷卻系統(tǒng)進(jìn)行盡可能少的控制,因?yàn)楫?dāng)與智能冷卻液分配單元(CDU)配套使用時(shí),直接液體冷卻技術(shù)可以自主運(yùn)行。
(9)空氣冷卻效果很好
有些根本不需要采用液體冷卻的數(shù)據(jù)中心,而是想利用其現(xiàn)有的一些空氣冷卻基礎(chǔ)設(shè)施來(lái)降低資本支出,同時(shí)最大程度地提高潛在的機(jī)架功率密度。直接液體冷卻組件足夠小,以至于不會(huì)妨礙服務(wù)器之間的氣流路徑,并且可以并行工作以通過(guò)這種混合冷卻方法充分吸收熱量。這對(duì)于首次探索直接液體冷卻技術(shù)并希望隨著時(shí)間的推移添加更多液體冷卻技術(shù)的數(shù)據(jù)中心運(yùn)營(yíng)商來(lái)說(shuō)尤其有吸引力。
(10)可用性
所有主要服務(wù)器原始設(shè)備制造商(包括HPE、Dell EMC、Intel和Gigabyte)都提供直接液冷服務(wù)器及其出廠保修服務(wù)??蛻艨梢垣@得他們提供的技術(shù)和服務(wù)方面的支持。
規(guī)劃數(shù)據(jù)中心的未來(lái)
采用正確的冷卻解決方案可以確保組織的數(shù)據(jù)中心設(shè)施滿足未來(lái)的計(jì)算需要。隨著芯片密度的增加和建筑空間成本日益高昂,需要選擇更有效的冷卻措施(例如直接液體冷卻技術(shù))以釋放數(shù)據(jù)中心的運(yùn)營(yíng)潛力。