數(shù)據(jù)中心邁入液冷時(shí)代

戴爾和超微表示,通過(guò)直接在機(jī)架上的 GPU 上使用液體冷卻,他們可以將數(shù)據(jù)中心的功耗降低三分之一。機(jī)架供應(yīng)商告訴《EE Times》,通過(guò)取代當(dāng)今數(shù)據(jù)中心的主要解決方案空氣冷卻,液體冷卻將使數(shù)據(jù)中心運(yùn)營(yíng)商能夠?qū)⒏嗟木性谟?jì)算上,而不是空調(diào)上。

本文來(lái)自微信公眾號(hào)“半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)”,編譯自eetimes。

目前典型數(shù)據(jù)中心所用電力的46%用于空氣冷卻。

戴爾和超微表示,通過(guò)直接在機(jī)架上的GPU上使用液體冷卻,他們可以將數(shù)據(jù)中心的功耗降低三分之一。機(jī)架供應(yīng)商告訴《EE Times》,通過(guò)取代當(dāng)今數(shù)據(jù)中心的主要解決方案空氣冷卻,液體冷卻將使數(shù)據(jù)中心運(yùn)營(yíng)商能夠?qū)⒏嗟木性谟?jì)算上,而不是空調(diào)上。

人工智能正在推動(dòng)需求。就在世界各地新建的超大型數(shù)據(jù)中心開(kāi)始給電網(wǎng)帶來(lái)壓力之際,更高的能源效率前景也隨之而來(lái)。

戴爾和Supermicro是高端數(shù)據(jù)中心液冷機(jī)架的主要供應(yīng)商,它們一直在提高產(chǎn)量以滿足預(yù)期的激增需求。Supermicro表示,它每月可在全球范圍內(nèi)交付一千多個(gè)機(jī)架。

Supermicro技術(shù)和AI高級(jí)副總裁Vik Malyala告訴EE Times:“我們可以了解我們的技術(shù)合作伙伴將推出哪些技術(shù),無(wú)論是英特爾、AMD還是Nvidia,以及像博通和英特爾這樣的網(wǎng)絡(luò)公司。我們與他們合作,然后查看他們的路線圖。”

Nvidia等GPU制造商為冷板和散熱器創(chuàng)建了參考設(shè)計(jì)。戴爾和Supermicro密切合作以采用這些設(shè)計(jì)。

戴爾工程技術(shù)專家Tim Shedd告訴《EE Times》:“我們希望確保我們?cè)O(shè)計(jì)的任何產(chǎn)品都能得到芯片制造商的支持,并得到他們的保證和支持。我們添加了多年來(lái)在行業(yè)中積累的專有功能,例如專有泄漏感應(yīng)技術(shù),以保護(hù)客戶和服務(wù)器。”

Supermicro表示,其冷卻解決方案包含冷板設(shè)計(jì)的專有信息。Malyala補(bǔ)充說(shuō),數(shù)據(jù)中心運(yùn)營(yíng)商一直不愿意放棄對(duì)空氣冷卻的依賴,但他預(yù)計(jì)這種狀況將會(huì)改變。

“隨著數(shù)據(jù)中心部署規(guī)模越來(lái)越大,我們知道效率將成為一個(gè)非常關(guān)鍵的因素,”瑪利亞拉說(shuō)。“電力消耗是一場(chǎng)噩夢(mèng)。”

戴爾估計(jì),目前典型數(shù)據(jù)中心所用電力的46%用于空氣冷卻。Shedd表示:“通過(guò)部署液體冷卻,我們可以將能耗降低到10%或更低,而不必在所有東西上都安裝冷卻板,而是使用智能混合技術(shù):只需空氣和液體冷卻。”他補(bǔ)充說(shuō),降低能耗的關(guān)鍵是減少數(shù)據(jù)中心的空氣壓縮機(jī)數(shù)量。

如今,大多數(shù)數(shù)據(jù)中心都采用從設(shè)施周邊吹向服務(wù)器的空氣進(jìn)行冷卻。服務(wù)器上的風(fēng)扇提供額外的冷卻。

“我需要相當(dāng)冷的水,通常約為45°F,才能充分冷卻空氣,”Shedd說(shuō)道。“這意味著一年中的大部分時(shí)間,我都需要壓縮機(jī)和制冷來(lái)冷卻水。使用液體冷卻,對(duì)于使用冷板和液體冷卻的數(shù)據(jù)中心部分,我通??梢允褂?0°F的水,甚至100°F的水來(lái)進(jìn)行冷卻?,F(xiàn)在,在大多數(shù)氣候條件下,我?guī)缀醪恍枰獕嚎s機(jī),因此節(jié)省的能源非??捎^。”

市場(chǎng)研究公司Dell'Oro在7月份的新聞稿中表示,液體冷卻正在從一個(gè)小眾市場(chǎng)轉(zhuǎn)變?yōu)橹髁鳂I(yè)務(wù),由于對(duì)熱管理的需求增加,到2030年其價(jià)值將達(dá)到150億美元。

液冷系統(tǒng)出貨量將增長(zhǎng)20%

Malyala表示,超微預(yù)計(jì)今年支持人工智能基礎(chǔ)設(shè)施(包括液體冷卻)的系統(tǒng)的出貨量增長(zhǎng)率將至少達(dá)到20%。他說(shuō):“我們正在考察許多數(shù)據(jù)中心,我們意識(shí)到其中許多數(shù)據(jù)中心效率極低,因?yàn)榻ㄔO(shè)基礎(chǔ)設(shè)施的人并不是支付制冷費(fèi)用的人。”

Shedd指出,需求是由1,000瓦GPU的進(jìn)步以及你可能想不到的地方對(duì)AI的需求所推動(dòng)的。“我們必須將AI帶入數(shù)據(jù),而不是將數(shù)據(jù)帶入處理能力。我不一定想將數(shù)據(jù)發(fā)送到云端,因?yàn)槲覔?dān)心安全問(wèn)題。政府不想將他們的數(shù)據(jù)(尤其是這種敏感、經(jīng)過(guò)處理、有用的數(shù)據(jù))發(fā)送到外面。那不是10,000個(gè)GPU的數(shù)據(jù)中心;那是一個(gè)機(jī)架。”

戴爾發(fā)現(xiàn)了液體冷卻在新領(lǐng)域的應(yīng)用案例。“我們過(guò)去主要關(guān)注高性能計(jì)算和一些非常具體的商業(yè)垂直行業(yè),比如銀行業(yè)和其他真正需要密集計(jì)算的領(lǐng)域,”Shedd說(shuō)道。“現(xiàn)在我們看到用例細(xì)化到工廠中的一個(gè)機(jī)架,他們希望實(shí)時(shí)從生產(chǎn)線收集數(shù)據(jù),處理數(shù)據(jù)并做出決策。這可能需要在該機(jī)架中使用液體冷卻。”

Malyala表示,邊緣安全是液冷機(jī)架供應(yīng)商的一個(gè)不斷增長(zhǎng)的業(yè)務(wù)。“我們談?wù)摰氖俏覀兊拿坎渴謾C(jī),”他說(shuō)。“我們?nèi)绾卧谠?jīng)的中心位置有效地保證它們的安全?實(shí)時(shí)威脅檢測(cè)和保護(hù)正在發(fā)生——這正在向邊緣靠攏。”

關(guān)掉空調(diào)

通過(guò)將數(shù)據(jù)中心甚至機(jī)架轉(zhuǎn)換為液體冷卻,應(yīng)該可以“關(guān)閉空調(diào),或者至少以更高效的方式運(yùn)行它們”,Malyala說(shuō)。“你說(shuō)的是40%的節(jié)能。這基本上意味著你可以在相同的空間內(nèi)放置40%的額外基礎(chǔ)設(shè)施。”

戴爾還將液體冷卻的節(jié)能視為向客戶銷(xiāo)售更多機(jī)架和提高數(shù)據(jù)中心處理密度的一種方式。

能源節(jié)省的效果還可能進(jìn)一步擴(kuò)大。新加坡供應(yīng)商Sustainable Metal Cloud 8月份向CNBC表示,其浸入式冷卻技術(shù)的安裝成本比液體解決方案低28%,且可將能耗降低高達(dá)50%。

在現(xiàn)有數(shù)據(jù)中心安裝液體冷卻需要對(duì)設(shè)施內(nèi)部進(jìn)行大量改造,而這正是客戶感到畏懼的。“對(duì)于客戶,我們需要根據(jù)他們的實(shí)際情況來(lái)滿足他們的需求,”Shedd說(shuō)。“有些客戶目前無(wú)法部署液體冷卻。安裝所有管道和水管實(shí)在是太麻煩了。所以我們與他們合作。我們不斷提高服務(wù)器風(fēng)扇的效率。我們不斷努力讓客戶使用更高的溫度,這樣他們就可以減少使用壓縮機(jī)。”

戴爾期待液體冷卻領(lǐng)域進(jìn)一步創(chuàng)新。未來(lái)處理器的熱密度將超過(guò)燃?xì)鈬姛舻幕鹧?。首席運(yùn)營(yíng)官杰夫·克拉克(Jeff Clarke)在9月份的LinkedIn博客中表示,戴爾正在改變冷卻板,以管理最具挑戰(zhàn)性的處理器功能,而不會(huì)影響數(shù)據(jù)中心的能源效率。他說(shuō)道:“我們正在為未來(lái)打造新的集成機(jī)架,以便每個(gè)機(jī)架能夠承受超過(guò)400 kW的電力和冷卻。”

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論