近兩年內(nèi),數(shù)據(jù)中心行業(yè)發(fā)展如日中天,越來越多的企業(yè)開始建設(shè)屬于自己的數(shù)據(jù)中心。但以往的企業(yè)建設(shè)數(shù)據(jù)中心都是由外到內(nèi),從數(shù)據(jù)中心建筑著手,如今隨著數(shù)據(jù)中心機房溫度的不斷攀升,傳統(tǒng)的由外到內(nèi)的數(shù)據(jù)中心建設(shè)已經(jīng)不能滿足企業(yè)的需求,現(xiàn)如今企業(yè)正在尋找一種新的數(shù)據(jù)中心設(shè)計方法。
數(shù)據(jù)中心圍繞服務(wù)器機架建造服務(wù)器機房,可以有助于減輕服務(wù)器機房冷卻方面的挑戰(zhàn)壓力,并節(jié)省運營資金。
由此,當前的企業(yè)組織紛紛正在慢慢開始采用一種全新的數(shù)據(jù)中心設(shè)計方法,在這種全新的設(shè)計方法中,他們將由內(nèi)而外的規(guī)劃其新的設(shè)施,首先選擇服務(wù)器機架及其冷卻技術(shù),然后圍繞它們進行數(shù)據(jù)中心設(shè)計的結(jié)構(gòu)。
在本文中,我們將與廣大讀者朋友們共同探討使得當前企業(yè)數(shù)據(jù)中心的冷卻比以往任何時候都更具挑戰(zhàn)性的相關(guān)因素,并還將為大家解釋為什么從服務(wù)器機架,而不是服務(wù)器機房開始著手數(shù)據(jù)中心的設(shè)計流程可以幫助企業(yè)降低能耗,增加容量,并優(yōu)化數(shù)據(jù)中心占地空間的利用率。
數(shù)據(jù)中心冷卻挑戰(zhàn)
得益于當前企業(yè)組織對于各種新興技術(shù)的廣泛積極的采用,使得當前企業(yè)數(shù)據(jù)中心的操作運行始終保持在一個相對安全的工作溫度范圍內(nèi),而這些新興的技術(shù)就包括:
●虛擬化技術(shù):借助虛擬化技術(shù)的部署,一款單一的物理服務(wù)器就能支持多臺虛擬機,而且每臺虛擬機都有其自己的操作系統(tǒng)和應(yīng)用程序。這反過來,可以降低企業(yè)的硬件采購和維護成本,進而使得企業(yè)組織得以能夠?qū)⑽闯浞掷玫姆?wù)器整合到更少數(shù)量、功能更為強大的主機設(shè)備上。但是,實現(xiàn)了更為充分利用的服務(wù)器同時也將會是一臺散熱更多的服務(wù)器。此外,一些使用了虛擬化技術(shù)的企業(yè)組織也在同時使用管理軟件,以便能夠根據(jù)工作負載的均衡要求,將虛擬機動態(tài)的重新定位托管到新的主機服務(wù)器上。在這樣的數(shù)據(jù)中心,相關(guān)利用率最高的設(shè)施的散熱量也就最大,故而會使得數(shù)據(jù)中心的某些部分可能每天甚至每小時的都散熱需求都不同。
●刀片式服務(wù)器:刀片式服務(wù)器通常與虛擬化技術(shù)結(jié)合使用,是即插即用的處理單元,具有共享的供電電源、風扇、電纜和存儲。通過將大量的計算容量壓縮到少量空間,刀片服務(wù)器可以有助于顯著的降低數(shù)據(jù)中心的空間占地需求。但不幸的是,刀片式服務(wù)器會將每臺服務(wù)器機架的功率密度提升到15 kW以上,從而顯著提高數(shù)據(jù)中心的散熱水平。
●多核處理器:今天的多核服務(wù)器處理器比它們的單核前代產(chǎn)品功能要強大得多,當然,他們對于電力的需求也遠遠超過了前代產(chǎn)品。實際上,配備了雙核或四核處理器的服務(wù)器平均每臺機架所消耗的功率將達到12到16 kW,從而顯著提高了服務(wù)器機架的操作運行溫度。
●云計算:為了降低運營開銷,并提高效率,當前有越來越多的企業(yè)開始紛紛積極的采用云計算解決方案。根據(jù)全球知名的市場分析公司IDC的調(diào)研數(shù)據(jù)顯示,在全球范圍內(nèi),通過互聯(lián)網(wǎng)交付提供應(yīng)用程序和基礎(chǔ)設(shè)施資源的公共云服務(wù)解決方案領(lǐng)域的支出已經(jīng)從2010年的215億美元躍升至2015年的729億美元。與此同時,私有云服務(wù)基礎(chǔ)架構(gòu)也在企業(yè)數(shù)據(jù)中心迅速發(fā)揮著重要作用。對于私有云服務(wù)基礎(chǔ)架構(gòu)而言,其與公共云服務(wù)所采用的技術(shù)基本相同,僅僅只是在企業(yè)的防火墻之內(nèi)使用。然而,這兩種類型的云服務(wù)通常都需要使用大量的商品化服務(wù)器,進而將顯著增加企業(yè)的功率和冷卻散熱需求。
此外,更為復(fù)雜的是,今天的數(shù)據(jù)中心設(shè)計人員還必須充分考慮到除了上述這些技術(shù)因素之外的非技術(shù)型因素,而這些非技術(shù)型因素包括:
●政府相關(guān)機構(gòu)旨在降低數(shù)據(jù)中心耗電量和溫室氣體排放量的環(huán)境保護監(jiān)管法律法規(guī)的不斷出臺,包括諸如英國的碳減排承諾立法,正在變得越來越普遍,推動企業(yè)數(shù)據(jù)中心必須盡可能的實現(xiàn)更高的能源效率。
●由于當前的數(shù)據(jù)中心業(yè)界對于諸如風能和太陽能,老化電力傳輸系統(tǒng)和公用電力服務(wù)事業(yè)放松管制計劃等環(huán)境友好,但成本昂貴的電源的采用日益增多,使得能源成本不斷上升,進一步促進了業(yè)界對于更高能源效率的需求。
●諸如美國環(huán)境保護局等監(jiān)管機構(gòu)以及眾多的公用電力服務(wù)公司正在向數(shù)據(jù)中心企業(yè)提供節(jié)能獎勵回扣,以推動實現(xiàn)顯著的節(jié)能效果。
●構(gòu)建和運營數(shù)據(jù)中心的高額成本代價使得當前的企業(yè)紛紛都在積極的在不影響對于其業(yè)務(wù)需求滿足的前提下,尋求縮小其計算設(shè)施的物理占地空間的方法。
數(shù)據(jù)中心冷卻策略的演變
在功率密度和散熱需求水平不斷提高的推動下,近年來,企業(yè)數(shù)據(jù)中心的冷卻散熱管理策略也發(fā)生了重大變化。
1、混沌空氣分配策略
直到最近,大多數(shù)數(shù)據(jù)中心的冷卻方案都依賴于所謂的“混沌”空氣分配方法。在該方法中,圍繞著服務(wù)器機房周邊的計算機房空調(diào)(CRAC)單元提供大量的冷空氣,而這些冷空氣即用于冷卻IT設(shè)備,同時還用于幫助將服務(wù)器所排出的熱的廢氣推向設(shè)施的回風管道。
然而,這種混亂的空氣分布通常會導(dǎo)致各種顯著的降低效率方面的問題,包括:
●再循環(huán):熱廢氣很可能回到服務(wù)器進氣口,進而將IT設(shè)備加熱到潛在的危險操作溫度。
●空氣分層:基于不同溫度層中的空氣質(zhì)量的自然趨勢可能會迫使精密冷卻設(shè)備的設(shè)定點需要低于推薦值。
●旁路空氣:冷卻的供氣可以在通過服務(wù)器之前加入回流氣流,從而降低冷卻效率。
為了提高冷卻效率,并與數(shù)據(jù)中心操作環(huán)境溫度的穩(wěn)步攀升保持同步,一些企業(yè)很快轉(zhuǎn)向開始采用服務(wù)器機架的熱通道/冷通道分隔定位安排機架的方法,該方法將相鄰既定服務(wù)器機架行的熱空氣排氣口在熱通道彼此面對面,而冷空氣進氣口則在冷通道彼此面對面。這種配置方法有助于產(chǎn)生氣流的對流,進而產(chǎn)生連續(xù)的冷卻氣流。
盡管如此,雖然該方法優(yōu)于混沌空氣分配策略,但熱通道/冷通道隔離的策略已被證明僅僅只能夠為當前日益密集的數(shù)據(jù)中心提供足夠的冷卻能力。這主要是因為這兩種方法最終都具有一大共同的致命缺陷:這兩種方法都允許空氣在整個數(shù)據(jù)中心操作環(huán)境空間內(nèi)自由的流通。
3、密封遏制策略
上述管理策略方案的共同缺陷最終導(dǎo)致了密封遏制冷卻策略的采用。該方案主要是被設(shè)計用于組織和控制氣流,這種解決方案將服務(wù)器機架封裝在密封結(jié)構(gòu)中,捕獲熱廢氣,并將這些熱廢氣排放到CRAC單元,然后將冷空氣直接輸送到服務(wù)器設(shè)備的進氣口。最終,該方案為企業(yè)數(shù)據(jù)中心的管理帶來了一系列重大的益處:
●提高冷卻效率:通過防止供應(yīng)的冷空氣和返回的熱氣流的混合,精心設(shè)計的密封解決方案可消除再循環(huán),空氣分層和旁路氣流所導(dǎo)致的冷卻氣流的浪費,從而提升冷卻效率。
●提高可靠性:消除了再循環(huán)備用服務(wù)器免于暴露于暖空氣之中的潛在危險,而暖空氣可能導(dǎo)致熱關(guān)機,進而提高了數(shù)據(jù)中心的可靠性。
●降低能源消耗:為了抵消再循環(huán)熱廢氣的影響,傳統(tǒng)的冷卻方案通常將回風冷卻至55華氏度/12.78攝氏度。但是,基于密封遏制的冷卻系統(tǒng)完全隔離了回風,因此可以安全地輸送65華氏度/18.34攝氏度的供氣。因此,密封遏制冷卻策略通??蓪RAC單元的功耗平均降低16%,進而降低能源消耗。
●更好的數(shù)據(jù)中心操作環(huán)境空間的布局靈活性:為了使熱通道/冷通道策略產(chǎn)生有效的冷卻氣流的對流,企業(yè)數(shù)據(jù)中心必須將其服務(wù)器機架放置在對齊的,均勻排列的機架行中。但是,密封遏制策略并不依賴于氣流的對流,因此該策略使得數(shù)據(jù)中心的設(shè)計人員們能夠?qū)⒎?wù)器機架定位在最適合其需求的任何配置中。
盡管采取密封遏制的策略對數(shù)據(jù)中心的冷卻帶來了革命性的影響,但大多數(shù)企業(yè)組織的數(shù)據(jù)中心仍然以與以往差不多的方式繼續(xù)規(guī)劃其新的計算設(shè)施。首先,他們設(shè)計一座建筑,并將其中的一部分規(guī)劃用于數(shù)據(jù)處理大廳或白空間。然后,他們將采用盡可能多的服務(wù)器機架填充空白區(qū)域。
但是,以傳統(tǒng)方式設(shè)計的數(shù)據(jù)中心可能會產(chǎn)生各種各樣的問題。例如,規(guī)格過小或過大的電力和冷卻基礎(chǔ)設(shè)施可能會引發(fā)對于運營能力的不必要額限制或增加資本支出。不方便定位的結(jié)構(gòu)元件可以迫使密封遏制管道以降低其效率的方式彎曲和繞行。服務(wù)器機房的過道過窄或不夠長會使服務(wù)器機架放置復(fù)雜化,并導(dǎo)致地面空間的浪費。
因此,越來越多的企業(yè)組織開始認識到數(shù)據(jù)中心的設(shè)計是充滿了智慧的,不是先建造起了數(shù)據(jù)中心建筑大樓然后安置進入服務(wù)器機架即可,而是需要圍繞著服務(wù)器機架來進行數(shù)據(jù)中心建筑大樓的設(shè)計建造。由此,他們不再是先建造其數(shù)據(jù)中心建筑,然后簡單的用服務(wù)器機架填充服務(wù)器機房了,而是根據(jù)他們實際業(yè)務(wù)的需求來選擇好理想的機架,并圍繞這些機架來進行服務(wù)器機房的設(shè)計。他們正在為他們將要使用的精確硬件和機箱陣列安裝最佳的基礎(chǔ)設(shè)施,而不是低估或過度配置新設(shè)施的電力和冷卻資源。他們不是選擇當結(jié)構(gòu)缺陷導(dǎo)致解決效率的低下問題發(fā)生時立即應(yīng)對,而是選擇了從開始設(shè)計之初就防止這些缺陷的發(fā)生。最終結(jié)果是不僅使得數(shù)據(jù)中心的冷卻和維護成本更低,而且更可靠,更適合業(yè)務(wù)需求。
圍繞數(shù)據(jù)中心服務(wù)器機架實施規(guī)劃的關(guān)鍵步驟
從服務(wù)器機架出發(fā),來進行數(shù)據(jù)中心的規(guī)劃與傳統(tǒng)設(shè)計方法是背道而馳的,但卻能夠始終如一地帶來更好的結(jié)果。以下是圍繞數(shù)據(jù)中心服務(wù)器機架實施規(guī)劃的基本措施:
1、需求收集
圍繞服務(wù)器機架設(shè)計數(shù)據(jù)中心的核心優(yōu)勢在于,該方案允許企業(yè)數(shù)據(jù)中心能夠根據(jù)相關(guān)確切的技術(shù)和業(yè)務(wù)需求定制設(shè)施。那么,確定這些需求就應(yīng)該成為數(shù)據(jù)中心規(guī)劃過程首當其沖的第一步。特別是,請務(wù)必評估您企業(yè)數(shù)據(jù)中心在以下重要領(lǐng)域的要求:
功率密度:對于該需求的估算是最為重要的,因為其在設(shè)計過程的后期將會推動好幾項重要決策的制定。同時還請務(wù)必注意,您數(shù)據(jù)中心的功率密度評估不僅僅應(yīng)考慮近期的業(yè)務(wù)需求,還應(yīng)充分考慮到未來長期的需求。
資金預(yù)算:對新數(shù)據(jù)中心可用資金和運營資金的實際理解預(yù)算將幫助您企業(yè)適當平衡效率和成本。
數(shù)據(jù)中心的選址:構(gòu)建數(shù)據(jù)中心的地理選址也可能是關(guān)鍵性的設(shè)計決策影響因素。例如,除最熱氣候地帶之外的所有企業(yè)組織都可能希望在其新的數(shù)據(jù)中心設(shè)施中安置空氣側(cè)的節(jié)能器??諝鈧?cè)節(jié)能器使企業(yè)數(shù)據(jù)中心能夠通過用從室外泵入的自然冷空氣替換熱廢氣的方法來減少對耗電的CRAC裝置的依賴。有相關(guān)的研究表明,即使在溫和或溫帶的氣候條件下,空氣側(cè)的節(jié)能器至少也是部分季節(jié)時間段的較為實用的選擇方案。
2、確定選擇行級還是機架級的冷卻方案
在最高級別,大多數(shù)基于密封遏制的冷卻方案分為兩類:行級和機架級。在行級系統(tǒng)中,服務(wù)器機架的整行或通道位于共享機箱內(nèi),共享機柜和CRAC單元或建筑物范圍的冷卻系統(tǒng)支持。在機架級系統(tǒng)中,每臺單獨的機架都有自己的機箱,壓力通風系統(tǒng)和冷卻設(shè)備。雖然任一選項都能夠處理高功率的密度,但機架級設(shè)計往往功能更強大,成本也更高。這通常使他們成為預(yù)測極高功率密度的企業(yè)數(shù)據(jù)中心的更好選擇,只要他們能夠承擔得起更高額的前期投資成本。
3、決定選擇被動還是主動的密封遏制方案
大多數(shù)密封遏制冷卻策略主要依賴于被動的排氣系統(tǒng),其中服務(wù)器硬件內(nèi)置的排氣扇完成大部分的散熱工作,即將供氣吸入并驅(qū)動返回空氣。然而,有時候,一種稱為回流或背壓的現(xiàn)象會抑制氣流,導(dǎo)致服務(wù)器風扇無法保持返回和供氣流的正常流通。在這種情況下,必須使用配備有更強大風扇的主動排氣系統(tǒng)。
當考慮是否使用被動或主動的密封遏制冷卻方案時,請牢記以下幾點:
●通常,大多數(shù)基于行的冷卻解決方案僅采用被動的排氣設(shè)計。
●而機架級冷卻方案中的每臺機柜都很少需要主動的密封。使用機架級冷卻的數(shù)據(jù)中心通常更好地將被動的密封封裝作為其默認選擇,然后在易于回流的特定位置選擇性地安裝主動的排氣產(chǎn)品。
4、確定冷通道和熱通道密封遏制之間的關(guān)系
大多數(shù)行級冷卻方案都具有冷通道或熱通道分離的密封設(shè)計,這兩種方式均采用傳統(tǒng)的熱通道/冷通道空氣分配方法。冷通道密封系統(tǒng)封閉了服務(wù)器機房的冷通道部分,允許熱廢氣在其他任何地方自由流動。熱通道密封系統(tǒng)隔離服務(wù)器機房的熱通道部分,允許冷空氣在其他地方自由移動。這兩種方法都可以提高CRAC裝置的效率和容量,或者通過在冷通道解決方案中專門在服務(wù)器設(shè)備上引導(dǎo)供氣,或者在熱通道解決方案中將廢氣直接引導(dǎo)到冷卻器。
雖然企業(yè)數(shù)據(jù)中心在冷通道和熱通道密封遏制方案之間進行選擇時必須權(quán)衡一些問題,但考慮以下兩大因素則可以幫助簡化某些情況下決策的制定:
●由于冷通道密封允許熱回風的自由流通,服務(wù)器機房的溫度很快就會讓數(shù)據(jù)中心的操作運營員工和訪客感到不舒服。熱通道密封裝置使用冷空氣填充服務(wù)器機房,從而改善了工作和觀察條件。因此,需要安排操作運營管理人員定期出現(xiàn)在服務(wù)器機房中的數(shù)據(jù)中心通常更傾向于采用熱通道密封系統(tǒng)。
●空氣側(cè)節(jié)約通常僅適用于利用熱通道密封遏制的數(shù)據(jù)中心,使其成為那些想要利用空氣側(cè)節(jié)能器所帶來的節(jié)省的數(shù)據(jù)中心的行級密封遏制策略。
一旦企業(yè)數(shù)據(jù)中心確定了將使用哪種機架和冷卻解決方案,并圍繞該解決方案進行服務(wù)器機房的設(shè)計。那么,下一步就是進行計算流體動力學(xué)(CFD)分析。這些研究將會涉及到使用復(fù)雜的軟件來模擬潛在數(shù)據(jù)中心操作環(huán)境空間內(nèi)的熱空氣流和冷空氣流的布局。借助CFD評估可以幫助您在構(gòu)建開始之前消除數(shù)據(jù)中心設(shè)計中的缺陷和低效率,從而使的數(shù)據(jù)中心管理運營人員們可以更輕松,更經(jīng)濟地修復(fù)這些缺陷和低效率。
從內(nèi)到外設(shè)計數(shù)據(jù)中心建筑物有悖于幾個世紀的建筑智慧。但是,通過選擇服務(wù)器機架作為數(shù)據(jù)中心規(guī)劃流程的起點而不是終點,企業(yè)可以通過確保其電源,冷卻和IT基礎(chǔ)架構(gòu)最適合其業(yè)務(wù)需求,進而提高可靠性,并節(jié)省資金。因此,每家企業(yè)都應(yīng)該仔細分析他們當前和未來的業(yè)務(wù)需求,并嚴格評估潛在的冷卻和密封遏制策略,這是他們構(gòu)建新數(shù)據(jù)中心的第一步。采用這種數(shù)據(jù)中心設(shè)計方法,將使得他們得以能夠提高關(guān)鍵任務(wù)計算設(shè)施的效率和成本效益。
(原標題:反思:數(shù)據(jù)中心的設(shè)計)