眾所周知,數(shù)據(jù)中心發(fā)展對企業(yè)至關(guān)重要。但由于運算與儲存資源需求的不斷增加,導致電價持續(xù)上漲,且不斷增加的數(shù)據(jù)已經(jīng)使得數(shù)據(jù)中心服務(wù)器不堪重負,因此優(yōu)化數(shù)據(jù)中心基礎(chǔ)設(shè)施勢在必行。
隨著越來越多的集成進入數(shù)據(jù)中心,更多系統(tǒng)遷移到數(shù)據(jù)中心,基礎(chǔ)設(shè)施最佳化已直接影響到高等級服務(wù)的交付,正因為如此,數(shù)據(jù)中心管理員都在不斷努力尋找方法來提升性能,提高基礎(chǔ)設(shè)施的密度,并增加多租戶功能。核心數(shù)據(jù)中心技術(shù)必須克服即將出現(xiàn)的所有挑戰(zhàn),而數(shù)據(jù)中心基礎(chǔ)設(shè)施也需要不停迭代。當然,數(shù)據(jù)中心的優(yōu)化絕不止以上幾個步驟,終端用戶和冗余也必須考慮進去,數(shù)據(jù)中心優(yōu)化的關(guān)鍵就是將環(huán)境保持放到第一位,數(shù)據(jù)中心能源消耗的優(yōu)化有幾種方法,有下面的幾種方法可以參考。
從設(shè)備配置上優(yōu)化數(shù)據(jù)中心能耗的方法:
(1)配備樓宇管理系統(tǒng)
安裝樓宇管理系統(tǒng)(BMS),該系統(tǒng)將從冷卻系統(tǒng)中提取大量信息。它自動執(zhí)行大量流程,并處理和記錄大量的最終使用數(shù)據(jù),因此用戶不用一直依賴人工調(diào)整,從而允許用戶更加有效地防止能源浪費。例如,如果早上2點鐘用電量激增,用戶就可以查看周圍的變量,就可以定位到相應的區(qū)域和設(shè)備,并采取相應措施來降低能耗。
(2)采用更加節(jié)能的EC風扇
用戶的另一個選擇是,通風散熱設(shè)備采用電子換向(EC)風扇。 EC風扇是一個節(jié)能減排的雙贏選擇。用戶通過安裝EC風扇,能夠獲得相同的速度和氣流,并顯著節(jié)省電能。但用戶需要通過結(jié)合更加智能的控制策略來加強風扇的控制和管理,根據(jù)溫度或需求來調(diào)節(jié)風扇轉(zhuǎn)速,因為EC風扇是一種指數(shù)型的曲線,而風扇轉(zhuǎn)速越低,就會節(jié)省越多的電能。
(3)冷水機組設(shè)置更高的溫度可能更節(jié)能
最后一個建議是冷水機組的冷凍水設(shè)定值不能設(shè)置太低,如果用戶通過一個固定的設(shè)定值來優(yōu)化數(shù)據(jù)中心能效,這可能會起到反作用。例如,將冷凍水的溫度固定在7℃,而在一年90%的時間里,其設(shè)定溫度過低,另外的10%的時間里,其設(shè)定的溫度則有些過高。
因此,通過監(jiān)控所有信息數(shù)據(jù),并將其捆綁在一起,才可以優(yōu)化設(shè)定值,特別是可以提高設(shè)定點,并使系統(tǒng)盡可能多地采用自然冷,這樣就能夠節(jié)省大量的電能。例如,如果冷卻系統(tǒng)以17℃冷凍水設(shè)定點運行,而不是以傳統(tǒng)的7℃-12℃設(shè)定點運行,那么在一年中可以采用更多的自然冷卻。
數(shù)據(jù)中心最常見五種優(yōu)化方式
(1)改善散熱等數(shù)據(jù)中心環(huán)境變量
數(shù)據(jù)中心環(huán)境是不容易控制的,但通過CFD仿真分析可以發(fā)現(xiàn)熱點并優(yōu)化數(shù)據(jù)中心制冷。在對數(shù)據(jù)中心環(huán)境進行優(yōu)化時,可以檢查以下幾個關(guān)鍵因素,包括機架放置、服務(wù)器密度、地板、通道設(shè)置等。另外,可以使用趨勢分析系統(tǒng),有助于當前和未來潛在的需求。優(yōu)化數(shù)據(jù)中心也意味著降低了運營成本,改善關(guān)鍵基礎(chǔ)設(shè)施可以讓你少花環(huán)境運行所需要花的錢。
(2)軟件定義技術(shù)(SDX)和虛擬化
在幾年前虛擬機監(jiān)控程序也許是比較前沿的技術(shù),但我們現(xiàn)在能夠直接與重要的API集成,減少跳線并大幅度提高工作負載性能,如通過軟件定義網(wǎng)絡(luò)、存儲、安全等新技術(shù)。網(wǎng)絡(luò)虛擬化的新水平允許管理員創(chuàng)建跨越數(shù)據(jù)中心跨越國界的龐大網(wǎng)絡(luò)環(huán)境,也突破了硬件的限制,軟件定義技術(shù)可以在不同程度上提升數(shù)據(jù)中心效率。
(3)優(yōu)化電源使用
優(yōu)化電源使用即對功耗進行優(yōu)化,由此也影響到數(shù)據(jù)中心在選址時考慮到了氣候問題。現(xiàn)在的帶寬情況比較好,即使是在比較偏遠的地區(qū)也是可以進行數(shù)據(jù)中心的部署。如冰島的電網(wǎng)完全采用水電和地熱發(fā)電,確保了完全的“綠色”電源。比起在美國、英國、德國等地的電價,冰島上的電力成本每千瓦時才4.5美分,也是吸引數(shù)據(jù)中心用戶的一個重要原因。除了新建數(shù)據(jù)中心外,還有很多直接的方式可以用來優(yōu)化電源,可以通過檢查現(xiàn)有的環(huán)境,檢查損耗功率,如服務(wù)器閑置時使用了多少功率,根據(jù)動態(tài)的資源需求選用比較好的電源管理系統(tǒng),或者在供電系統(tǒng)規(guī)劃設(shè)計時圍繞整體基礎(chǔ)設(shè)施進行優(yōu)化,使用監(jiān)測并調(diào)整功率。
(4)利用云計算
混合云平臺越來越受客戶的青睞,通過整合一個云模型是提高數(shù)據(jù)中心效率的一個不錯的方式,這也是很多用戶將數(shù)據(jù)中心擴展到云的原因。數(shù)據(jù)中心空間的競爭為大家?guī)砹诵碌漠a(chǎn)品,更優(yōu)惠的價格和更多的可用資源,也意味著創(chuàng)建私有云和公共云環(huán)境之間的智能鏈路也變得更加容易。數(shù)據(jù)中心管理現(xiàn)在可以跨越許多不同的云模型,管理人員并沒有過多擔心物理基礎(chǔ)設(shè)施,他們更關(guān)心的是在上面直接運行的工作量。這種數(shù)據(jù)中心優(yōu)化方法,只需要搭建基本的基礎(chǔ)設(shè)施環(huán)境,通過使用云計算技術(shù)、軟件定義技術(shù)以及分布式基礎(chǔ)架構(gòu)管理,可以更多的服務(wù)則延伸到云中。
(5)創(chuàng)建透明管理
大量的數(shù)據(jù)中心分發(fā)和云計算的使用給現(xiàn)代數(shù)據(jù)中心帶來了新的挑戰(zhàn),在數(shù)據(jù)中心優(yōu)化方法中,明確的管理是很關(guān)鍵的。當前數(shù)據(jù)中心虛擬化以及新數(shù)據(jù)中心操作系統(tǒng)(DCOS),這些管理平臺需要基于DCIM、自動化、云控制,并把數(shù)據(jù)中心服務(wù)提升到一個全新的水平,需要確切的知道物理系統(tǒng)上正在運行著什么,需要對周圍的資源更好的主動分配,讓數(shù)據(jù)中心未來支持更多的用戶,這一切都需要一個好的數(shù)據(jù)中心管理平臺。
創(chuàng)建一個更好的數(shù)據(jù)中心不僅僅是上述的五個方法,數(shù)據(jù)中心優(yōu)化只是確保數(shù)據(jù)中心環(huán)境更好的被使用,并處在最佳的運行狀態(tài)。優(yōu)化您的數(shù)據(jù)中心,如果開發(fā)出一個更具彈性的平臺,在提高您的整體業(yè)務(wù)時將更節(jié)省您的錢。
哪些問題阻礙了優(yōu)化數(shù)據(jù)中心?
許多組織在公有云中無意識地導致過度配置,而這個錯誤的代價太高,企業(yè)對此無法忽視。通過避免五個最常見的錯誤,企業(yè)可以最大限度地提高云計算資源效率,并降低業(yè)務(wù)在這些新環(huán)境中的性能風險。
(1)沒有利用基準來平衡平臺之間的數(shù)據(jù)
調(diào)整云計算資源分配的一個常見方法是在從一個虛擬環(huán)境或云環(huán)境移動到另一個虛擬環(huán)境或云環(huán)境時,將其分配差不多的大小。這意味著將工作負載分配給舊的資源。但并不是每個環(huán)境都運行相同規(guī)格的硬件。如果企業(yè)不使用基準來規(guī)范工作負載數(shù)據(jù),并適應環(huán)境中底層硬件之間的性能差異,那么就無法準確地了解該工作負載將如何在新環(huán)境中執(zhí)行。
較新的環(huán)境通常具有更強大的硬件,從而使企業(yè)更容易獲得回報,因此,工作負載并不需要分配相同數(shù)量的資源。這是在轉(zhuǎn)換服務(wù)器和優(yōu)化公有云使用時的關(guān)鍵所在,因為提供者不斷提供新硬件上運行的更新的云實例類型。為了避免大量占用資金,你需要能夠進行比較,唯一的辦法就是通過數(shù)據(jù)的標準化。
(2)陷入“Bump-up循環(huán)”
“Bump-up循環(huán)”是一個惡性的循環(huán),會導致過度配置和超支。假設(shè)工作負載正在運行,其CPU使用率是100%。采用一個簡單的工具將會看到這一點,認為它的配置不足,并且建議調(diào)高CPU資源(以及云實例的成本)。這里的問題是某些工作負載將使用與它們相同的資源。如果提供更多的CPU,這些應用程序?qū)⒉捎盟匀贿\行在100%,也許只是更短的時間。這個循環(huán)重復執(zhí)行,被困在代價昂貴的Bump-up循環(huán)中。為了避免這種資源吸引循環(huán),您需要準確了解工作負載的工作情況以及其工作原理。再次,我們回到需要了解各個工作負載模式和工作負載的性質(zhì)。當查看內(nèi)存時,這是特別重要的,這是云計算成本的主要驅(qū)動力。
(3)不了解詳細的應用程序工作負載模式
并不是所有的工作負載都是平等的,無論企業(yè)正在采用哪個公有云,最大的問題就是關(guān)于云實例選擇的細節(jié)。理解工作負載的用途和工作負載利用模式的詳細性質(zhì),這一點很重要。
在每個月底完成一次工作的公有云中運行批處理工作負載的經(jīng)濟性與那些全天忙于各種高峰和低谷的應用程序有很大的不同。要正確地選擇正確的資源和云實例,企業(yè)確實需要了解一天之內(nèi)工作負載模式以及該模式如何在業(yè)務(wù)周期中發(fā)生變化。
不幸的是,許多組織采取簡單的方法分析其工作量,而只查看每天的平均數(shù)或百分位數(shù)并不是徹底的方法,不能深入地了解具體的模式。結(jié)果是對資源需求的不準確的描述,這可能導致過度配置和性能問題。這些簡單的方法很少做到正確。當企業(yè)在尋找?guī)椭溥x擇正確的云實例的解決方案時,請選擇真正了解工作負載的詳細使用模式的東西。
(4)著眼于調(diào)整規(guī)模,并忽視現(xiàn)代化的工作量
將工作負載實現(xiàn)現(xiàn)代化,在更新的性能更強大的硬件上運行版本更新的云實例產(chǎn)品,可以成為降低成本的有效手段。事實上,人們已經(jīng)發(fā)現(xiàn),適當規(guī)模的實例可以在公有云計算中節(jié)省20%的成本,而現(xiàn)代化和適當?shù)恼{(diào)整則平均節(jié)省了41%的成本。
隨著公有云供應商提供的服務(wù)和實例類型多的令人眼花繚亂,企業(yè)很難選擇適合的實例,更不用說跟上新的選擇。盡管潛在的節(jié)省成本值得努力。要做到這一點,需要詳細了解工作負載,云實例目錄,成本以及規(guī)范化數(shù)據(jù)的能力,以解決環(huán)境之間的性能差異。這不是人工可以完成的,需要進行徹底的分析才能找到正確的組合來節(jié)省資金并確保業(yè)績。這也是應該定期完成的事情,甚至幾個月前部署的應用程序可能就是很好的候選者。
(5)無法管理空閑的僵尸實例
大多數(shù)組織沒有一個有效的過程來識別空閑的“僵尸”實例,導致他們隨著時間的推移而堆積。它們通常是由于倉促地為短期部署實例而忘記關(guān)閉實例的結(jié)果。僵尸實例只是浪費預算。為了避免這種不必要的成本,組織必須使用足夠的歷史來查看整個業(yè)務(wù)周期(數(shù)周或數(shù)月)的工作量模式。識別和消除這種實例可以節(jié)省成本,但它需要比大多數(shù)工具提供更長期的工作量可見性。
大多數(shù)組織沒有意識到他們在公有云中花費的費用是多少。節(jié)省這筆資金需要更加注意了解企業(yè)工作負載如何利用資源以及他們真正需要在不影響性能的前提下盡可能高效地工作。要明白細節(jié)是避免云預算超支的唯一途徑。
(原標題:如何優(yōu)化數(shù)據(jù)中心能耗?哪些問題阻礙優(yōu)化數(shù)據(jù)中心?)