近兩年,數(shù)據(jù)中心領(lǐng)域似乎不是很太平,火災(zāi)頻現(xiàn)、網(wǎng)絡(luò)時(shí)常被攻擊……頻繁發(fā)生的災(zāi)害使得數(shù)據(jù)中心損失慘重,因此數(shù)據(jù)中心的安全和持久穩(wěn)定運(yùn)行成為了人們極為關(guān)注的問(wèn)題。其實(shí)在互聯(lián)網(wǎng)數(shù)據(jù)中心中,防御就是最好的進(jìn)攻。
雖然平均數(shù)據(jù)中心正在更好地利用其能源,但它更容易遭受中斷
從電力中斷到惡劣天氣再到網(wǎng)絡(luò)犯罪,災(zāi)難可能隨時(shí)發(fā)生。但是,無(wú)論威脅如何,互聯(lián)網(wǎng)數(shù)據(jù)中心都應(yīng)始終保持正常運(yùn)行狀態(tài)。為了確保在緊急情況下的正常運(yùn)行時(shí)間,組織必須有一個(gè)經(jīng)過(guò)深思熟慮的災(zāi)難準(zhǔn)備計(jì)劃,以恢復(fù)生產(chǎn)力,并快速完成。
雖然停電一直是數(shù)據(jù)中心經(jīng)理關(guān)注的問(wèn)題,但這些事件已經(jīng)變得越來(lái)越普遍。最近的Uptime Institute報(bào)告指出混合IT的復(fù)雜性導(dǎo)致許多組織陷入困境。調(diào)查顯示,雖然平均數(shù)據(jù)中心正在更好地利用其能源,但更容易遭遇停電。這些中斷也比去年更具破壞性。
隨著數(shù)據(jù)中心發(fā)現(xiàn)自己更容易受到停機(jī)威脅的影響,因此退一步評(píng)估當(dāng)前的災(zāi)難恢復(fù)程序顯得非常重要。在本文中,我們將探討數(shù)據(jù)中心和IT專(zhuān)業(yè)人員可以做些什么來(lái)推動(dòng)持續(xù)正常運(yùn)行時(shí)間。
呼叫備份
在大多數(shù)數(shù)據(jù)中心環(huán)境中,防止停機(jī)的第一步涉及使用可靠的不間斷電源系統(tǒng)(UPS),通常與備用發(fā)電機(jī)配合使用。這些系統(tǒng)可幫助組織避免數(shù)據(jù)丟失并防止硬件損壞,在發(fā)生電力事件的情況下為網(wǎng)絡(luò)和其他應(yīng)用程序提供可用性。由于這些系統(tǒng)對(duì)業(yè)務(wù)連續(xù)性非常重要,因此在評(píng)估其部署過(guò)程中的特性和功能時(shí)要小心謹(jǐn)慎。
組織使用UPS時(shí)考慮的主要因素之一是彈性。例如,在緊急情況下需要多少電池備份時(shí)間來(lái)關(guān)閉系統(tǒng)或切換到備用發(fā)電機(jī)?冗余是另一個(gè)因素。保護(hù)UPS有助于確保備用電源始終可用;如果單個(gè)模塊出現(xiàn)故障或需要脫機(jī)進(jìn)行維修,冗余UPS系統(tǒng)仍能提供足夠的電力。
在評(píng)估備災(zāi)時(shí),考慮如何將電力輸送到關(guān)鍵設(shè)備也很重要。在某些情況下,數(shù)據(jù)中心經(jīng)理可能只是將負(fù)載直接插入其UPS中。在其他情況下,可以部署配備有多個(gè)輸出的配電單元(PDU)來(lái)分配電力,這在機(jī)架環(huán)境中或者與位于數(shù)據(jù)中心內(nèi)的網(wǎng)絡(luò)設(shè)備特別有用。
正確的監(jiān)控方式
在沒(méi)有電動(dòng)管理軟件的情況下操作UPS就像在沒(méi)有擋風(fēng)玻璃刮水器的雨中駕駛,您可能會(huì)受到保護(hù)免受傾盆大雨的影響,但您無(wú)法清楚地看到東西。UPS解決方案與監(jiān)控和管理軟件相結(jié)合,是數(shù)據(jù)中心經(jīng)理獲得增強(qiáng)可見(jiàn)性的完美補(bǔ)充。
當(dāng)今領(lǐng)先的電源管理軟件解決方案提供的最大好處之一是能夠與通用虛擬化平臺(tái)集成。這些系統(tǒng)提供了在物理或虛擬環(huán)境中監(jiān)控和管理電源設(shè)備所需的工具,允許用戶(hù)遠(yuǎn)程監(jiān)控,管理和控制組織網(wǎng)絡(luò)中的UPS和其他設(shè)備,從而幫助確保正常運(yùn)行時(shí)間和數(shù)據(jù)完整性。UPS可以與管理程序一起使用,在設(shè)施斷電或惡劣天氣事件期間自動(dòng)啟動(dòng)到災(zāi)難恢復(fù)站點(diǎn)的數(shù)據(jù)遷移。從查看事件歷史記錄并提供警報(bào)到提供實(shí)時(shí)狀態(tài)和自動(dòng)解決問(wèn)題,這些工具可用于幫助保持關(guān)鍵設(shè)備的運(yùn)行。
一些解決方案還利用預(yù)測(cè)分析服務(wù)的進(jìn)步,這可以幫助組織將電力監(jiān)控策略從被動(dòng)轉(zhuǎn)變?yōu)橹鲃?dòng)。通過(guò)收集和分析來(lái)自連接的電力基礎(chǔ)設(shè)施設(shè)備的數(shù)據(jù),該解決方案使員工能夠預(yù)測(cè)關(guān)鍵電力組件發(fā)生之前的故障??梢栽诜奖愕臅r(shí)間安排維修或更新,避免緊急服務(wù)電話,并使用方便的維護(hù)窗口。而且,隨著這些系統(tǒng)變得更加先進(jìn),它們將實(shí)現(xiàn)對(duì)組織的整個(gè)電力基礎(chǔ)設(shè)施(包括UPS,PDU和跨多個(gè)供應(yīng)商和平臺(tái)的其他集成電力系統(tǒng))的更加集中,高效的管理。
不要忘記那些檢查
為避免意外故障,車(chē)輛需要定期進(jìn)行預(yù)防性維護(hù),包括常規(guī)換油和調(diào)整。確保UPS和其他電源管理系統(tǒng)的持續(xù)最佳性能大致相同。
最近的一項(xiàng)研究表明,伊頓公司對(duì)經(jīng)歷負(fù)荷損失的UPS的周邊服務(wù)進(jìn)行了記錄。該研究發(fā)現(xiàn),每年進(jìn)行兩次預(yù)防性維護(hù)訪問(wèn)的客戶(hù)發(fā)生負(fù)載丟失事件的可能性是計(jì)劃外停機(jī)時(shí)間的四倍。
定期服務(wù)訪問(wèn)可以幫助檢測(cè)各種疾病,避免它們成為嚴(yán)重且成本高昂的問(wèn)題。經(jīng)過(guò)培訓(xùn)的技術(shù)人員可以在服務(wù)呼叫期間通過(guò)檢查、評(píng)估UPS、測(cè)試電池以及檢查其他關(guān)鍵組件(如風(fēng)扇、電容器和內(nèi)部連接),使數(shù)據(jù)中心經(jīng)理通過(guò)檢查。如果數(shù)據(jù)中心有發(fā)電機(jī),那么定期測(cè)試這些發(fā)電機(jī)也很重要,以確保在發(fā)生長(zhǎng)時(shí)間停電時(shí)能夠獲得持久的應(yīng)急電源。
展望未來(lái)
最終,很多人都乘坐數(shù)據(jù)中心的電氣系統(tǒng)。意外斷電會(huì)對(duì)運(yùn)營(yíng)造成破壞性影響,并且會(huì)耗費(fèi)大量資金。為了優(yōu)化電力系統(tǒng)并避免停機(jī)的危險(xiǎn),組織及其IT團(tuán)隊(duì)需要做好防御準(zhǔn)備。通過(guò)利用集成的電源備份解決方案,再加上日常服務(wù)檢查,數(shù)據(jù)中心將為可能發(fā)生的意外事件做好準(zhǔn)備。
(原標(biāo)題:災(zāi)難來(lái)襲:在互聯(lián)網(wǎng)數(shù)據(jù)中心,防御是最好的進(jìn)攻)