當(dāng)災(zāi)難來襲時(shí),許多關(guān)鍵設(shè)施可能會(huì)面臨災(zāi)難性的后果,但是數(shù)據(jù)中心尤其脆弱。無論是企業(yè)內(nèi)部部署數(shù)據(jù)中心、托管數(shù)據(jù)中心還是邊緣數(shù)據(jù)中心,其所擁有的大量關(guān)鍵業(yè)務(wù)信息都無法托管到其他設(shè)施。因此在斷電的情況下,其他設(shè)施都會(huì)面臨重大的業(yè)務(wù)后果。
為數(shù)據(jù)中心供電的電氣設(shè)備也很獨(dú)特。因此,雖然災(zāi)難造成的數(shù)據(jù)中心停機(jī)后果非常嚴(yán)重,但電氣安全問題帶來的潛在風(fēng)險(xiǎn)也是如此。
以下通過電力中斷和電氣安全兩種視角來研究災(zāi)難對(duì)數(shù)據(jù)中心的影響:
與災(zāi)難有關(guān)的停機(jī)成本
隨著美國近期發(fā)生一些重大災(zāi)難(從墨西哥灣的颶風(fēng)到加州的森林火災(zāi)),現(xiàn)在是數(shù)據(jù)中心運(yùn)營商了解此類災(zāi)難在導(dǎo)致中斷時(shí)如何影響其運(yùn)營的好時(shí)機(jī)。
Uptime Institute公司在2018年的評(píng)估調(diào)查報(bào)告中提供了有關(guān)電源管理趨勢(shì)和當(dāng)前挑戰(zhàn)的見解,重點(diǎn)是數(shù)據(jù)中心。該調(diào)查報(bào)告發(fā)現(xiàn)了停電數(shù)量上升的令人擔(dān)憂的趨勢(shì),基礎(chǔ)設(shè)施停電和“嚴(yán)重服務(wù)質(zhì)量下降”事件的數(shù)量比上一年增加了6%,31%的受訪者表示在自己的數(shù)據(jù)中心經(jīng)歷了電力中斷事件。
數(shù)據(jù)中心的電力中斷可能會(huì)給企業(yè)帶來巨大的收入損失。最近一項(xiàng)IT智能咨詢(ITIC)的研究發(fā)現(xiàn),在47個(gè)垂直市場中,81%的企業(yè)估計(jì),他們的平均每小時(shí)停機(jī)成本(不包括災(zāi)難性停機(jī))超過30萬美元。33%以上的企業(yè)表示,每小時(shí)的停機(jī)時(shí)間會(huì)使他們損失100萬美元或更多。
雖然每個(gè)行業(yè)都面臨著自己的一系列挑戰(zhàn),但數(shù)據(jù)中心的特殊之處在于,它們對(duì)100%正常運(yùn)行時(shí)間的期望與訪問關(guān)鍵業(yè)務(wù)數(shù)據(jù)的需求直接相關(guān),任何訪問的丟失都可能發(fā)生超出其他業(yè)務(wù)范圍的后果。重大電力中斷的威脅突出表明,需要電力備份解決方案來保護(hù)和最大限度地減少停機(jī)的影響。
備用電源系統(tǒng)的關(guān)鍵組件
為了防止這些高成本并保持系統(tǒng)正常運(yùn)行,數(shù)據(jù)中心需要一個(gè)集成的電源系統(tǒng)來進(jìn)行電源管理和災(zāi)難預(yù)防。首先從一個(gè)或多個(gè)不間斷電源系統(tǒng)(UPS)(通常與備用發(fā)電機(jī)和配電單元結(jié)合部署)開始,以確保電力中斷期間提供可靠電源,保障關(guān)鍵IT資產(chǎn)繼續(xù)運(yùn)行。這些系統(tǒng)通過在電源事件期間提供網(wǎng)絡(luò)和其他應(yīng)用程序的可用性來幫助企業(yè)避免數(shù)據(jù)丟失和硬件損壞。
隨著向混合云環(huán)境發(fā)展的趨勢(shì)不斷發(fā)展,監(jiān)視軟件現(xiàn)在已成為電源管理系統(tǒng)的重要組成部分。此外,一些企業(yè)已經(jīng)實(shí)施了虛擬化基礎(chǔ)設(shè)施,可以將其與電源監(jiān)控軟件結(jié)合使用,以在發(fā)生災(zāi)難或其他事件的可能性較小的情況下簡化并最大化其管理電源的能力。通過使電源管理解決方案與常見的虛擬化管理平臺(tái)(如來自VMware、Cisco、NetApp、Dell EMC、HPE、Nutanix和Scale Computing的虛擬化管理平臺(tái))結(jié)合起來,企業(yè)及其IT團(tuán)隊(duì)可以擴(kuò)展其服務(wù)的可用性。此功能允許團(tuán)隊(duì)從單個(gè)控制臺(tái)遠(yuǎn)程管理物理和虛擬服務(wù)器以及電源管理設(shè)備。
歸根結(jié)底,數(shù)據(jù)中心運(yùn)營商需要知道其基礎(chǔ)設(shè)施中采用了哪些電源管理技術(shù),并了解這些解決方案是否能夠在災(zāi)難發(fā)生時(shí)滿足其可靠性需求。采用正確的電源系統(tǒng)可能意味著業(yè)務(wù)連續(xù)性或數(shù)千美元的收入損失之間的差異。
安全勢(shì)在必行
在數(shù)據(jù)中心為災(zāi)難做好準(zhǔn)備時(shí),電氣安全可能會(huì)被忽略。這其中有幾個(gè)原因。企業(yè)通常依賴專業(yè)人員安裝電氣設(shè)備,甚至依賴電氣設(shè)備制造商自己來確保其基礎(chǔ)設(shè)施的安全。但現(xiàn)實(shí)是,每個(gè)組織都有自己的角色,尤其是數(shù)據(jù)中心運(yùn)營商。
數(shù)據(jù)中心的電氣系統(tǒng)通常是為功能性、美觀性、易維護(hù)性、高效性和安全性而設(shè)計(jì)的,但由于存在許多相互競爭的優(yōu)先級(jí)(更不用說數(shù)據(jù)中心運(yùn)營商面臨的許多其他職責(zé)),安全性并不總是能得到它所需要的關(guān)注。
第一步也是最重要的一步是花時(shí)間了解給定位置可能面臨的獨(dú)特環(huán)境和挑戰(zhàn)。這可能包括審核當(dāng)前的配電資產(chǎn),并審查關(guān)鍵負(fù)載分析、發(fā)電機(jī)連接性、可用性和燃料來源,從而確定發(fā)生風(fēng)險(xiǎn)的位置以及在發(fā)生災(zāi)難時(shí)如何解決這些風(fēng)險(xiǎn)。此外,必須具有設(shè)施配電系統(tǒng)的最新單線圖。為了確保安全是重中之重,考慮采用現(xiàn)代化或更新在災(zāi)難期間可能變得不安全的特定設(shè)備,并利用這些更改的機(jī)會(huì)的方法將很有幫助。
在此之后,數(shù)據(jù)中心可以在其設(shè)施內(nèi)實(shí)施緊急情況連續(xù)性計(jì)劃,以識(shí)別合格人員。然后,他們可以利用數(shù)據(jù),通過隔離危險(xiǎn)的設(shè)備或?qū)⑽kU(xiǎn)的設(shè)備放在限制未經(jīng)授權(quán)的員工訪問的安全位置,使員工能夠快速安全地減少危害。企業(yè)團(tuán)隊(duì)必須確保將連續(xù)性計(jì)劃傳達(dá)給適當(dāng)?shù)臄?shù)據(jù)中心員工和服務(wù)人員,并進(jìn)行災(zāi)難演習(xí),以便員工可以有效地做出響應(yīng)。
與備用電源計(jì)劃一樣,電氣安全也需要對(duì)設(shè)施的運(yùn)營采取整體方法。設(shè)施設(shè)計(jì)的結(jié)構(gòu)、管道、HVAC和其他方面在安全中起著至關(guān)重要的作用,如果在整體災(zāi)難規(guī)劃工作中未將其考慮在內(nèi),則會(huì)造成危害。
結(jié)論
災(zāi)難隨時(shí)可能發(fā)生,并且會(huì)對(duì)企業(yè)業(yè)務(wù)運(yùn)營造成許多不利影響。數(shù)據(jù)中心運(yùn)營商需要一個(gè)全面的災(zāi)難備災(zāi)策略,其中既要包含用于預(yù)防中斷的技術(shù),又要包含負(fù)責(zé)確保電氣安全的程序、協(xié)議和人員。有了正確的方法和計(jì)劃,數(shù)據(jù)中心運(yùn)營商可以讓災(zāi)難對(duì)人員安全和業(yè)務(wù)整體健康的影響降至最低。