危機四伏,數(shù)據(jù)中心最好的進攻便是防守

今日頭條
科技圈Plus
從斷電到惡劣天氣再到網(wǎng)絡犯罪,災難事故隨時都可能發(fā)生。然而,不管危機有多大,數(shù)據(jù)中心都必須一直保持高速運轉(zhuǎn),為客戶提供穩(wěn)定安全的數(shù)據(jù)中心服務。為確保在緊急情況下的正常運行時間,對于企業(yè)快速恢復生產(chǎn)...

從斷電到惡劣天氣再到網(wǎng)絡犯罪,災難事故隨時都可能發(fā)生。然而,不管危機有多大,數(shù)據(jù)中心都必須一直保持高速運轉(zhuǎn),為客戶提供穩(wěn)定安全的數(shù)據(jù)中心服務。為確保在緊急情況下的正常運行時間,對于企業(yè)快速恢復生產(chǎn)力,一個深思熟慮的備災計劃是十分重要的。

雖然停電一直是數(shù)據(jù)中心一直關注的核心問題,但這個問題已經(jīng)變得越來越普遍。根據(jù)最近 Uptime Institute的一份報告稱,這一趨勢歸因于混合IT的復雜性,這種復雜性正導致許多企業(yè)陷入困境。該調(diào)查還顯示,雖然一個普通的數(shù)據(jù)中心正在很好地利用其能源,但它更有可能遭遇斷電。與去年相比,斷電造成的后果也更大。

由于數(shù)據(jù)中心發(fā)現(xiàn)自己更容易受到停機威脅,因此有必要后退一步,評估當前的災難恢復程序。

要求備份

在大多數(shù)的數(shù)據(jù)中心環(huán)境里,防止停機的第一步是使用可靠的不間斷電源系統(tǒng)(UPS),這通常與備用發(fā)電機一起使用。這些系統(tǒng)能夠有效幫助企業(yè)避免數(shù)據(jù)丟失和硬件損壞,在斷電事件發(fā)生時維持網(wǎng)絡和其他應用程序正常運行。由于這些系統(tǒng)對業(yè)務的連續(xù)性是非常重要的,因此在評估部署所帶來的特性和功能時一定要小心。

組織使用UPSs時要考慮的主要因素之一是“彈性”。例如,在緊急情況下,需要多少電池備用時間來關閉系統(tǒng)或切換到備用發(fā)電機?冗余是另一個因素。維護UPSs有助于確保備份電源始終可用,如果單個模塊出現(xiàn)故障或需要離線服務的,冗余UPS系統(tǒng)仍能提供足夠的電力。

在評估備災準備時,考慮如何將電力輸送到關鍵設備也很重要。在某些情況下,數(shù)據(jù)中心可以直接將負載插入UPS。在其他情況下,可以部署具有多個輸出的功率分配單元(PDU)來分配電力,這在機架環(huán)境或位于數(shù)據(jù)中心內(nèi)的網(wǎng)絡設備中特別有用。

正確的監(jiān)控方式

操作一個沒有電源管理軟件的UPS就像是開車沒有儀表盤。UPS解決方案與監(jiān)控和管理軟件相結(jié)合,是數(shù)據(jù)中心管理人員獲得加強可見性的完美補充。當今領先的電源管理軟件解決方案所提供的最大好處之一是能夠與通用虛擬化平臺集成。這些系統(tǒng)提供了在物理或虛擬環(huán)境中監(jiān)視和管理電力設備所需的工具,允許用戶遠程監(jiān)視、管理和控制組織網(wǎng)絡上的UPSs和其他設備,從而幫助確保正常運行時間和數(shù)據(jù)完整性。UPS可以與系統(tǒng)管理程序一起工作,在設備斷電或惡劣天氣事件期間自動啟動數(shù)據(jù)遷移到災難恢復站點。從回顧事件歷史和提供警報到提供實時狀態(tài)和自動化問題解決,這些工具可以用來幫助關鍵設備運行。

一些解決方案還利用了預測性分析服務的進步,這可以幫助組織將電力監(jiān)控策略從被動轉(zhuǎn)向主動。通過從連接的電力基礎設施設備收集和分析數(shù)據(jù),這些解決方案允許工作人員在關鍵電力組件發(fā)生故障之前預測它們。維修或更新可以安排在方便的時間,避免緊急服務呼叫,并利用方便的維修窗口。而且,隨著這些系統(tǒng)越來越先進,它們將使組織的整個電力基礎設施(包括UPSs、PDU和跨多個供應商和平臺的其他集成電力系統(tǒng))得到更集中、更高效的管理。

檢查

一般來說,為了避免意外故障,我們的車輛需要定期進行預防性維護,包括定期換油和調(diào)優(yōu)。這與確保UPSs和其他電源管理系統(tǒng)的持續(xù)最佳性能是一樣的

最近的一項研究發(fā)現(xiàn),每年進行兩次預防性維護的客戶,其負載損失事件導致意外停機的可能性要低四倍。

常規(guī)服務檢查可以幫助我們在各種疾病變得嚴重和昂貴之前發(fā)現(xiàn)它們。一名受過培訓的技術(shù)人員可以帶領數(shù)據(jù)中心在電話中通過檢查、評估UPSs、測試電池以及檢查其他關鍵部件(如風扇、電容器和內(nèi)部連接)。如果數(shù)據(jù)中心有發(fā)電機,定期對其進行測試也很重要,以確保在出現(xiàn)長期停機時,能持續(xù)地提供應急電源。

展望未來

在一天結(jié)束的時候,數(shù)據(jù)中心的電子系統(tǒng)會有很多問題。計劃外的停電會對運營造成毀滅性的影響,并耗費大量的資金。為優(yōu)化電力系統(tǒng)并避免停機的危險,企業(yè)和他們的IT團隊都需要做好充分且良好的防御準備。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論