DCIM(數(shù)據(jù)中心基礎(chǔ)設(shè)施監(jiān)控管理)系統(tǒng)是對數(shù)據(jù)中心資產(chǎn)設(shè)備,資源設(shè)備運行狀況的進行全面監(jiān)控和管理,包含基礎(chǔ)設(shè)施監(jiān)控和基礎(chǔ)設(shè)施管理兩大功能模塊。通過采集設(shè)備、傳輸設(shè)備和管理設(shè)備等,DCIM提供一個全面的管理平臺,對數(shù)據(jù)中心資產(chǎn)設(shè)備和場地基礎(chǔ)設(shè)施進行統(tǒng)一監(jiān)控、科學管理、全方位展示。
數(shù)據(jù)中心基礎(chǔ)設(shè)施管理運行維護流程。設(shè)備是數(shù)據(jù)中心基礎(chǔ)設(shè)施的組成子集,對設(shè)備的維護是保障基礎(chǔ)設(shè)施穩(wěn)定運行的重要措施。設(shè)備維護的工作主要包括維護流程的制定、預防性維護工作的執(zhí)行、維護檔案的管理和故障的處理幾方面內(nèi)容。
運行維護流程是設(shè)備維護工作的指導和依據(jù),數(shù)據(jù)中心管理者首先要保證各維護流程的正確性、完整性和全面性,同時通過反復的培訓和演練使運維人員對流程充分熟悉和理解,并在實際工作中嚴格執(zhí)行。
運行維護流程通常包括三個主要類別:標準操作流程(SOP)、維護操作流程(MOP)、應(yīng)急操作流程(EOP)。
1、標準操作流程通俗地說就是設(shè)備的開機、關(guān)機操作步驟,對于數(shù)據(jù)中心的任何一個型號的設(shè)備都必須有SOP。這里值得一提的是,同類型的設(shè)備可能有不同的型號,比如空調(diào)可能包括制冷量60KW和80KW兩種,對于不同型號的設(shè)備開機、關(guān)機的操作步驟可能不同,所以SOP應(yīng)該按照型號的不同分別編寫。
2、維護操作流程包括了設(shè)備的維護、保養(yǎng)、預防性巡檢等流程內(nèi)容,一般情況下MOP會包含SOP的條目,因為不論是維護、保養(yǎng)還是巡檢,常常需要進行開機、關(guān)機的操作。對于主設(shè)備,每個型號都要有SOP和MOP;輔助設(shè)備(閥門等)可以分類定義,每類有單獨的SOP和MOP。
3、每個數(shù)據(jù)中心都至少應(yīng)該有7~10個應(yīng)急操作流程(EOP),主要呈現(xiàn)在斷電、空調(diào)失效、火災(zāi)、防汛、安防、信息安全等方面。當數(shù)據(jù)中心有異常情況發(fā)生時,往往是多系統(tǒng)、多專業(yè)聯(lián)動反應(yīng),所以在平時的培訓和演練中,需要多個應(yīng)急預案交叉啟動,為應(yīng)對實際中可能出現(xiàn)的場景做充足準備。