安全生產永續(xù)運行是數(shù)據(jù)中心核心目標之一。新建數(shù)據(jù)中心項目的運行維護相當復雜,但行業(yè)內對基礎設施運維能力關注并不多,很多項目對基礎設施運維需求并沒有清晰全面的描述。
回顧參加數(shù)據(jù)中心基礎設施建設和運行的經驗教訓,筆者認識到關注數(shù)據(jù)中心運行維護需求,打造基礎設施級可維護能力,不僅大量減少建設過程中的變更、返工,還可減少運行故障隱患,并避免投產后的改造。在此,特初步梳理基礎設施級運維需求,與同行分享和探討。
一基礎設施維護需求
1數(shù)據(jù)中心資源組成
行業(yè)內將數(shù)據(jù)中心運行資源分為兩個級別:I和業(yè)務級、基礎設施級?;A設施級運行資源包括四個要素:建筑、物理基礎設施、基礎設施監(jiān)控/維修工具備件、運維團隊。數(shù)據(jù)中心資源圖如圖1所示。
2什么是基礎設施級運維需求
為提供連續(xù)不中斷服務,數(shù)據(jù)中心基礎設施應既能實現(xiàn)正常運行,又同時支持故障快速發(fā)現(xiàn)定位和修復,保持功能不中斷:
①建筑及物理基礎設施應有監(jiān)視維護條件,支持快速修復故障,同時正常工作;
②監(jiān)控系統(tǒng)功能全面,運行正常,迅速發(fā)現(xiàn)故障和異常;
③維修工具備品資源便利好用,支持維護工作開展;
④基礎設施運維團隊可順利完成現(xiàn)場工作。
3基礎設施級運維需求的實現(xiàn)
通常在四個層次上實現(xiàn):
①站點級可維護:通過完全獨立的多站點,實現(xiàn)數(shù)據(jù)中心級并行維護;常見方式有同城備份中心、異地災備中心、兩地三中心等;
②系統(tǒng)級可維護:通過系統(tǒng)架構上設備和路徑冗余,實現(xiàn)專業(yè)系統(tǒng)的并行維護,如2N系統(tǒng)、雙冷源空調系統(tǒng)、柴油發(fā)電系統(tǒng)等應急電源,TIA-942、GB50174-2017等主要數(shù)據(jù)中心標準對此有具體描述;
③功能級可維護:各專業(yè)系統(tǒng)、設備和機組具備正常工作條件、可運維功能可以正確實現(xiàn);主要通過系統(tǒng)設計、安裝、調試實現(xiàn);
④部件級可運維:設備設施的部件功能可被調整、監(jiān)控、清洗、更換。具體主要散見各專業(yè)系統(tǒng)設計安裝規(guī)范,通過安裝實現(xiàn);
⑤運維團隊支持運維:運維團隊有合格資質,人力充足,能貼近設備現(xiàn)場長期工作,監(jiān)控、維護工具齊全易用。
上述5個方面中,功能級、部件級、基礎設施運維團隊的可維護性要求常常被忽略,出現(xiàn)各種問題。
二基礎設施運維團隊
常見問題是,重視IT技術、業(yè)務運維團隊需要,忽視基礎設施運維團隊的需要,把電工值班室作為運維團隊唯一工作區(qū),功能空間規(guī)劃面積不足,布局不合理,使用不便。
一線基礎設施運維值守團隊需貼近設備現(xiàn)場并長期工作,工作形式多樣,現(xiàn)場工作區(qū)應解決下列功能面積:
①一線監(jiān)控區(qū):關鍵設施監(jiān)控區(qū)(電工值班室)、建筑設施監(jiān)控區(qū)(安防消防值班室);
②現(xiàn)場團隊工作區(qū):簡單會議/培訓、廠商接待/臨時工作;
③一線管理辦公區(qū):生產輔助管理、辦公、茶水區(qū)、維修清掃區(qū);
④圖紙文檔區(qū):各專業(yè)竣工圖紙資料等。此外,應鄰近建筑入口、高低壓供電設備區(qū),建筑邊角區(qū)位置
三運維監(jiān)控設備和維修工具
常見問題是:對各類運維監(jiān)控設備總量及所需用電量、建筑空間估計不足,未設專用設備機房,配電結構不夠安全等。特別是有可能UPS設備容量、配電系統(tǒng)結構變化,會導致建設中的大量修改。
某A級中型數(shù)據(jù)中心基礎設施監(jiān)控系統(tǒng)與運維工具如表1所表示。圖片
建議安排專用機房和倉庫,配備專用UPS系統(tǒng)和獨立配電結構。
四可維護的建筑可能
最常見問題是支持人員和貨物不可達設備維修部位,或缺乏水電等維修支持資源。
1可達性
建筑應支持人員和貨物設備可達安裝位置需求具體見表2。
2清洗維護需求
建筑應提供場地、水、電、排水等維修資源支持,滿足設備部件清洗維護需要,具體見表3。
五物理基礎設施設備運維需求
建設中的常見問題是缺少操作間距和不可維護,如設備部件安裝打不開門,不能清洗、更換、測量等問題。物理基礎設施設備的運維需求見表4。