本文來(lái)自IDC圈,作者/未然。
數(shù)據(jù)中心是數(shù)字經(jīng)濟(jì)的重要基礎(chǔ)設(shè)施,隨著人工智能的應(yīng)用以及各行業(yè)數(shù)字化轉(zhuǎn)型的加速,數(shù)據(jù)中心的需求和規(guī)模不斷增長(zhǎng),根據(jù)科智咨詢數(shù)據(jù),2022年中國(guó)整體IDC業(yè)務(wù)市場(chǎng)規(guī)模達(dá)到3975.6億元,同比增長(zhǎng)32%;預(yù)計(jì)到2025年,中國(guó)整體IDC業(yè)務(wù)市場(chǎng)規(guī)模有望突破1萬(wàn)億元。
然而,如此大規(guī)模的數(shù)據(jù)中心的運(yùn)行也面臨著各種挑戰(zhàn)和風(fēng)險(xiǎn),如極端天氣、設(shè)備故障、人為操作失誤等,都可能導(dǎo)致數(shù)據(jù)中心的性能下降、甚至停機(jī)宕機(jī),給客戶和用戶帶來(lái)巨大的損失。因此,數(shù)據(jù)中心的運(yùn)維服務(wù)至關(guān)重要,需要專業(yè)的團(tuán)隊(duì)、科學(xué)的方法、創(chuàng)新的技術(shù)來(lái)保障數(shù)據(jù)中心的安全穩(wěn)定運(yùn)行。
極端天氣是數(shù)據(jù)中心運(yùn)維服務(wù)面臨的最大挑戰(zhàn)之一,如高溫、臺(tái)風(fēng)、暴雨等。這些天氣條件可能對(duì)數(shù)據(jù)中心的建筑物結(jié)構(gòu)、設(shè)備系統(tǒng)、網(wǎng)絡(luò)連接等造成不利影響,甚至引發(fā)災(zāi)難性后果。今年以來(lái)極端天氣多發(fā),例如深圳市9月就遭遇了今年首個(gè)紅色暴雨預(yù)警,部分地區(qū)出現(xiàn)內(nèi)澇積水。
普洛斯數(shù)據(jù)中心運(yùn)維團(tuán)隊(duì)第一時(shí)間啟動(dòng)特大暴雨生產(chǎn)應(yīng)急預(yù)案,組織人員、物資和設(shè)備,建立工作機(jī)制,宣貫應(yīng)急預(yù)案,明確職責(zé)分工,梳理工作清單,并逐一落實(shí)。據(jù)普洛斯數(shù)據(jù)中心運(yùn)維負(fù)責(zé)人介紹,在近20小時(shí)里,普洛斯深圳各數(shù)據(jù)中心開展各IT模塊機(jī)房巡查累計(jì)162次,配電系統(tǒng)累計(jì)81次,柴發(fā)及制冷機(jī)組區(qū)域累計(jì)25次,樓頂及園區(qū)積水巡查及處理累計(jì)22次,并已向相關(guān)客戶通報(bào)運(yùn)營(yíng)情況總計(jì)逾80次。運(yùn)維團(tuán)隊(duì)還保持高度戒備,加強(qiáng)安全巡查和值班值守,為客戶筑牢安全防護(hù)線。
臺(tái)風(fēng)前應(yīng)急巡檢及物資儲(chǔ)備
高溫、臺(tái)風(fēng)、暴雨,普洛斯如何化風(fēng)險(xiǎn)于無(wú)形?
極端天氣和緊急情況下,更能凸顯數(shù)據(jù)中心運(yùn)營(yíng)商的運(yùn)維能力和服務(wù)水平。普洛斯數(shù)據(jù)中心作為一個(gè)跨地域、跨行業(yè)的數(shù)據(jù)中心運(yùn)營(yíng)商,擁有專業(yè)的運(yùn)維團(tuán)隊(duì)和管理體系,為客戶提供高效、安全、可靠的運(yùn)維服務(wù)。
快速預(yù)警響應(yīng)、應(yīng)急演練規(guī)劃
今年7月,4號(hào)臺(tái)風(fēng)“泰利”登陸華南地區(qū),通常臺(tái)風(fēng)會(huì)伴隨著暴雨。普洛斯數(shù)據(jù)中心應(yīng)急保障組根據(jù)氣象預(yù)警,立即啟動(dòng)了《臺(tái)風(fēng)暴雨應(yīng)急預(yù)案》、《市電中斷應(yīng)急預(yù)案》等預(yù)案,用詳細(xì)的保障計(jì)劃指導(dǎo)工作安排,包括人員部署安排、應(yīng)急通報(bào)流程、后勤物資保障、風(fēng)險(xiǎn)應(yīng)對(duì)策略等。
普洛斯數(shù)據(jù)中心運(yùn)維負(fù)責(zé)人介紹道,運(yùn)維人員在極端天氣到來(lái)之前,會(huì)對(duì)建筑物屋頂、外墻等部位的防水、給排水系統(tǒng)、電氣及暖通系統(tǒng)、數(shù)據(jù)中心內(nèi)部物理環(huán)境進(jìn)行全量細(xì)致專項(xiàng)檢查,如發(fā)現(xiàn)隱患會(huì)及時(shí)消除應(yīng)對(duì)。
基于日常開展的防臺(tái)風(fēng)應(yīng)急培訓(xùn)及組織應(yīng)急演練,由專業(yè)工程師講解臺(tái)風(fēng)對(duì)數(shù)據(jù)中心運(yùn)行帶來(lái)的影響及相應(yīng)的應(yīng)急措施,同時(shí)根據(jù)防臺(tái)風(fēng)應(yīng)急預(yù)案,組織應(yīng)急跑位演練,確保應(yīng)急人員在面對(duì)臺(tái)風(fēng)帶來(lái)的影響時(shí)可以及時(shí)采取有效的應(yīng)急措施。
運(yùn)維人員進(jìn)行專項(xiàng)檢查
完善風(fēng)險(xiǎn)管控機(jī)制
普洛斯數(shù)據(jù)中心參照ISO9001質(zhì)量管理體系、ISO22301業(yè)務(wù)連續(xù)性管理體系、Uptime M&O等先進(jìn)的國(guó)際管理標(biāo)準(zhǔn)、行業(yè)內(nèi)應(yīng)對(duì)極端天氣的經(jīng)驗(yàn),并結(jié)合自身內(nèi)部的經(jīng)驗(yàn)登記冊(cè),制定了相對(duì)完善的風(fēng)險(xiǎn)管控機(jī)制。
普洛斯數(shù)據(jù)中心會(huì)對(duì)數(shù)據(jù)中心可能受到的風(fēng)險(xiǎn)影響進(jìn)行分類,由高到低劃分為四個(gè)預(yù)警等級(jí),分別為:紅色、橙色、黃色、藍(lán)色。不同的預(yù)警等級(jí)對(duì)應(yīng)不同的應(yīng)急保障組和應(yīng)急措施,以實(shí)現(xiàn)快速響應(yīng)和有效處置。
在近幾年中,普洛斯數(shù)據(jù)中心運(yùn)維團(tuán)隊(duì)多次參與兩會(huì)、冬奧會(huì)等重大活動(dòng)和各大電商節(jié)的“重保”,并在2022年榮獲某頭部互聯(lián)網(wǎng)客戶的“優(yōu)秀運(yùn)維團(tuán)隊(duì)”獎(jiǎng)項(xiàng)。目前,普洛斯數(shù)據(jù)中心運(yùn)維團(tuán)隊(duì)人數(shù)超過(guò)300人,共管理逾50,000架的機(jī)柜規(guī)模,7x24h為全國(guó)客戶提供運(yùn)維保障服務(wù)。
科學(xué)選址、前瞻規(guī)劃
普洛斯數(shù)據(jù)中心高效應(yīng)對(duì)風(fēng)險(xiǎn)的前提,是其在項(xiàng)目選址階段,除了綜合考慮地理位置、電力供應(yīng)、通訊基礎(chǔ)設(shè)施等因素,嚴(yán)格依據(jù)相應(yīng)的國(guó)家標(biāo)準(zhǔn)外,就特別關(guān)注地理位置的自然災(zāi)害風(fēng)險(xiǎn),遠(yuǎn)離水災(zāi)、地震等自然災(zāi)害隱患區(qū)域。普洛斯數(shù)據(jù)中心各項(xiàng)目均參照百年歷史最高水位線為基準(zhǔn),選址地勢(shì)較高、排水良好,并遠(yuǎn)離行洪泄洪區(qū)域,同時(shí)在電力供應(yīng)上做好多重保障,滿足安全運(yùn)行要求。
另外設(shè)計(jì)及建設(shè)階段,在確保結(jié)構(gòu)安全、機(jī)電系統(tǒng)可靠性等方面滿足要求的同時(shí),普洛斯數(shù)據(jù)中心的屋面、外立面等區(qū)域都按一級(jí)防水設(shè)計(jì)施工,得以更好地應(yīng)對(duì)極端天氣帶來(lái)的挑戰(zhàn),確保數(shù)據(jù)的安全和業(yè)務(wù)的穩(wěn)定性。
普洛斯多措并舉,持續(xù)提升運(yùn)維效率和質(zhì)量
數(shù)據(jù)中心作為承載海量數(shù)據(jù)存儲(chǔ)、分析的重要基礎(chǔ)設(shè)施,其運(yùn)維服務(wù)的質(zhì)量和效率直接影響著客戶的業(yè)務(wù)穩(wěn)定和發(fā)展。普洛斯不僅注重運(yùn)維服務(wù)的安全性和可靠性,也不斷追求運(yùn)維服務(wù)的創(chuàng)新性和智能化。普洛斯數(shù)據(jù)中心運(yùn)維團(tuán)隊(duì)負(fù)責(zé)人總結(jié)了普洛斯提升運(yùn)維效率和質(zhì)量的“三大秘訣”:運(yùn)維團(tuán)隊(duì)通過(guò)科技賦能、流程優(yōu)化、專業(yè)隊(duì)伍,為客戶提供更加專業(yè)化、高效化、智慧化的運(yùn)維服務(wù)。
自研智慧化運(yùn)營(yíng)管理系統(tǒng),提升運(yùn)維效率
普洛斯自研推出GLP DC BASE智慧化運(yùn)營(yíng)管理系統(tǒng),采用了業(yè)內(nèi)領(lǐng)先的中心化管控模式,滿足大規(guī)模數(shù)據(jù)中心精細(xì)化、智能化運(yùn)營(yíng)管理的需求,打造高標(biāo)準(zhǔn)綠色算力基礎(chǔ)設(shè)施。
該系統(tǒng)具有以下特點(diǎn)和優(yōu)勢(shì):
引入AI算法和大數(shù)據(jù)處理能力,通過(guò)進(jìn)行溫度和氣流組織優(yōu)化,消除和降低數(shù)據(jù)中心的局部熱點(diǎn),降低PUE,保障設(shè)備的安全穩(wěn)定運(yùn)行,為綠色數(shù)據(jù)中心做出貢獻(xiàn)。
建立各指標(biāo)測(cè)點(diǎn)的運(yùn)行基線,基于相對(duì)值的變化進(jìn)行提前預(yù)警,相比傳統(tǒng)的監(jiān)控系統(tǒng)依賴于測(cè)點(diǎn)的上下限閾值進(jìn)行絕對(duì)值的告警,動(dòng)態(tài)基線可以更快地識(shí)別出故障風(fēng)險(xiǎn)與異動(dòng),有效地降低數(shù)據(jù)中心的風(fēng)險(xiǎn)。
GLP DC BASE集成多種運(yùn)維工具和設(shè)備,實(shí)現(xiàn)運(yùn)維的一站式管理,提高運(yùn)維工作的自動(dòng)化、智能化、數(shù)字化水平,減少人為干預(yù)和誤操作,提升運(yùn)維工作的準(zhǔn)確性和穩(wěn)定性。
GLP DC BASE智慧化運(yùn)營(yíng)管理系統(tǒng)
優(yōu)化標(biāo)準(zhǔn)化流程,提升運(yùn)維效率和質(zhì)量
普洛斯數(shù)據(jù)中心運(yùn)維團(tuán)隊(duì)在日常工作中,不斷優(yōu)化運(yùn)維流程,提高運(yùn)維效率和質(zhì)量。該團(tuán)隊(duì)采用了以下方法:
制定標(biāo)準(zhǔn)化、規(guī)范化、精細(xì)化的運(yùn)維流程,確保運(yùn)維工作的有序進(jìn)行,避免出現(xiàn)漏項(xiàng)、錯(cuò)項(xiàng)、多項(xiàng)等問(wèn)題。
建立完善的運(yùn)維管理體系,實(shí)現(xiàn)運(yùn)維的可視化、可量化、可追溯、可改進(jìn),提高運(yùn)維的透明度、可控性、可持續(xù)性。
引入先進(jìn)的運(yùn)維工具和設(shè)備,提高運(yùn)維的自動(dòng)化、智能化、數(shù)字化水平,減少人為干預(yù)和誤操作,提升運(yùn)維的準(zhǔn)確性和穩(wěn)定性。
智能運(yùn)維機(jī)器人
打造創(chuàng)新型、專業(yè)化運(yùn)維團(tuán)隊(duì)
一支擁有高度責(zé)任心和專業(yè)技能的人才隊(duì)伍,是保證數(shù)據(jù)中心安全穩(wěn)定運(yùn)行的根本,也是為客戶提供高品質(zhì)服務(wù)的核心競(jìng)爭(zhēng)力。普洛斯數(shù)據(jù)中心通過(guò)建立起基于崗位需求、符合客戶需求的人才培訓(xùn)體系,打造高素質(zhì)、創(chuàng)新型、專業(yè)化、以客戶為導(dǎo)向的運(yùn)維人員團(tuán)隊(duì)。
普洛斯數(shù)據(jù)中心旗下某數(shù)據(jù)中心項(xiàng)目建設(shè)年代較早,柴發(fā)控制系統(tǒng)只有一套PLC,如果停電時(shí)PLC故障,運(yùn)維人員需要手動(dòng)開機(jī),耗時(shí)長(zhǎng),可能導(dǎo)致機(jī)房斷電宕機(jī)。運(yùn)維管理團(tuán)隊(duì)提出了創(chuàng)新性改造方案:安裝一套強(qiáng)制繼電器,一旦PLC故障,值守人員只需手動(dòng)操控繼電器即可啟動(dòng)柴油機(jī)組,操作時(shí)間不超過(guò)2分鐘,有效避免了風(fēng)險(xiǎn)。
該方案施工難度和成本都很低,成本不過(guò)千元級(jí)別,對(duì)數(shù)據(jù)中心整體運(yùn)營(yíng)的影響最小,同時(shí)通過(guò)培訓(xùn)與演練,所有值守人員都能夠順利操作,減少了安全隱患,進(jìn)一步提升了創(chuàng)新人才在運(yùn)維中的作用,同時(shí)為數(shù)據(jù)中心的安全運(yùn)營(yíng)提供了保障。
(圖為改造后的控制器機(jī)柜,值守人員可通過(guò)綠色按鈕快速啟動(dòng)7臺(tái)柴油發(fā)電機(jī))
普洛斯數(shù)據(jù)中心運(yùn)維一體化運(yùn)營(yíng)模式
普洛斯數(shù)據(jù)中心運(yùn)維一體化運(yùn)營(yíng)模式是由運(yùn)維專家組和屬地人員共同構(gòu)建的,結(jié)合了全國(guó)各地?cái)?shù)據(jù)中心的特點(diǎn)和需求。該體系采用一體化管理模式,體現(xiàn)在以下幾個(gè)方面:統(tǒng)一規(guī)劃,整合資源,提高運(yùn)維質(zhì)量和效率;實(shí)時(shí)共享運(yùn)維文檔,實(shí)現(xiàn)運(yùn)維內(nèi)部信息的透明化,避免信息差造成的問(wèn)題;全國(guó)范圍內(nèi)執(zhí)行一套標(biāo)準(zhǔn),減少協(xié)調(diào)溝通的成本,同時(shí)定期檢查執(zhí)行情況,保證運(yùn)維的一致性和可持續(xù)性;協(xié)助屬地運(yùn)維經(jīng)理統(tǒng)一管理,減少管理工作的差異化,提升管理水平和效果。
實(shí)現(xiàn)客戶價(jià)值最大化
數(shù)據(jù)中心運(yùn)維不僅可以為客戶提供高效、安全、可靠的算力基礎(chǔ)設(shè)施,滿足客戶業(yè)務(wù)發(fā)展的需求,還可以為客戶提供綠色、低碳、節(jié)能的算力解決方案,助力客戶實(shí)現(xiàn)可持續(xù)發(fā)展的目標(biāo)。
實(shí)現(xiàn)降本增效
普洛斯數(shù)據(jù)中心通過(guò)優(yōu)化機(jī)房設(shè)計(jì)、提高設(shè)備效率、采用可再生能源等方式,降低了數(shù)據(jù)中心的能耗和碳排放,從而為客戶節(jié)省了運(yùn)營(yíng)成本。同時(shí),普洛斯數(shù)據(jù)中心通過(guò)提供一站式的運(yùn)維服務(wù),減少了客戶的管理復(fù)雜度和人力投入,從而為客戶節(jié)省了人力成本。
提升業(yè)務(wù)穩(wěn)定性
普洛斯數(shù)據(jù)中心通過(guò)建立完善的風(fēng)險(xiǎn)管控機(jī)制、應(yīng)急預(yù)案、備份系統(tǒng)等方式,保障了數(shù)據(jù)中心的安全穩(wěn)定運(yùn)行,從而為客戶提供了高可用性的算力服務(wù)。同時(shí),普洛斯數(shù)據(jù)中心通過(guò)建立高效的運(yùn)維管理體系、監(jiān)控系統(tǒng)、服務(wù)流程等方式,保障了數(shù)據(jù)中心的高效運(yùn)行,從而為客戶提供了高性能的算力服務(wù)。
助力可持續(xù)發(fā)展目標(biāo)
綠色低碳的運(yùn)營(yíng)模式,節(jié)能減碳,降低PUE,為客戶推進(jìn)環(huán)境和社會(huì)可持續(xù)發(fā)展目標(biāo)奠定基礎(chǔ)。普洛斯數(shù)據(jù)中心為行業(yè)樹立一個(gè)智慧化、低碳化運(yùn)營(yíng)管理的標(biāo)桿,推動(dòng)行業(yè)技術(shù)創(chuàng)新和綠色發(fā)展。