維護(hù)數(shù)據(jù)中心運(yùn)作的最佳方式是什么?

中國(guó)IDC圈
佚名
現(xiàn)今,稍有資本的互聯(lián)網(wǎng)企業(yè)都在建設(shè)數(shù)據(jù)中心,數(shù)據(jù)中心建設(shè)不易,維護(hù)更不容易。有關(guān)專(zhuān)家稱(chēng),持續(xù)在線狀態(tài)監(jiān)測(cè)是管理數(shù)據(jù)中心維護(hù)的最佳方式,但讓操作人員持續(xù)工作是不現(xiàn)實(shí)的,因此作為領(lǐng)導(dǎo)要做好工作人員之間的調(diào)...

現(xiàn)今,稍有資本的互聯(lián)網(wǎng)企業(yè)都在建設(shè)數(shù)據(jù)中心,數(shù)據(jù)中心建設(shè)不易,維護(hù)更不容易。有關(guān)專(zhuān)家稱(chēng),持續(xù)在線狀態(tài)監(jiān)測(cè)是管理數(shù)據(jù)中心維護(hù)的最佳方式,但讓操作人員持續(xù)工作是不現(xiàn)實(shí)的,因此作為領(lǐng)導(dǎo)要做好工作人員之間的調(diào)配。

對(duì)于過(guò)濾器的監(jiān)測(cè)來(lái)說(shuō),只需安裝差壓傳感器與樓宇管理系統(tǒng)(BMS)監(jiān)控器,并指定適當(dāng)?shù)木瘓?bào)閾值即可。對(duì)于振動(dòng)的監(jiān)測(cè),可以安裝永久性加速度計(jì)并將其復(fù)用到專(zhuān)用服務(wù)器上,以便進(jìn)行振動(dòng)分析、歸檔和趨勢(shì)分析,并提供遠(yuǎn)程報(bào)警功能。顯然,只有在最重要的設(shè)備和流程中,才能在選擇和審慎的基礎(chǔ)上使用連續(xù)的在線振動(dòng)分析。明顯的折衷辦法是確定執(zhí)行在線狀態(tài)監(jiān)測(cè)的最佳頻率。

操作人員是數(shù)據(jù)中心可靠性的重要因素

盡管數(shù)據(jù)中心行業(yè)在數(shù)據(jù)中心設(shè)施和物理基礎(chǔ)設(shè)施方面取得了成功,但與相關(guān)的操作人員和設(shè)施管理方面的關(guān)系并不理想。人們普遍認(rèn)為,絕大多數(shù)關(guān)鍵設(shè)施問(wèn)題現(xiàn)在可以歸因于人為錯(cuò)誤(有調(diào)查表明工作人員導(dǎo)致的問(wèn)題高達(dá)70%至80%)。而數(shù)據(jù)中心基礎(chǔ)設(shè)施復(fù)雜性的增加與操作人員人為錯(cuò)誤的增加之間存在直接關(guān)系。

而這樣的問(wèn)題不再是可用性問(wèn)題之一。大多數(shù)數(shù)據(jù)中心設(shè)施希望員工連續(xù)工作(100%可用性)。問(wèn)題在于工作人員的可靠性(以及在某些情況下的有效性)并不像人們想像的那么高,工作人員在工作中會(huì)疲倦、分心、生病、困惑等,這些都會(huì)導(dǎo)致不可靠的表現(xiàn)。

其答案是讓工作過(guò)程產(chǎn)生可靠的結(jié)果。詳細(xì)的、逐步的過(guò)程是一個(gè)很好的例子,但除非操作人員每次都遵循正確的方法,否則無(wú)法保證可靠的結(jié)果。另一方面,如果操作人員在完成每個(gè)步驟時(shí)需要首先列出清單,并且由單獨(dú)的參與者見(jiàn)證其操作行為,則過(guò)程的可靠性大大提高。如果程序還描述了與每個(gè)步驟相關(guān)的預(yù)期結(jié)果,例如啟動(dòng)水泵時(shí)的預(yù)期壓力和流量,或關(guān)閉斷路器時(shí)的預(yù)期指示燈和報(bào)警,則可以確保過(guò)程的有效性。盲目地遵循程序而不注意結(jié)果的操作人員將不可避免地產(chǎn)生意想不到的結(jié)果。

基于績(jī)效的培訓(xùn)也是一個(gè)過(guò)程。培訓(xùn)一臺(tái)新電腦或控制器簡(jiǎn)單而快捷,可以下載編程代碼,連接到網(wǎng)絡(luò),并且新配備的計(jì)算機(jī)的能力與其替換的計(jì)算機(jī)或控制器相當(dāng)。然而培訓(xùn)新員工卻并不那么容易。因?yàn)閱T工每個(gè)人都是獨(dú)一無(wú)二的。

參加一系列教授基本技能和知識(shí)水平的課程的操作人員將比未經(jīng)培訓(xùn)的員工更可靠。培訓(xùn)需要通過(guò)測(cè)驗(yàn)、考試和資格考試來(lái)驗(yàn)證,這些考試要求學(xué)生表現(xiàn)出理解力和表現(xiàn)能力。最好的做法是培訓(xùn)員工之后進(jìn)行測(cè)試和認(rèn)證,然后讓他們?cè)跓o(wú)人監(jiān)督下履行職責(zé)和責(zé)任。

保持機(jī)器運(yùn)行對(duì)數(shù)據(jù)中心可靠性非常重要,但運(yùn)行機(jī)器的人員也很重要。因此,企業(yè)對(duì)工作人員需要做好人事、計(jì)劃和準(zhǔn)備,并通過(guò)以下措施提高工作人員的素質(zhì)和水平。

通過(guò)針對(duì)特定場(chǎng)合的培訓(xùn)可以提高員工績(jī)效

積極的規(guī)劃和準(zhǔn)備比隨機(jī)應(yīng)用的反應(yīng)更可靠。

高度積極的員工表現(xiàn)要好于按部就班工作的員工。

安全培訓(xùn)和安全審計(jì)減少事故和傷害(這也可能導(dǎo)致停機(jī)和設(shè)備損壞)。

過(guò)度溝通比溝通不足要好,但準(zhǔn)確的溝通無(wú)論如何都是至關(guān)重要的。

隨機(jī)抽查,突擊檢查和非計(jì)劃審計(jì)揭示了超過(guò)計(jì)劃的檢查和審計(jì)。

(原標(biāo)題:持續(xù)在線狀態(tài)監(jiān)測(cè)是管理數(shù)據(jù)中心維護(hù)的最佳方式)

THEEND