遠(yuǎn)程管理數(shù)據(jù)中心的獨(dú)特之處

產(chǎn)業(yè)氣象站
遠(yuǎn)程管理為數(shù)據(jù)中心托管供應(yīng)商及其客戶帶來了劃分問題。例如,客戶希望了解諸如制冷和電力之類的數(shù)據(jù)中心基礎(chǔ)設(shè)施情況,但是這些都在數(shù)據(jù)中心運(yùn)營商的控制之下。同時(shí),數(shù)據(jù)中心運(yùn)營商還會(huì)劃清界線,讓客戶自行管理自己的IT操作系統(tǒng)和工作負(fù)載。

多年來,遠(yuǎn)程管理一直是運(yùn)營和管理數(shù)據(jù)中心的一個(gè)很好的理念,而如今已經(jīng)成為一種必需的管理措施。

數(shù)據(jù)中心設(shè)施通常位于位置偏僻的地方,因此遠(yuǎn)程管理而不是派遣工程師到現(xiàn)場(chǎng)處理將會(huì)更快捷、更具成本效益。

在極端情況下,數(shù)據(jù)中心運(yùn)營商可以運(yùn)營無人管理的數(shù)據(jù)中心,也就是所謂的“熄燈”設(shè)施。但這種承諾往往并沒有成為現(xiàn)實(shí)。一方面,提供遠(yuǎn)程控制的工具往往很難集成。另一方面,托管提供商和他們的客戶并不信任遠(yuǎn)程控制系統(tǒng),而是派遣員工直接管理和操作服務(wù)器和其他設(shè)備。

到了2020年,一切都將有所改變,而這是必然的。全球大部分國家和地區(qū)如今都受到了持續(xù)蔓延的疫情影響,并發(fā)布限制人們出行的禁令。即使數(shù)據(jù)中心工作人員被歸類為“基本服務(wù)”人員并且不受出行限制,但其進(jìn)出措施和次數(shù)也受到一些限制。數(shù)據(jù)中心標(biāo)準(zhǔn)組織和認(rèn)證機(jī)構(gòu)Uptime Institute的數(shù)據(jù)中心可靠性專家指出,雖然數(shù)字基礎(chǔ)設(shè)施對(duì)全球經(jīng)濟(jì)發(fā)展至關(guān)重要,但也需要盡量減少對(duì)數(shù)據(jù)中心設(shè)施的訪問。

Uptime Institute高級(jí)副總裁Fred Dickerman表示,必須減少租戶進(jìn)出托管數(shù)據(jù)中心設(shè)施的次數(shù),并且數(shù)據(jù)中心運(yùn)營商的員工訪問權(quán)限也應(yīng)受到限制,并且必須非常謹(jǐn)慎地進(jìn)行防護(hù)處理,而當(dāng)員工或租戶進(jìn)入數(shù)據(jù)中心時(shí),應(yīng)該在遠(yuǎn)處或通過電話聯(lián)系進(jìn)行工作交接。

今年3月,托管數(shù)據(jù)中心行業(yè)巨頭Equinix公司對(duì)政府發(fā)布的出行禁令做出了回應(yīng),并嚴(yán)格限制客戶進(jìn)入其托管數(shù)據(jù)中心的訪問,規(guī)定訪客、客戶、承包商以及Equinix公司非關(guān)鍵業(yè)務(wù)員工禁止進(jìn)入位于其法國、德國、意大利和西班牙的Equinix IBX數(shù)據(jù)中心,并對(duì)該公司在其他國家和地區(qū)數(shù)據(jù)中心的訪問實(shí)行預(yù)約制。

這一舉措對(duì)遠(yuǎn)程控制技術(shù)提出了很高的要求,遠(yuǎn)程管理技術(shù)在以往可能很少使用,或者沒有完全實(shí)現(xiàn)。用于數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)或服務(wù)管理(SM)的產(chǎn)品本身就是一個(gè)完整的解決方案,但是大多數(shù)需要小心謹(jǐn)慎實(shí)施才能完全交付。

當(dāng)疫情危機(jī)來襲時(shí),那些擁有功能齊全的遠(yuǎn)程控制系統(tǒng)以及使用現(xiàn)有工具的企業(yè)在應(yīng)對(duì)危機(jī)方面占據(jù)先機(jī)。

當(dāng)世界有所改變

數(shù)據(jù)中心運(yùn)營商QTS公司首席技術(shù)官Brent Bensten表示,該公司為各種規(guī)模的用戶提供數(shù)據(jù)中心托管服務(wù),而該公司擁有一個(gè)基于Carpathia Hosting公司(2015年收購)開發(fā)的服務(wù)交付平臺(tái)(SDP)。

他表示,此次疫情導(dǎo)致一些客戶的行為和措施發(fā)生了重大變化。在發(fā)布出行禁令的前三周,該公司服務(wù)交付平臺(tái)(SDP)的登錄數(shù)量增加了30%,并且頂級(jí)用戶在該系統(tǒng)上花費(fèi)的時(shí)間幾乎增加了一倍,從36分鐘增加到62分鐘。

而在此期間,該公司的客戶仍然可以進(jìn)入數(shù)據(jù)中心,但是下降的訪問量與服務(wù)交付平臺(tái)(SDP)上增加的流量相一致。Bensten說:“如果有必要的話,我們希望客戶進(jìn)入數(shù)據(jù)中心進(jìn)行操作。但是在疫情中可以使用這些工具進(jìn)行管理和控制,因此他們可以遠(yuǎn)程完成以前在數(shù)據(jù)中心現(xiàn)場(chǎng)完成的工作。”

該公司的統(tǒng)計(jì)數(shù)據(jù)非常細(xì)致,因?yàn)椴煌瑪?shù)據(jù)中心設(shè)施的訪問者數(shù)量差異很大,具體取決于客戶的概況及其部署情況。QTS公司在亞特蘭大的規(guī)模最大的數(shù)據(jù)中心每個(gè)月可以接待400至700位訪客,但與疫情發(fā)生之前的前一個(gè)月相比,訪問量下降了40%。

Bensten說:“如果客戶沒有意識(shí)到對(duì)數(shù)據(jù)中心的訪問是一種風(fēng)險(xiǎn)的話,我們不會(huì)對(duì)客進(jìn)入數(shù)據(jù)中心強(qiáng)行拒絕。但我們要求訪客公開去過的地方,使用生物識(shí)別技術(shù)進(jìn)行識(shí)別,并在他們碰觸物體時(shí)采用濕巾進(jìn)行消毒。根據(jù)我們掌握的每一項(xiàng)統(tǒng)計(jì)數(shù)據(jù),在數(shù)據(jù)中心運(yùn)營商努力滿足更大流量需求的背景下,數(shù)據(jù)中心功耗顯著上升,帶寬大幅增加。并且隨著所有這些指標(biāo)的上升,客戶采用遠(yuǎn)程工具的數(shù)量有所上升。”

Bensten表示。幸運(yùn)的是,QTS公司擁有一個(gè)功能齊全的服務(wù)交付平臺(tái)(SDP)。他說,“這是一種高接觸、高需求的服務(wù)??蛻魺o需進(jìn)入數(shù)據(jù)中心就能進(jìn)行控制和操作,這就是與QTS公司集成的唯一方法。客戶可以采用iPhone進(jìn)入門戶網(wǎng)站或使用API,因此可以通過編程方式完成所有操作。”

像初創(chuàng)廠商這樣的小公司只需要采用應(yīng)用程序快速檢查,而大型公司則具有從程序訪問中獲得最大收益的資源。他說,“它們的使用方式截然不同。小企業(yè)的員工可以使用他的iPhone應(yīng)用程序進(jìn)行檢查。但是,擁有1MW以上容量的大型企業(yè)客戶需要采用我們API共享數(shù)據(jù),轉(zhuǎn)移負(fù)載以減少能耗,并保持服務(wù)可靠運(yùn)行。而在以往的實(shí)踐中,他們需要派遣工作人員去現(xiàn)場(chǎng)進(jìn)行操作。”

人們可能認(rèn)為那些精通IT技術(shù)的大公司更容易適應(yīng)遠(yuǎn)程控制,但Bensten并不這么認(rèn)為。他說,“數(shù)據(jù)中心訪問量減少針對(duì)的是各種規(guī)模的客戶,其中包括企業(yè)和政府部門。”

他表示,通過服務(wù)交付平臺(tái)(SDP)進(jìn)行遠(yuǎn)程檢查實(shí)際上比訪問現(xiàn)場(chǎng)更有效,因?yàn)樗梢栽L問更多數(shù)據(jù),他說:“多年來,我們根據(jù)在數(shù)據(jù)中心部署的大量傳感器中收集的數(shù)據(jù)建立一個(gè)龐大的數(shù)據(jù)湖。”

它還包括更廣泛的數(shù)據(jù)(例如天氣模式),并有效地查看了數(shù)據(jù)中心內(nèi)部的“天氣”。他說,“我們擁有一個(gè)使用先進(jìn)分析技術(shù)的數(shù)據(jù)科學(xué)家團(tuán)隊(duì),因此可以預(yù)測(cè)7天內(nèi)的能耗,以預(yù)測(cè)未來的模式,而數(shù)據(jù)湖可以由我們和客戶挖掘數(shù)據(jù)。”

遠(yuǎn)程工作

由于遠(yuǎn)程控制對(duì)客戶有好處,對(duì)數(shù)據(jù)中心運(yùn)營商的員工也有好處。QTS公司盡可能使用相同工具的不同視圖實(shí)現(xiàn)遠(yuǎn)程辦公。Bensten說,“我們的NOC支持中心為遠(yuǎn)程工作提供支持,使用3D視圖軟件查看數(shù)據(jù)中心設(shè)施,其中包括客戶的機(jī)柜。”

當(dāng)然,這些工具并不能解決所有問題,但是當(dāng)必須進(jìn)行物理操作時(shí),最好讓操作人員進(jìn)入數(shù)據(jù)中心,并在支持中心的指導(dǎo)下為客戶完成操作。Bensten說,“我們的員工被認(rèn)為是必不可少的基礎(chǔ)服務(wù)人員。當(dāng)需要服務(wù)時(shí),我們的員工可以為客戶進(jìn)行操作,因此不需要客戶派遣人員進(jìn)行操作。其工作由服務(wù)交付平臺(tái)(SDP)提供指導(dǎo),工作人員將會(huì)打開機(jī)柜進(jìn)行操作。”

他表示,數(shù)據(jù)中心工作人員的輪班模式也略有不同,并且人數(shù)并沒有明顯的變化。

QTS公司還分享其建筑安全系統(tǒng),為客戶提供視頻監(jiān)控服務(wù)。Bensten說,“客戶可以通過監(jiān)控設(shè)備監(jiān)視進(jìn)出人員。”該公司也在數(shù)據(jù)中心入口到數(shù)據(jù)大廳的共享區(qū)域提供監(jiān)控措施,因此它可以跟蹤數(shù)據(jù)中心工作人員和客戶的出入情況。

遠(yuǎn)程管理為數(shù)據(jù)中心托管供應(yīng)商及其客戶帶來了劃分問題。例如,客戶希望了解諸如制冷和電力之類的數(shù)據(jù)中心基礎(chǔ)設(shè)施情況,但是這些都在數(shù)據(jù)中心運(yùn)營商的控制之下。同時(shí),數(shù)據(jù)中心運(yùn)營商還會(huì)劃清界線,讓客戶自行管理自己的IT操作系統(tǒng)和工作負(fù)載。

Bensten說,“我們將服務(wù)器和存儲(chǔ)控制器視為IT設(shè)備資產(chǎn),因此客戶可以加載IP配置和VLAN。我們的管理技術(shù)不會(huì)干擾客戶操作其IT系統(tǒng)。而我們和客戶也有不同的看法,例如我們的員工需要查看宏觀的畫面,而客戶需要查看更深入的微觀視圖。”

小型數(shù)據(jù)中心設(shè)施在遠(yuǎn)程工作方面也取得了先機(jī),這是因?yàn)楦采w多個(gè)位置所涉及的開銷。

EdgeConneX公司是一家數(shù)據(jù)中心托管服務(wù)提供商,專門為世界各地中小城市提供定制的數(shù)據(jù)中心托管服務(wù)。該公司首席信息官Lance Devin說,“我們很多的數(shù)據(jù)中心設(shè)施是基于無人值守的數(shù)據(jù)中心,這些數(shù)據(jù)中心的電力容量為2MW,而不是大規(guī)模數(shù)據(jù)中心。在這樣的數(shù)據(jù)中心工作的工程師、安全人員、維護(hù)人員的人數(shù)要少得多。”

該公司擁有和運(yùn)營600個(gè)這樣的小型數(shù)據(jù)中心設(shè)施,從一開始就有實(shí)現(xiàn)遠(yuǎn)程控制和管理的想法,并且存在更具效益的商業(yè)運(yùn)營理由,而且隨著其業(yè)務(wù)進(jìn)一步發(fā)展到邊緣計(jì)算,可能會(huì)建設(shè)和運(yùn)營電力容量只有100kW或200kW的數(shù)據(jù)中心,這使得遠(yuǎn)程管理變得更加重要。

Devin表示,冠狀病毒疫情帶來的危機(jī)為EdgeOS公司的EdgeOS數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)提供了更多的市場(chǎng)機(jī)遇。他說,“這就是我們經(jīng)營業(yè)務(wù)的一種方式。”

這些管理系統(tǒng)可以管理EdgeConneX公司數(shù)據(jù)中心設(shè)施和客戶的機(jī)架設(shè)備,但是必須管理數(shù)據(jù)視圖。盡管其數(shù)據(jù)中心設(shè)施數(shù)量龐大,但EdgeConneX還是一家數(shù)據(jù)中心批發(fā)供應(yīng)商,并致力于與云計(jì)算提供商開展合作。他說,“客戶不希望我們知道他們的東西是什么,反之亦然。”

因此,EdgeConneX公司提供的DCIM管理系統(tǒng)可以遠(yuǎn)程管理電源和冷卻等設(shè)備,這些設(shè)備具有計(jì)算機(jī)化的預(yù)測(cè)性維護(hù),可以顯示設(shè)備何時(shí)進(jìn)行認(rèn)證和測(cè)試,以及運(yùn)行記錄等詳細(xì)信息。

數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(SCADA)每100毫秒就監(jiān)測(cè)一次發(fā)生事件,并發(fā)現(xiàn)異常情況,然后檢查原因。例如,在遠(yuǎn)程配線架(RPP)中發(fā)現(xiàn)PDU電源顯示錯(cuò)誤并出現(xiàn)故障。該系統(tǒng)將這一事件通知硬件供應(yīng)商。Devin說,“我們的運(yùn)營人員不必介入其中,該系統(tǒng)會(huì)自動(dòng)將這些信息直接發(fā)送給供應(yīng)商。”

該系統(tǒng)還與客戶進(jìn)行通信,客戶可以知道PDU電源和其他套件的位置和狀態(tài),他們采用服務(wù)器的機(jī)架,受到影響的設(shè)備,以及是否會(huì)影響其服務(wù)等級(jí)協(xié)議(SLA)。他說,“數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)會(huì)自動(dòng)告知客戶,而硬盤供應(yīng)商將對(duì)此進(jìn)行處理。”

EdgeConneX公司還允許客戶通過將數(shù)據(jù)中心監(jiān)控?cái)z像頭集成到其管理系統(tǒng)中直觀地監(jiān)視其設(shè)備。Devin說,“當(dāng)客戶考慮從自動(dòng)化和遠(yuǎn)程工作中看到一切時(shí),感覺可以更好地進(jìn)行掌控。例如可以看到實(shí)時(shí)負(fù)載和票證,也可以看到機(jī)柜運(yùn)行狀態(tài),但其視圖和數(shù)據(jù)將受到嚴(yán)格控制。在疫情持續(xù)蔓延的情況下,進(jìn)入數(shù)據(jù)中心將成為一個(gè)難題。我們?yōu)榇颂峁┮曨l監(jiān)控區(qū)域和一個(gè)與安全系統(tǒng)配合使用的呼叫系統(tǒng),因此可以遠(yuǎn)程驗(yàn)證客戶身份,拍下他們的面部圖像,然后要求驗(yàn)證系統(tǒng)進(jìn)行雙重身份驗(yàn)證或遠(yuǎn)程生物特征讀取識(shí)別身份。”

他說,“這些人員的通行證通常有ID,必須安全地簽發(fā),因此我們嘗試采用虹膜掃描儀,但是這種技術(shù)太復(fù)雜了,訪問者不得不以不同的距離重復(fù)掃描。”

這是EdgeConneX公司通過部分解決方案組合而成的復(fù)雜系統(tǒng)。Devin說,“我們嘗試采用四款現(xiàn)成的DCIM系統(tǒng),實(shí)際上從票務(wù)到管理再到報(bào)告,沒有一個(gè)DCIM系統(tǒng)可以完成所有工作。”

而對(duì)于QTS公司的Bentsen來說,客戶需要的不僅僅是DCIM系統(tǒng)。他說,“我們是數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)的忠實(shí)擁護(hù)者,但這只是我們平臺(tái)的一小部分。如果沒有數(shù)據(jù)湖,就無法使用DCIM系統(tǒng),而我們的服務(wù)交付平臺(tái)將無法實(shí)現(xiàn)它的功能。”

他認(rèn)為疫情已經(jīng)改變了人們的一些行為。他說,“我們認(rèn)為我們的工具集更適合客戶,并且疫情促使更多的客戶采用。我認(rèn)為可能不會(huì)回到原來的樣子,而我們的目標(biāo)之一是實(shí)現(xiàn)數(shù)據(jù)中心的云化,希望數(shù)據(jù)中心能夠以云計(jì)算的方式工作。”

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論