什么是熄燈數(shù)據(jù)中心?可能在新應(yīng)用和邊緣采用

解密數(shù)據(jù)機(jī)房管理
“熄燈”這個(gè)術(shù)語(yǔ)可以追溯到Philip K Dick在1955年發(fā)表的一篇短篇小說(shuō)。例如在制造行業(yè)中,荷蘭飛利浦公司的一家工廠在少數(shù)質(zhì)檢人員的監(jiān)督下生產(chǎn)剃須刀;而日本Fanuc公司生產(chǎn)工業(yè)機(jī)器人的工廠可以長(zhǎng)期關(guān)閉空調(diào)和供暖系統(tǒng),以使機(jī)器人的生產(chǎn)不受干擾。

熄燈數(shù)據(jù)中心這個(gè)理念已經(jīng)流行了多年的時(shí)間,但是為什么要運(yùn)營(yíng)這樣的數(shù)據(jù)中心呢?它們會(huì)成為未來(lái)的發(fā)展趨勢(shì)嗎?

熄燈數(shù)據(jù)中心其實(shí)是一種無(wú)人值守的數(shù)據(jù)中心,也是一種完全實(shí)現(xiàn)自動(dòng)化的數(shù)據(jù)中心設(shè)施,可以更顯著地節(jié)約能源和管理成本。

“熄燈”這個(gè)術(shù)語(yǔ)可以追溯到Philip K Dick在1955年發(fā)表的一篇短篇小說(shuō)。例如在制造行業(yè)中,荷蘭飛利浦公司的一家工廠在少數(shù)質(zhì)檢人員的監(jiān)督下生產(chǎn)剃須刀;而日本Fanuc公司生產(chǎn)工業(yè)機(jī)器人的工廠可以長(zhǎng)期關(guān)閉空調(diào)和供暖系統(tǒng),以使機(jī)器人的生產(chǎn)不受干擾。

當(dāng)最初構(gòu)建的熄燈數(shù)據(jù)中心運(yùn)營(yíng)時(shí),其計(jì)算機(jī)系統(tǒng)仍然需要定期維護(hù)和保養(yǎng)。現(xiàn)場(chǎng)工作人員不得不經(jīng)常進(jìn)入機(jī)房重置服務(wù)器或重新連接交換機(jī)。

但這種情況正在改變,如今的IT組件變得越來(lái)越可靠。而軟件定義網(wǎng)絡(luò)(SDN)意味著通過(guò)軟件重新設(shè)置服務(wù)器或連接網(wǎng)絡(luò)。采用虛擬化技術(shù)使工作負(fù)載獨(dú)立于物理服務(wù)器,而采用自動(dòng)化技術(shù)意味著可以遠(yuǎn)程完成重置和調(diào)整。

多年來(lái),傳統(tǒng)數(shù)據(jù)中心一直通過(guò)運(yùn)營(yíng)人員管理和維護(hù)數(shù)百臺(tái)甚至數(shù)千臺(tái)服務(wù)器。除非更換硬件或修復(fù)故障,通常不會(huì)進(jìn)入機(jī)房。數(shù)據(jù)中心的機(jī)械和電氣設(shè)備采用自動(dòng)化技術(shù),而空調(diào)制冷系統(tǒng)也可以在無(wú)人值守的情況下運(yùn)行,并且提示工程師或制造商進(jìn)行預(yù)防性維護(hù)。

傳統(tǒng)數(shù)據(jù)中心“浪費(fèi)”了更多的空間和能源,這是因?yàn)樾枰獮檫\(yùn)營(yíng)人員提供工作環(huán)境和條件,并設(shè)置了滿足安全和生理等需求的安全出入口和洗手間等設(shè)施。

熄燈數(shù)據(jù)中心首次在2011年亮相,美國(guó)互聯(lián)網(wǎng)服務(wù)提供商AOL公司當(dāng)時(shí)宣布將采用一種激進(jìn)的模式,推出名為ATC的小型無(wú)人值守的數(shù)據(jù)中心。AOL公司技術(shù)副總裁Mike Manos曾是在微軟公司的數(shù)據(jù)中心專家,他在一篇博客文章對(duì)熄燈數(shù)據(jù)中心的理念表示贊賞,認(rèn)為這種技術(shù)可以從根本上改變一切。

2345截圖20200908083720.png

對(duì)熄燈數(shù)據(jù)中心的宣傳和炒作

但是十年過(guò)去了,AOL公司早已不復(fù)存在,而數(shù)據(jù)中心仍然需要運(yùn)營(yíng)人員的運(yùn)營(yíng)和維護(hù)。但熄燈數(shù)據(jù)中心的的想法一直存在,通??梢圆捎妙A(yù)先安裝服務(wù)器的方式將機(jī)架安裝在這樣的數(shù)據(jù)中心中。

數(shù)據(jù)中心設(shè)計(jì)師指出,如果無(wú)需工作人員運(yùn)營(yíng)和維護(hù)的話,數(shù)據(jù)中心的機(jī)架和服務(wù)器等IT設(shè)備將部署得更緊湊,在更高的溫度下運(yùn)行,并且大幅削減冷卻費(fèi)用。而抽取空氣中的氧氣可以防止火災(zāi),減少腐蝕。

但是事實(shí)表明,大型數(shù)據(jù)中心設(shè)施仍然需要配備運(yùn)營(yíng)人員。

Uptime Institute是數(shù)據(jù)中心可靠性方面的全球權(quán)威機(jī)構(gòu),該機(jī)構(gòu)一直建議數(shù)據(jù)中心運(yùn)營(yíng)人員需要隨時(shí)準(zhǔn)備處理出現(xiàn)的任何問(wèn)題。該機(jī)構(gòu)的技術(shù)專家Richard F.Van Loo在2015年發(fā)布的一份簡(jiǎn)報(bào)中說(shuō):“對(duì)于需要在Tier III級(jí)或Tier IV數(shù)據(jù)中心設(shè)施運(yùn)營(yíng)關(guān)鍵業(yè)務(wù)的組織來(lái)說(shuō),我們建議至少有一到兩家數(shù)據(jù)中心運(yùn)營(yíng)商的工作人員全天候在現(xiàn)場(chǎng)工作,而配備適當(dāng)數(shù)量的數(shù)據(jù)中心人員是可靠運(yùn)營(yíng)的關(guān)鍵。”

熄燈數(shù)據(jù)中心的發(fā)展在此后發(fā)生了一些變化,尤其是規(guī)模較小的數(shù)據(jù)中心提供商,例如EdgeConneX公司。

EdgeConneX公司席信息官Lance Devin表示:“我們的業(yè)務(wù)是建立在熄燈數(shù)據(jù)中心的基礎(chǔ)上,我們通常部署電力容量為2MW的數(shù)據(jù)中心,而不是100MW的大型數(shù)據(jù)中心。因?yàn)槲覀児緹o(wú)法承擔(dān)在數(shù)據(jù)中心雇傭更多的工程師、安全人員以及維護(hù)人員的成本。”

EdgeConneX公司運(yùn)行了分段管理系統(tǒng),該系統(tǒng)可讓客戶控制IT硬件,而EdgeConneX公司則負(fù)責(zé)管理電源和冷卻基礎(chǔ)設(shè)施。

但這樣的數(shù)據(jù)中心并非完全熄燈,EdgeConneX公司具有遠(yuǎn)程控制安全性,因此可以通過(guò)蜂鳴器通知客戶或運(yùn)營(yíng)商的運(yùn)營(yíng)人員。

2345截圖20200908083720.png

疫情鎖定和熄燈運(yùn)營(yíng)

擁有和運(yùn)營(yíng)規(guī)模更大的數(shù)據(jù)中心設(shè)施的運(yùn)營(yíng)商并不需要這樣做。但是他們需要具有遠(yuǎn)程管理數(shù)據(jù)中心的能力,由于2020年發(fā)生了冠狀病毒疫情,這些能力得到了驗(yàn)證。

當(dāng)很多組織的員工在家遠(yuǎn)程工作時(shí),數(shù)據(jù)中心運(yùn)營(yíng)商采用的遠(yuǎn)程控制服務(wù)激增。數(shù)據(jù)中心運(yùn)營(yíng)商QTS Data Centers公司首席技術(shù)官Brent Bensten表示,在由于疫情而導(dǎo)致封鎖的前三周內(nèi),該公司遠(yuǎn)程管理門戶(服務(wù)交付平臺(tái)或SDP)的登錄量增長(zhǎng)了30%,而用戶在該系統(tǒng)上花費(fèi)的時(shí)間增加了一倍。

雖然允許工作人員進(jìn)入數(shù)據(jù)中心,但是需要相互遠(yuǎn)離,并且發(fā)現(xiàn)數(shù)據(jù)中心仍然可以在更少的人為干預(yù)下運(yùn)行,因此我發(fā)現(xiàn)了遠(yuǎn)程管理的更多價(jià)值。Bensten說(shuō):“冠狀疫情加快了遠(yuǎn)程管理平臺(tái)和工具的應(yīng)用,因此可以遠(yuǎn)程完成以前在現(xiàn)場(chǎng)完成的工作。”

熄燈運(yùn)營(yíng)是為了解決技能短缺問(wèn)題?

在許多情況下,“熄燈”是降低數(shù)據(jù)中心技能要求的一種方式,既可以作為一種削減成本的措施,也可以作為解決難以尋求熟練員工問(wèn)題的一種方式。

施耐德電氣公司的工程師Steven Carlini在一篇博客文章中對(duì)“為什么將來(lái)每個(gè)數(shù)據(jù)中心都將成為熄燈數(shù)據(jù)中心”進(jìn)行了解釋。他在這篇文章指出,企業(yè)應(yīng)該盡可能讓其內(nèi)部部署數(shù)據(jù)中心實(shí)現(xiàn)熄燈,其中一個(gè)原因是為了應(yīng)對(duì)疫情的封鎖,另一個(gè)原因是解決技能短缺問(wèn)題。

Carlini說(shuō):“熄燈和無(wú)人值守的說(shuō)法可能并不完全準(zhǔn)確,因?yàn)榘踩藛T很可能會(huì)在現(xiàn)場(chǎng)工作。”他建議數(shù)據(jù)中心應(yīng)該雇用具有機(jī)械技能的安全人員,并讓他們實(shí)施即插即用的硬件更換工作,有些公司已經(jīng)在嘗試使用Zoom視頻軟件指導(dǎo)人員進(jìn)行維護(hù)和維修。

在很多情況下,熄燈數(shù)據(jù)中心的概念已經(jīng)演變?yōu)閿?shù)據(jù)中心不需要更多技能的概念。

水下數(shù)據(jù)中心的探索

那么,熄燈數(shù)據(jù)中心真的存在和可行嗎?也許有一些數(shù)據(jù)中心以這種方式運(yùn)行,也許是一些公司對(duì)此進(jìn)行保密,也許已經(jīng)失敗(例如AOL公司的ATC數(shù)據(jù)中心)。

但是行業(yè)人士確實(shí)了解一個(gè)知名案例。微軟公司試點(diǎn)部署的一個(gè)水下數(shù)據(jù)中心已經(jīng)運(yùn)營(yíng)了兩年,該數(shù)據(jù)中心的電力容量為240kW,并且不用工作人員現(xiàn)場(chǎng)訪問(wèn)和維護(hù),這是因?yàn)檫@個(gè)數(shù)據(jù)中心沉在海底。

微軟公司的一個(gè)名為Project Natick的研究團(tuán)隊(duì)在2018年將12個(gè)服務(wù)器機(jī)架部署在一個(gè)壓力容器中,并將其沉入蘇格蘭海岸附近的海底。兩年來(lái),這個(gè)水下數(shù)據(jù)中心的服務(wù)器的運(yùn)行沒(méi)有受到任何影響,與它們的唯一通信是通過(guò)電力和網(wǎng)絡(luò)電纜進(jìn)行的。該數(shù)據(jù)中心運(yùn)行了864臺(tái)服務(wù)器和27.6 PB的存儲(chǔ)設(shè)備,主要處理來(lái)自Azure云平臺(tái)的工作負(fù)載。這個(gè)無(wú)人值守的數(shù)據(jù)中心部署在充滿了非活性氮?dú)獾拿芊夤摅w中。

微軟公司最終在2020年從海底打撈出這個(gè)名為“SSDC-002”的水下數(shù)據(jù)中心。Project Natick水下數(shù)據(jù)中心主管David Cutler說(shuō):“這個(gè)水下數(shù)據(jù)中心無(wú)人運(yùn)營(yíng)長(zhǎng)達(dá)25個(gè)月零八天,其運(yùn)營(yíng)結(jié)果令人滿意。”

可靠性和摩爾定律

水下數(shù)據(jù)中心服務(wù)器的可靠性與傳統(tǒng)數(shù)據(jù)中心的同類服務(wù)器相比高出大約七倍。Project Natick水下數(shù)據(jù)中心使用的是一批二手服務(wù)器,并將其中135臺(tái)的服務(wù)器在陸基傳統(tǒng)數(shù)據(jù)中心中運(yùn)行,其余的855臺(tái)服務(wù)器部署在這個(gè)水下數(shù)據(jù)中心。

Cutler說(shuō):“在135臺(tái)陸地服務(wù)器中,有8臺(tái)服務(wù)器在兩年內(nèi)發(fā)生了宕機(jī)。而在水下數(shù)據(jù)中心的855臺(tái)服務(wù)器中,只有6臺(tái)服務(wù)器發(fā)生宕機(jī)。這些服務(wù)器都執(zhí)行相同的任務(wù),并且沒(méi)有進(jìn)行任何維護(hù),但是傳統(tǒng)數(shù)據(jù)中心的振動(dòng)和氧氣環(huán)境導(dǎo)致其可靠性相對(duì)不高。”

行業(yè)人士反對(duì)運(yùn)營(yíng)熄燈數(shù)據(jù)中心的主要意見(jiàn)是,需要定期更換服務(wù)器和存儲(chǔ)設(shè)備,這并不是因?yàn)榉?wù)器和存儲(chǔ)設(shè)備的硬件損耗,而是因?yàn)樗鼈円呀?jīng)過(guò)時(shí)。幾十年來(lái),IT硬件遵循摩爾定律(硬件性能隨著技術(shù)進(jìn)步每18個(gè)月翻一番),采用新服務(wù)器僅在使用能源成本方面就可以在三年內(nèi)收回投資。

芯片工藝現(xiàn)在已經(jīng)接近極限,摩爾定律也即將終結(jié),而服務(wù)器的使用壽命將更長(zhǎng)。Uptime Institute研究總監(jiān)Rabih Bashroush說(shuō),“在更換使用壽命長(zhǎng)達(dá)9年的服務(wù)器時(shí),仍然有非常充分的理由節(jié)約能源。”

Cutler預(yù)測(cè),這將使數(shù)據(jù)中心運(yùn)營(yíng)商更加關(guān)注熄燈數(shù)據(jù)中心的部署和運(yùn)營(yíng)。他說(shuō),“在數(shù)據(jù)中心的整個(gè)生命周期中,服務(wù)器的成本占很大比例。在后摩爾定律時(shí)代,沒(méi)有理由每?jī)赡旮鼡Q一次IT設(shè)備。”

2345截圖20200908083720.png

在邊緣采用熄燈數(shù)據(jù)中心

盡管傳統(tǒng)數(shù)據(jù)中心仍然需要運(yùn)營(yíng)人員進(jìn)行管理,但新的應(yīng)用場(chǎng)景和邊緣計(jì)算領(lǐng)域?qū)⒖赡苄枰\(yùn)營(yíng)熄燈數(shù)據(jù)中心。

物聯(lián)網(wǎng)等新技術(shù)發(fā)展以及更多采用流媒體和遠(yuǎn)程工作應(yīng)用程序,導(dǎo)致數(shù)據(jù)中心用戶對(duì)高度分散的低延遲資源的需求。這意味著需要靠近人員和數(shù)據(jù)源部署大量小型數(shù)據(jù)中心設(shè)施。大多數(shù)的邊緣數(shù)據(jù)中心規(guī)模比微軟公司Project Natick的水下數(shù)據(jù)中心要小得多,有些甚至在燈柱上安裝。除非能夠完全消除現(xiàn)場(chǎng)訪問(wèn)和運(yùn)營(yíng),否則邊緣數(shù)據(jù)中心在維護(hù)成本方面難以承受。

Cutler說(shuō):“就像我們所做的那樣,通常會(huì)采用熄燈數(shù)據(jù)中心。邊緣計(jì)算設(shè)施最終只能獨(dú)立運(yùn)行。”

當(dāng)AOL公司技術(shù)副總裁Mike ManosMike Manos提出這一想法時(shí),實(shí)際上是在談?wù)撨吘売?jì)算設(shè)施,旨在使AOL公司的服務(wù)更貼近客戶。

Cutler表示,隨著技術(shù)的進(jìn)步和發(fā)展,熄燈數(shù)據(jù)中心的發(fā)展可能比人們想象的還要快,將會(huì)成為數(shù)據(jù)中心行業(yè)的一種趨勢(shì)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論