阿里巴巴將數(shù)據(jù)中心建到千島湖旁邊,騰訊將數(shù)據(jù)中心深藏在山洞中,如今的數(shù)據(jù)中心除了不能上天,這下水入地似乎無所不能。這雖然是句玩笑話,但也反映出隨著規(guī)?;?、集約化、綠色化等理念的深入人心,數(shù)據(jù)中心一直在向著規(guī)模更大、速度更快、能效更高且永不停頓的目標前進。
在數(shù)字經(jīng)濟時代,人們關注的目光都放到了數(shù)據(jù)和業(yè)務上,但任何轉(zhuǎn)型與創(chuàng)新都離不開數(shù)據(jù)中心的支撐。數(shù)據(jù)中心的高效、穩(wěn)定、高可用和自動化運維是業(yè)務連續(xù)性的重要保障。
數(shù)據(jù)中心的建設和運維并不是一個靜止的點,而是一個持續(xù)的過程。不可否認,建設一座現(xiàn)代化數(shù)據(jù)中心需要歷盡周折,殊不知在數(shù)據(jù)中心建設完成后,大量的日常運維工作對于企業(yè)來說更是一種沉重的負擔。如果企業(yè)沒有一個全局觀念,從數(shù)據(jù)中心全生命周期管理的角度做好萬全準備,那么無論數(shù)據(jù)中心在規(guī)劃、建設、運維的哪個階段出現(xiàn)一些問題,都有可能產(chǎn)生“蝴蝶效應”,造成不可逆的損失。
“可驗證”的數(shù)據(jù)中心
這并不是危言聳聽。在大多數(shù)據(jù)情況下,數(shù)據(jù)中心保持平穩(wěn)運行,我們似乎感覺不到它的存在,而一旦出現(xiàn)問題,就可能讓企業(yè)傷筋動骨。時間回溯到2018年5月18日晚,北京某知名數(shù)據(jù)中心運營商在亦莊的數(shù)據(jù)中心兩路市電全停,機房全部負載由柴油發(fā)電機供電維持,直到5月29日,該數(shù)據(jù)中心機房完全依靠柴油發(fā)電機帶載近260小時。這讓數(shù)據(jù)中心專業(yè)人士聽到都感到后怕。這樣的數(shù)據(jù)中心真可謂危如累卵,客戶業(yè)務的連續(xù)性又從何談起呢?
隨著云服務的興起,我們越來越頻繁地聽到某某云服務商業(yè)務宕機的消息,AWS、阿里云、騰訊云等都曝出過云業(yè)務中斷的消息,引起了社會的廣泛關注,近期還出現(xiàn)了客戶向云服務商索賠上千萬元的例子。
毋庸置疑,企業(yè)上云有利于未來業(yè)務的開展和創(chuàng)新,但是任何事情都有兩面性,企業(yè)上云后如何才能更好地保證基礎架構(gòu)的穩(wěn)定、可靠和連續(xù)性呢?其實,萬變不離其宗,這樣一個業(yè)務新課題落到數(shù)據(jù)中心層面,還是要依據(jù)數(shù)據(jù)中心全生命周期管理的理念,抽絲剝繭,從數(shù)據(jù)中心的規(guī)劃設計開始,在建設、運維等各個階段,做到有的放矢、精益求精,通過不斷驗證和持續(xù)優(yōu)化,盡量減少故障隱患,保證數(shù)據(jù)中心在全生命周期中都能健康運行。
施耐德電氣IT業(yè)務部數(shù)據(jù)中心業(yè)務架構(gòu)總監(jiān)張子揚介紹說,施耐德電氣為數(shù)據(jù)中心提供的全生命周期服務主要抓住四個關鍵周期:第一,規(guī)劃設計階段,施耐德電氣可以提供咨詢設計和設計驗證服務;第二,在建設末端到接維過程中提供測試驗證,保證設計所見即所得;第三,在運營階段為客戶提供永續(xù)運營的能力;第四,為數(shù)據(jù)中心提供二次評估。
覆蓋這四個關鍵階段,施耐德電氣的數(shù)據(jù)中心全生命周期管理服務能夠提供端到端的全過程管理,通過標準化、可視化的工具為客戶提供全過程的規(guī)劃、運營和升級服務,從而實現(xiàn)可驗證性,降低運營風險。
張子揚指出:“十年前,人們關注的是數(shù)據(jù)中心的可用性,但是現(xiàn)在可驗證性成為更關鍵的因素。在數(shù)據(jù)中心的規(guī)劃設計和建設階段,企業(yè)應盡可能地采用一些先進的數(shù)字化技術、工具和手段,提升數(shù)據(jù)中心的可視性和可驗證性。這就需要像施耐德電氣這樣的戰(zhàn)略合作伙伴提供適合的解決方案、工具以及專業(yè)的技術團隊。”
施耐德電氣在中國擁有36年的技術積累和豐富的實踐經(jīng)驗,為許多大型數(shù)據(jù)中心的永續(xù)運行提供堅實的保障。這也讓施耐德電氣在實踐中鍛造出一套成熟的方法論,即WHOES工作法,包含識別設計需求(What)、檢查或發(fā)現(xiàn)實施路徑(How)、優(yōu)化實施路徑或技術(Optimize)、檢查實施工程的工程語言合理性(Engineering)和檢查工程文檔的標準化程度(Standardization)。施耐德電氣整個設計認證團隊和測試認證團隊都嚴格按照WHOSE法則推進數(shù)據(jù)中心項目的落地和實施,逐步提高數(shù)據(jù)中心的可驗證性、可用性和能效。
施耐德電氣在北上廣、東北以及西南等地區(qū)的一線城市和商業(yè)重鎮(zhèn)都配備了本土化的團隊。專業(yè)的團隊、對行業(yè)的深刻洞察、成熟的工作方法論,以及豐富的實踐經(jīng)驗使得施耐德電氣可以提供更高質(zhì)量的數(shù)據(jù)中心全生命周期管理服務。
看看真實的案例吧。河南中原云項目是政府和企業(yè)數(shù)字化轉(zhuǎn)型的典型。當?shù)氐睦箱搹S、老電廠、老紡織廠都面臨著轉(zhuǎn)型的契機,很多人選擇跨界做數(shù)字地產(chǎn)。在這個過程中,如何充分利用自身資源優(yōu)勢是一個值得深思的問題。中原云非常有勇氣,也非常有想法,計劃用現(xiàn)有電廠的余熱實現(xiàn)數(shù)據(jù)中心的能源梯級利用。但是,在中國落地三聯(lián)供技術是一項極為復雜、對專業(yè)性要求很高的挑戰(zhàn),業(yè)內(nèi)能夠做到三聯(lián)供的數(shù)據(jù)中心園區(qū)屈指可數(shù)。在規(guī)劃設計的中間階段,施耐德電氣作為合作伙伴加入,憑借設計驗證服務幫助客戶對整體施工方案進行了有機梳理,使項目變成真正可以落地運營的三聯(lián)供方案。如今,該項目已投運兩年,當?shù)卣推髽I(yè)對這一成果十分滿意。
據(jù)統(tǒng)計,目前中國的數(shù)據(jù)中心超過50萬個,規(guī)模僅次于美國市場。隨著云計算的快速發(fā)展,IDC也在積極轉(zhuǎn)型,國內(nèi)托管數(shù)據(jù)中心的兼并與收購屢見不鮮。面對數(shù)據(jù)中心的規(guī)模化發(fā)展,如何通過規(guī)范化、標準化的服務滿足客戶對數(shù)據(jù)中心基礎設施建設和管理的新要求呢?企業(yè)必須重視數(shù)據(jù)中心全生命周期管理。
十年差距如何彌補?
如果將數(shù)據(jù)中心的全生命周期再進行一下簡化,其實也可以分成前后兩個階段:一個是數(shù)據(jù)中心的規(guī)劃和建設階段,另一個是數(shù)據(jù)中心的運維階段。上文,我們主要是在談數(shù)據(jù)中心的規(guī)劃設計和建設,這是廣大用戶耳熟能詳?shù)?,也是相對比較成熟的。只要能夠跟隨技術的發(fā)展與時俱進,并且遵循正確的方法論,大多數(shù)用戶在數(shù)據(jù)中心的規(guī)劃與建設階段都可以輕松應對。
需要特別提醒的一點就是,數(shù)據(jù)中心一旦建成就很難再改動,可能要使用幾年、十幾年甚至更長時間,如果在規(guī)劃設計和建設階段留下了隱患,在數(shù)據(jù)中心投入運維后再想追溯和修復,難度比較大。所以,用戶應該在數(shù)據(jù)中心的規(guī)劃設計和建設階段,反復多次進行驗證,用張子揚的話說,就是建立一個度量衡,通過驗證不斷與最初的設計目標進行對比、修正,提前發(fā)現(xiàn)問題、解決問題,讓那些隱性的問題無所遁形。
2017年的統(tǒng)計數(shù)據(jù)顯示,50%的數(shù)據(jù)中心出現(xiàn)過異常,18%的數(shù)據(jù)中心曾經(jīng)發(fā)生過導致應用中斷的大型事故,數(shù)據(jù)中心的業(yè)務連續(xù)性一直是個嚴峻的挑戰(zhàn)。歸納來說,導致數(shù)據(jù)中心中斷的原因主要包括規(guī)劃設計階段的設計質(zhì)量低下,以及運維階段出現(xiàn)的體系流程不完善、人員資質(zhì)和數(shù)量不足導致維護跟不上等。
施耐德電氣IT業(yè)務部全生命周期服務業(yè)務拓展經(jīng)理蔣勝表示,數(shù)據(jù)中心運營人才各個公司儲備都不足,中國的專業(yè)數(shù)據(jù)中心運營服務商與國外相比也有相當差距。美國數(shù)據(jù)中心基礎設施運營經(jīng)理的年齡基本都在四五十歲,至少擁有10年甚至更長時間的數(shù)據(jù)中心基礎設施運營經(jīng)驗。與國外相比,中國在數(shù)據(jù)中心基礎設施運營方面至少有十年的差距。
許多人混淆了運維與運營兩個概念。運維就是設備的基本運行和維護,而運營則與業(yè)務密切相關。一些數(shù)據(jù)中心用戶搞不清數(shù)據(jù)中心運維和運營的區(qū)別,因此在選擇服務供應商時,會在專業(yè)的數(shù)據(jù)中心運營服務商和普通的物業(yè)公司之間舉棋不定。
蔣勝分析說,通常,數(shù)據(jù)中心投入運營5年后,由于設備老化,各種問題就會逐漸顯露出來。另外,大多數(shù)客戶會將大部分資金和精力投入在數(shù)據(jù)中心建設階段,而忽視了運維,甚至將數(shù)據(jù)中心全權(quán)交由物業(yè)公司代運維,大大降低了數(shù)據(jù)中心后期維護的質(zhì)量,在故障發(fā)生時,很難及時準確地反應并采用有效措施。
施耐德電氣提供的數(shù)據(jù)中心管理是“運營”而非單純的“運維”。施耐德電氣不僅關注數(shù)據(jù)中心的高可用性和高可驗證性,還重視業(yè)務連續(xù)性、設備可用性和能效管理。
以聯(lián)通數(shù)據(jù)中心為例,最初,施耐德電氣接到代運營聯(lián)通呼和浩特和廊坊云基地的需求。聯(lián)通對施耐德電氣提出的明確要求包括:第一、施耐德電氣需幫助其建立符合聯(lián)通要求的運維體系;第二,提高整個數(shù)據(jù)中心的可用性和可靠性;第三,施耐德電氣要幫助其實現(xiàn)節(jié)能減排和優(yōu)化成本。在施耐德電氣的幫助下,聯(lián)通云數(shù)據(jù)有限公司建立了自己的運維體系,提升了數(shù)據(jù)中心的可用性,不僅實現(xiàn)了零中斷,而且將成本降低了30%。
蔣勝介紹說,在運營階段,施耐德電氣可為客戶提供多種分層級服務。第一層為維護集成服務,即服務的總包。這種服務適用于金融類的小型機房客戶,可幫助客戶提供對UPS、制冷、配電和安防設備的所有供應商的統(tǒng)一管理服務。第二層為維護管理服務,是維護集成服務的升級,施耐德電氣將派遣一名服務專家到現(xiàn)場監(jiān)督服務過程,并進行變更管理。第三層為關鍵設施運營,這是高度咨詢屬性的服務,將由施耐德電氣的員工在現(xiàn)場提供數(shù)據(jù)中心運營服務。
關鍵設施運營是最高層級的運營服務,從數(shù)據(jù)中心灰白區(qū)到樓宇管理層級,施耐德電氣在后臺可根據(jù)客戶需求提供大量全方位、標準化的資源。
數(shù)據(jù)中心的建設固然重要,但是后期的運維和運營同樣不容忽視,兩者相輔相成,形成一個完整的數(shù)據(jù)中心生命周期管理閉環(huán)。
施耐德電氣有“金剛鉆”
誰能提供數(shù)據(jù)中心全生命周期管理解決方案和服務?施耐德電氣是一個理想的候選。
施耐德電氣擁有專業(yè)的運營團隊和強大的后臺技術支持團隊,可以利用規(guī)范的運維方法論為客戶提供全方位的服務。在全球,施耐德電氣擁有250多個服務中心,在中國就有8個;擁有7000多名專業(yè)的現(xiàn)場服務專家,可以提供高級服務;擁有5500多個經(jīng)過培訓和認證的合作伙伴。
施耐德電氣結(jié)合自身在國內(nèi)外實踐中積累的數(shù)據(jù)中心關鍵基礎設施運維管理經(jīng)驗,基于收購公司Lee Technologies的先進方法論,協(xié)助客戶建立內(nèi)部運維管理標準和M&O認證體系,便于客戶日后因業(yè)務擴展等需求實現(xiàn)數(shù)據(jù)中心的快速部署和管理。
施耐德電氣也為數(shù)據(jù)中心基礎設施的安全運行提供了專業(yè)維護服務,所有現(xiàn)場工程師可以通過App端的施耐德電氣“千里眼”運維平臺完成工單。針對一些特殊工單,施耐德電氣要求工程師在現(xiàn)場將前中后期錄像和照片一并上傳到云平臺,確保所有步驟有跡可循。通過云計算、人工智能等先進技術,施耐德電氣幫助用戶實現(xiàn)了數(shù)據(jù)中心規(guī)劃設計、建設和運維的可視化、可追溯化和智能化,保證了數(shù)據(jù)中心這個數(shù)字化轉(zhuǎn)型基座的可靠、穩(wěn)定、安全。這也充分展示了數(shù)據(jù)中心全生命周期管理的價值所在。