很少有東西需要像數(shù)據(jù)中心一樣始終可靠,隨著數(shù)字化趨勢之下,更多企業(yè)需要確保業(yè)務(wù)的始終連接,而這就是對數(shù)據(jù)中心的更高要求。但是考慮到現(xiàn)代數(shù)據(jù)中心的復(fù)雜性,不得不承認(rèn)這也成為一大挑戰(zhàn)。近日Facebook就因數(shù)據(jù)中心網(wǎng)絡(luò)連接問題導(dǎo)致全球范圍內(nèi)服務(wù)大宕機(jī),連這般超大規(guī)模服務(wù)商都可能遭遇不可預(yù)測的中斷,那么企業(yè)該如何防止業(yè)務(wù)中斷呢?
認(rèn)識數(shù)據(jù)中心是第一步,了解數(shù)據(jù)中心項(xiàng)目,以及其對災(zāi)難或停機(jī)處理、故障排查等的方案,就能初步判斷一個設(shè)施是否運(yùn)營良好還是有很多不足之處。當(dāng)然,企業(yè)可以選擇性地進(jìn)行認(rèn)知,譬如主要在亞太地區(qū)部署業(yè)務(wù)的企業(yè)可以集中考慮該區(qū)域內(nèi)的數(shù)據(jù)中心基礎(chǔ)情況即可,畢竟位置是實(shí)現(xiàn)更低延遲的主要原則,此時如果一心研究歐洲數(shù)據(jù)中心便著實(shí)不妥。
對于數(shù)據(jù)中心可能出現(xiàn)運(yùn)營中斷的原因可能出于很多類型,但是應(yīng)該基于各類基礎(chǔ)設(shè)施配置都齊全的情況下,才有資格入選企業(yè)的數(shù)據(jù)中心名單。特別是在電力供應(yīng)方面,由于絕大部分的數(shù)據(jù)中心仍舊依靠電力實(shí)現(xiàn)運(yùn)營,穩(wěn)定的電力系統(tǒng)和適當(dāng)?shù)碾娏θ哂鄬⒖梢悦黠@提高數(shù)據(jù)中心的可靠性。而各類基礎(chǔ)設(shè)施配置都主要針對不同的數(shù)據(jù)中心運(yùn)維層面,像是冷卻系統(tǒng)旨在將機(jī)房內(nèi)部的濕度和溫度控制在合理范圍,來最大提高內(nèi)部所有設(shè)施硬件的可用周期。但是這種可用周期其實(shí)背后都遵循硬件的周期生命,定期地排查和升級便成為必要。
除了基于硬件層面的考慮,同時還要針對數(shù)據(jù)中心與連接方面的關(guān)系進(jìn)行更深了解。通常數(shù)據(jù)中心會接入多家運(yùn)營商的網(wǎng)絡(luò)連接線路,其主要目的是避免單點(diǎn)事故,哪怕有某一條線路出現(xiàn)連接問題,也可以將日常的負(fù)荷轉(zhuǎn)移到其他可用的冗余線路上,來確保網(wǎng)絡(luò)在線。但是,這應(yīng)該是作為備用方案,而不是數(shù)據(jù)中心設(shè)計的出發(fā)點(diǎn)。
簡單來說,機(jī)房所接入的所有網(wǎng)絡(luò)資源都應(yīng)經(jīng)過嚴(yán)格的設(shè)計和確認(rèn),冗余線路僅限在特殊情況適用,而不應(yīng)盲目地添加劣質(zhì)網(wǎng)絡(luò)盲目充數(shù)。新天域互聯(lián)香港數(shù)據(jù)中心就接入來自內(nèi)地三大網(wǎng)絡(luò)運(yùn)營商的直連線路,確保與內(nèi)地市場交互,同時還集合來自全球多家Tier 1級電信運(yùn)營商的Premium級路由,智能調(diào)節(jié)最佳路徑,幫助企業(yè)實(shí)現(xiàn)真正的全球互聯(lián)互通。
隨著技術(shù)的進(jìn)步,越來越多的復(fù)雜性被添加至數(shù)據(jù)中心之中,部分原因是來于數(shù)據(jù)中心技術(shù)不斷發(fā)展,像是AI自動篩查機(jī)房故障、使用綠色能源發(fā)展可持續(xù)數(shù)據(jù)中心等,這些實(shí)施可能更好地如期完成連接,但也更高地依賴于非現(xiàn)場人員的系列方案,意味企業(yè)也將需要對這類系統(tǒng)運(yùn)營的流程和質(zhì)量的保證。
在許多情況下,數(shù)據(jù)中心運(yùn)維不應(yīng)該停留在表面,企業(yè)選擇的數(shù)據(jù)中心應(yīng)該成為推動其數(shù)字化的驅(qū)動,在使用時間內(nèi)盡可能地使用數(shù)據(jù)中心資源,通過確保數(shù)據(jù)中心始終可靠,來最大程度防止停機(jī)。