隨著基礎(chǔ)服務(wù)設(shè)施的覆蓋規(guī)模逐漸延伸和背后支援技術(shù)持續(xù)向前,我們看到商業(yè)數(shù)據(jù)化轉(zhuǎn)型的整體趨勢,以及所有企業(yè)將數(shù)據(jù)戰(zhàn)略作為重要部署的內(nèi)容。那么,如何將數(shù)據(jù)與企業(yè)其他資源進(jìn)行整合,并增強(qiáng)企業(yè)的產(chǎn)品與服務(wù)組合,亦成為關(guān)鍵。
數(shù)據(jù)中心作為重要的互聯(lián)網(wǎng)基礎(chǔ)硬件設(shè)施,為數(shù)據(jù)化轉(zhuǎn)型,以至建設(shè)信息社會提供主要動力,通過為服務(wù)器提供穩(wěn)定可靠的無間斷運(yùn)作環(huán)境,保障終端用戶對數(shù)字化服務(wù)的需求,根據(jù)statista統(tǒng)計研究,預(yù)計到2021年全球數(shù)據(jù)中心數(shù)量將達(dá)到7200萬座。
數(shù)據(jù)中心不但承擔(dān)數(shù)據(jù)傳遞運(yùn)輸、存儲、計算等等相關(guān)工作,也是現(xiàn)代化信息時代里與人力資源、自然資源一樣重要的戰(zhàn)略資源。雖然它僅是一個擁有極大空間的場所,但其內(nèi)部的環(huán)境會極大程度影響數(shù)據(jù)工作效率,以對企業(yè)業(yè)務(wù)產(chǎn)生系列影響。
因此,數(shù)據(jù)中心的運(yùn)維與管理工作常常是基礎(chǔ)服務(wù)供應(yīng)商最為重視的部分,也是企業(yè)考量主機(jī)解決方案時最重要的參考指標(biāo)要素。不過由于對未來不確定性,數(shù)據(jù)中心需要為所有可能性事故做好防范,以確保真正發(fā)生災(zāi)難期間,盡可能地縮短影響時長,協(xié)助企業(yè)維持無間斷運(yùn)營。
通常而言,數(shù)據(jù)中心常見的故障主要分為硬件故障與系統(tǒng)故障。從硬件故障來說,主要事故來源包括設(shè)備、線路、端口等等,哪一個部分功能無法正常發(fā)揮或者運(yùn)作,都會導(dǎo)致機(jī)房異常和中斷。因此,企業(yè)可以通過確定機(jī)房內(nèi)所有硬件是否具備冗余,可否在出現(xiàn)問題時進(jìn)行第一時間更換,作為一個基本參考指標(biāo)。
除了冗余配置之外,就是是否具備可追蹤硬件的方式,譬如新天域互聯(lián)香港數(shù)據(jù)中心將機(jī)房內(nèi)部所有硬件進(jìn)行明確標(biāo)識,能夠在最快時間內(nèi)確定故障源,及時進(jìn)行處理,以避免帶來嚴(yán)重影響,保證企業(yè)業(yè)務(wù)的持續(xù)性和可靠性。當(dāng)然受惠于人工智能(AI)、物聯(lián)網(wǎng)(IoT)傳感技術(shù)發(fā)展,目前也有智能化硬件管理方案,最大程度通過自動化簡易數(shù)據(jù)中的管理工作,還能達(dá)成相同效率和效益。
另一方面就是數(shù)據(jù)中心的系統(tǒng)故障,主要涉及電力系統(tǒng)、冷卻系統(tǒng)、滅火系統(tǒng),以及安防系統(tǒng)四大內(nèi)容。與上述硬件相同,所有系統(tǒng)均需具備冗余,這是基礎(chǔ)且必要的。作為備用設(shè)施能夠在意外期間及時地啟用,以進(jìn)行抵抗。同時為確保這些冗余系統(tǒng)的有效性,需要定期進(jìn)行檢查和固定演練。
而電力系統(tǒng)與冷卻系統(tǒng)還需企業(yè)更深層次的信息挖掘,例如機(jī)房的供電來源源于哪一家電力公司,該公司的能源供應(yīng)可靠度指數(shù),以及冷卻系統(tǒng)采取的是風(fēng)扇冷卻,還是空調(diào)冷卻,抑或是水循環(huán)冷卻,因為每一種不同的系統(tǒng)由不同能源驅(qū)動,可成為企業(yè)評判機(jī)房綠色程度、可靠程度的重要指標(biāo)。
總而言之,企業(yè)選擇服務(wù)器或者是數(shù)據(jù)中心的當(dāng)下,也不妨以機(jī)房故障的角度進(jìn)行轉(zhuǎn)換思考,去檢測該運(yùn)維團(tuán)隊是否具備良好素質(zhì)和合規(guī)專業(yè)技術(shù),確保自身的基礎(chǔ)設(shè)施配置獲得足夠保障,并能夠借助這些資源充分地利用數(shù)據(jù)化優(yōu)勢,發(fā)展更廣泛業(yè)務(wù)。