數(shù)據(jù)中心為什么需要持續(xù)保持警惕和維護?

西部數(shù)碼
西部數(shù)碼
數(shù)據(jù)中心的正常運行時間對于業(yè)務(wù)成功至關(guān)重要,確保提供不間斷的服務(wù)需要持續(xù)對運行情況保持警惕和維護。隨著組織越來越多地部署更多關(guān)鍵業(yè)務(wù)應(yīng)用程序,這種對持續(xù)維護和依賴基礎(chǔ)設(shè)施的需求似乎只會增加。 雖然技...

數(shù)據(jù)中心的正常運行時間對于業(yè)務(wù)成功至關(guān)重要,確保提供不間斷的服務(wù)需要持續(xù)對運行情況保持警惕和維護。隨著組織越來越多地部署更多關(guān)鍵業(yè)務(wù)應(yīng)用程序,這種對持續(xù)維護和依賴基礎(chǔ)設(shè)施的需求似乎只會增加。

雖然技術(shù)不斷創(chuàng)新,并引入新的基礎(chǔ)設(shè)施管理工具,但許多工具仍然無法滿足業(yè)界所追求的實現(xiàn)自動化和降低維護成本的要求。因此,許多IT專業(yè)人員仍在投入大量精力人工處理需要調(diào)整和優(yōu)化的問題。

運維人員面臨的主要問題是數(shù)據(jù)中心的維護周期仍然需要人為干預(yù)。此外,數(shù)據(jù)中心運營商將大部分預(yù)算用于保持其正常運行。

這就帶來一個問題,即為什么在不斷引入新的工具來解決這個問題的同時,仍然需要大量的維護。人們到底錯過了什么?

傳統(tǒng)基礎(chǔ)設(shè)施工具的不足之處

真正消除數(shù)據(jù)中心基礎(chǔ)設(shè)施的管理負擔(dān)需要具有預(yù)見性,以便在問題發(fā)生之前預(yù)測問題,同時能夠提供深入洞察力的基礎(chǔ)工作負載和資源情報,以實現(xiàn)更好的基礎(chǔ)設(shè)施優(yōu)化。

組織需要考慮以下四個因素,以確定采用的工具在克服令人沮喪的維護問題方面的不足之處:

1. 沒有向他人學(xué)習(xí)

只是報告本地系統(tǒng)指標的分析往往提供有限的價值。相反,采用工具的目的是它能夠從數(shù)千個對等系統(tǒng)的行為中學(xué)習(xí),以幫助檢測和診斷發(fā)展中的問題。從某種意義上說,兩種想法總比一種想法要好,需要集思廣益。

數(shù)據(jù)收集和分析的整體方法可以匯集來自各種各樣的工作負載的觀測結(jié)果。這允許在一個數(shù)據(jù)中心識別的罕見事件在另一個數(shù)據(jù)中心預(yù)先避免,并且更準確地檢測更常見的事件。

2. 不能看到整體情況

傳統(tǒng)工具通常只能以孤立的方式提供分析。每個設(shè)備僅提供系統(tǒng)狀態(tài),這只是整個過程的一部分。由于存在破壞應(yīng)用程序在基礎(chǔ)設(shè)施堆棧中任何位置突然出現(xiàn)的問題,因此能夠跨多個層進行跨堆棧分析以獲得更大的視野非常重要。這將需要關(guān)鍵組件,例如應(yīng)用程序、計算,虛擬化、數(shù)據(jù)庫、網(wǎng)絡(luò)和存儲。

3. 不夠深入了解

預(yù)測建模需要深入的領(lǐng)域經(jīng)驗,需要了解基礎(chǔ)設(shè)施堆棧中每個系統(tǒng)內(nèi)的所有操作、環(huán)境和遙測參數(shù)。通用分析需要深入。但是,行業(yè)領(lǐng)域?qū)<遗c人工智能相互配合可以使機器學(xué)習(xí)算法能夠識別歷史事件的因果關(guān)系,進而預(yù)測最復(fù)雜和最具顛覆性的問題。

4. 無法積極采取行動

也許采用傳統(tǒng)工具的最大缺點是無法積極采取行動。在理想的自主操作狀態(tài)下,數(shù)據(jù)中心將會自我管理、自我修復(fù)和自我優(yōu)化。從本質(zhì)上講,他們應(yīng)該能夠避免問題或改善環(huán)境,而無需管理員的人為干預(yù)。要實現(xiàn)這種自動化水平,需要經(jīng)過驗證的自動化建議歷史記錄,以提供必要的信任和信心。

數(shù)據(jù)中心維護的未來

為了克服傳統(tǒng)工具的局限性,并有效地降低維護需求,以及更好地讓數(shù)據(jù)中心實現(xiàn)自動化,人們需要采用新一代的人工智能解決方案。這意味著利用能夠觀察、學(xué)習(xí)、預(yù)測、推薦并最終實現(xiàn)自動化的工具。

通過觀察,人工智能將能夠針對各種工作負載和應(yīng)用程序?qū)硐氩僮鳝h(huán)境的穩(wěn)態(tài)理解。深度系統(tǒng)遙測與全球連接相結(jié)合,可實現(xiàn)快速的云計算機學(xué)習(xí),從而使人工智能具能夠通過模式匹配算法快速預(yù)測問題。甚至可以根據(jù)過去的歷史配置和工作負載模式為新的基礎(chǔ)設(shè)施建模和調(diào)整優(yōu)化應(yīng)用程序性能。

基于這些預(yù)測分析,人工智能解決方案可以確定改善數(shù)據(jù)中心環(huán)境所需的適當(dāng)響應(yīng)。然后IT團隊消除壓力,這意味著他們不再需要通宵達旦地工作以在管理基礎(chǔ)設(shè)施時找到問題的根源。更重要的是,如果人工智能證明是有效的,那么可以自動應(yīng)用建議而無需IT管理員的干預(yù)。那么這就是實現(xiàn)自動化的意義。

例如HPE公司的數(shù)據(jù)中心運維,采用人工智能工具在86%的時間內(nèi)自動預(yù)測和解決問題。此外,他們在存儲問題上花費的時間減少了85%,甚至可以將IT存儲運營支出減少79%。因此,部署人工智能以協(xié)助數(shù)據(jù)中心基礎(chǔ)設(shè)施的優(yōu)勢是不可否認的。

此外,隨著技術(shù)進步和經(jīng)濟發(fā)展,預(yù)計到2030年,高度多樣化的地區(qū)將面臨200萬IT專業(yè)人才短缺的情況。而在不那么遙遠的未來,自動化將成為數(shù)據(jù)中心管理的下一個前沿技術(shù)。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論