為什么維護工作讓數(shù)據(jù)中心工作人員夜不能寐?

搜狐科技
數(shù)據(jù)中心運維管理
數(shù)據(jù)中心的正常運行時間對于企業(yè)的業(yè)務(wù)成功至關(guān)重要,而確保不間斷服務(wù)需要維護人員時刻保持警惕和維護。隨著企業(yè)越來越多地部署業(yè)務(wù)關(guān)鍵型應(yīng)用程序,這種對持續(xù)維護和依賴基礎(chǔ)設(shè)施的需求也在增加。 雖然運營商不...

數(shù)據(jù)中心的正常運行時間對于企業(yè)的業(yè)務(wù)成功至關(guān)重要,而確保不間斷服務(wù)需要維護人員時刻保持警惕和維護。隨著企業(yè)越來越多地部署業(yè)務(wù)關(guān)鍵型應(yīng)用程序,這種對持續(xù)維護和依賴基礎(chǔ)設(shè)施的需求也在增加。

雖然運營商不斷創(chuàng)新以引入新的基礎(chǔ)設(shè)施管理工具,但許多工具仍然無法實現(xiàn)業(yè)界所追求的提高自動化和減少維護的要求。因此,許多IT專業(yè)人員仍在全天候地人工處理需要調(diào)整的問題。

運營商在與客戶溝通時不斷出現(xiàn)的一個主要痛點是維護周期仍然需要人為干預(yù)。此外,運營商將大部分預(yù)算用于保持?jǐn)?shù)據(jù)中心持的續(xù)運營狀態(tài),并大量支出運營預(yù)算。

這就產(chǎn)生了一個問題:盡管運營商不斷采用新的工具來處理這個問題,為什么維護工作仍然讓數(shù)據(jù)中心工作人員夜不能寐。到底哪里出現(xiàn)了問題?

傳統(tǒng)基礎(chǔ)設(shè)施工具的不足之處

真正消除管理基礎(chǔ)設(shè)施的負(fù)擔(dān)需要具有預(yù)見性,以便在問題發(fā)生之前預(yù)測問題,同時能夠提供對工作負(fù)載和資源的深刻洞察力,以便更好地優(yōu)化基礎(chǔ)設(shè)施。

這就產(chǎn)生了一個問題:盡管運營商不斷采用新的工具來處理這個問題,為什么維護工作仍然讓數(shù)據(jù)中心工作人員夜不能寐。到底哪里出現(xiàn)了問題?

為了讓工作人員不再為數(shù)據(jù)中心維護而失眠??紤]以下四個因素來確定運營商的工具是否在克服令人沮喪的維護問題方面做得不夠:

1、不具備學(xué)習(xí)能力

只是提供本地系統(tǒng)指標(biāo)的分析往往提供有限的價值。相反,運營商應(yīng)該在工具中獲得的是能夠從數(shù)千個對等系統(tǒng)的行為中學(xué)習(xí)的能力,以幫助檢測和診斷發(fā)展中的問題。從某種意義上說,可以集思廣益。

數(shù)據(jù)收集和分析的整體方法可以從大量的工作負(fù)載中匯集觀測結(jié)果。這允許在一個站點識別的罕見事件在另一個站點被預(yù)先避免,并且更準(zhǔn)確地檢測更常見的事件。

2、未能看到整體情況

傳統(tǒng)工具通常只能以孤島的方式提供分析;每個設(shè)備僅提供系統(tǒng)狀態(tài),這只是整個過程的一部分。由于在基礎(chǔ)設(shè)施堆棧中任何地方都會出現(xiàn)中斷應(yīng)用程序的問題,因此有必要有能力跨多個層進行跨堆棧分析,以獲得更大的視野。這將需要諸如應(yīng)用程序、計算、虛擬化、數(shù)據(jù)庫、網(wǎng)絡(luò)和存儲等關(guān)鍵組件。

3、不夠了解深入

預(yù)測建模需要深入的領(lǐng)域經(jīng)驗—了解基礎(chǔ)設(shè)施堆棧中每個系統(tǒng)內(nèi)的所有操作、環(huán)境和遙測參數(shù)。通用的分析只能如此深入。人工智能行業(yè)專家可以采用機器學(xué)習(xí)算法從歷史事件中識別因果關(guān)系,進而預(yù)測最復(fù)雜和最具破壞性的問題。

4、不能自主操作

也許傳統(tǒng)工具的最大缺點是無法采取自主行動。而在理想的自主操作狀態(tài)下,數(shù)據(jù)中心將是自我管理、自我修復(fù)和自我優(yōu)化。從本質(zhì)上講,他們應(yīng)該能夠避免問題或改善環(huán)境,而無需管理員的人為干預(yù)。要實現(xiàn)這種自動化水平,需要經(jīng)過驗證的自動化建議歷史記錄,以提供必要的信任和信心。

數(shù)據(jù)中心維護的未來

為了克服傳統(tǒng)工具的局限性,并降低維護需求,以及使數(shù)據(jù)中心自動化——人們將不得不采用新一代的人工智能解決方案。這意味著利用能夠觀察、學(xué)習(xí)、預(yù)測、推薦并最終實現(xiàn)自動化的工具。

通過觀察,人工智能將能夠針對各種工作負(fù)載和應(yīng)用程序開發(fā)對理想操作環(huán)境的穩(wěn)態(tài)理解。深度系統(tǒng)遙測與全球連接相結(jié)合,可以實現(xiàn)快速的云計算機學(xué)習(xí),從而使人工智能工具能夠通過模式匹配算法快速預(yù)測問題。甚至可以根據(jù)過去的歷史配置和工作負(fù)載模式為新的基礎(chǔ)設(shè)施建模和調(diào)整應(yīng)用程序性能。

基于這些預(yù)測分析,人工智能解決方案可以改善數(shù)據(jù)中心環(huán)境所需的適當(dāng)響應(yīng),最后將消除IT團隊的壓力,他們不再需要通宵達(dá)旦地管理基礎(chǔ)設(shè)施,并尋找問題的根源。更重要的是,如果人工智能被證明是有效的,那么可以在沒有IT管理人員干預(yù)的情況下自動應(yīng)用。對于數(shù)據(jù)中心來說,這正是實現(xiàn)自動化的目標(biāo)。

例如HPE公司的客戶利用人工智能工具在86%的時間內(nèi)自動預(yù)測和解決問題。此外,他們在存儲問題上減少了85%的時間,甚至可以減少79%的IT存儲運營支出。因此,部署人工智能以協(xié)助數(shù)據(jù)中心基礎(chǔ)設(shè)施的優(yōu)勢是不可否認(rèn)的。

隨著技術(shù)進步促進市場發(fā)展,預(yù)計到2030年,一些國家和地區(qū)將面臨200萬IT專業(yè)人才短缺的情況。而自動化將成為數(shù)據(jù)中心管理的未來前沿技術(shù)。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論