數(shù)字化運維的“行”與“思”

鄭凱Kay
傳統(tǒng)IT運維工作可以用“背鍋俠”來形容,很多企業(yè)的系統(tǒng)出現(xiàn)故障,第一時間總是找運維部門解決問題。作為“互聯(lián)網(wǎng)消防兵”,運維工作通常最為忙碌,就如像消防員一樣,時刻保持警惕,準備著救急救火。

“先研發(fā)之憂而憂,后業(yè)務之樂而樂;起早與貪黑齊飛,調(diào)休共假期待定”,這就是我們對傳統(tǒng)運維的固有認知。

傳統(tǒng)IT運維工作可以用“背鍋俠”來形容,很多企業(yè)的系統(tǒng)出現(xiàn)故障,第一時間總是找運維部門解決問題。作為“互聯(lián)網(wǎng)消防兵”,運維工作通常最為忙碌,就如像消防員一樣,時刻保持警惕,準備著救急救火。

但伴隨著數(shù)字化轉(zhuǎn)型的深入,企業(yè)的應用系統(tǒng)越來越多,越來越復雜,傳統(tǒng)的IT系統(tǒng)與保障方式已不能適應新需求的變化。能夠讓運維產(chǎn)生更多價值,提升運維人員效率的數(shù)字化運維呼之欲出。

從傳統(tǒng)運維向數(shù)字化運維轉(zhuǎn)型

IT運維誕生于最早的信息化時代。在信息化時代,企業(yè)的信息化系統(tǒng),主要為了滿足企業(yè)內(nèi)部管理的需求。通常是集中、可控和固化的煙囪式架構(gòu)。傳統(tǒng)IT運維,以人力運維為主,在單點式和煙囪式的架構(gòu)中,的確起到了非常重要的作用。

2345截圖20211028093243.png

我們知道,傳統(tǒng)運維模式關注的是單臺IT設備的故障率或單套應用系統(tǒng)的可用性,系統(tǒng)與系統(tǒng)之間,設備與設備之間,是彼此孤立的。

所以當業(yè)務系統(tǒng)發(fā)生故障時,首先由各個運維崗位對各自負責的設備、應用組件、系統(tǒng)進行自檢。期間還會召集硬件設備提供商、軟件系統(tǒng)開發(fā)商、集成商等眾多服務商進行“會診”,整個流程拖沓而漫長。

但進入到云計算時代之后,IT的邊界被完全打開,更多的聯(lián)接、更多的設備、云化的系統(tǒng)和應用,以數(shù)據(jù)中心為例,采用分布式系統(tǒng),且集群龐大,傳統(tǒng)運維方式明顯已經(jīng)無法應對這么復雜的IT環(huán)境。

因此數(shù)字化運維手段和工具的引入,不僅可以幫助運維業(yè)務減輕工作負擔,提高效率,還可以改變運維的現(xiàn)狀,幫助其走向數(shù)字化轉(zhuǎn)型。

例如,隨著機器學習、深度學習等技術的不斷成熟,AI技術將在業(yè)務運維體系中得到廣泛的應用,也同時推動了智能運維的發(fā)展趨勢,可以將運維人員從紛繁復雜、過度依賴人工的監(jiān)控、發(fā)現(xiàn)、告警和修復工作中徹底解放出來,而運維也將變得更加自動化、智能化。

企業(yè)快速發(fā)展,應用不停地迭代,運維體系也需要不斷迭代,從傳統(tǒng)運維走向數(shù)字化運維,顯然是大勢所趨。

數(shù)字化運維的“道”

客觀地說,數(shù)字化運維應該是智能化運維發(fā)展中的一個重要階段,它對企業(yè)來說意義非凡。怎么如何衡量一個好的運維服務體系呢?

第一點,數(shù)字化運維的架構(gòu),首先要有堅實的底座,因為數(shù)字化運維的服務主要以云化部署,要求平臺的能力積累和資源足夠厚重。2018年,華為就發(fā)布了神農(nóng)統(tǒng)一運維平臺IMOC,基于IMOC,全面支撐起數(shù)字化的運維服務。

第二點,服務的解決方案要足夠豐富,企業(yè)隨著數(shù)字化轉(zhuǎn)型的深入,不僅在日常運維上需求升級,更在數(shù)字化轉(zhuǎn)型咨詢或是數(shù)字化運營這些更高維度上,對運維服務有新的需求。而華為的運維服務解決方案集,則具備了業(yè)界豐富的服務體系。

2345截圖20211028093243.png

第三點,行業(yè)場景與運維體系相結(jié)合,產(chǎn)生了很多個性化的服務需求。因此,不斷拓展服務場景,亦是運維服務升級的未來方向,如今華為的運維服務解決方案已深入到智慧城市、智慧交通、平安城市、智慧政務和智慧能源等多個行業(yè)場景。

第四點,沒有一家企業(yè)能夠解決企業(yè)所有在運維服務上的需求,在運維服務領域也需要豐富的生態(tài)伙伴,共同去面對企業(yè)在運維服務上的復雜性,并提供聯(lián)合解決方案。華為的周圍也聚攏了大量的運維伙伴,與華為共同打造端到端的行業(yè)運維方案。

2345截圖20211028093243.png

總體而言,我們從華為運維服務解決方案的體系建設上,看到了數(shù)字化運維未來發(fā)展的方向。

數(shù)字化運維時代一直“在路上”

那么在數(shù)字化運維的角度,企業(yè)的運維部門需要有哪些技術方向的突破?

2345截圖20211028093243.png

首先,企業(yè)運維希望能夠?qū)︼L險有一定的預知能力,尤其當安全風險越來越需要全局視角的當下,風險的可預知,可以減輕運維部門很多的壓力。

其次,在安全領域,態(tài)勢感知是一個大家熟知的技術。它是基于環(huán)境的、動態(tài)、整體地洞悉安全風險的能力,依托的是大數(shù)據(jù),也是從全局視角發(fā)現(xiàn)識別并響應處置。很明顯,運維與安全有很多想通之處,所以態(tài)勢可感知也將是數(shù)字化運維不可或缺的技術項。

最后,運維與運營雖然只有一字之隔,但意義卻完全不同。運營是建立在良好的運維之上,從“穩(wěn)定活著”走向“主動經(jīng)營”的IT管理模式。從運維向運營轉(zhuǎn)型,是每個運維部門的愿景。

據(jù)我了解,華為將發(fā)布行業(yè)運維HI-OPS3.0。在風險可預知方向,跨層跨域快定界,預測預防控全局;在勢可感知方向,全鏈路打通,化繁為簡,業(yè)務態(tài)勢實時可感知;在價值可運營方向,構(gòu)建業(yè)務目標驅(qū)動的運維價值模型與體系。

事實上,數(shù)字化運維在企業(yè)端的滲透率遠遠不足,推動數(shù)字化運維的全面實現(xiàn),華為一直在努力。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論