Gartner預測,到2019年底,全球四分之一的企業(yè)將策略性地實施AIOps,支持兩個或更多的IT運營功能。而到2022年,40%的大型企業(yè)將結合大數(shù)據(jù)和機器學習功能,支持和部分替代監(jiān)測、服務臺和自動化流程和任務。
利用AIOps進行IT運營,此刻,正在到來。您所在的企業(yè),目前正站在哪個位置上呢?
畢竟,AIOps解決方案的最終目標是讓工程師的生活更美好,這是所有IT人致力的目標,我們值得付出。
業(yè)務性能場景引領AIOps快速發(fā)展
從以下圖中,可知在DEM、ITM、NPMD、APM等幾個監(jiān)控領域都可以發(fā)展AIOps能力。AIOps需要在大量數(shù)據(jù)的場景下,結合機器學習、深度學習等AI技術才能發(fā)揮較大作用,而業(yè)務性能監(jiān)控的場景正滿足于此。這正是華青融天較早使用AI技術來研究業(yè)務性能監(jiān)控的市場需求之源。
華青融天的業(yè)務性能監(jiān)控產(chǎn)品有一定的創(chuàng)新性,它通過旁路鏡像的方式實時獲取到網(wǎng)絡流量數(shù)據(jù)包,進行協(xié)議解析后,獲得大量的動態(tài)業(yè)務數(shù)據(jù),尤其在金融、稅務、證券等場景中有很好的應用。
這個業(yè)務性能監(jiān)控對于Gartner定義的應用性能監(jiān)控(APM)是一個很大的擴展和創(chuàng)新,它們實現(xiàn)的技術方式不同,華青融天業(yè)務性能監(jiān)控產(chǎn)品是通過旁路鏡像的方式采集數(shù)據(jù),而傳統(tǒng)的APM更多采用撥測或agent方式采集數(shù)據(jù)。
雖然技術實現(xiàn)方式不同,目標仍然都是保障應用系統(tǒng)的可用性和提升用戶體驗。國外廠商比較多使用傳統(tǒng)的APM方式,提供應用性能監(jiān)控、基礎設施監(jiān)控、數(shù)字化體驗管理、混合云監(jiān)控等一體化方案。
而國內大型企業(yè),特別是在生產(chǎn)環(huán)境中更青睞于華青融天這種基于網(wǎng)絡旁路流量數(shù)據(jù)采集和解碼的方式,實現(xiàn)對應用性能指標的實時監(jiān)控和告警,保證對應用系統(tǒng)本身非侵入、零影響。
華青融天這種業(yè)務性能監(jiān)控的技術實現(xiàn)方式,也得到了Gartner APM領域研究專家的業(yè)內認可。
未來:運維數(shù)據(jù)平臺+智能分析大腦+自動化工具
企業(yè)數(shù)字化轉型對應用系統(tǒng)運維提出更高的要求,要求監(jiān)控粒度更細,告警定位更準,業(yè)務性能監(jiān)控產(chǎn)品正在與大數(shù)據(jù)、機器學習、云計算等技術相結合,未來的產(chǎn)品定位應重點關注以下幾個方向:
1)智能化
智能化已經(jīng)成為企業(yè)在動態(tài)和復雜的IT環(huán)境中應用系統(tǒng)監(jiān)控的必需品,運維部門采集的數(shù)據(jù)種類和數(shù)量已經(jīng)呈現(xiàn)了指數(shù)級的增長,繼續(xù)依賴人工分析已經(jīng)無法滿足需要。利用海量、實時、全棧的監(jiān)控數(shù)據(jù),通過AI算法,替代或部分替代傳統(tǒng)的人工分析,給出問題定位和運維決策的建議,縮短MTTR (平均故障恢復時間),并通過迭代提高分析和決策的準確性。
2)數(shù)據(jù)融合
業(yè)務性能監(jiān)控產(chǎn)品需要擴大攝取數(shù)據(jù)類型的范圍,包括網(wǎng)絡流量數(shù)據(jù)、日志數(shù)據(jù)、應用系統(tǒng)追蹤文件和基礎監(jiān)控指標等,通過對這些數(shù)據(jù)的實時分析和歷史分析,實現(xiàn)細粒度的實時監(jiān)控和全棧式視圖。網(wǎng)絡流量數(shù)據(jù)適用于端到端的性能監(jiān)控和跨業(yè)務節(jié)點的交易追蹤; 日志數(shù)據(jù)和應用系統(tǒng)追蹤文件有助于問題定位和根因推斷; 與基礎監(jiān)控指標關聯(lián)可以分析資源的可用性和性能瓶頸。
數(shù)據(jù)融合和開放性不僅包含攝取數(shù)據(jù)的完整性和融合,也包含對各種采集數(shù)據(jù)、統(tǒng)計分析的指標數(shù)據(jù)、告警數(shù)據(jù)、決策建議等對外提供服務。
3)平臺化
智能運維(AIOps)未來將是一個大數(shù)據(jù)和人工智能或機器學習技術相結合的軟件平臺,以增強和部分取代傳統(tǒng)的IT運維流程和任務,包括可用性和性能監(jiān)控、事件相關性與分析、IT服務管理和自動化。既提供平臺能力,用戶可以在此之上實現(xiàn)交互式分析,也提供開箱即用的運維工具。
Gartner預計,在未來五年中,大范圍的AIOps平臺將成為交付AIOps功能的主要形式,而不是像目前這樣嵌入在APM、NPMD(網(wǎng)絡性能管理和診斷)或ITIM(IT基礎設施監(jiān)控)等監(jiān)控工具中的AIOps功能。
4)業(yè)務價值
業(yè)務性能監(jiān)控目前主要針對IT運維和應用系統(tǒng)支持,而一些更領先的企業(yè)已經(jīng)開始使用這些數(shù)據(jù)分析的結果向業(yè)務部門和領導者提供洞察力。 運維數(shù)據(jù)中既包含技術的指標,也包含業(yè)務的指標,如交易量、交易類型、渠道分布、客戶來源、交易金額等,這些都是企業(yè)重要的數(shù)據(jù)資產(chǎn), 可以實現(xiàn)業(yè)務數(shù)據(jù)可視化、 實時業(yè)務分析、業(yè)務預測和用戶行為分析等。
企業(yè)的數(shù)據(jù)中心正在從IT視角轉變?yōu)闃I(yè)務視角,從成本中心轉變?yōu)槔麧欀行?,既保障業(yè)務系統(tǒng)的“穩(wěn)定”、“安全”、“可靠”運行 ,又通過數(shù)據(jù)分析和服務幫助企業(yè)提升“客戶體驗”、“運營效率”和“業(yè)務收益”。
綜上所述, 應用性能監(jiān)控產(chǎn)品的未來是運維數(shù)據(jù)平臺+智能分析大腦+自動化工具,運維數(shù)據(jù)平臺是基礎,智能分析大腦是能力,自動化工具是手段。
敬請期待
華青融天業(yè)務性能監(jiān)控產(chǎn)品EZSonar 4 以大數(shù)據(jù)融合平臺為基礎,通過數(shù)據(jù)融合和AI引擎,持續(xù)增加AIOps能力,已經(jīng)推出了動態(tài)基線告警、聚合維度告警、流量數(shù)據(jù)與日志數(shù)據(jù)融合、實時數(shù)據(jù)服務、業(yè)務儀表盤、所見即所得報表、平臺自運維等功能,使告警更有效,分析和定位問題更方便,數(shù)據(jù)更開放,配置管理更簡單,提升產(chǎn)品實用性和易用性。
EZSonar 4 即將發(fā)布新的迭代版本 EZSonar 4.2, 繼續(xù)推出告警分析結果智能推薦、告警對象精細化、告警合并策略等新功能,上述功能的特點和使用場景近期會陸續(xù)介紹,敬請期待。