如何形容傳統(tǒng)運(yùn)維的職業(yè)處境?
如果說的冠冕堂皇些:運(yùn)維人員保障了企業(yè)業(yè)務(wù)的穩(wěn)定性與安全性;
如果說的直白些:傳統(tǒng)運(yùn)維更像消防員,哪里起火救哪里。
若是僅僅如此,倒也還好。可如今,隨著云計(jì)算產(chǎn)業(yè)的日益成熟, AIOps 、DevOps 理念的盛行,大量運(yùn)維工作通過自動化運(yùn)維和智能化運(yùn)維實(shí)現(xiàn),傳統(tǒng)運(yùn)維的生存空間愈發(fā)狹窄。
IDC 預(yù)測, IT 運(yùn)維分析,即 AIOps 市場將從 2018 年的 29 億美元增長到 2023 年的 45 億美元,其中大部分增長來自“AIOps 即服務(wù)”。
按工作內(nèi)容分,運(yùn)維工作包括 IDC 運(yùn)維、網(wǎng)絡(luò)運(yùn)維、桌面運(yùn)維、系統(tǒng)運(yùn)維、應(yīng)用運(yùn)維、運(yùn)維開發(fā)、數(shù)據(jù)庫運(yùn)維,大數(shù)據(jù)運(yùn)維等。其中工作內(nèi)容相對簡單的,比如 IDC 運(yùn)維和網(wǎng)絡(luò)運(yùn)維、系統(tǒng)運(yùn)維、數(shù)據(jù)庫運(yùn)維,最容易被 IAAS 和 AI 取代。
思變持恒。職業(yè)前景面臨挑戰(zhàn)的運(yùn)維們唯一的出路是尋求轉(zhuǎn)型,搏一搏也許還能掙得轉(zhuǎn)機(jī)。考慮到技術(shù)趨勢、運(yùn)維的技術(shù)積累,基于云平臺的技術(shù)運(yùn)營也許是運(yùn)維們的一個不錯的轉(zhuǎn)型方向。TGO 鯤鵬會北京會員熊昌偉有 12 年 SaaS 行業(yè)工作經(jīng)驗(yàn),這位 36 歲的運(yùn)維專家、阿里云 MVP 就職于用友旗下成員企業(yè)暢捷通,任運(yùn)維總監(jiān)。他基于豐富的云平臺研發(fā)、架構(gòu)、運(yùn)營經(jīng)驗(yàn),堅(jiān)定從運(yùn)維管理轉(zhuǎn)型技術(shù)運(yùn)營,從保障產(chǎn)品,轉(zhuǎn)向通過運(yùn)營技術(shù)提升產(chǎn)品價(jià)值。
云計(jì)算的十年
給互聯(lián)網(wǎng)帶來巨變的云計(jì)算可以追溯到 2006 年,當(dāng)時(shí)亞馬遜推出 Elastic Compute Cloud (EC2),為用戶提供虛擬計(jì)算機(jī)租賃服務(wù),用戶可以在上面運(yùn)行他們的應(yīng)用程序,EC2 正是 AWS 的核心。當(dāng)時(shí)沒有人想到,這樣的虛擬計(jì)算機(jī)租賃服務(wù)會在日后成為亞馬遜的重要業(yè)務(wù)。根據(jù)財(cái)報(bào),AWS 2019 年?duì)I收 350 億美元,占亞馬遜整體營收一成以上。
AWS 快速發(fā)展,巨頭紛紛布局。2008 年,谷歌發(fā)布 Google App Engine,日后發(fā)展成為 Google Cloud。2010 年,微軟宣布進(jìn)軍云計(jì)算,推出 Microsoft Azure。至此,巨頭齊聚云計(jì)算戰(zhàn)場。
云計(jì)算讓用戶實(shí)現(xiàn)了按需購買 IT 資源,時(shí)間靈活,而且享有隨意擴(kuò)展的資源彈性。此外,云計(jì)算成為基礎(chǔ)設(shè)施,讓用戶能夠站在巨人的肩膀上,拉平了技術(shù)代溝?;谶@些特點(diǎn),云計(jì)算行業(yè)迅速崛起,被廣泛采用。
2010 年,暢捷通開始采購混合云,到 2015 年全面轉(zhuǎn)向公有云,同時(shí)進(jìn)行了云原生模式的新一代產(chǎn)品研發(fā)。
與歷史上所有前沿技術(shù)趨勢一樣,誕生之初的云計(jì)算,總會對一些舊有職業(yè)產(chǎn)生威脅,傳統(tǒng)運(yùn)維就是其中之一。艾瑞咨詢在今年發(fā)布的《中國 IT 基礎(chǔ)架構(gòu)運(yùn)維市場研究報(bào)告》中指出,由于與云計(jì)算基礎(chǔ)設(shè)施相關(guān)的事件、日志、指標(biāo)、告警等監(jiān)控信 息需要云服務(wù)商來提供基礎(chǔ)數(shù)據(jù),云服務(wù)商開始介入到 IT 基礎(chǔ)架構(gòu)運(yùn)維服務(wù)中,IT 運(yùn)維行業(yè)市場規(guī)??s小,根據(jù)艾瑞咨詢,從 2016 年開始,中國 IT 基礎(chǔ)架構(gòu)運(yùn)維服務(wù)市場增速呈逐年降低趨勢。
“在這個過程中,我深刻的理解到,原有的運(yùn)維模式將發(fā)生巨大的改變,很多我們大量消耗精力的地方,比如機(jī)器、網(wǎng)絡(luò)穩(wěn)定性,數(shù)據(jù)庫高可用等,都不再需要過多的關(guān)注了 ,這樣將釋放出大量的‘剩余勞動力’,去思考如何‘駕馭’好云,‘運(yùn)營’好業(yè)務(wù),” 熊昌偉告訴 TGO 鯤鵬會。
他下定決心,從運(yùn)維模式,轉(zhuǎn)換為技術(shù)運(yùn)營,實(shí)現(xiàn)反向技術(shù)賦能。
相比面向基礎(chǔ)設(shè)施、維持穩(wěn)定,技術(shù)運(yùn)營主要面向業(yè)務(wù),注重提升用戶體驗(yàn)及業(yè)務(wù)經(jīng)營效率,從人員能力建設(shè)以及考核指標(biāo)都全面對標(biāo)用戶的體驗(yàn)與業(yè)務(wù)經(jīng)營,比如從原來應(yīng)用 SLA 的追求,到現(xiàn)在 MTTR、MTBF 與 Apdex 多維考核。
“運(yùn)維人員主要關(guān)注產(chǎn)品穩(wěn)定性,技術(shù)運(yùn)營主要關(guān)注可用性、安全性、成本,只講能用的產(chǎn)品是沒有市場的。”
各大招聘網(wǎng)站對技術(shù)運(yùn)營的崗位描述一般是,負(fù)責(zé)企業(yè)整體業(yè)務(wù)的技術(shù)支撐和服務(wù)。技術(shù)運(yùn)營負(fù)責(zé)運(yùn)維平臺的設(shè)計(jì)及優(yōu)化;根據(jù)產(chǎn)品整體定位幫助運(yùn)維產(chǎn)品進(jìn)行演進(jìn)迭代,實(shí)現(xiàn)產(chǎn)品化和標(biāo)準(zhǔn)化;調(diào)研業(yè)務(wù)的運(yùn)維、安全、效率、成本、質(zhì)量,分析問題并診斷,提供解決方案;深入業(yè)務(wù),通過技術(shù)優(yōu)化產(chǎn)品提升客戶體驗(yàn)。
“技術(shù)運(yùn)營主要是通過整合資源、運(yùn)營技術(shù),賦能研發(fā),使他們能夠自助實(shí)現(xiàn)應(yīng)用全生命周期的管理。我們更多的的發(fā)現(xiàn)整個生命周期中系統(tǒng)平臺支撐的問題進(jìn)行改進(jìn),實(shí)現(xiàn)業(yè)務(wù)狀態(tài)的數(shù)字化,輔助管理業(yè)務(wù)運(yùn)營過程中出現(xiàn)的突發(fā)狀況。日常,我們對業(yè)務(wù)進(jìn)行健康狀態(tài)監(jiān)控分析,出現(xiàn)致命問題時(shí)及時(shí)止損。“
業(yè)務(wù)數(shù)據(jù)數(shù)字化
熊昌偉所就職的暢捷通為小微企業(yè)提供財(cái)務(wù)及管理服務(wù),包括財(cái)務(wù)管理方面的好會計(jì)、T+Cloud、易代賬,進(jìn)銷存管理方面的好生意、T1 plus,人財(cái)貨客一體化管理方面的 T+ & 工作圈、T6 等,增值數(shù)據(jù)分析方面的暢捷貸。
據(jù)介紹,暢捷通已經(jīng)有累計(jì) 466 萬家注冊企業(yè)用戶,暢捷貸已經(jīng)幫助超過 2 萬家小微企業(yè)通過軟件中的財(cái)稅數(shù)據(jù)申請純信用貸款,2019 年為 1.45 萬億交易額提供管理服務(wù)。
熊昌偉面臨的課題是,如何保證如此多用戶的訪問質(zhì)量、以及先于用戶發(fā)現(xiàn)問題。
他的解決途徑是,用模型把業(yè)務(wù)數(shù)據(jù)或者感性數(shù)據(jù)數(shù)字化,用數(shù)字來規(guī)劃業(yè)務(wù)的容量,保障業(yè)務(wù)的可靠運(yùn)行。具體來說,對業(yè)務(wù)數(shù)據(jù)進(jìn)行獲取、表達(dá)、存儲、傳輸、處理、交付,通過數(shù)字化提升解決問題、滿足需求的效率。這樣可以精細(xì)衡量業(yè)務(wù)表現(xiàn)和人效,比如每增加一個人,投入產(chǎn)出的變化能清楚看到。
同時(shí),他在團(tuán)隊(duì)組織架構(gòu)及職能方面,也做了相應(yīng)調(diào)整:將 20 多人的團(tuán)隊(duì)分成 MSP 開發(fā)、OT 開發(fā)、DB、安全、品控幾個小組。其中, MSP 指的是 Managed Service Provider,MSP 開發(fā)負(fù)責(zé)為對內(nèi)和對外的客戶提供一站式的云服務(wù)管理、運(yùn)營平臺,保障平臺的高效、可靠運(yùn)行,并完成面向客戶的管理平臺建設(shè)。OT 指 Operational, Technology,OT 開發(fā)負(fù)責(zé)用科學(xué)的流程與技術(shù)提升業(yè)務(wù)運(yùn)營的層次,完成面向新一代云原生應(yīng)用的可靠性管理系統(tǒng)建設(shè),為公司數(shù)字化運(yùn)營提供完整全面的業(yè)務(wù)數(shù)據(jù)分析呈現(xiàn)。
目前,熊昌偉一天的工作主要圍繞公司所有產(chǎn)品的整體運(yùn)行情況、發(fā)現(xiàn)和解決風(fēng)險(xiǎn)點(diǎn)、提升空間,尋找業(yè)務(wù)亮點(diǎn)。
他提到一個小故事,曾經(jīng)有客服反饋一位客戶單據(jù)丟失,希望找回,同時(shí)希望為客服部門做一個功能,以快速處理類似問題。這樣的功能,如果按照傳統(tǒng)的產(chǎn)品設(shè)計(jì)、開發(fā)、測試上線流程,需要兩周才能完成開發(fā)。熊昌偉的團(tuán)隊(duì)了解后,一方面通過日志系統(tǒng)中的業(yè)務(wù)數(shù)據(jù),快速定位到是客戶的另一個操作導(dǎo)致的單據(jù)刪除,回復(fù)客戶;另一方面,通過服務(wù)化的方式,當(dāng)天就為客服人員提供了自助查詢功能。相比傳統(tǒng)的救火式運(yùn)維,技術(shù)運(yùn)營的價(jià)值更豐富。
對個人而言,技術(shù)運(yùn)營也正成為一個更受市場歡迎的崗位。根據(jù)科銳國際今年的報(bào)告,未來云計(jì)算市場規(guī)模仍將保持 20% 以上的增速,IT 企業(yè)對 “未來懂得最新云計(jì)算技術(shù)的運(yùn)營人才需求激增”。
如何做好轉(zhuǎn)型?
轉(zhuǎn)型首先要解決的是,定位與心態(tài)。熊昌偉認(rèn)為定位方面,要從保障轉(zhuǎn)向服務(wù),為公司、為業(yè)務(wù)的發(fā)展護(hù)航。技術(shù)運(yùn)營要關(guān)注以下幾點(diǎn):
如何促進(jìn)產(chǎn)品成熟?通過量化數(shù)字,真實(shí)、實(shí)時(shí)地反應(yīng)出產(chǎn)品運(yùn)行的狀態(tài)——錯誤、響應(yīng)時(shí)間、用戶路徑等——幫助研發(fā)和產(chǎn)品及時(shí)發(fā)現(xiàn)問題,調(diào)整產(chǎn)品功能和方向。
如何發(fā)揮技術(shù)的價(jià)值?運(yùn)用好云的能力,避免低質(zhì)量的重復(fù)造輪子,降低產(chǎn)品開發(fā)難度,避免基礎(chǔ)組件給產(chǎn)品設(shè)計(jì)、研發(fā)帶來困擾。達(dá)到技術(shù)所見即所得。
如何給用戶帶來感動?深入業(yè)務(wù),通過技術(shù)手段,給客戶帶來超預(yù)期的使用與服務(wù)體驗(yàn)。比如:當(dāng)出現(xiàn)使用問題時(shí),系統(tǒng)能夠識別客戶端的使用問題,對于非通用性問題自動通知后臺服務(wù)人員,對于通用性問題,自動彈出建議方案。
成為企業(yè)的另一個核心競爭力。通過自身能力的打磨,實(shí)現(xiàn)對內(nèi),對外的技術(shù)能力與系統(tǒng)平臺輸出,就像電商出身但現(xiàn)在成為 IaaS 供應(yīng)商的亞馬遜和阿里巴巴。
其次是能力。與所有工作崗位一樣,技術(shù)運(yùn)營在各個公司的定位大相徑庭。熊昌偉介紹,在暢捷通,對技術(shù)運(yùn)營的要求主要是兩個方面。
第一,要懂技術(shù),技術(shù)運(yùn)營不創(chuàng)造技術(shù),是技術(shù)的搬運(yùn)工,要知道如何運(yùn)用好云技術(shù),避免踩坑,避免重復(fù)造輪子。另外,要學(xué)一些架構(gòu)方面的知識和技能,運(yùn)維要求對所負(fù)責(zé)領(lǐng)域精通,而技術(shù)運(yùn)營要了解方方面面的知識,當(dāng)然可能不用都特別深入。
第二,要會布道,很多的好技術(shù)要推廣,要說服,讓這些技術(shù)發(fā)揮出能量,創(chuàng)造出價(jià)值,這樣才能正循環(huán)。
在具體工作中,運(yùn)維轉(zhuǎn)型技術(shù)運(yùn)營要關(guān)注:
運(yùn)營的數(shù)字化。運(yùn)營數(shù)字化聚焦在故障的生命周期,從故障的發(fā)現(xiàn)、定位到處置操作,要做到感知的泛在化、認(rèn)知的智能化和操作的無人化,即 AIOps 的落地。
能力的中臺化。能力中臺化是指在構(gòu)建運(yùn)維的平臺,讓可感知的網(wǎng)元,可編程的網(wǎng)元能力沉淀,運(yùn)維能力顯性化。
運(yùn)維的研發(fā)化。讓運(yùn)維人員進(jìn)行研發(fā),人創(chuàng)造機(jī)器,再由機(jī)器取代人來做維護(hù),這個落地就是 OpsDev,基于顯性化的運(yùn)維能力,各個專業(yè)領(lǐng)域都要自治。
組織的敏捷化。暢捷通打造了幾大敏捷的組織,包括 GMC(全局監(jiān)控)、SRE(應(yīng)急保障)、BOE(業(yè)務(wù)準(zhǔn)確性保障)以及 OPE(運(yùn)維平臺的開發(fā))。這其中,SRE 是最重要的破局點(diǎn),暢捷通組建了一個較大規(guī)模的 SRE 團(tuán)隊(duì)去開發(fā)和運(yùn)維。
在實(shí)際工作中,技術(shù)運(yùn)營要面臨的另一個難題在于工作產(chǎn)出的衡量。運(yùn)維更像滅火隊(duì),在問題出現(xiàn)的時(shí)候去解決,那么可以通過解決掉的問題來衡量工作價(jià)值,比如故障的發(fā)生率、應(yīng)用的可用率。相比之下,技術(shù)運(yùn)營需要發(fā)現(xiàn)隱患,在問題出現(xiàn)和爆發(fā)前就解決掉。熊昌偉建議,針對技術(shù)運(yùn)營,可以通過發(fā)現(xiàn)的風(fēng)險(xiǎn)點(diǎn)數(shù)量、或者對于故障的定位解決速度的提升來考核其表現(xiàn)。
完成轉(zhuǎn)型技術(shù)運(yùn)營的標(biāo)準(zhǔn)是什么?
是否真正完成技術(shù)運(yùn)營轉(zhuǎn)型,主要看工作模式是否改變。不要簡單重復(fù)三次同樣的操作,必須時(shí)刻思考如何提煉出標(biāo)準(zhǔn)流程,固化到系統(tǒng)中。技術(shù)運(yùn)營必須堅(jiān)持“賦能”研發(fā)與業(yè)務(wù),學(xué)習(xí)他們的工作模式,發(fā)現(xiàn)其中的不便與斷層,做好膠水層,讓各方業(yè)務(wù)流程通暢。最終,技術(shù)運(yùn)營的精神思想與能力都能通過系統(tǒng)和平臺交付出去。