數(shù)字化時代,重新思考IT運維價值

數(shù)字化轉(zhuǎn)型的規(guī)劃階段可采用自上而下的策略(即遞推分解任務(wù)),在實施階段則采用自下而上的策略(解決分治任務(wù)),最終由局部數(shù)字化管理的實現(xiàn)推動公司整體數(shù)字化轉(zhuǎn)型。

【摘要】數(shù)字化能為企業(yè)帶來什么價值?傳統(tǒng)ROI績效指標(biāo)與客戶價值創(chuàng)造驅(qū)動的方式有何不同?進(jìn)入數(shù)智萬物的數(shù)字世界,技術(shù)本身的追求不應(yīng)該作為金融公司技術(shù)團(tuán)隊的價值創(chuàng)造,而是應(yīng)該圍繞在企業(yè)價值下重新思考運維價值,由新的運維價值重新設(shè)計運維的數(shù)字化世界。

【作者】彭華盛,廣發(fā)證券數(shù)字化運維研發(fā)團(tuán)隊負(fù)責(zé)人。超過10年的金融領(lǐng)域運維工作,期間負(fù)責(zé)參與企業(yè)運維組織、流程、工具的建設(shè),包括各類重大業(yè)務(wù)系統(tǒng)項目與數(shù)據(jù)中心工程性項目的實施,數(shù)據(jù)中心標(biāo)準(zhǔn)化工作流程構(gòu)建,運維工具體系的規(guī)劃與研發(fā)、數(shù)字化轉(zhuǎn)型研究與實施相關(guān)等工作,對金融領(lǐng)域的運維有較全面的理解。近年來專注數(shù)字化轉(zhuǎn)型研究,探索推進(jìn)數(shù)字化技術(shù)與業(yè)務(wù)轉(zhuǎn)型雙輪驅(qū)動的協(xié)同模式,推進(jìn)業(yè)務(wù)數(shù)字化轉(zhuǎn)型。平時喜歡研究新技術(shù)、新理念、思維模式、產(chǎn)品設(shè)計等等,樂于分享。騰訊TVP成員。

1數(shù)字化時代己至

數(shù)字化戰(zhàn)略上升到國家層面。2019年10月28日至31日召開的中共十九屆四中全會上,審議通過了《中共中央關(guān)于堅持和完善中國特色社會主義制度、推進(jìn)國家治理體系和治理能力現(xiàn)代化若干重大問題的決定》,決定指出:“要健全勞動、資本、土地、知識、技術(shù)、管理、數(shù)據(jù)等生產(chǎn)要素由市場評價貢獻(xiàn)、按貢獻(xiàn)決定報酬的機制”。這是中央首次公開提出將數(shù)據(jù)作為生產(chǎn)要素參與分配,意味著數(shù)據(jù)從技術(shù)中獨立出來,作為一種單獨的生產(chǎn)要素而存在。這傳遞了兩層含義,一是數(shù)據(jù)己對國家經(jīng)濟(jì)增長產(chǎn)生突出貢獻(xiàn),提升現(xiàn)有產(chǎn)品和服務(wù)生產(chǎn)效率,并創(chuàng)造全新的產(chǎn)品和服務(wù);二是數(shù)據(jù)作為商品參與的產(chǎn)出分配與收入分配,背后涉及經(jīng)濟(jì)結(jié)構(gòu)的變化,將對行業(yè)產(chǎn)生顛覆性的作用。

監(jiān)管高度重視數(shù)字化轉(zhuǎn)型。連續(xù)三屆的深交所技術(shù)大會均圍繞數(shù)字化轉(zhuǎn)型:2018年的“科技引領(lǐng)·邁向數(shù)字化新時代”,2019年的“科技引領(lǐng)·構(gòu)建行業(yè)數(shù)字化新生態(tài)”,2020年的“科技引領(lǐng)·共譜數(shù)字化新篇章”,證監(jiān)會副主席李超在2020年深交所技術(shù)大會上指出:近年來,證監(jiān)會認(rèn)真貫徹落實黨中央、國務(wù)院關(guān)于建設(shè)數(shù)字中國的決策部署,扎實做好頂層設(shè)計,制定全系統(tǒng)數(shù)據(jù)體系建設(shè)和發(fā)展規(guī)劃,優(yōu)化科技監(jiān)管體系,增強科技監(jiān)管效能,大力建設(shè)數(shù)字化應(yīng)用平臺,積極開展金融科技創(chuàng)新試點,持續(xù)推動數(shù)字化戰(zhàn)略有效落地。

金融經(jīng)營機構(gòu)數(shù)字化正當(dāng)其時。隨著新一代科技革命和產(chǎn)業(yè)變革深入發(fā)展,數(shù)字化浪潮蓬勃興起,數(shù)字化不僅影響了證券行業(yè)客戶、市場、上下游合作伙伴等價值鏈要素,將重構(gòu)整個行業(yè)的價值體系。以證券公司為例,券商面臨的風(fēng)險挑戰(zhàn)主要包括:互聯(lián)網(wǎng)原生企業(yè)的顛覆、國內(nèi)銀行與保險混業(yè)營、國外領(lǐng)先投行進(jìn)入中國重塑了新的行業(yè)競爭格局;以個性化、定制化、場景化為特點的消費方式重塑了現(xiàn)有客戶服務(wù)模式;信息傳遞方向從PC、移動為代表的方式向,萬物互聯(lián)、線上線下融合,信息精準(zhǔn)觸達(dá)的方式變化;企業(yè)內(nèi)部運營管理從經(jīng)驗驅(qū)動向以數(shù)據(jù)感知、洞察、決策、執(zhí)行閉環(huán)的智能運營的模式持續(xù)改進(jìn);員工與企業(yè)的關(guān)系從雇傭關(guān)系向員工賦能的方式變化,協(xié)同的節(jié)點從圍繞企業(yè)為中心向共生、共創(chuàng)的協(xié)同網(wǎng)絡(luò)的模式轉(zhuǎn)變。

2轉(zhuǎn)型推動企業(yè)價值創(chuàng)造的轉(zhuǎn)變

盡管大部分企業(yè)都知道需要數(shù)字化轉(zhuǎn)型,但對于如何數(shù)字化轉(zhuǎn)型,往哪些場景轉(zhuǎn)型,如何轉(zhuǎn)型可能會比較模糊,圍繞價值創(chuàng)造角度是一個方法。

關(guān)于“價值”的觀點:

陳春花教授在2020年經(jīng)營關(guān)鍵詞提到:“在數(shù)字化時代,企業(yè)真實的定義是創(chuàng)造顧客價值,所以2020年首先的經(jīng)營策略選擇,應(yīng)該是為顧客創(chuàng)新價值以驅(qū)動增長。如何真正去理解顧客價值,如何借助于技術(shù)創(chuàng)新,為顧客創(chuàng)造價值,是獲得增長的根本來源。”

在《價值革命:重構(gòu)商業(yè)模式的方法論》一書中提到當(dāng)前判斷一個企業(yè)商業(yè)模型是否成立的核心標(biāo)準(zhǔn)在于價值創(chuàng)造和價值捕獲這兩個維度是否平衡,即你在為用戶創(chuàng)造價值的同時,自身是否能夠從中獲取價值。價值創(chuàng)造重點是以客戶為中心為為客戶創(chuàng)造價值,價值捕獲是在價值創(chuàng)造的前提下企業(yè)自身能夠從中獲得的價值。

2019年,ITIL4標(biāo)準(zhǔn)正式發(fā)布,重點聚焦企業(yè)IT管理的價值。隨著技術(shù)的快速發(fā)展,業(yè)務(wù)迭代加速,外部形勢越來越嚴(yán)峻,IT組織面臨越來越多的雜亂無章的工作,ITIL4提出標(biāo)準(zhǔn)化、自動化服務(wù)價值流,釋放IT人力創(chuàng)造新的價值。ITIL4鼓勵組織打破信息孤島,強調(diào)跨組織的協(xié)作和溝通,并將敏捷和DevOps實踐集成到框架當(dāng)中,改進(jìn)價值交付能力。

思考一:數(shù)字化能為企業(yè)帶來什么價值呢?

在IDG對全球領(lǐng)先的702位IT和商業(yè)決策者調(diào)查結(jié)果,他們認(rèn)為數(shù)字化轉(zhuǎn)型將從企業(yè)管理、業(yè)務(wù)經(jīng)營等產(chǎn)出價值,具體如下:

1.提升員工生產(chǎn)力(52%):通過移動化、數(shù)據(jù)化、在線化等工具加強協(xié)同,提高員工生產(chǎn)力。

2.數(shù)據(jù)驅(qū)動業(yè)務(wù)(49%):利用數(shù)據(jù)與業(yè)務(wù)模式的融合,將更好的管理業(yè)務(wù)洞察、決策、執(zhí)行。

3.提升客戶體驗(46%):利用數(shù)據(jù)能更好的理解、洞察客戶需求與客戶反饋,并快速且準(zhǔn)確的滿足客戶體驗。

4.業(yè)務(wù)在線(46%):構(gòu)建全在線的業(yè)務(wù)交付方式,落地實時在線的數(shù)據(jù)資產(chǎn)。

5.流程自動化(37%):通過自動化業(yè)務(wù)及運營流程,釋放生產(chǎn)力。

6.增加收入來源(33%):圍繞數(shù)據(jù)形成新的業(yè)務(wù)或產(chǎn)品模式,增加收入。

7.促進(jìn)產(chǎn)品創(chuàng)新(31%):通過數(shù)字化將為產(chǎn)品的升級及創(chuàng)新提供新的源泉。

結(jié)合IDG調(diào)研,以及對數(shù)字化轉(zhuǎn)型的理解,我總結(jié)一下數(shù)字化轉(zhuǎn)型為企業(yè)帶來的三個最重要的價值:

1.提升客戶體驗,創(chuàng)造客戶價值,實時感知客戶需求,快速響應(yīng)客戶,為客戶提供個性化服務(wù);

2.加快速業(yè)務(wù)創(chuàng)新,重塑商業(yè)模式,以客戶為中心的價值創(chuàng)造與價值捕獲方式重塑現(xiàn)有業(yè)務(wù)模式,提升業(yè)務(wù)競爭力、增加收入;

3.提升運營效能,提能增效,盤活公司資源配置,促進(jìn)協(xié)同,激活員工參與,重塑員工生產(chǎn)力,建立企業(yè)內(nèi)外雙在線的工作模式。

思考二:傳統(tǒng)ROI績效指標(biāo)與客戶價值創(chuàng)造驅(qū)動的方式有何不同?

說到價值創(chuàng)造,還有一個詞是價值捕獲。以往,企業(yè)更關(guān)注價值捕獲,ROI(投資回報率)是價值捕獲的一個評估指標(biāo),百度百科的定義是:通過投資而應(yīng)返回的價值,即企業(yè)從一項投資活動中得到的經(jīng)濟(jì)回報,它涵蓋了企業(yè)的獲利目標(biāo)。

ROI是一個有形的,可量化的績效指標(biāo),在一個確定性比較強的商業(yè)世界里,ROI很有指導(dǎo)意義,ROI是衡量一個企業(yè)盈利狀況所使用的比率,是衡量一個企業(yè)經(jīng)營效果和效率的一項綜合性的指標(biāo)。但進(jìn)入數(shù)字化時代后,企業(yè)的客戶、市場、供應(yīng)商等價值鏈要素都發(fā)生了巨大變化,企業(yè)面臨環(huán)境的最大特征是復(fù)雜性與不確定性?!秂dge價值驅(qū)動的數(shù)字化轉(zhuǎn)型》中引自哥倫比亞商學(xué)院教授Rita Mcgrath的觀點:“在當(dāng)今快節(jié)奏、不確定的世界里,可持續(xù)競爭優(yōu)勢本身己經(jīng)不存在,取而代之的是短暫的競爭優(yōu)勢,在這種競爭優(yōu)勢中,快速學(xué)習(xí)和高適應(yīng)力是通過成功的入場券。”也就是說,Rita Mcgrath的觀點快速響應(yīng)能力、適應(yīng)力和客戶價值應(yīng)該成為商業(yè)投資的驅(qū)動。

數(shù)字化時代復(fù)雜性、不確定性、非線性等特征,導(dǎo)致原來ROI不能作為企業(yè)最關(guān)鍵的驅(qū)動的績效指標(biāo),而應(yīng)該認(rèn)識到企業(yè)成功的并非要考慮如何搭建商業(yè)模式,而是要看到機遇,如何滿足用戶需求。所謂的“機遇/需求”就是“價值”在企業(yè)實踐中的具體表現(xiàn)形式:找到目標(biāo)用戶,發(fā)現(xiàn)他們急需解決的問題,并為用戶提供解決方案,這就是價值主張。也就是說,數(shù)字化時代,企業(yè)的價值創(chuàng)造要以客戶價值創(chuàng)造、快速響應(yīng)與適應(yīng)能力作為關(guān)鍵的績效指標(biāo)。

3數(shù)智萬物下,IT運維何去何從?

進(jìn)入數(shù)智萬物的數(shù)字世界,技術(shù)本身的追求不應(yīng)該作為金融公司技術(shù)團(tuán)隊的價值創(chuàng)造,而是應(yīng)該圍繞在企業(yè)價值下重新思考運維價值,由新的運維價值重新設(shè)計運維的數(shù)字化世界。

數(shù)字化及數(shù)字化轉(zhuǎn)型定義比較多,前期對相關(guān)定義作了一個解釋:數(shù)字化轉(zhuǎn)型是以數(shù)字化思維,通過數(shù)字化技術(shù)的應(yīng)用,構(gòu)建一個符合企業(yè)價值創(chuàng)造與價值捕獲的數(shù)字世界,對現(xiàn)有商業(yè)模式、運營方式、企業(yè)文化進(jìn)行創(chuàng)新和重塑,實現(xiàn)業(yè)務(wù)價值。也就是說數(shù)字化時代,企業(yè)將圍繞客戶價值創(chuàng)造與價值捕獲重塑一個數(shù)字世界,我們都將進(jìn)入一個數(shù)智萬物的時代。聽起來有點抽象,但其實,IT運維應(yīng)該對數(shù)字化并不陌生,IT運維工作實際上是一個相對數(shù)字化的環(huán)境:

運維協(xié)同網(wǎng)絡(luò)中面臨的硬件機器、軟件資產(chǎn)、配置信息、架構(gòu)、運行狀態(tài)、業(yè)務(wù)運營狀況等都是比較適合數(shù)字化或已經(jīng)數(shù)字化;

運維關(guān)鍵的工作流程有成熟的ITIL、ISO20000、ISO9001、ITSS、DevOps等方法論推動線下到線上;

運維的很多線下的工作在很多年以前便開始推進(jìn)自動化、在線化;

配置、日志、監(jiān)控、流程等數(shù)據(jù)也有較成熟的技術(shù)方案實現(xiàn)集中的持久化。

所以,數(shù)字化轉(zhuǎn)型對于運維帶來的挑戰(zhàn)不是數(shù)字化的技術(shù)表現(xiàn),而是數(shù)字化轉(zhuǎn)型推動新技術(shù)、新場景的快速迭代,讓運維面臨的復(fù)雜度、不確定性因素加大,這與傳統(tǒng)運維對于穩(wěn)定、可靠的追求相反。

那么,運維應(yīng)該如何應(yīng)對復(fù)雜性與不確定性?類似OKR的思路中目標(biāo)是從企業(yè)目標(biāo)不斷分解,傳遞到組織、團(tuán)隊、個人,我的老板提出了一種遞歸的思路看待企業(yè)價值的分解與傳遞。他認(rèn)為數(shù)字化轉(zhuǎn)型實施可借鑒計算機“遞歸算法”,即把整體問題分解成規(guī)??s小的同類問題,然后逐步遞歸調(diào)用解決。遞歸算法的關(guān)鍵是總體目標(biāo)的實現(xiàn),由目標(biāo)一致的細(xì)分方法不斷分解來實現(xiàn)。他認(rèn)為在數(shù)字化轉(zhuǎn)型的規(guī)劃階段可采用自上而下的策略(即遞推分解任務(wù)),在實施階段則采用自下而上的策略(解決分治任務(wù)),最終由局部數(shù)字化管理的實現(xiàn)推動公司整體數(shù)字化轉(zhuǎn)型。基于這種由企業(yè)到IT組織,再到運維的價值傳遞,下面先介紹IT價值。

3.1 IT價值創(chuàng)造的演進(jìn)

企業(yè)要實現(xiàn)價值創(chuàng)造,需要從輸入客戶需求開始,由業(yè)務(wù)產(chǎn)品或服務(wù)進(jìn)行交付,實現(xiàn)業(yè)務(wù)價值創(chuàng)造與價值捕獲,IT的價值則需要瞄準(zhǔn)業(yè)務(wù)目標(biāo)進(jìn)行轉(zhuǎn)變。結(jié)合前面提到的“提升客戶體驗、加快業(yè)務(wù)創(chuàng)新交付、為運營提能增效”三個數(shù)字化轉(zhuǎn)型價值,我們可以先看看IT價值的變化。

傳統(tǒng)的IT組織架構(gòu)通常包括公司層面與部門層面。公司層面的分管CIO或CTO,IT治理委員會,公司級的項目辦公室。部門層面則包括:IT規(guī)劃管理,即根據(jù)公司戰(zhàn)略及業(yè)務(wù)發(fā)展,設(shè)計IT體系架構(gòu)和部署線路;IT研發(fā)管理,即根據(jù)現(xiàn)有IT系統(tǒng)架構(gòu)和系統(tǒng),受理業(yè)務(wù)功能優(yōu)化需求,支持業(yè)務(wù)開展;IT運維管理,即提供基礎(chǔ)設(shè)施環(huán)境支持,確保業(yè)務(wù)連續(xù)性、可用性、安全性,提供IT運營服務(wù)支持;IT信息安全管理,即制定信息安全制度、流程、技術(shù)管控,確保信息系統(tǒng)、數(shù)據(jù)安全運行;以及,其他IT測試/質(zhì)量管理、IT項目管理、人員管理、外包管理等。傳統(tǒng)的IT能力體系可以歸納為下圖,在這個圖中如果說應(yīng)用研發(fā)、數(shù)據(jù)治理服務(wù)、質(zhì)量/測試是為了活得更好,那么運維管理是為了能活下去,這點在金融行業(yè)尤為重要。

1.png

在IT組織架構(gòu)中,IT部門主要承擔(dān)成本中心角色,主要以技術(shù)提供者身份出現(xiàn),強調(diào)被動支持業(yè)務(wù)需求與運行保障。隨著業(yè)務(wù)與科技的快速發(fā)展,IT系統(tǒng)環(huán)境發(fā)生了巨大變化:架構(gòu)層逐漸從本地化轉(zhuǎn)向云化、虛擬化,應(yīng)用層的應(yīng)用數(shù)量激增,迭代速度加快,業(yè)務(wù)復(fù)雜度與系統(tǒng)架構(gòu)越來越復(fù)雜,系統(tǒng)間關(guān)聯(lián)度高,數(shù)據(jù)量呈指數(shù)級增長等變化,而現(xiàn)有成本中心的工作模式將受挑戰(zhàn)?;诖?,IT部門工作方式需由被動響應(yīng)方式向主動運營方式轉(zhuǎn)型,將IT價值從被動支撐中逐步分離出來。首先是向強調(diào)IT主動服務(wù)能力的服務(wù)中心角色轉(zhuǎn)型,目標(biāo)是打造敏捷型的團(tuán)隊,提升IT交付效能,更好的支撐業(yè)務(wù)發(fā)展的需要。在實現(xiàn)服務(wù)中心后,下一步是致力于主動利用數(shù)字化技術(shù)創(chuàng)造新的業(yè)務(wù)機會,從IT資源中尋求更多的業(yè)務(wù)突破,引領(lǐng)業(yè)務(wù)創(chuàng)新,即由服務(wù)中心向業(yè)務(wù)創(chuàng)新中心轉(zhuǎn)型。在實現(xiàn)業(yè)務(wù)創(chuàng)新中心的同時,近年來不少商業(yè)銀行成立IT子公司,向利潤輸出的價值中心轉(zhuǎn)型,為企業(yè)外部市場提供IT服務(wù),為企業(yè)創(chuàng)造更多收入。

2.png

IT要成為價值中心,推動業(yè)務(wù)高質(zhì)量的發(fā)展,重點是讓公司更好的實現(xiàn)“提升客戶體驗、加快業(yè)務(wù)創(chuàng)新交付、為運營提能增效”三個價值。轉(zhuǎn)換成IT能力包括以下6個:

連續(xù)性保障能力:以數(shù)據(jù)驅(qū)動的業(yè)務(wù)連續(xù)性保障與風(fēng)險防控能力;

客戶服務(wù)能力:以客戶為中心的“感知、決策、執(zhí)行”的服務(wù)能力;

快速交付能力:利用敏捷、設(shè)計思維等方法,推動技術(shù)平臺轉(zhuǎn)型,快速支持業(yè)務(wù),交付新產(chǎn)品、新服務(wù)的創(chuàng)新能力;

生態(tài)擴展能力:開放的場景接入,融入或構(gòu)建生態(tài)的能力;

IT服務(wù)能力:提升IT服務(wù)效能,靈活彈性、安全可靠的技術(shù)基礎(chǔ)資源交付能力;

運營協(xié)同能力:構(gòu)建高效的數(shù)字化工作空間,優(yōu)化資源配置,為運營提能增效。

上述6大IT能力的建設(shè),需要從組織文化、流程機制、技術(shù)平臺三個角度制定相應(yīng)措施,比如在組織文化方面,在合規(guī)風(fēng)控基礎(chǔ)上推行敏捷文化,增加扁平化、柔性化、網(wǎng)絡(luò)化的敏捷組織架構(gòu),打造快速響應(yīng)能力;在流程機制方面,以數(shù)字化協(xié)同網(wǎng)絡(luò)、數(shù)據(jù)智能、敏捷交付等數(shù)字化思維,重塑協(xié)同機制等;在技術(shù)平臺方面,推動業(yè)務(wù)中臺、數(shù)據(jù)中臺、技術(shù)中臺等共享能力中心的技術(shù)架構(gòu)轉(zhuǎn)型,推動大數(shù)據(jù)應(yīng)用、智能應(yīng)用、自動化應(yīng)用、智能風(fēng)控等數(shù)據(jù)應(yīng)用建設(shè),以及建立云數(shù)據(jù)中心,一體化運維平臺等技術(shù)平臺。

3.2從IT能力建設(shè)驅(qū)動運維價值創(chuàng)造

3.2.1運維面臨的挑戰(zhàn)與轉(zhuǎn)型

傳統(tǒng)的運維團(tuán)隊,通常按職能劃分不同的縱向職能型團(tuán)隊,比如:應(yīng)用/業(yè)務(wù)運維、運行操作、系統(tǒng)運維、網(wǎng)絡(luò)運維、硬件資源運維、安全風(fēng)險運維、服務(wù)管理幾個部分,不同企業(yè)對于具體團(tuán)隊的職能可能有所不同或合并。進(jìn)入數(shù)字化時代,IT架構(gòu)面臨的復(fù)雜性越來越高,以證券行業(yè)為例,對證券實時交易而言,業(yè)務(wù)停滯一秒均可能帶來巨大損失,證券自身的業(yè)務(wù)特點以及外部監(jiān)管“零容忍”的要求,信息系統(tǒng)業(yè)務(wù)連續(xù)性的訴求遠(yuǎn)高于其他行業(yè),確保業(yè)務(wù)連續(xù)性成為證券行業(yè)IT運維的核心任務(wù),業(yè)務(wù)連續(xù)性管理的總體目標(biāo)是提高公司的風(fēng)險防范能力、有效地減少非計劃的業(yè)務(wù)中斷、防范運維操作風(fēng)險,對于首次出現(xiàn)的未知異常能夠利用工具量化分析并快速定位,確保在重大災(zāi)難性事件發(fā)生后能按計劃恢復(fù)業(yè)務(wù)連續(xù)性。

在這樣的背景下,近年來傳統(tǒng)的運維團(tuán)隊認(rèn)識到采用原來被動救火式、問題驅(qū)動式、操作運維、經(jīng)驗運維等特點己不能有效支撐公司業(yè)務(wù)發(fā)展與轉(zhuǎn)型,所以不少企業(yè)的運維提出了一些轉(zhuǎn)型的思路,比如:

從被動救火式向主動精細(xì)化轉(zhuǎn)型,專業(yè)化分工、標(biāo)準(zhǔn)化流程、建立橫向持續(xù)優(yōu)化型團(tuán)隊;

從問題驅(qū)動向服務(wù)驅(qū)動轉(zhuǎn)型,抽象運維IT服務(wù)能力,建立IT服務(wù)目錄,量化IT服務(wù)輸出能力。

從操作運維向運維研發(fā)轉(zhuǎn)型,為運維人員提供運維研發(fā)平臺,降低運維研門檻,快速落地一些緊迫的運維工具,降低操作性、重復(fù)性的運維工作;

從依靠經(jīng)驗向數(shù)據(jù)驅(qū)動運維轉(zhuǎn)型,結(jié)合數(shù)據(jù)分析、知識庫、機器學(xué)習(xí)技術(shù)促進(jìn)運維智能化。

從運維向IT運營轉(zhuǎn)型,這里的IT運營通常圍繞IT自身的效能提升、風(fēng)險控制、降低成本角度,開展數(shù)據(jù)分析。

還有其它類似SRE、AIOps、NOOps等轉(zhuǎn)型。

上述轉(zhuǎn)型主要通過運維內(nèi)部自發(fā)性、偏技術(shù)角度驅(qū)動,容易出現(xiàn)與公司價值不匹配,轉(zhuǎn)型方向有誤,產(chǎn)出不明顯,投入不能持續(xù)等問題。從價值傳遞的角度,我覺得運維轉(zhuǎn)型要從公司價值主張出發(fā),傳遞到需要IT能力,再思考需要什么運維價值。也就是說,圍繞“提升客戶體驗、加快業(yè)務(wù)創(chuàng)新交付、為運營提能增效”三個企業(yè)的轉(zhuǎn)型價值,分析客戶及業(yè)務(wù)價值主張,了解客戶與業(yè)務(wù)的痛點,再從IT團(tuán)隊“客戶服務(wù)、連續(xù)性保障、快速交付、生態(tài)擴展、IT服務(wù)、運營協(xié)同”6大能力角度,分析運維在數(shù)字化轉(zhuǎn)型過程中的關(guān)鍵價值。

總結(jié)起來,我覺得運維可以考慮圍繞“提高業(yè)務(wù)連續(xù)保障水平”、“提升業(yè)務(wù)交付效率”、“輔助提升客戶體驗”、“提升IT運營服務(wù)質(zhì)量”。

3.2.2提高業(yè)務(wù)連續(xù)性保障水平

1、提升業(yè)務(wù)連續(xù)性保障水平的方法

業(yè)務(wù)連續(xù)性管理是整個運維,乃至IT最基本的工作,業(yè)務(wù)連續(xù)性問題事關(guān)IT是否“活下去”。在業(yè)務(wù)連續(xù)保障的思維中,可以參考架構(gòu)設(shè)計中“故障一定會發(fā)生”的思路,梳理分解影響業(yè)務(wù)連續(xù)性因素,量化這些因素的評估能力,持續(xù)完善組織能力、流程機制、應(yīng)用架構(gòu)與工具平臺支撐。業(yè)務(wù)連續(xù)性保障是運維的重中之重。在金融行業(yè)里的業(yè)務(wù)連續(xù)性通常采用BCM(業(yè)務(wù)連續(xù)性管理),百度百科對BCM的定義:業(yè)務(wù)連續(xù)性管理(Business Continuity Management,簡稱BCM),是一項綜合管理流程,它使企業(yè)認(rèn)識到潛在的危機和相關(guān)影響,制訂響應(yīng)、業(yè)務(wù)和連續(xù)性的恢復(fù)計劃,其總體目標(biāo)是為了提高企業(yè)的風(fēng)險防范能力,以有效地響應(yīng)非計劃的業(yè)務(wù)破壞并降低不良影響。

3.jpg

上圖是介紹BCM的一張圖,從上圖可以大概看到影響業(yè)務(wù)連續(xù)性的要素,每個要素的缺失都可能引發(fā)業(yè)務(wù)連續(xù)性問題,即類似木桶原理,影響要素的最短板決定整個業(yè)務(wù)連續(xù)性。進(jìn)入數(shù)字化時代,政策、市場、業(yè)務(wù)模式、外部安全、系統(tǒng)架構(gòu)、迭代效率、新技術(shù)的應(yīng)用等因素進(jìn)一步增加了業(yè)務(wù)連續(xù)性的不確定性。結(jié)合生產(chǎn)事件的工作經(jīng)驗再總結(jié)一下影響業(yè)務(wù)連續(xù)性的因素:變更問題、維護(hù)問題、性能容量問題、操作問題/誤操作、容災(zāi)/應(yīng)用架構(gòu)高可用、應(yīng)用邏輯缺陷、版本控制、產(chǎn)品或功能設(shè)計不足、數(shù)據(jù)質(zhì)量、高可用有效性、應(yīng)急方案、技術(shù)保障方案不完善、應(yīng)急預(yù)案缺失、應(yīng)急演練不到位、問題跟蹤不閉環(huán)、參數(shù)設(shè)置問題、配置問題、人員技能不足、流程機制不完善、外部攻擊、基礎(chǔ)設(shè)施異常、數(shù)據(jù)備份、數(shù)據(jù)丟失、監(jiān)控發(fā)現(xiàn)及時性、故障處置時效性等(詳細(xì)可見下面的魚骨圖)。

4.png

2、如何提升業(yè)務(wù)連續(xù)性保障

以前面影響要素中的“故障處置場景“為例,我從一個故障處理流程步驟,量化業(yè)務(wù)連續(xù)性相關(guān)指標(biāo)以便我們分析如何達(dá)到”提升業(yè)務(wù)續(xù)性保障水平”:

1)監(jiān)控自動發(fā)現(xiàn)事件的百分比;

2)監(jiān)控發(fā)現(xiàn)事件的平均時間;

3)備機接管成功次數(shù)百分比、備機接管的平均時間;

4)應(yīng)用級異常自愈自動化成功率(分為應(yīng)用程序健壯性涉及的降級、熔段等,與應(yīng)用程序以外的自動化自愈);

5)業(yè)務(wù)影響分析,涉及業(yè)務(wù)中斷或重要業(yè)務(wù)量損失比例;

6)問題診斷分析及解決的平均時長;

7)應(yīng)急協(xié)同響應(yīng)時長;

8)應(yīng)急恢復(fù)時效性與平均處理時長;

可以看到,第1-2針對故障發(fā)現(xiàn),第3-4針對應(yīng)急自動化接管成功情況下,第5-8針對接管失敗或無法自動化下的應(yīng)急恢復(fù)。對上面8個指標(biāo)進(jìn)行運營分析,可以驅(qū)動故障處置場景的連續(xù)性保障能力,具體分析后的點:如何提升監(jiān)控覆蓋面,如何提升監(jiān)控發(fā)現(xiàn)事件的及時性,如何提升架構(gòu)或容災(zāi)的可用性,如何提升應(yīng)用架構(gòu)非功能設(shè)計水平,如何快速感知業(yè)務(wù)影響,如何加快問題診斷,如何加強應(yīng)急協(xié)同,如何加強應(yīng)急處置的工具及技能。即,分解影響業(yè)務(wù)連續(xù)性因素節(jié)點,量化評估節(jié)點的有效性或運作質(zhì)量,通過可量化指標(biāo)及工作流程機制驅(qū)動組織能力、流程協(xié)同機制、工具的完善,提升業(yè)務(wù)連續(xù)性、健壯性。

隨著生產(chǎn)環(huán)境復(fù)雜性不斷增加,影響業(yè)務(wù)連續(xù)性要素越來越多,在現(xiàn)有人力與技術(shù)手段下,運維團(tuán)隊將很難有效保證業(yè)務(wù)連續(xù)性,利用新一代數(shù)字技術(shù)在復(fù)雜的IT世界中建立適應(yīng)性系統(tǒng)是必由之路。提升業(yè)務(wù)連續(xù)性的方法有:

1)以“連接網(wǎng)絡(luò)+數(shù)據(jù)驅(qū)動”重塑“監(jiān)管控析”運維平臺化能力。“連接網(wǎng)絡(luò)+數(shù)據(jù)驅(qū)動”不僅僅是實現(xiàn)運維數(shù)據(jù)“采存管算用”的技術(shù)能力,而是要以業(yè)務(wù)為中心,重新梳理與業(yè)務(wù)互聯(lián)網(wǎng)絡(luò)連接的點,圍繞業(yè)務(wù)連續(xù)性價值驅(qū)動運行數(shù)據(jù)的在線落地,將上帝視角的數(shù)據(jù)分析能力融入到“監(jiān)管控析”平臺。

2)以主動的運行數(shù)據(jù)分析推動應(yīng)用架構(gòu)的健壯性。通過性能、容量、安全、可用性、業(yè)務(wù)感知、客戶反饋等運行分析評估數(shù)據(jù),輔助研發(fā)團(tuán)隊發(fā)現(xiàn)線上潛在問題,在異常問題爆發(fā)前優(yōu)化應(yīng)用,提升系統(tǒng)健壯性。

3)加強應(yīng)急管理、可用性管理能力,推動運維前移,加強應(yīng)用架構(gòu)非功能性設(shè)計。

4)落地敏穩(wěn)雙態(tài)的運維模式。敏穩(wěn)雙態(tài)的運維模式將長期并存,針對不同態(tài)的應(yīng)用系統(tǒng)建立不同的連續(xù)性保障方式,穩(wěn)中求穩(wěn),敏中求快。

5)優(yōu)化協(xié)同機制,采用運維工作場景全在線的方式提升運維工作的工作在線、操作自動化、可視可控。

6)持續(xù)推進(jìn)運維組織人員能力建設(shè),建立學(xué)習(xí)型組織,推動可用性、穩(wěn)定性為目標(biāo)的SRE模式。

7)云化基礎(chǔ)設(shè)施,提升基礎(chǔ)設(shè)施的穩(wěn)定性、高可用、安全性、彈性伸縮能力。

8)建立混沌工程,主動檢測、演練、發(fā)現(xiàn)、修復(fù)影響業(yè)務(wù)連續(xù)性因素的風(fēng)險。

9)加強數(shù)據(jù)應(yīng)用,健全應(yīng)對新技術(shù)風(fēng)險的信息安全防控體系。

3.2.3提升業(yè)務(wù)交付效率

1、提升業(yè)務(wù)交付效率方法

如果說數(shù)字化轉(zhuǎn)型中業(yè)務(wù)轉(zhuǎn)型的關(guān)鍵是以客戶為中心,那么技術(shù)轉(zhuǎn)型關(guān)鍵是快速交付、快速適應(yīng)。

提升業(yè)務(wù)交付效率應(yīng)以IT關(guān)鍵價值鏈作為切入點。我們知道軟件生命周期(SDLC)主要包括:構(gòu)思、論證、需求分析、方案設(shè)計、開發(fā)、系統(tǒng)測試、用戶驗收、部署發(fā)布、生產(chǎn)維護(hù)、后評價、退出,這個過程形成了全生命周期的IT風(fēng)險管理。對SDLC進(jìn)行分析,可以考慮分解以下三條價值鏈路:

1)IT需求交付價值鏈(項目、需求、設(shè)計、研發(fā)、測試、發(fā)布)

2)IT服務(wù)交付價值鏈(SLI、SLO、SLA、服務(wù)目錄、服務(wù)請求、服務(wù)響應(yīng)、服務(wù)反饋)

3)IT系統(tǒng)退出(投入收益指標(biāo)化、運營、評估效能、啟動退出、釋放資源)

可以考慮從以下幾個角度切入來提升交付效率:

1)從業(yè)務(wù)需求及產(chǎn)品設(shè)計角度,更快的感知客戶需求,準(zhǔn)確挖掘痛點,利用設(shè)計思維及MVP等思路引導(dǎo)業(yè)務(wù)構(gòu)思,建立敏捷型的產(chǎn)品研發(fā)模式,加快業(yè)務(wù)交付效率。

2)運用更靈活的中臺架構(gòu),比如中臺架構(gòu)的可復(fù)用、可共享、組件服務(wù)化,沉淀業(yè)務(wù)邏輯及技術(shù)標(biāo)準(zhǔn),加快前臺應(yīng)用的敏捷。

3)推進(jìn)更先進(jìn)的應(yīng)用架構(gòu),比如云原生方法論,包括容器化、微服務(wù)等,全面向云化的技術(shù)架構(gòu)轉(zhuǎn)型。

4)DevOps的持續(xù)交付能力建設(shè),推動全鏈路的持續(xù)集成,持續(xù)發(fā)布工具鏈及協(xié)同模式建設(shè)。

5)利用混合云的基礎(chǔ)設(shè)施,發(fā)揮云計算彈性、靈活、自動化等特征,屏蔽基礎(chǔ)設(shè)施的復(fù)雜性。

6)建立數(shù)字化的系統(tǒng)投入與收益評估模型,推動系統(tǒng)退出機制,釋放資源投入到業(yè)務(wù)需求。

從上面幾點,我覺得運維可以重點圍繞:利用運行數(shù)據(jù)運營分析輔助業(yè)務(wù)決策(第1點)、推進(jìn)持續(xù)交付中的持續(xù)發(fā)布能力建設(shè)(第4點)、云化基礎(chǔ)設(shè)施(第5點)、建立系統(tǒng)退出機制(第6點)。

2、運維如何提升業(yè)務(wù)交付效率?

利用運行數(shù)據(jù)運營分析輔助業(yè)務(wù)決策。相比于產(chǎn)品、需求、研發(fā)、測試等IT崗位,金融企業(yè)的運維崗位是一個復(fù)雜的、綜合性技能的工作崗位,需要掌握大量的方法論與技術(shù)棧。也正是因為運維崗位的綜合性,運維應(yīng)該結(jié)合運維對應(yīng)用系統(tǒng)邏輯、鏈路等架構(gòu),以及己掌握的運行狀態(tài)與業(yè)務(wù)感知數(shù)據(jù),為業(yè)務(wù)感知、業(yè)務(wù)運營、業(yè)務(wù)創(chuàng)新等提供決策支持。具體的包括:利用線上化及自動化工具平臺支撐,將運維從操作性、重復(fù)性的工作中釋放出來;利用運維數(shù)據(jù)分析、數(shù)據(jù)可視化等,為業(yè)務(wù)提供應(yīng)用運營效能、業(yè)務(wù)狀態(tài)感知,輔助業(yè)務(wù)決策信息;利用運維工具,比如監(jiān)管撥測、性能管理等工具,輔助業(yè)務(wù)更快的感知新業(yè)務(wù)上線后的運營狀況。舉個例子,為了快速將新產(chǎn)品或需求上線,系統(tǒng)可能會減少相關(guān)運營類數(shù)據(jù)分析工作,如果運維快速提供相關(guān)新產(chǎn)品或需求的實時運營狀況,就能幫助業(yè)務(wù)更快的感知新業(yè)務(wù)落地情況,適時調(diào)整運營方式。

推進(jìn)持續(xù)交付中的持續(xù)發(fā)布能力建設(shè)。市場的高速變化,需要業(yè)務(wù)保持敏捷的適應(yīng)能力,快速抓住商業(yè)機會,快速迭代業(yè)務(wù)需求,不斷試錯。對技術(shù)來說,IT需要擁有持續(xù)交付的能力,包括需求、研發(fā)、測試、運維的交付過程。金融企業(yè)研發(fā)、測試、開發(fā)在組織層面進(jìn)行分離,結(jié)合康威定律,比較好的持續(xù)交付落地方式應(yīng)該是多個團(tuán)隊共同參與CI與CD的建設(shè)。運維側(cè)可以牽頭CD側(cè)的平臺落地工作,通常讓整個發(fā)布部署流水線在線化,可以讓軟件測試、部署、發(fā)布更加快速,并通過在線化讓發(fā)布過程人人可見,更早的發(fā)現(xiàn)并解決問題,在線的進(jìn)行部署版本管理。另外,對于敏捷型的發(fā)布模式,AB測試、灰度也是實現(xiàn)軟件持續(xù)交付的方式。

云化基礎(chǔ)設(shè)施。云計算將傳統(tǒng)硬件、系統(tǒng)軟件等復(fù)雜的基礎(chǔ)設(shè)施資源進(jìn)行整合和自動化,過濾技術(shù)細(xì)節(jié),為上層面的應(yīng)用場景提供簡單、按需、所見即所得的基礎(chǔ)設(shè)施服務(wù),極大的提升研發(fā)工作效率、減少重復(fù)建設(shè)、提升資源利用率,且平臺對資源需求的彈性支撐有助于保障應(yīng)用系統(tǒng)更有效的應(yīng)對市場行情的波動。證券公司的云平臺通常采用混合云模式,可以考慮以私有云建立完整的IAAS和PAAS,并根據(jù)業(yè)務(wù)需要引入行業(yè)云、公有云,其中涉及敏感數(shù)據(jù)的應(yīng)用系統(tǒng)部署于私有云,非敏感信息部署于行業(yè)云或公有云。

建立系統(tǒng)退出機制。隨著企業(yè)IT建設(shè)不斷建設(shè),只上不下的模式將大大占用IT資源,系統(tǒng)數(shù)量的不斷增加需要配套投入更多的人力、硬件、正版化軟件、網(wǎng)絡(luò)帶寬、基礎(chǔ)設(shè)備等資源。按國家計算機相關(guān)認(rèn)證考試評估,軟件上線后的IT運行管理階段是SDLC(軟件全生命周期)中持續(xù)時間最長,投入最大的階段,約占60%-80%。以數(shù)據(jù)驅(qū)動的方式加強IT運營管理將有助于提高應(yīng)用系統(tǒng)運營效能,通過定期識別并釋放低效能業(yè)務(wù)系統(tǒng)資源,將有效IT資源傾斜到高效能的應(yīng)用系統(tǒng),以此來提升IT交付業(yè)務(wù)的效率。

3.2.4輔助提升客戶體驗

以客戶為中心,提升客戶體驗己作為大部分公司轉(zhuǎn)型的關(guān)鍵戰(zhàn)略目標(biāo)。

百度百科對客戶體驗作了一個定義:“是一種純主觀的在用戶使用產(chǎn)品過程中建立起來的感受”。從企業(yè)角度看客戶體驗,需要建立客戶體驗管理,建立客戶與企業(yè)接觸的全觸點的用戶旅程,包括感知、搜索、推送、使用、傾聽、反饋等,以持續(xù)提升產(chǎn)品、營銷、服務(wù)的系統(tǒng)性工程。Gartner對客戶體驗管理作了如下定義:“設(shè)計和響應(yīng)客戶互動以滿足或超越客戶期望的做法,從而提高客戶滿意度,忠誠度和倡導(dǎo)度。”

1、客戶體驗管理方法

主動優(yōu)化客戶體驗,關(guān)鍵是構(gòu)建與用戶的各種連接,采用與用戶相關(guān)度更強的思維方式,做出可執(zhí)行的業(yè)務(wù)策略組合,在實施上可以從用戶故事分析、客戶感知、客戶溝通、產(chǎn)品交互、產(chǎn)品設(shè)計五方面開展。用戶故事分析,即按客戶與我司業(yè)務(wù)的接觸點,對現(xiàn)有產(chǎn)品或服務(wù)整個生命周期進(jìn)行分解,對每個接觸環(huán)節(jié)的客戶操作友好性進(jìn)行針對性優(yōu)化;客戶感知,即加強感知客戶體驗數(shù)據(jù)的獲取,包括業(yè)務(wù)應(yīng)用中客戶端數(shù)據(jù)埋點、一線員工反饋、對關(guān)聯(lián)客戶行為分析、外部輿論等,利用數(shù)據(jù)處理技術(shù)深入洞察,探尋用戶顯性與隱性需求;客戶溝通,即與客戶建立友好的客戶溝通閉環(huán),為客戶提供方便的溝通渠道,為一線業(yè)務(wù)提供更全面數(shù)據(jù)支撐,加強應(yīng)對客戶反饋的在線實時性;產(chǎn)品交互,即結(jié)合社交、視頻、物聯(lián)網(wǎng)新一代產(chǎn)品交互方式,用戶可以通過自然語言、沉浸智能等產(chǎn)品交互方式獲得業(yè)務(wù)服務(wù),激發(fā)客戶積極性與深度參與;產(chǎn)品設(shè)計,培養(yǎng)產(chǎn)品經(jīng)理的設(shè)計思維,加強業(yè)務(wù)與技術(shù)的深度融合。

CRM,即客戶關(guān)系管理,百度百科字義為:“企業(yè)為提高核心競爭力,利用相應(yīng)的信息技術(shù)以及互聯(lián)網(wǎng)技術(shù)協(xié)調(diào)企業(yè)與顧客間在銷售、營銷和服務(wù)上的交互,從而提升其管理方式,向客戶提供創(chuàng)新式的個性化的客戶交互和服務(wù)的過程”。CRM重點是從企業(yè)出發(fā),改善用戶關(guān)系,給企業(yè)帶來利潤。從價值角度看,CRM關(guān)注價值捕獲,但進(jìn)入數(shù)字化轉(zhuǎn)型時代,強調(diào)客戶價值創(chuàng)造,要明確客戶價值主張,解決客戶痛點,實現(xiàn)客戶價值,在這樣的基礎(chǔ)上企業(yè)的價值捕獲自然會得到。

數(shù)字化轉(zhuǎn)型下的客戶體驗管理需要從客戶角度出發(fā),關(guān)注客戶的感覺、情感,所以下面引出CEM的方法。CEM是客戶體驗管理的一個方法論,管理客戶對產(chǎn)品或公司全面體驗的過程,在IBM、奔馳、DELL等國外企業(yè)得到應(yīng)用。CEM以提高客戶整體體驗為出發(fā)點,注重與客戶的每一次接觸,通過協(xié)調(diào)整合售前、售中和售后等各個階段,各種客戶接觸點,或接觸渠道,有目的地,無縫隙地為客戶傳遞目標(biāo)信息,創(chuàng)造匹配品牌承諾的正面感覺,以實現(xiàn)良性互動,進(jìn)而創(chuàng)造差異化的客戶體驗,實現(xiàn)客戶的忠誠,強化感知價值,從而增加企業(yè)收入與資產(chǎn)價值。通過對客戶體驗加以有效把握和管理,可以提高客戶對公司的滿意度和忠誠度,并最終提升公司價值。

CEM核心理念主要包括3部分:Listen(傾聽反饋),Analyze(挖掘價值),Action(行動指引)。具體的,Listen重點是指收集線上公開數(shù)據(jù)與打通個業(yè)內(nèi)部數(shù)據(jù),打破信息孤島,關(guān)注數(shù)據(jù)采集、客戶感知等;Analyze重點是對在線數(shù)據(jù)進(jìn)行分析,實時分析挖掘,洞察客戶觀點與需求,競品信息、市場信息等,關(guān)注數(shù)據(jù)分析能力;Action重點是通過數(shù)據(jù)洞察,輔助管理或產(chǎn)品設(shè)計者決策,并推動一線業(yè)務(wù)的客戶服務(wù)決策,關(guān)注自動化決策、主動客戶服務(wù)等。

2、運維應(yīng)該如何提升客戶體驗?

結(jié)合上面提到的從“Listen,Analyze,Action”三個角度,我們看看運維能做些什么。

增加客戶行為數(shù)據(jù)的收集與分析,為產(chǎn)品設(shè)計的決策提供輔助數(shù)據(jù)。數(shù)據(jù)資產(chǎn)將成為公司核心競爭力,業(yè)務(wù)在線通常是數(shù)字化資產(chǎn)化的第一步。全方位的在線數(shù)據(jù)通常包括:員工行為數(shù)據(jù)、客戶行為數(shù)據(jù)、競爭環(huán)境、業(yè)務(wù)經(jīng)營數(shù)據(jù)、業(yè)務(wù)/運營管理數(shù)據(jù)5類。員工行為數(shù)據(jù)主要包括員工團(tuán)隊協(xié)作、工作執(zhí)行、完成質(zhì)量、意見反饋等數(shù)據(jù);客戶行為數(shù)據(jù)是客戶體驗優(yōu)化的前提,主要包括客戶行為,包括客戶的個性化喜好,客戶對企業(yè)數(shù)字產(chǎn)品的反饋等;商業(yè)環(huán)境數(shù)據(jù)包括客戶群、競爭對手、合作伙伴、監(jiān)管的變化,以及合作伙伴活動、競爭對手舉措、行業(yè)趨勢、監(jiān)管政策、宏觀經(jīng)濟(jì)等;經(jīng)營數(shù)據(jù)是數(shù)字化轉(zhuǎn)型績效指標(biāo)。提升客戶體驗,運維側(cè)重點要關(guān)注客戶行為、業(yè)務(wù)/運營管理數(shù)據(jù)。運維涉及大量的應(yīng)用日志、性能管理、網(wǎng)絡(luò)報文、功能監(jiān)控、業(yè)務(wù)撥測、各類SLI等數(shù)據(jù),這些數(shù)據(jù)以往主要用于運維業(yè)務(wù)連續(xù)性保障方面的實時監(jiān)控、性能分析等用途,對于業(yè)務(wù)數(shù)據(jù)分析來說可以說是一個未開采的寶藏。以網(wǎng)絡(luò)報文為例,以往應(yīng)用系統(tǒng)通常將交易的結(jié)果持久化,網(wǎng)絡(luò)報文一方面能補充交易節(jié)點之間的通訊過程數(shù)據(jù),形成端到端的數(shù)據(jù)連接,另一方面這類數(shù)據(jù)通過NPM等技術(shù)能實現(xiàn)低延時的持久化與分析能力,對于提升客戶體驗來說是一個很好的數(shù)據(jù)資產(chǎn)。同時,應(yīng)用日志,以及監(jiān)控數(shù)據(jù)等數(shù)據(jù),在客戶體驗分析方面也有獨特的作用,這些數(shù)據(jù)都可以作為企業(yè)數(shù)據(jù)資產(chǎn)的補充。

加強業(yè)務(wù)系統(tǒng)的性能管理,優(yōu)化響應(yīng)效率。雷軍也說:拋開性能談體驗全部是耍流氓。谷歌有一個關(guān)于網(wǎng)頁響應(yīng)時間最大值1秒的觀點,他們作了一個調(diào)查研究,發(fā)現(xiàn)如果移動網(wǎng)頁加載時間超過1秒,用戶就不愿停留在頁面上。同樣的例子,網(wǎng)絡(luò)延遲每增加0.4秒,亞馬遜每年損失16億美金,而每減少0.4秒,雅虎訪問量就會增加9%。由于當(dāng)前系統(tǒng)架構(gòu)越來越復(fù)雜,對用戶體驗的提升已不僅僅需要提升單一應(yīng)用的反應(yīng)速度,而是要跟不同的應(yīng)用串聯(lián)起來,整合成讓用戶真正接受的內(nèi)容。數(shù)字化轉(zhuǎn)型對于運維的要求己不僅限于業(yè)務(wù)不斷,還要求運維能夠在用戶發(fā)現(xiàn)問題前更早的發(fā)現(xiàn)并解決問題。所以,運維需要在現(xiàn)有的以業(yè)務(wù)連續(xù)性為基礎(chǔ)的監(jiān)控體系中,加強業(yè)務(wù)性能管理能力,收集更多的應(yīng)用響應(yīng)、時延、交易失敗等數(shù)據(jù),了解用戶在使用應(yīng)用過程中的問題、等待時長,在最短的時間內(nèi)解決問題。

模擬客戶行為操作監(jiān)控,提前發(fā)現(xiàn)并解決潛在問題。主動撥測是一種主動性的監(jiān)控測試方式,主要利用跨區(qū)域的監(jiān)控網(wǎng)絡(luò),以真實終端用戶使用場景為視角,對目標(biāo)應(yīng)用進(jìn)行性能管理和網(wǎng)絡(luò)性能監(jiān)控,透視防火墻外的各環(huán)節(jié)性能,先于最終用戶挖掘故障隱患。撥測通常是模擬用戶訪問域名、URL、API等方式,檢測網(wǎng)絡(luò)鏈路質(zhì)量,監(jiān)控web的事務(wù)可用性,主動感知用戶端應(yīng)用訪問體驗,先于客戶發(fā)現(xiàn)問題。在撥測的方向看,通??梢該軠y監(jiān)控不同區(qū)域的運營商的性能耗時與丟包,撥測網(wǎng)頁元素與可用性指標(biāo),撥測競品對比監(jiān)控,終端類型的運行時長,區(qū)域性能數(shù)據(jù)等。撥測相比傳統(tǒng)監(jiān)控手段,能夠更好的從功能層面提前發(fā)現(xiàn)問題。

建立混沌工程思想,對應(yīng)用系統(tǒng)進(jìn)行主動的破壞性測試。進(jìn)行數(shù)字時代,運維面臨的環(huán)境越來越復(fù)雜,比如全新的應(yīng)用集成與發(fā)布模式,渠道設(shè)備的數(shù)量與各類快速擴大并在線互聯(lián),各種基礎(chǔ)設(shè)施及新技術(shù)的應(yīng)用,大規(guī)模的分布式、云原生應(yīng)用引入等?;煦绻こ唐鹪从谀物w的Chaos Monkey項目,這個項目主動進(jìn)行破壞性動作以驗證、發(fā)現(xiàn)、提升系統(tǒng)健壯性、應(yīng)急處理等能力。混沌工程遵循的原則是:避免大多數(shù)失效的主要方式就是經(jīng)常失效?;煦绻こ淌且环N幫助我們獲得更多的關(guān)于系統(tǒng)的新認(rèn)知的實驗方法,隨著混沌工程應(yīng)用的不斷深入,涉及的破壞性測試己經(jīng)從原來的基礎(chǔ)設(shè)施層面的可用性測試,向應(yīng)用功能、上下游鏈路等功能性、業(yè)務(wù)冗余等方面測試?;煦绻こ淌且詳?shù)字化時代復(fù)雜性下的一個適應(yīng)性解決方案,深入使用將有助于提升客戶體驗。

3.2.5提升IT服務(wù)質(zhì)量

1、提升IT服務(wù)質(zhì)量的方法

提升IT服務(wù)質(zhì)量要先看看IT部門被抱怨比較多問題:業(yè)務(wù)系統(tǒng)連續(xù)性問題、業(yè)務(wù)需求交付速度、服務(wù)期望與實際交付效果差距的問題。數(shù)字化轉(zhuǎn)型推動IT支持能力全面軟件化,企業(yè)對IT的期望從確保系統(tǒng)連續(xù)性轉(zhuǎn)向提升應(yīng)用效能,促使IT為業(yè)務(wù)及運營提供更好的支持。IT服務(wù)(ITSM)呼應(yīng)這一業(yè)務(wù)期望,百度百科對IT服務(wù)管理的定義:是一套幫助企業(yè)對IT系統(tǒng)的規(guī)劃、研發(fā)、實施和運營進(jìn)行有效管理的方法。IT服務(wù)管理核心思想是IT組織主要工作是提供IT服務(wù),IT服務(wù)質(zhì)量由用戶判斷,通常會結(jié)合SLA來保證IT服務(wù)交付的協(xié)同流程,重點是面向客戶或業(yè)務(wù)。大部分企業(yè)將ITIL作為ITSM的指導(dǎo)思路,并形成一個信息化的IT服務(wù)管理系統(tǒng)。ITIL一共有5個版本,分別是:ITIL V1,ITILV2,ITIL V3,ITIL 2011,ITIL4。大體看,V2以前主要提倡流程管理的思路,V3以后則強調(diào)IT服務(wù),服務(wù)則涉及服務(wù)戰(zhàn)略、服務(wù)設(shè)計、服務(wù)轉(zhuǎn)換、服務(wù)運營、持續(xù)的服務(wù)改進(jìn)。最新的ITIL4,在原來的版本上整合了一些敏捷、DevOps、精益、IT治理、領(lǐng)導(dǎo)力等工作方法,將IT組織內(nèi)的運維、研發(fā)、測試與IT組織外的業(yè)務(wù)、客戶的協(xié)同整合到了一個整體的方法,提供一個數(shù)字服務(wù)的管理模式。將ITSM向企業(yè)擴展,就形成了ESM(企業(yè)服務(wù)管理),即將企業(yè)內(nèi)標(biāo)準(zhǔn)化能力服務(wù)化,提供相應(yīng)協(xié)同輸出的服務(wù)能力。

除了ITSM以外,BSM也是提升IT服務(wù)的方法,百度百科的定義是:以業(yè)務(wù)為重點的IT服務(wù)與基礎(chǔ)IT基礎(chǔ)設(shè)施之間建立起聯(lián)系的軟件。以業(yè)務(wù)為重點的IT服務(wù)可以是特殊的IT服務(wù)或者是業(yè)務(wù)流程的一部分,它需要實現(xiàn)IT資產(chǎn)與其支持的業(yè)務(wù)服務(wù)之間的動態(tài)映射,支持業(yè)務(wù)所有者重要的、可見的業(yè)務(wù)指標(biāo)。有些解決方案中,將IT服務(wù)分為三個階段:主動管理階段,此階段對關(guān)鍵環(huán)節(jié)流程化,提供的服務(wù)是業(yè)務(wù)連續(xù)性保障,IT資源的有效管控,重點是提高IT環(huán)境的運行質(zhì)量;第二階段是服務(wù)管理階段,此階段以ITSM為方法,以服務(wù)、流程為導(dǎo)向,以客戶為中心的管理方法,通過集成IT服務(wù)和業(yè)務(wù),協(xié)助企業(yè)提高其IT服務(wù)提供和支持能力;第三階段是業(yè)務(wù)價值階段,采用BSM實現(xiàn)管理提升在信息時代,企業(yè)的發(fā)展和IT環(huán)境的成熟是一個互相驅(qū)動、交替上升的過程。這個過程與前面分析的IT轉(zhuǎn)型方向相匹配。

2、運維如何提升IT服務(wù)質(zhì)量?

提升IT服務(wù)質(zhì)量通常有三個環(huán)節(jié):建立評價IT服務(wù)質(zhì)量的管理模型,建立全在線的IT服務(wù)交付模式,搭建IT服務(wù)管理系統(tǒng)。以下從這三個角度介紹:

建立評價IT服務(wù)質(zhì)量的管理模型。要建立評價IT服務(wù)質(zhì)量的管理模型,首先要從思維上由傳統(tǒng)注重內(nèi)部動作轉(zhuǎn)向面向?qū)ν夥?wù)輸出的轉(zhuǎn)變;其次要深入了解業(yè)務(wù)部門對IT服務(wù)的需求,并將業(yè)務(wù)需求轉(zhuǎn)化為IT服務(wù)的核心目標(biāo);接下來是將IT需求轉(zhuǎn)化為線上支持服務(wù),并建立一套完整的、可評估的IT服務(wù)評價協(xié)議,IT服務(wù)評價協(xié)議由可量化的指標(biāo)組成,評價指標(biāo)不僅包括IT部門,也包括業(yè)務(wù)部門、外部供應(yīng)商,用于IT服務(wù)水平的評估與持續(xù)改進(jìn)。在實施上,通常采用SLA、SLO、SLI進(jìn)行逐層分解,其中SLA(Service Level Agreement):服務(wù)水平協(xié)議,是IT服務(wù)提供方和被服務(wù)方之間就服務(wù)提供中關(guān)鍵的服務(wù)目標(biāo)及雙方的責(zé)任等有關(guān)細(xì)節(jié)問題而約定的協(xié)議;SLO(Service Level Objective):服務(wù)質(zhì)量目標(biāo),服務(wù)提供方與服務(wù)需求方對服務(wù)期望,比如系統(tǒng)可用性是4個9,還是3個9;SLI(Services Level Indicator):服務(wù)質(zhì)量指標(biāo),SLO需要通過一系列SLI技術(shù)指標(biāo)指標(biāo)細(xì)化并量化,比如上面的可用性可能會轉(zhuǎn)化為運行時長,故障時間等,性能的話會轉(zhuǎn)換為響應(yīng)時長、成功率等。加強運維組織的IT服務(wù)管理,可以采用SLA為基礎(chǔ),以SLO為服務(wù)質(zhì)量期望,以SLI為量化指標(biāo),來設(shè)計自身的服務(wù)流程、提供服務(wù)形式、績效評估方法。

建立全在線的IT服務(wù)交付模式。建立全在線的IT服務(wù)交付模式可以考慮采用以下方式:首先,對關(guān)鍵的IT支持服務(wù)以流程方式落地,可以借鑒ITIL的服務(wù)提供流程和服務(wù)支持流程,其中服務(wù)提供流程包括服務(wù)級別管理、財務(wù)管理、容量管理、IT服務(wù)持續(xù)管理、可用性管理等,服務(wù)支持流程包括配置管理、事件管理、問題管理、變更管理、發(fā)布管理等;其次,隨著IT成為日用品,企業(yè)對IT需求越來越多,傳統(tǒng)的支持服務(wù)流程將無法滿足業(yè)務(wù)需求,IT需要具備快速服務(wù)化IT支持能力,推動XAAS(一切皆服務(wù));同時,服務(wù)化IT支持后,還需要線上系統(tǒng)支持服務(wù)的交付,交付模式即將人(服務(wù)需求方、服務(wù)供應(yīng)方)、事、系統(tǒng)利用線上方法連接起來;最后,全在線的IT服務(wù)交付模式沉淀了數(shù)據(jù),需要利用數(shù)據(jù)運營來推動服務(wù)交付質(zhì)量的持續(xù)提升。

搭建IT服務(wù)管理系統(tǒng)。IT服務(wù)管理系統(tǒng)通常的組成部分包括:服務(wù)臺、故障及變更等關(guān)鍵流程、配置管理、服務(wù)目錄、知識管理等,其價值主要有:

確保IT流程能夠支持業(yè)務(wù)流程,提高業(yè)務(wù)運營質(zhì)量。

通過核心的流程的保障能力,為業(yè)務(wù)提供可靠的業(yè)務(wù)支持。

將IT服務(wù)以SLA約定,讓業(yè)務(wù)對IT服務(wù)質(zhì)量有明確的期望,并清楚需要的付出。

標(biāo)準(zhǔn)化并線上化IT服務(wù),加強IT與業(yè)務(wù)的協(xié)同,讓IT更好的服務(wù)于業(yè)務(wù)。

全在線IT服務(wù)獲取與交付,提升客戶/業(yè)務(wù)滿意度。

這里,推薦企業(yè)建立統(tǒng)一的IT服務(wù)目錄。在IT組織內(nèi)部將IT能力標(biāo)準(zhǔn)化,形成服務(wù)目錄,企業(yè)中用戶能夠像進(jìn)入電商系統(tǒng)上,找到自己所需要IT支持的服務(wù),并申請服務(wù),同時用戶能夠在線獲得服務(wù)的反饋,并利用社交化的手段對服務(wù)水平進(jìn)行評價推動IT服務(wù)質(zhì)量的持續(xù)提升。這里的IT服務(wù)目錄是將IT所有內(nèi)部、外部服務(wù)加以整合、標(biāo)準(zhǔn)化,為服務(wù)供需雙方提供線上連接的工具,并與服務(wù)臺、知識庫、自動化、云平臺等連通,提供人工、半自動化、全自動化多樣的能力。服務(wù)目錄主要為了應(yīng)對以下問題:

業(yè)務(wù)不知道IT能夠提供什么服務(wù),有些業(yè)務(wù)認(rèn)為和“電”相關(guān)的都和IT有關(guān),有些認(rèn)為只有軟件開發(fā)才與IT有關(guān)。

業(yè)務(wù)、IT對于IT服務(wù)的定義或期望不匹配,是否所有系統(tǒng)的可用性都應(yīng)該是4個9,所有IT需求都應(yīng)該是一周內(nèi)迭代上線?

IT作為成本中心,源源不斷的消耗公司資源,IT價值是好是壞如何衡量?IT服務(wù)是否有成本?有限的成本應(yīng)該往哪個方面傾斜?

以成為中心為基礎(chǔ)的IT組織充當(dāng)被動的角色,缺少可量化的服務(wù)質(zhì)量水平與清晰的計劃,主動的持續(xù)優(yōu)化服務(wù)質(zhì)量

IT服務(wù)的支持以經(jīng)驗導(dǎo)向為主,IT組織缺乏一個有效的、便捷的、一站式的服務(wù)協(xié)同工具,IT可以快速上架服務(wù),業(yè)務(wù)可以透明的獲知服務(wù)反饋,管理上可以基于服務(wù)交付數(shù)據(jù)進(jìn)行持續(xù)優(yōu)化。

IT組織內(nèi)團(tuán)隊如何保持激勵機制,需要提供工作機制推動IT組織內(nèi)由被動向主動轉(zhuǎn)型,提升IT價值。

IT組織關(guān)鍵的價值鏈?zhǔn)鞘裁矗棵織l價值鏈路實際運營情況如何?如何持續(xù)提升?

……

4總結(jié)

1、數(shù)字化轉(zhuǎn)型時代己至,大部分企業(yè)都在嘗試轉(zhuǎn)型。

2、數(shù)字化轉(zhuǎn)型三個關(guān)鍵價值是:“提升客戶體驗,創(chuàng)造客戶價值”、“加快速業(yè)務(wù)創(chuàng)新,重塑商業(yè)模式”,“提升運營效能,提能增效”。

3、以客戶價值創(chuàng)造為中心,打造企業(yè)快速適應(yīng)復(fù)雜性與不確定性通常是數(shù)字化轉(zhuǎn)型的一個方法。

4、數(shù)字化轉(zhuǎn)型的規(guī)劃階段可采用自上而下的策略(即遞推分解任務(wù)),在實施階段則采用自下而上的策略(解決分治任務(wù)),最終由局部數(shù)字化管理的實現(xiàn)推動公司整體數(shù)字化轉(zhuǎn)型。

5、從價值傳遞看,可以圍繞“提升客戶體驗、加快業(yè)務(wù)創(chuàng)新交付、為運營提能增效”三個企業(yè)的轉(zhuǎn)型價值,分析客戶及業(yè)務(wù)價值主張,了解客戶與業(yè)務(wù)的痛點,再從IT團(tuán)隊“客戶服務(wù)、連續(xù)性保障、快速交付、生態(tài)擴展、IT服務(wù)、運營協(xié)同”6大能力角度,分析運維在數(shù)字化轉(zhuǎn)型過程中的關(guān)鍵價值:“提高業(yè)務(wù)連續(xù)保障水平”、“提升業(yè)務(wù)交付效率”、“輔助提升客戶體驗”、“提升IT運營服務(wù)質(zhì)量”。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論