運(yùn)維挑戰(zhàn):如何構(gòu)建復(fù)雜環(huán)境下的適應(yīng)性系統(tǒng)

在數(shù)字化轉(zhuǎn)型理念大行其道的今天,我們經(jīng)常會聽到“復(fù)雜”、“不確定性”等詞,所以在開始進(jìn)入運(yùn)維體系適應(yīng)性系統(tǒng)前,先聊點(diǎn)還原論、復(fù)雜學(xué)、適應(yīng)性系統(tǒng)的事情,讓我們可以更好的理解這些名詞背后的意義。

“我們渴望構(gòu)建一種能夠描述市場、顧客及組織等世界萬物的模型,并利用它為未來制定完美的戰(zhàn)略。但很不幸,那是做不到的,而且永遠(yuǎn)做不到。未來具有VUCA特性,即波動性(volatility)、不確定性(uncertaninty),復(fù)雜性(complexity)和模糊性(ambiguity)。沒有哪個哪個模型能夠永遠(yuǎn)適用,相反我們必須保持敏捷、行動迅速,培養(yǎng)創(chuàng)造性思維,接受敢于嘗試的文化。”——彼得漢森

所幸,人類社會一直在遇見問題、解決問題、適應(yīng)環(huán)境的一個能力螺旋上升中發(fā)展。比如,牛頓的物理定律雖然解釋了從星球運(yùn)行到蘋果落地的所有事情,但無法解釋非常非常小或速度非常非常快的事物,所以人類發(fā)現(xiàn)/產(chǎn)生了量子力學(xué)和相對論。在金融企業(yè),為了應(yīng)對環(huán)境、市場、政策、業(yè)務(wù)的變化,信息技術(shù)發(fā)展經(jīng)歷了電算化、信息化、數(shù)字化轉(zhuǎn)型三個階段發(fā)展。站在數(shù)字化時代,從運(yùn)維體系角度看運(yùn)維適應(yīng)性系統(tǒng),它包括了大量系統(tǒng)部件,比如各類不同角色的人、團(tuán)隊、軟件、硬件等,部件之間通過越來越復(fù)雜的技術(shù)架構(gòu)、業(yè)務(wù)邏輯、協(xié)同關(guān)系串起來形成復(fù)雜的協(xié)同網(wǎng)絡(luò),為了保障運(yùn)維適應(yīng)性系統(tǒng)能夠穩(wěn)定、高效、安全,運(yùn)維組織一直持續(xù)推動單節(jié)點(diǎn)的可靠性、可用性、適應(yīng)性,同時利用“整體大于局部之和”的思路去實現(xiàn)更加完善的協(xié)同網(wǎng)絡(luò),達(dá)到支撐企業(yè)轉(zhuǎn)型傳遞下來的運(yùn)維價值創(chuàng)造。

本篇嘗試從復(fù)雜與適應(yīng)性系統(tǒng)相關(guān)內(nèi)涵、運(yùn)維面臨的復(fù)雜性因素、如何建立運(yùn)維適應(yīng)性系統(tǒng)3個角度提出相應(yīng)觀點(diǎn)。

1關(guān)于復(fù)雜

在數(shù)字化轉(zhuǎn)型理念大行其道的今天,我們經(jīng)常會聽到“復(fù)雜”、“不確定性”等詞,所以在開始進(jìn)入運(yùn)維體系適應(yīng)性系統(tǒng)前,先聊點(diǎn)還原論、復(fù)雜學(xué)、適應(yīng)性系統(tǒng)的事情,讓我們可以更好的理解這些名詞背后的意義。

還原論,百度百科的定義是:還原論是一種哲學(xué)思想,它認(rèn)為復(fù)雜的系統(tǒng)、事物、現(xiàn)象可以將其化解為各部分之組合來加以理解和描述。還原論思想認(rèn)為世界的本質(zhì)在于簡單性??梢哉f還原論是我們工作及生活中最基礎(chǔ)的思維模式之一,是因果關(guān)系的極致反映。現(xiàn)實中,我們一直致力于讓自己工作與生活能更加簡約、單純、有序,比如我們描述技術(shù)方案時,會分解為“痛點(diǎn)分析、政策或業(yè)務(wù)背景、調(diào)研分析、目的與目標(biāo)、整體解決方案、技術(shù)方案、關(guān)鍵技術(shù)、投入產(chǎn)出、短期計劃、中長期展望”的方法;在產(chǎn)品設(shè)計時,會分解為使用的用戶旅程分析、客戶價值主張、精益創(chuàng)新等方法;在工具的使用上,我們使用的結(jié)構(gòu)化思維的思維導(dǎo)圖等等。

但是,隨著人認(rèn)知的不斷前行,環(huán)境復(fù)雜性不斷加大,越來越多的問題無法簡單用還原論的因果關(guān)系、分解描述解釋。比如單擺與雙擺,單擺可以完美的用重力學(xué)理論得到驗證,有一個規(guī)律性軌跡。

與雙擺軌跡類似的,大家可能聽過蝴蝶效應(yīng)一詞,是美國氣象學(xué)家愛德華·洛倫茲在1963年在一篇提交紐約科學(xué)院的論文提到(來自百度百科):

“一個氣象學(xué)家提及,如果這個理論被證明正確,一只海鷗扇動翅膀足以永遠(yuǎn)改變天氣變化。”在以后的演講和論文中他用了更加有詩意的蝴蝶。對于這個效應(yīng)最常見的闡述是:“一只南美洲亞馬遜河流域熱帶雨林中的蝴蝶,偶爾扇動幾下翅膀,可以在兩周以后引起美國得克薩斯州的一場龍卷風(fēng)。”其原因就是蝴蝶扇動翅膀的運(yùn)動,導(dǎo)致其身邊的空氣系統(tǒng)發(fā)生變化,并產(chǎn)生微弱的氣流,而微弱的氣流的產(chǎn)生又會引起四周空氣或其他系統(tǒng)產(chǎn)生相應(yīng)的變化,由此引起一個連鎖反應(yīng),最終導(dǎo)致其他系統(tǒng)的極大變化。

還有像沙丁魚群、蟻群、人體免疫性系統(tǒng)等都呈類似的復(fù)雜性。百度百科對復(fù)雜科學(xué)定義如下:復(fù)雜科學(xué)是研究自然界中各類系統(tǒng)復(fù)雜性的一門科學(xué),專指復(fù)雜系統(tǒng)中的復(fù)雜性,研究復(fù)雜系統(tǒng)在一定規(guī)則下如何產(chǎn)生宏觀有序的組織和行為。復(fù)雜性有非線性、不確定性、自組織性、涌現(xiàn)性的特性,我們運(yùn)維經(jīng)常提到混沌測試中的“混沌”屬于復(fù)雜性科學(xué)的一個表現(xiàn),初始條件的一點(diǎn)點(diǎn)變化,造成結(jié)果巨大影響,導(dǎo)致系統(tǒng)不可預(yù)測。

當(dāng)然,復(fù)雜科學(xué)不僅僅是對簡單還原論的否定,而是為了針對社會中復(fù)雜性,提出在復(fù)雜環(huán)境下提高洞察能力、決策效果的系統(tǒng)性分析方法。或者說,復(fù)雜的系統(tǒng),仍然體現(xiàn)秩序,很多復(fù)雜性中存在“在不存在中央控制的情況下,大量簡單個體自行組織成能夠產(chǎn)生模式、處理信息甚至能夠進(jìn)化和學(xué)習(xí)的整體”。復(fù)雜適應(yīng)系統(tǒng)具有適應(yīng)性,因為個體和集體的行為會隨著微觀事件或事件集合的發(fā)生而進(jìn)行變異或自組織。復(fù)雜適應(yīng)系統(tǒng)可以看做是“相似且部分連接的微觀結(jié)構(gòu)”形成的“復(fù)雜宏觀集合”,可以適應(yīng)不斷變化的環(huán)境,提高作為“宏觀結(jié)構(gòu)”的生存能力。

接下來我們看看VUCA的四個特性含義。波動性(volatility)是指企業(yè)或生活將面臨越來動蕩、干擾越來越多以及波動性不斷增長;不確定性(uncertaninty)是指我們不確定客戶、業(yè)務(wù)、市場會發(fā)生什么變化,就算是原來相對確定的事情也會衍生大量不確定的應(yīng)對行為;復(fù)雜性(complexity)是指一件小事可能會產(chǎn)生巨大影響,而且這些小事的輸入因素越來越多;模糊性(ambiguity)是指事物并非只有一個答案,或非0即1。針對VUCA的特性,行業(yè)通常會為IT提出能力提升的要求,比如:以客戶為中心,以價值創(chuàng)造為核心,加快速IT交付速度,提升協(xié)同的敏捷、提升支持業(yè)務(wù)創(chuàng)新效率、加強(qiáng)技術(shù)創(chuàng)新引領(lǐng)、建立試錯的文化、建立協(xié)同網(wǎng)絡(luò)等。

對還原論、復(fù)雜學(xué)、復(fù)雜適應(yīng)性系統(tǒng)、VUCA的介紹,不是為了否定還原論,相反目前看運(yùn)維體系的各個組成部分仍是遵循因果關(guān)系的還原論;也不是為了說明復(fù)雜與不確定性的存在,而是希望借助更為系統(tǒng)性的方法論,站在整個運(yùn)維體系角度分析各個運(yùn)維體系參與元素的作用,更好的利用“整體大于局部之和”的思路去實現(xiàn)更加完善的協(xié)同網(wǎng)絡(luò),以此更加從容的應(yīng)對企業(yè)數(shù)字化轉(zhuǎn)型過程中產(chǎn)生的新挑戰(zhàn)與新機(jī)遇。

2運(yùn)維適應(yīng)性系統(tǒng)面臨的復(fù)雜因素

企業(yè)運(yùn)維體系的發(fā)展,是一個不斷從“組織、流程、平臺、場景”四個維度不斷適應(yīng)IT環(huán)境變化的過程,整個過程形成了一個IT世界的適應(yīng)性系統(tǒng)。

在上一篇關(guān)于企業(yè)數(shù)字化轉(zhuǎn)型下運(yùn)維關(guān)鍵價值創(chuàng)造的文章中,我提出了圍繞“提高業(yè)務(wù)連續(xù)保障水平”、“提升業(yè)務(wù)交付效率”、“輔助提升客戶體驗”、“提升IT運(yùn)營服務(wù)質(zhì)量”四點(diǎn)推進(jìn)相應(yīng)工作(見:《數(shù)字化時代,重新思考IT運(yùn)維價值》)。本節(jié)中從價值創(chuàng)造角度分析一下運(yùn)維適應(yīng)性系統(tǒng)的入?yún)⒂心男?fù)雜性因素。

價值1:業(yè)務(wù)連續(xù)性保障

上一篇我用魚骨圖梳理了影響業(yè)務(wù)連續(xù)性的要素(見下圖),可以看到影響業(yè)務(wù)連續(xù)性要素很多,且這種影響要素隨著業(yè)務(wù)發(fā)展、外部政策變化、企業(yè)內(nèi)部轉(zhuǎn)型戰(zhàn)略與舉措實施將會不斷擴(kuò)大。

10cc1ff9abd24c50ba6b4889bf9e4457(1).jpg

以技術(shù)架構(gòu)的演進(jìn)為例。以往金融企業(yè)的架構(gòu)主要以單體煙囪式架構(gòu)為主,這種架構(gòu)系統(tǒng)邏輯簡單,開發(fā)設(shè)計靈活,短時間即可快速上線。但是隨著業(yè)務(wù)需求變化、系統(tǒng)數(shù)量增加、系統(tǒng)間上下游鏈路增加,企業(yè)技術(shù)架構(gòu)向服務(wù)化架構(gòu)轉(zhuǎn)變,服務(wù)化又從SOA向微服務(wù)方式演進(jìn),具體實現(xiàn)上則從集中式ESB向每個服務(wù)都引入ESB部分功能轉(zhuǎn)變??梢钥闯?,雖然我們在分布式軟件架構(gòu)層面強(qiáng)調(diào)軟件能力重用、業(yè)務(wù)抽象、去耦合、平臺化、標(biāo)準(zhǔn)化、自動化,但是對于運(yùn)維而言,服務(wù)化架構(gòu)的變化不可避免的應(yīng)用鏈路節(jié)點(diǎn)增加、邏輯關(guān)系更加復(fù)雜,讓運(yùn)維面臨更大挑戰(zhàn)。為此,運(yùn)維需要推動運(yùn)維組織能力前移,優(yōu)化工作流程,建立更加復(fù)雜的工程能力,比如自動化發(fā)布系統(tǒng)、持續(xù)增強(qiáng)監(jiān)控體系、加強(qiáng)故障發(fā)現(xiàn)能力、探索數(shù)據(jù)分析能力,構(gòu)建彈性伸縮的基礎(chǔ)設(shè)施能力等。

價值2:提高業(yè)務(wù)交付效率

對于提升業(yè)務(wù)交付效率,在運(yùn)維側(cè)可以利用運(yùn)維數(shù)據(jù)分析輔助業(yè)務(wù)決策、推進(jìn)devOps中的自動化發(fā)布能力、云化基礎(chǔ)設(shè)施、建立系統(tǒng)退出機(jī)制等手段。這些手段的引入,相應(yīng)的也增加了運(yùn)維復(fù)雜性。以devOps為例,devOps的出現(xiàn)主要是來源于業(yè)務(wù)部門對軟件產(chǎn)品或服務(wù)交付速度要求,更多的是站在提升研發(fā)管理效率提升角度的解決方案,對于測試或運(yùn)維則更多是對原來質(zhì)量、業(yè)務(wù)連續(xù)性保障工作方式的沖擊。這里的沖擊不僅是運(yùn)維基于devOps最佳實踐的理念在流程、工程項目角度進(jìn)行建設(shè),而是一整套文化、組織、流程、工具、技術(shù)架構(gòu)的全局建設(shè)是否就位。由于很多企業(yè)只引入devOps目標(biāo),并沒有考慮現(xiàn)有底子水平或缺乏全局性的能力建設(shè),導(dǎo)致devOps效果不佳。為此,為了有效落實devOps,運(yùn)維需要建立集中式的IT基礎(chǔ)設(shè)施、持續(xù)發(fā)布的自動化發(fā)布工具鏈、針對互聯(lián)網(wǎng)系統(tǒng)建立灰度發(fā)布能力、補(bǔ)充更加敏感的運(yùn)行狀態(tài)與業(yè)務(wù)運(yùn)作的感知、利用運(yùn)行數(shù)據(jù)反向推動應(yīng)用技術(shù)架構(gòu)的解耦、調(diào)整運(yùn)維協(xié)同的組織架構(gòu)以及敏捷文化的學(xué)習(xí)等一系列工作。

價值3、4:輔助提升客戶體驗、提升IT服務(wù)質(zhì)量

提升IT服務(wù)質(zhì)量或輔助提升客戶體驗,重點(diǎn)是讓運(yùn)維團(tuán)隊由原來以被動保障的工作思維向主動型的工作思維轉(zhuǎn)變,比如加強(qiáng)客戶體驗數(shù)據(jù)分析、加強(qiáng)性能管理能力、模擬客戶行為操作監(jiān)控、混沌測試、建立服務(wù)質(zhì)量管理機(jī)制與在線服務(wù)交付能力等。這些工作對于現(xiàn)在運(yùn)維團(tuán)隊而言,是對組織能力、文化思維、角色定位、管理流程、平臺能力的重塑。運(yùn)維需要在現(xiàn)有人力資源基本不變的情況下進(jìn)行價值創(chuàng)造,就必然涉及讓現(xiàn)有運(yùn)維人員想盡辦法讓自身從原來簡單、重復(fù)性、操作性的工作中釋放出來,深入到業(yè)務(wù)層面,借助平臺工具、運(yùn)行數(shù)據(jù)分析等能力實現(xiàn)能力提升。

通過分析上述四個運(yùn)維價值創(chuàng)造所面臨的復(fù)雜因素挑戰(zhàn),我來總結(jié)一下運(yùn)維體系的適應(yīng)性系統(tǒng)的影響因素(或運(yùn)維挑戰(zhàn)),主要包括以下幾點(diǎn):

10cc1ff9abd24c50ba6b4889bf9e4457(1).jpg

技術(shù)架構(gòu):業(yè)務(wù)迭代需求、商業(yè)模式創(chuàng)新、技術(shù)創(chuàng)新等因素,驅(qū)動IT能力的持續(xù)提升,帶來新技術(shù)與新架構(gòu)模式的引入,運(yùn)維在新技術(shù)選擇時機(jī)、技術(shù)成熟度、架構(gòu)及數(shù)據(jù)高可用的評估能力、對存量技術(shù)架構(gòu)的影響,以及新技術(shù)附帶的選擇成本等挑戰(zhàn)。

應(yīng)用邏輯:越來越復(fù)雜的業(yè)務(wù)邏輯關(guān)系、更細(xì)粒度的原子服務(wù)、外部監(jiān)管政策要求的風(fēng)險控制要求等因素,驅(qū)動業(yè)務(wù)邏輯越來越復(fù)雜,呈現(xiàn)動則生變的常態(tài)化風(fēng)險,以及新風(fēng)險引發(fā)的組織人員對應(yīng)用邏輯知識掌握、產(chǎn)品設(shè)計、性能容量評估、故障應(yīng)急、快速恢復(fù)、影響分析、故障定位等能力的新要求。

變更交付:在線感知客戶體驗、更快的產(chǎn)品或服務(wù)創(chuàng)新、更快的迭代速度、更短的技術(shù)評審時間、更復(fù)雜的版本管理、無序的變更計劃等因素,驅(qū)動運(yùn)維采用更全面的技術(shù)平臺的建設(shè),交付協(xié)同模式的變化,績效考核的調(diào)整等新要求。

海量連接:移動化、物聯(lián)網(wǎng)、開放平臺等新業(yè)務(wù)模式的引入,以及全數(shù)字化協(xié)同網(wǎng)絡(luò)的產(chǎn)生,帶來海量的數(shù)據(jù)、海量連接、海量終端,每個連接節(jié)點(diǎn)之間在線連接質(zhì)量以及節(jié)點(diǎn)的可用性都將大幅增加運(yùn)維業(yè)務(wù)連續(xù)性保障的范圍,甚至重塑運(yùn)維業(yè)務(wù)連續(xù)性保障定義。

操作風(fēng)險:外部網(wǎng)絡(luò)攻擊形勢、政策法規(guī)要求、應(yīng)急操作管理、應(yīng)急處置能力、運(yùn)維操作性工作量大幅增加等因素,帶來更多的操作風(fēng)險。應(yīng)對更多操作風(fēng)險帶來了更多的自動化工具,自動化工具的引入又帶來新的操作風(fēng)險,以及人員操作技能下降帶來的風(fēng)險。

協(xié)同機(jī)制:devOps、一切皆服務(wù)、應(yīng)用運(yùn)營等工作模式變化,帶來新的協(xié)同機(jī)制的建立,如何選擇合適時機(jī),有節(jié)奏的推進(jìn)組織、流程、平臺有序建設(shè),考驗運(yùn)維體系建設(shè)者的全局設(shè)計與落地能力。

技能與文化:新需求、新技術(shù)、新機(jī)制帶來新知識,組織面臨建立新的學(xué)習(xí)型文化以更快適應(yīng)變化,以及學(xué)習(xí)型文化對現(xiàn)有人員角色重塑,能力培養(yǎng)等配套機(jī)制。

外部因素:政策及監(jiān)管趨嚴(yán)、全線上在線監(jiān)管等因素,驅(qū)動IT運(yùn)維精細(xì)化能力不斷提升,需要在現(xiàn)有人力資源基本不變的基礎(chǔ)上,分離更多資源進(jìn)行精細(xì)化能力的建設(shè)。

上述8點(diǎn)復(fù)雜性要素每一點(diǎn)都能擴(kuò)展出更為細(xì)化的影響因素,任一個因素的風(fēng)險事件都可能導(dǎo)致運(yùn)維體系的重大事故。所以,我覺得運(yùn)維體系具體組成部分遵循因果關(guān)系的還原論,整體上呈現(xiàn)復(fù)雜性,需要利用復(fù)雜性適應(yīng)性系統(tǒng)方法,用“整體大于局部之和”的思路去實現(xiàn)更加完善的協(xié)同網(wǎng)絡(luò)。

3如何建立運(yùn)維體系的適應(yīng)系統(tǒng)

1、以螺旋上升方式建立運(yùn)維體系的適應(yīng)系統(tǒng)

站在運(yùn)維體系這個適應(yīng)性系統(tǒng)看,包括了大量系統(tǒng)部件,比如各類不同角色的人、團(tuán)隊、軟件、硬件等,這些部件之間通過越來越復(fù)雜的架構(gòu)、邏輯、協(xié)同關(guān)系串起來形成復(fù)雜的協(xié)同網(wǎng)絡(luò),為了保障這個運(yùn)維適應(yīng)性系統(tǒng)能夠穩(wěn)定、高效、安全,我們一直持續(xù)推動單節(jié)點(diǎn)的可靠性、可用性、適應(yīng)性,同時也希望更好的利用“整體大于局部之和”的思路去實現(xiàn)更加完善的協(xié)同網(wǎng)絡(luò),達(dá)到支撐企業(yè)轉(zhuǎn)型傳遞下來的運(yùn)維價值創(chuàng)造。運(yùn)維這個適應(yīng)系統(tǒng)我借鑒亞馬遜價值增長閉環(huán)思路(如下圖),在這個閉環(huán)中的中心是亞馬遜零售業(yè)務(wù)增長的點(diǎn),業(yè)務(wù)增長后帶來更低的成本,再帶來更低價格,又會帶來體驗、流量、賣家、選擇的閉環(huán),是一個螺旋上升的增長能力。

10cc1ff9abd24c50ba6b4889bf9e4457(1).jpg

類似的,可以建立一個IT運(yùn)維能力螺旋上升的適應(yīng)性系統(tǒng),即主線是運(yùn)維能力的持續(xù)提升,能力包括業(yè)務(wù)連續(xù)性保障能力、應(yīng)用交付效率、輔助客戶體驗提升、提升IT服務(wù)質(zhì)量的綜合能力提升。能力的提升來源于更高(質(zhì))、更多(量)、更快(速度)的需求驅(qū)動;為了適應(yīng)新的需求,運(yùn)維組織快速引入新的技術(shù)與新方法;改變通常會產(chǎn)生新的風(fēng)險;綜合優(yōu)化組織、流程、場景、平臺能力,解決風(fēng)險,形成適應(yīng)性能力;建立了適應(yīng)性能力后可以支持更高、更快、更多的需求(這個閉環(huán)不一定從需求開始,也可以從其它節(jié)點(diǎn)開始)。這個能力螺旋上升的能力圍繞需求(need)、改變(change)、風(fēng)險(risk)、適應(yīng)(adapt)4個節(jié)點(diǎn)循環(huán),適應(yīng)性系統(tǒng)的關(guān)鍵要素是組織、流程、平臺、場景。

10cc1ff9abd24c50ba6b4889bf9e4457(1).jpg

這個運(yùn)維體系的適應(yīng)性系統(tǒng),可進(jìn)行分解,以云原生架構(gòu)為例:

需求:充分發(fā)揮云計算的彈性、靈活、自動化優(yōu)勢,使得工程管理和基礎(chǔ)設(shè)施管理變得更加高效和自治,從而將精力集中到業(yè)務(wù)創(chuàng)新之中。

改變:優(yōu)化應(yīng)用的開發(fā)架構(gòu),容器化基礎(chǔ)設(shè)施架構(gòu)建設(shè),加強(qiáng)微服務(wù)治理效率

風(fēng)險:新技術(shù)引入的時機(jī)是合適,新技術(shù)不成熟度帶來的風(fēng)險,原有系統(tǒng)改變帶來風(fēng)險,混合云環(huán)境和各種跨云/跨平臺的運(yùn)維操作,更加復(fù)雜的上下游鏈路關(guān)系

適應(yīng):運(yùn)維人員對云原生能力技術(shù)及應(yīng)用上下游關(guān)系鏈路的技能學(xué)習(xí),打造云原生的技術(shù)中臺及配套的協(xié)同機(jī)制,優(yōu)化devOps流水線的持續(xù)發(fā)布能力,云上的監(jiān)控能力,針對容器PAAS平臺的監(jiān)控能力,自動化全鏈路的監(jiān)控及故障發(fā)現(xiàn)能力,混沌測試能力等建設(shè)工作,形成一個針對云原生運(yùn)維的工作場景。

2、數(shù)字化時代運(yùn)維適應(yīng)性系統(tǒng)解決方案的一般性選擇方向

雖然說適應(yīng)性系統(tǒng)根據(jù)輸入條件不同,而采用不同的應(yīng)對措施,但在數(shù)字化時代,還是可以總結(jié)一些一般性的選擇方向,比如(以下簡述幾個方向,具體的內(nèi)容在后續(xù)章節(jié)細(xì)化):

(1)業(yè)務(wù)為中心

應(yīng)用上云解決了運(yùn)維在基礎(chǔ)設(shè)施層面的工作量,運(yùn)維平臺能力建設(shè)降低了運(yùn)維操作性工作,這些能力建設(shè)一方面是讓運(yùn)維能夠更具更穩(wěn)、更快的技術(shù)能力;另一方面是為了讓運(yùn)維能從低價值的操作性工作中釋放出來,能夠更貼近業(yè)務(wù)、理解業(yè)務(wù),利用運(yùn)行數(shù)據(jù)的分析,提升業(yè)務(wù)連續(xù)性及客戶體驗,確保運(yùn)維價值交付鏈路更加高效。圍繞業(yè)務(wù)為中心的思路尤其適合金融企業(yè)運(yùn)維團(tuán)隊,因為金融企業(yè)運(yùn)維團(tuán)隊人員流動性較少,優(yōu)點(diǎn)是適合業(yè)務(wù)經(jīng)驗的沉淀,缺點(diǎn)是不適合技能上進(jìn)行大幅度的轉(zhuǎn)變。所以類型google以運(yùn)維開發(fā)為主的SRE團(tuán)隊可能并不適合金融企業(yè),而應(yīng)該為金融企業(yè)打造一個圍繞以業(yè)務(wù)為中心的SRE團(tuán)隊,不斷加深運(yùn)維SRE對業(yè)務(wù)的理解,利用組織、流程、平臺、場景能力建設(shè),落實“提高業(yè)務(wù)連續(xù)保障水平”、“提升業(yè)務(wù)交付效率”、“輔助提升客戶體驗”、“提升IT運(yùn)營服務(wù)質(zhì)量”的價值創(chuàng)造。

(2)自組織驅(qū)動

要達(dá)到自組織驅(qū)動是要建立一個柔性的組織架構(gòu),關(guān)鍵要建立學(xué)習(xí)型文化與組織持續(xù)改進(jìn)的方法論。前者是在組織內(nèi)建立學(xué)習(xí)、分享、沉淀、應(yīng)用的學(xué)習(xí)閉環(huán);后者是在組織內(nèi)形成一個清晰、統(tǒng)一、可理解的持續(xù)改進(jìn)方法論,要讓方法論能快速融入到組織各個角色的日常工作。同時,組織還要加強(qiáng)橫向優(yōu)化型崗位,落實數(shù)字化的目標(biāo)管理、計劃管理、時間管理、績效管理。

(3)一切皆服務(wù)

云的自助式,所見即所得,按需獲取,量化服務(wù)成本等特點(diǎn),已在IAAS、PAAS、DAAS上得到驗證。XAAS(一切皆服務(wù))是IT運(yùn)維組織的一個能力建設(shè)方向。即,對運(yùn)維能力標(biāo)準(zhǔn)化,形成服務(wù)目錄,業(yè)務(wù)能夠像進(jìn)入電商系統(tǒng)一樣,找到自己所需要IT支持的服務(wù),并申請服務(wù),在線獲得服務(wù)反饋,并利用社交化的手段對服務(wù)水平進(jìn)行評價,推動IT服務(wù)質(zhì)量的持續(xù)提升。無論是企業(yè)整體戰(zhàn)略的以客戶為中心,還是一切皆服務(wù)的IT服務(wù)目錄思路,都是以人為本的延伸,利用線上化、自動化的技術(shù)提升在線體驗質(zhì)量。

(4)自動化一切

自動化一切是將事件驅(qū)動思維模式融入到運(yùn)維的方方面面,可以從思維、技術(shù)兩個角度發(fā)力。思維角度,即運(yùn)維組織從一線操作、二線運(yùn)維、管理崗位,能夠?qū)χ貜?fù)性、操作性工作有天然的排斥感,并想方設(shè)法用軟件方式代替手工操作。技術(shù)角度,一是從運(yùn)維工具層面建立以運(yùn)維原子腳本、編排任務(wù)、調(diào)度的基礎(chǔ)的自動化操作能力;二是將運(yùn)維手工操作標(biāo)準(zhǔn)化,線上場景化標(biāo)準(zhǔn)的運(yùn)維操作,對標(biāo)準(zhǔn)化可腳本執(zhí)行的操作自動化;三是從運(yùn)維工作前移,推動應(yīng)用系統(tǒng)自身自愈或無人值守的可靠性設(shè)計。

(5)數(shù)據(jù)賦能

數(shù)據(jù)賦能作用主要體現(xiàn)在利用運(yùn)行數(shù)據(jù),獲得即時業(yè)務(wù)及運(yùn)行狀態(tài)的感知能力,建立自動化或半自動化的決策能力。具體來說,一是要實現(xiàn)運(yùn)維協(xié)同網(wǎng)絡(luò)工作的全在線,落地IT運(yùn)營數(shù)據(jù)資產(chǎn),利用運(yùn)維數(shù)據(jù)平臺強(qiáng)大的計算能力與平臺擴(kuò)展能力,實現(xiàn)數(shù)據(jù)的采集、傳輸、存儲、處理、治理、反饋、消費(fèi)的閉環(huán);二是變現(xiàn)運(yùn)維數(shù)據(jù)資產(chǎn),將數(shù)據(jù)融入到IT運(yùn)維工作場景中,為運(yùn)維提供數(shù)據(jù)驅(qū)動的工作能力,包括實時感知系統(tǒng)運(yùn)行狀態(tài),業(yè)務(wù)狀態(tài)感知,IT團(tuán)隊協(xié)同效率,業(yè)務(wù)部門的真實需求等信息,輔助決策,形成高效的執(zhí)行力等;三是實現(xiàn)利用自動化技術(shù),提供人機(jī)協(xié)同的模式,將可量化、可衡量、可程序化的工作由機(jī)器輔助人處理。

(6)場景在線

場景在線,一是要場景驅(qū)動,以場景的人、事、時間、協(xié)同、環(huán)境5要素,配置組織、流程資源,整合“監(jiān)管控析”的平臺能力;二是要在線,在線不僅是線上化,還強(qiáng)調(diào)即時協(xié)作、隨時連接、落地數(shù)據(jù)資產(chǎn)。

3本章小結(jié)

1、數(shù)字化時代面臨VUCA四個特性。

2、運(yùn)維體系具體組成部分遵循因果關(guān)系的還原論,整體上呈現(xiàn)復(fù)雜性,需要利用復(fù)雜性適應(yīng)性系統(tǒng)方法,利用“整體大于局部之和”的思路去實現(xiàn)更加完善的協(xié)同網(wǎng)絡(luò)。

3、運(yùn)維的適應(yīng)性系統(tǒng)的復(fù)雜性輸入?yún)?shù)包括:技術(shù)架構(gòu)、應(yīng)用邏輯、變更交付、海量連接、操作風(fēng)險、協(xié)同機(jī)制、技能與文化、外部因素。

4、建立一個IT運(yùn)維能力螺旋上升的適應(yīng)性系統(tǒng),即主線是運(yùn)維能力的持續(xù)提升,螺旋的閉環(huán)包括需求、改變、風(fēng)險、適應(yīng)。

5、一般性選擇方向:業(yè)務(wù)為中心、自組織驅(qū)動、一切皆服務(wù)、自動化一切、數(shù)據(jù)賦能、場景在線。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論