IT體系結(jié)構(gòu)和IT業(yè)務(wù)的技術(shù)發(fā)展是運(yùn)維發(fā)展的原動(dòng)力和推手,所IT業(yè)務(wù)的開發(fā)總是比IT技術(shù)的發(fā)展戰(zhàn)略落后。在IT領(lǐng)域,SDN、云計(jì)算、大數(shù)據(jù)等技術(shù)不斷涌現(xiàn)IT資源體系結(jié)構(gòu)日益復(fù)雜,IT資源規(guī)模日益增大,運(yùn)行的復(fù)雜性和難度日益增大,IT可維護(hù)性越來越受到人們的關(guān)注,而首輪施工后IT可運(yùn)維性問題也逐漸成為IT管理人員不斷關(guān)注的焦點(diǎn)。
從早到晚的純手工運(yùn)維,到后來依賴于網(wǎng)管工具報(bào)告工具化運(yùn)維為主的工具化運(yùn)維,與工具相關(guān)聯(lián)或融合的平臺(tái)運(yùn)維,以及目前流行的智能和自動(dòng)化運(yùn)維系統(tǒng),使運(yùn)維領(lǐng)域在技術(shù)上不斷發(fā)生變化。開發(fā)新工具并不意味著完全消除舊工具,而是使用不同的工具來解決實(shí)際的運(yùn)維問題。新工具進(jìn)一步解放了運(yùn)行運(yùn)維的效率。
云計(jì)算時(shí)代,如何選擇合適的運(yùn)維模式,選擇合適的運(yùn)維工具,建立合理的組織結(jié)構(gòu)和管理體系,這些都是IT管理者們必須重新思考的問題。
面臨運(yùn)維的多維屬性,企業(yè)如何進(jìn)行自我定位
說到運(yùn)維和維護(hù),人們往往只考慮技術(shù)本身,而忽視場(chǎng)景的差異,簡(jiǎn)單地追求技術(shù)領(lǐng)先和上層建筑,往往事半功倍,不容易達(dá)到預(yù)期的效果。其實(shí)不同的運(yùn)維場(chǎng)景在實(shí)際運(yùn)維上差別很大,一味求新、求快,并不一定能取得好的運(yùn)維效果。通過多年對(duì)運(yùn)維領(lǐng)域的了解,我總結(jié)了影響運(yùn)維工具選擇的行業(yè)屬性、成熟度屬性、規(guī)模屬性和位置屬性等以下屬性
行業(yè)
先說行業(yè)屬性,不同行業(yè)由于業(yè)務(wù)特征不同,其所關(guān)注的內(nèi)容和運(yùn)行模式也大相徑庭。就拿因特網(wǎng)來說,因特網(wǎng)的發(fā)布速度快,更新快,服務(wù)器數(shù)量多,研究開發(fā)能力強(qiáng),通常一周內(nèi)會(huì)有數(shù)個(gè)甚至數(shù)十個(gè)新業(yè)務(wù)發(fā)布,同時(shí)也會(huì)有數(shù)十個(gè)新的發(fā)布。在ITIL基礎(chǔ)上開發(fā)的變更與發(fā)布流程雖然考慮周全、過程嚴(yán)謹(jǐn),但節(jié)奏緩慢、周期長(zhǎng)。
在互聯(lián)網(wǎng)業(yè)務(wù)快速更迭的行業(yè)背景下,傳統(tǒng)的變更發(fā)布流程已使互聯(lián)網(wǎng)企業(yè)失去了產(chǎn)品的市場(chǎng)機(jī)會(huì)窗口,因此因特網(wǎng)運(yùn)應(yīng)會(huì)選擇諸如自動(dòng)化和自我維護(hù)等高效的運(yùn)維模式,要做自動(dòng)化就必須建立精確的CMDB,為了提高效率必須追求敏捷開發(fā),DevOps、灰色版本和開源模式。那么因特網(wǎng)運(yùn)維模式主要關(guān)注的是運(yùn)維效率
運(yùn)維成熟度數(shù)
各個(gè)行業(yè)受各自業(yè)務(wù)特點(diǎn)的影響,其運(yùn)維模式、關(guān)注點(diǎn)和工具選擇各不相同,同時(shí)影響運(yùn)維工具選擇的是運(yùn)維成熟度。運(yùn)維成熟度也是制約企業(yè)運(yùn)維發(fā)展的關(guān)鍵因素。ITIL的核心方法是PDCA,這一方法向我們闡明了運(yùn)行的一個(gè)簡(jiǎn)單原則是逐步、螺旋上升的模式。運(yùn)維成熟度的高低,決定著運(yùn)維所處的不同階段,也決定了不同時(shí)期用戶應(yīng)關(guān)注的內(nèi)容。在運(yùn)維過程中選擇脫離實(shí)際情況的激進(jìn)做法往往只能起到拔苗助長(zhǎng)的作用,最后又推倒重來,反而得不償失。許多用戶以前都沒有注意這一客觀規(guī)律,在沒有做好監(jiān)測(cè)的情況下,就同時(shí)構(gòu)建了運(yùn)行流程,從而導(dǎo)致運(yùn)維過程與監(jiān)控脫節(jié),流程對(duì)運(yùn)維管理員的幫助非常有限,淪為走單工具。另外一種常犯的錯(cuò)誤是在CMDB的構(gòu)建中過分追求完美,沒有與現(xiàn)有的監(jiān)控功能相結(jié)合,由于沒有采用自動(dòng)化方法來簡(jiǎn)化CMDB的維護(hù)工作,相反,過度追求CMDB設(shè)計(jì)中的精細(xì)化,以致CMDB的維護(hù)費(fèi)用很高,甚至超過了實(shí)際使用價(jià)值,導(dǎo)致CMDB項(xiàng)目最終走向破產(chǎn)。
運(yùn)維的另一成熟度是指人員成熟度模型。其中包括運(yùn)維人員的技術(shù)成熟度、組織過程成熟度和開發(fā)能力成熟度。技術(shù)成熟度包括運(yùn)維人員對(duì)網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)、虛擬化和業(yè)務(wù)的熟悉程度和問題處理能力。技術(shù)成熟度越高,對(duì)問題的處理和反應(yīng)速度就越快,相反,對(duì)管理能力較差的管理員將延長(zhǎng)故障恢復(fù)時(shí)間。因此如何讓運(yùn)維人員減少對(duì)個(gè)人技能和知識(shí)的依賴也是對(duì)運(yùn)維工具的一個(gè)重要考慮。以往建立在知識(shí)庫(kù)基礎(chǔ)上的系統(tǒng),實(shí)際運(yùn)行效果不甚理想。要從根本上解決這一問題,一方面要建立起精確的CMDB配置信息庫(kù),另一方面要把專家的經(jīng)驗(yàn)同時(shí)固化為運(yùn)維工具,那么運(yùn)維專家系統(tǒng)將成為未來運(yùn)維工具發(fā)展的又一趨勢(shì)
如今,開放源碼軟件的數(shù)量和成熟度日益增加,如果能充分利用開源軟件進(jìn)行自我開發(fā),不管從業(yè)務(wù)層面還是運(yùn)維層面,都是很好的選擇,但同時(shí)也提高了對(duì)運(yùn)行人員開發(fā)能力的要求。成熟度,體現(xiàn)了運(yùn)維人員在需求分析、架構(gòu)設(shè)計(jì)、代碼編寫、開放源碼軟件熟悉程度、商業(yè)背景知識(shí)以及對(duì)軟件開發(fā)過程的了解。DevOps在運(yùn)維界的流行表明了開發(fā)和運(yùn)行維護(hù)的逐漸融合,這無疑也是未來運(yùn)維發(fā)展的趨勢(shì)之一,但是,如果不能充分開發(fā)人力,又缺乏敏捷流程儲(chǔ)備,如果貿(mào)然選擇DevOps(開發(fā)及運(yùn)維)模式,有可能面臨巨大的風(fēng)險(xiǎn)
因此企業(yè)要看清楚自己所處的運(yùn)維階段、運(yùn)維人員成熟度,選擇更務(wù)實(shí)的運(yùn)維策略,尋求逐步改善、水到渠成的方法
運(yùn)維規(guī)模
還有一點(diǎn)要注意尺寸屬性,這一尺度包括哪些內(nèi)容(服務(wù)器和網(wǎng)絡(luò))、業(yè)務(wù)規(guī)模和管理人員的數(shù)量。一個(gè)用戶的50個(gè)服務(wù)器還是200個(gè)服務(wù)器在運(yùn)維方面,1000臺(tái)服務(wù)器或者成千上萬臺(tái)服務(wù)器之間的差異非常明顯。在設(shè)備數(shù)量較少的情況下,許多時(shí)間都可以進(jìn)行人工管理,但隨著受管理設(shè)備數(shù)目的增加,運(yùn)行工作量將直線上升,此時(shí)運(yùn)維難度實(shí)際上呈指數(shù)級(jí)上升,再依賴人工運(yùn)維幾乎成為不可能完成的任務(wù)。大規(guī)模的運(yùn)維必須依靠自動(dòng)?監(jiān)?測(cè)測(cè)測(cè)測(cè)工具、自動(dòng)配置工具、自動(dòng)部署工具和自動(dòng)過程工具來輔助實(shí)施。隨著運(yùn)行規(guī)模的進(jìn)一步擴(kuò)大,傳統(tǒng)的運(yùn)行將向大容量運(yùn)行演化。大容量運(yùn)行不僅僅是運(yùn)維工具的改變,大容量運(yùn)維帶來了技術(shù)價(jià)值的改變,技術(shù)手段的改變,以及運(yùn)維意識(shí)的改變,這些都影響到深度運(yùn)維方法的變革。
大量運(yùn)行運(yùn)維指南
影響運(yùn)維的另一個(gè)因素是運(yùn)維人員規(guī)模,如果運(yùn)維人員在8人以下,則要慎重考慮是否要進(jìn)行復(fù)雜的運(yùn)維流程建設(shè)。過程設(shè)置解決了運(yùn)維事件閉環(huán)跟蹤、責(zé)任確認(rèn)、規(guī)范管理等問題,但若企業(yè)的運(yùn)維人數(shù)較少,建立復(fù)雜流程反而會(huì)降低運(yùn)維效率,增加運(yùn)維成本。但若企業(yè)運(yùn)維人員的數(shù)量超20世紀(jì)末,對(duì)運(yùn)維流程進(jìn)行規(guī)范管理,同時(shí)在運(yùn)維人員績(jī)效管理方面也需要對(duì)運(yùn)維流程進(jìn)行輔助,此時(shí)運(yùn)維流程的重要性就凸顯出來。但隨著時(shí)代的發(fā)展,自動(dòng)化和智能化技術(shù)逐漸普及,運(yùn)維流程的發(fā)展趨勢(shì)越來越輕量化,ITIL流程體系的建設(shè)將在將來越來越少
運(yùn)維定位屬性
最終探討了運(yùn)維的定位屬性,這里的位置包括了網(wǎng)絡(luò)位置和邏輯位置。運(yùn)維目標(biāo)所處的網(wǎng)絡(luò)位置大致可以分為接入網(wǎng)絡(luò)、廣域網(wǎng)和數(shù)據(jù)中心。因?yàn)槿齻€(gè)系統(tǒng)所處的地理位置不同,其運(yùn)維差率很高。上一節(jié)討論的大部分內(nèi)容都是關(guān)于數(shù)據(jù)中心的運(yùn)行維護(hù),下面主要講接入網(wǎng)的運(yùn)維。接入網(wǎng)絡(luò)運(yùn)維涉及終端(類型、系統(tǒng))、接入者(無線嗎),在身份認(rèn)證等方面,由于終端類型復(fù)雜,接入人員水平參差不齊,接入網(wǎng)運(yùn)行的復(fù)雜性也較高,運(yùn)維人員不僅要具備多方面的運(yùn)維知識(shí),還要有足夠的耐心,要有豐富的運(yùn)維經(jīng)驗(yàn),還要有足夠的耐心。