在市場競爭日益白熱化的形勢下,如何屹立不倒仍是很多企業(yè)頭痛的問題。那么一個企業(yè)想要擴(kuò)大版圖,實(shí)現(xiàn)帝國規(guī)模擴(kuò)張,在內(nèi)部運(yùn)作里必然是少不,網(wǎng)絡(luò)運(yùn)維系統(tǒng)作為支撐后盾,而企業(yè)擁有了一個全面的運(yùn)維系統(tǒng)后也可以減輕運(yùn)維工程師的負(fù)擔(dān)。那么一個全面的運(yùn)維系統(tǒng)應(yīng)該是怎么樣的?應(yīng)該怎么,從哪里開始呢?來看看網(wǎng)強(qiáng)公司總結(jié)的經(jīng)驗(yàn)。
HOW—怎樣的運(yùn)維系統(tǒng)才算全面?
一個全面的運(yùn)維系統(tǒng),應(yīng)該包括五個要素:效率、穩(wěn)定、安全、體驗(yàn)和成本。
在這5個要素中,效率和穩(wěn)定應(yīng)是每個運(yùn)維人最基礎(chǔ)的本職工作,在此前提下,再進(jìn)行安全、體驗(yàn)和成本3個要素考量,一個全面的運(yùn)維系統(tǒng)將應(yīng)運(yùn)而生。
WHAT—具體內(nèi)容以及執(zhí)行操作方法
1.效率
這里重點(diǎn)指的是日常運(yùn)維例行工作的效率,這些是指運(yùn)維最基礎(chǔ)的工作:資源分配與回收、域名配置、VIP配置、持續(xù)集成與發(fā)布、應(yīng)用部署、應(yīng)用擴(kuò)容與縮容等。而我們提過的運(yùn)維自動化,大多是集中在這些工作上,因?yàn)檫@些工作偏日常和重復(fù)。
2.穩(wěn)定(質(zhì)量)
可以通過監(jiān)控、全鏈路、強(qiáng)弱依賴、限流降級、容量評估、預(yù)案平臺等措施,讓業(yè)務(wù)運(yùn)行更加穩(wěn)定。做好這一點(diǎn),需要有相對比較獨(dú)立、專業(yè)的監(jiān)控和穩(wěn)定性平臺來支持。
這部分目標(biāo)是最大程度地保障系統(tǒng)的穩(wěn)定性和運(yùn)行質(zhì)量。即使出現(xiàn)問題,也能夠快速發(fā)現(xiàn)、快速響應(yīng)、快速自動)恢復(fù)。
3.安全
安全,是橫向與運(yùn)維同等甚至更加重要的專業(yè)領(lǐng)域。但同時又是跟運(yùn)維緊密相關(guān)的,運(yùn)維同樣要關(guān)注安全,因?yàn)榘踩霈F(xiàn)導(dǎo)致的問題,往往也會給運(yùn)維帶來沉重的防護(hù)和修復(fù)成本。我們經(jīng)常提到的安全類關(guān)鍵詞,各類主機(jī)安全、DB安全、Web安全、應(yīng)用安全等等,與此相關(guān)的還有漏洞、DDos、CC等。
4.體驗(yàn)
這里提到的體驗(yàn),指的是終端用戶的訪問體驗(yàn)。對于非功能或非產(chǎn)品的使用體驗(yàn),運(yùn)維最需要關(guān)注的是訪問速度。開發(fā)人員,可能更多的注意力會放在自己負(fù)責(zé)的代碼以及該部分的性能問題,不會關(guān)注到端到端全流程的性能和體驗(yàn)。而運(yùn)維可以站在全局的角度來審視和治理整個端到端的全鏈路性能情況,并給出對應(yīng)的性能優(yōu)化建議。
5.成本
成本問題,也就是技術(shù)ROI(投入產(chǎn)出的問題。當(dāng)系統(tǒng)規(guī)模和體量變大之后,掌控在運(yùn)維手中的各類資源,將成為整個研發(fā)團(tuán)隊(duì)支出的主要占比。如果沒有很好的成本控制意識和策略,資源體量將會持續(xù)增大,甚至是翻倍或指數(shù)級的增長,對于公司成本會是非常大的負(fù)擔(dān)和壓力。
那么運(yùn)維工作者需要考慮到服務(wù)器CPU資源利用率的提升(引申出來各種虛擬化、容器或云資源的使用)、IDC&CDN流量帶寬使用的管控,還有人力的投入和成本的管控。如何使得系統(tǒng)能夠更高效地被充分利用起來,如何能夠最大限度的減少成本支出,是我們必須要去考慮的問題。
以上可以發(fā)現(xiàn)網(wǎng)絡(luò)運(yùn)維范疇其實(shí)能夠延伸到很大的范圍;或者這樣來說,只要最終是跟線上業(yè)務(wù)運(yùn)行相關(guān)的工作,都是運(yùn)維要關(guān)注的焦點(diǎn)。如果運(yùn)維僅僅是片面和狹隘地給自己限定一個范圍,無法做到提前統(tǒng)籌和規(guī)劃,會很容易變成被動響應(yīng)的角色。