前言
為了推進(jìn)企業(yè)數(shù)字化轉(zhuǎn)型,實(shí)現(xiàn)企業(yè)戰(zhàn)略目標(biāo),企業(yè)上云是趨勢(shì),從IaaS、PaaS、SaaS到混合云,而且占據(jù)比例越來(lái)越高,運(yùn)維工作量越來(lái)越大,運(yùn)維難度越來(lái)越大,運(yùn)維架構(gòu)越來(lái)越復(fù)雜,如何有效實(shí)現(xiàn)云平臺(tái)運(yùn)維、提升運(yùn)維效率?本文就云模式下總體運(yùn)維架構(gòu)演進(jìn)進(jìn)行探討。
1、IaaS運(yùn)維架構(gòu)
IaaS云管平臺(tái)領(lǐng)域分類如下:
云管平臺(tái)在企業(yè)IT云化過(guò)程中有著獨(dú)立的角色定位和使命。越來(lái)越多的企業(yè)IT部門面臨著IT能力云化/服務(wù)化的訴求。這種訴求的背后面臨著幾個(gè)關(guān)鍵性的技術(shù)挑戰(zhàn),即IT資源服務(wù)化、IT資源全生命周期管理和異構(gòu)IT及多云對(duì)接。
■IT資源服務(wù)化:
如果需要對(duì)企業(yè)內(nèi)部各種IT資源進(jìn)行服務(wù)化,那就需要有一個(gè)獨(dú)立的用戶/租戶體系,這個(gè)用戶/租戶體系需要超越任何IT資源自帶的用戶/租戶體系。這就是獨(dú)立云管平臺(tái)一個(gè)重要的產(chǎn)品特征。
另外,IT資源服務(wù)化還需要能夠建立起IT產(chǎn)品及能力的標(biāo)準(zhǔn)服務(wù)目錄,這需要IT產(chǎn)品及能力服務(wù)目錄定義、抽象以及相關(guān)的自動(dòng)化能力。但是,當(dāng)面對(duì)現(xiàn)實(shí),你會(huì)發(fā)現(xiàn)企業(yè)內(nèi)部不同IT產(chǎn)品及能力在服務(wù)化支持能力上參差不齊,這要求云管平臺(tái)能夠針對(duì)不同IT產(chǎn)品及能力的現(xiàn)狀建立合適的IT資源服務(wù)化模式。獨(dú)立云管平臺(tái)則可以保障這個(gè)模式得以靈活構(gòu)建。
■IT資源全生命周期管理:
企業(yè)IT內(nèi)部的資源形態(tài)非常多樣化,有云主機(jī)這樣的計(jì)算資源,也有塊存儲(chǔ)、對(duì)象存儲(chǔ)和文件存儲(chǔ),還有備份、監(jiān)控、安全等運(yùn)維管理能力。每種IT產(chǎn)品及能力因?yàn)槠涠ㄎ徊煌?,使用?chǎng)景不同,其生命周期管理模式也不同。云管平臺(tái)需要能夠提供足夠的擴(kuò)展能力,讓不同的IT產(chǎn)品及能力的生命周期管理模式在其框架內(nèi)實(shí)現(xiàn)。而這種擴(kuò)展能力也要求云管平臺(tái)能夠有獨(dú)立的角色定位。日常綁定特定IT產(chǎn)品和能力的云管平臺(tái)很難擔(dān)當(dāng)起這個(gè)獨(dú)立角色。
■異構(gòu)IT及多云對(duì)接:
企業(yè)內(nèi)部的IT異構(gòu)主要來(lái)自于兩個(gè)方面,一是企業(yè)IT的演化和迭代是一個(gè)長(zhǎng)期的過(guò)程,這就意味著不同階段的IT產(chǎn)品及能力會(huì)長(zhǎng)時(shí)間共存。最為典型的代表就是很多企業(yè)內(nèi)部IT計(jì)算資源會(huì)同時(shí)存在有大型機(jī)、小型機(jī)、X86服務(wù)器、X86虛擬化、IaaS乃至容器云等。因?yàn)檫@個(gè)原因,綁定一種IT產(chǎn)品及能力的云管平臺(tái)很難承擔(dān)起整個(gè)企業(yè)IT能力云化/服務(wù)化的使命。
云管平臺(tái)運(yùn)維架構(gòu)演進(jìn):
一是對(duì)基礎(chǔ)設(shè)施的混合IT整合,形成一體化的資源池;二是混合IT的對(duì)接與管理,包括與原有ITSM流程的自動(dòng)化對(duì)接,IT數(shù)據(jù)流轉(zhuǎn)與自服務(wù)的對(duì)接等。以云管平臺(tái)為綱,向兼顧穩(wěn)健性和敏捷性的混合IT基礎(chǔ)平臺(tái)轉(zhuǎn)型,全面推進(jìn)基礎(chǔ)架構(gòu)的升級(jí)。
2、PaaS運(yùn)維架構(gòu)
基于業(yè)務(wù)發(fā)展的需要和快速進(jìn)步的金融科技技術(shù),越來(lái)越多的傳統(tǒng)銀行希望從技術(shù)層面更有效地支持業(yè)務(wù)創(chuàng)新,如微服務(wù)架構(gòu)、更好的靈活性、擴(kuò)展性、高可用性、更高效的業(yè)務(wù)上線效率等,因此建設(shè)并推廣適合自身的基于容器技術(shù)的云平臺(tái)是關(guān)鍵任務(wù)。
基于Kubernetes集群節(jié)點(diǎn)的運(yùn)維可以從以下幾點(diǎn)考慮并靈活運(yùn)用:
主要資源指標(biāo)監(jiān)控、告警
Node affinity/taint
鏡像、容器gc策略
擴(kuò)展節(jié)點(diǎn)設(shè)備類型-ListAndWatch/Allocate
節(jié)點(diǎn)維護(hù)狀態(tài)
時(shí)間同步
節(jié)點(diǎn)故障、自定義agent上報(bào)異常情況
節(jié)點(diǎn)資源不足時(shí)的處理
在不同的底層IaaS平臺(tái)基礎(chǔ)上,還可以充分發(fā)揮IaaS的一些能力來(lái)簡(jiǎn)化或者改善容器PaaS的運(yùn)維工作。隨著Kubernetes自身的快速迭代,升級(jí)也就成了不得不考慮的一方面,目前提供兩種升級(jí)路徑,in-place或者data migration,分別適合小版本升級(jí)和跨度較大的版本升級(jí)。PaaS架構(gòu)用戶不需要去關(guān)心底層的基礎(chǔ)設(shè)施,只需要專注業(yè)務(wù)應(yīng)用本身,容器PaaS以應(yīng)用為中心,標(biāo)準(zhǔn)化、自動(dòng)化應(yīng)用的構(gòu)建(Build)、交付(Ship)、部署運(yùn)行(Run)流程,支撐應(yīng)用的完整生命周期管理。通過(guò)容器云PaaS提供的豐富基礎(chǔ)服務(wù)及之上的SaaS服務(wù),提高IT設(shè)施自服務(wù)能力以及新業(yè)務(wù)的交付效率。
3、DevOPS運(yùn)營(yíng)
云原生價(jià)值的最大體現(xiàn)之一在于對(duì)企業(yè)DevOps的支持,它將企業(yè)開發(fā)運(yùn)維部門很好地結(jié)合起來(lái),DevOps將打破開發(fā)、測(cè)試、運(yùn)維部門之間的隔閡,讓整體的應(yīng)用交付變得更快速。從技術(shù)角度看,DevOps涵蓋了應(yīng)用的開發(fā)、編譯、構(gòu)建、測(cè)試、打包、發(fā)布的自動(dòng)化流程,并包含了很多DevOps工具鏈。
Devos的構(gòu)想藍(lán)圖如下:
DevOps落地:
DevOps起于規(guī)劃,行于設(shè)計(jì),終于運(yùn)營(yíng):
1、規(guī)模組織的DevOPS轉(zhuǎn)型是個(gè)系統(tǒng)工程,任何單方面和局部的調(diào)整收效都將有限;
2、DevOPS不會(huì)讓運(yùn)維消失,但運(yùn)維必須在工作思維、工作模式和軟件工程能力上躍進(jìn);
3、快速發(fā)展的業(yè)務(wù)域是開展DevOPS模式的優(yōu)選;
4、研發(fā)開始就要必須入局,從設(shè)計(jì)之初就開始為系統(tǒng)的穩(wěn)定性考慮;運(yùn)維也需要和研發(fā)一起提高對(duì)業(yè)務(wù)的交付效率和質(zhì)量;
5、資源和組件服務(wù)團(tuán)隊(duì)、CI/CD工具團(tuán)隊(duì)及OPS工具團(tuán)隊(duì)在技術(shù)戰(zhàn)略規(guī)劃、戰(zhàn)術(shù)展開都要參與并通力協(xié)作;
6、工具鏈的建設(shè)必須服務(wù)于用戶,工具鏈設(shè)計(jì)需要場(chǎng)景化,非場(chǎng)景化的設(shè)計(jì)會(huì)割裂完整的工作,損失工具鏈在提效上的效果;工具鏈研發(fā)戰(zhàn)線不要拉得太長(zhǎng),以敏捷的思維優(yōu)先解決讓用戶最痛的剛性場(chǎng)景需求;
7、研發(fā)進(jìn)入生產(chǎn)環(huán)境在初期可能帶來(lái)系統(tǒng)穩(wěn)定性質(zhì)量的風(fēng)險(xiǎn),做好管控,不要止步于恐懼;
8、系統(tǒng)上云工作需把握好節(jié)奏和規(guī)劃好逃生通道并做有效演練;
9、轉(zhuǎn)型初期見(jiàn)效可能不明顯,甚至?xí)霈F(xiàn)效能和質(zhì)量的下降,需要及時(shí)分析問(wèn)題所在并優(yōu)化,要有耐心。
4、業(yè)務(wù)運(yùn)營(yíng)
銀行數(shù)據(jù)中心的重點(diǎn)不再僅僅是提供基礎(chǔ)資源和維護(hù),而是提供產(chǎn)品和服務(wù)來(lái)支持和實(shí)現(xiàn)企業(yè)的業(yè)務(wù)戰(zhàn)略。在當(dāng)前環(huán)境下如何利用人工智能、網(wǎng)絡(luò)SDN、容器等技術(shù),來(lái)支持快速增產(chǎn)的基礎(chǔ)資源并滿足業(yè)務(wù)需求。
運(yùn)維中心在保證安全運(yùn)營(yíng)的基礎(chǔ)上,持續(xù)打造自身核心競(jìng)爭(zhēng)力,提出了將運(yùn)維工作敏捷化、數(shù)字化、智能化、服務(wù)化的目標(biāo),具體包括以下內(nèi)容:
5、展望未來(lái)
隨著DevOps的深化、普及,將會(huì)形成更加標(biāo)準(zhǔn)化的應(yīng)用交付流程。PaaS會(huì)逐步弱化IaaS層的一些概念,在某些需求場(chǎng)景下甚至舍棄IaaS,在物理資源上直接部署PaaS。微服務(wù)、服務(wù)網(wǎng)格、APM等應(yīng)用側(cè)工具逐步繁榮,用戶的重心向業(yè)務(wù)架構(gòu)及其治理方向轉(zhuǎn)移。隨著云的類型增多及其復(fù)雜性的增加,多云管理、云管平臺(tái)也會(huì)出現(xiàn)強(qiáng)烈需求,另外用戶對(duì)“云原生”的更多理解,會(huì)帶動(dòng)新的開發(fā)模式、開發(fā)框架的產(chǎn)生,比如Serverless等,最終實(shí)現(xiàn)企業(yè)高效、敏捷、管理、精益IT服務(wù)管理的目標(biāo)。