云管平臺與運(yùn)維平臺是應(yīng)該統(tǒng)一建立還是分開建立好?如果分開建邊界如何劃分?
在企業(yè)沒有成熟的云管平臺和運(yùn)維平臺的情況下,企業(yè)應(yīng)該選擇方案一還是方案二?
方案一:分別建設(shè)云管平臺和運(yùn)維平臺,然后對接。
方案二:選擇一個(gè)云管平臺,然后豐富其運(yùn)維功能。
方案一的困難在于需要分別建設(shè),需要?jiǎng)澐诌吔纾环桨付膯栴}在于云管平臺會越來越臃腫,演進(jìn)方向不明。
問題來自@systemroot 中國航空結(jié)算有限責(zé)任公司 系統(tǒng)工程師,下文來自twt社區(qū)眾多同行實(shí)踐經(jīng)驗(yàn)分享。
@木木糖 吉利汽車 基礎(chǔ)架構(gòu)經(jīng)理:
我們的云管平臺是資源生命周期管理平臺,資源(虛擬機(jī)、物理機(jī)、DNS、VIP、負(fù)載均衡等)的生命周期,包括資源申請創(chuàng)建、回收和變更;運(yùn)維平臺有CMDB、堡壘機(jī)、ITSM、監(jiān)控、日志等,云管平臺和運(yùn)維平臺有數(shù)據(jù)交互,通過提供API接口實(shí)現(xiàn)。
公司規(guī)模不大,可以考慮云管和運(yùn)維平臺放一起,可方便統(tǒng)一管理。
公司規(guī)模大了,每個(gè)部門和人負(fù)責(zé)的事情更加細(xì)化,云管和運(yùn)維平臺是否放一起要看組織架構(gòu)如何劃分,我們的云平臺和運(yùn)維平臺是獨(dú)立的部門,所以只能分開。相互的配合和數(shù)據(jù)交互是問題,比如云管平臺要從監(jiān)控平臺取所有虛擬機(jī)的性能數(shù)據(jù),但是監(jiān)控平臺卻只監(jiān)控核心系統(tǒng)的數(shù)據(jù)。
所以要有頂層設(shè)計(jì),定義好每個(gè)模塊的功能,模塊之前要交互哪些數(shù)據(jù),如何交互,想清楚再做。
@lewoli qingcloud 系統(tǒng)架構(gòu)師:
云管,顧名思義,云的管理,云的核心是云服務(wù)交付,所以云管的核心應(yīng)該是多云環(huán)境的云服務(wù)的申請、審批、交付。從標(biāo)準(zhǔn)而言,應(yīng)該是面對租戶為主的。
運(yùn)維平臺,以資源管理為主,面對的是運(yùn)維團(tuán)隊(duì),關(guān)注的是系統(tǒng)的運(yùn)行和管理。
所以,云管和運(yùn)維是否合一,取決于其用戶的分類,如云管的用戶也是運(yùn)維團(tuán)隊(duì)自己,則必然將兩個(gè)管理系統(tǒng)合一,如果云管面對的是普通用戶,即租戶,那應(yīng)該分開。
所以,還是根據(jù)場景來進(jìn)行判斷兩個(gè)系統(tǒng)是否需要整合。
@mtming333 太平洋保險(xiǎn) 系統(tǒng)運(yùn)維工程師:
運(yùn)維平臺目前承擔(dān)了發(fā)布工作流、生產(chǎn)發(fā)布打包,工單快速處理、告警配置 、腳本管理。除了工單做了意義不大,其他都應(yīng)該糅合進(jìn)云管平臺與應(yīng)用相關(guān),成為應(yīng)用生命周期管理的一部分。
從落實(shí)到使用者上,考慮到減少用戶學(xué)習(xí)成本,我認(rèn)為也是建立一套更好。
@summit 城商行 系統(tǒng)架構(gòu)師:
首先要確認(rèn)企業(yè)要建云管平臺和運(yùn)維平臺的目標(biāo)是什么?
1、云管平臺主要實(shí)現(xiàn)資源的統(tǒng)一管理,統(tǒng)一交付,生命周期管理,流程管理等工作。
2、運(yùn)維平臺主要實(shí)現(xiàn)數(shù)據(jù)中心的資源監(jiān)控、動(dòng)環(huán)監(jiān)控、監(jiān)控實(shí)時(shí)告警等,并集成事件、問題、工單、CMDB等,并與ITSM結(jié)合實(shí)現(xiàn)流程線上化。
3、云管平臺自帶的監(jiān)控主要監(jiān)控自己管理的資源,監(jiān)控的維度也不全面,比如中間件、數(shù)據(jù)庫、硬件、動(dòng)環(huán)的監(jiān)控維度有可能不能涵蓋,如果要實(shí)現(xiàn)全方位的監(jiān)控需要做的工作很多,也會造成云管平臺的臃腫。
4、可以分別建立兩個(gè)平臺,兩個(gè)平臺進(jìn)行對接到統(tǒng)一的展示平臺,實(shí)現(xiàn)統(tǒng)一管理。
總之,兩個(gè)平臺的功能實(shí)現(xiàn)不同,企業(yè)需要確認(rèn)自己到底要實(shí)現(xiàn)什么功能和目標(biāo),來確定建設(shè)什么樣的平臺。
@duyh 中鐵信 系統(tǒng)架構(gòu)師:
在我們云管平臺的建設(shè)中,由于云平臺的建設(shè)和運(yùn)維由不同的組負(fù)責(zé),所以云平臺的建設(shè)和運(yùn)維平臺的建設(shè)是分開的。這時(shí)候體現(xiàn)出來的優(yōu)勢就是分工明確,每個(gè)組的定位清晰,缺點(diǎn)是在云平臺和運(yùn)維平臺交叉的一些問題上,不好定位,后來分析是由于兩個(gè)組的配合問題,采取的解決辦法就是一旦出現(xiàn)無法判斷是哪個(gè)平臺的問題的時(shí)候,就將兩個(gè)組的人拉到一起共同解決。
而如果要把兩個(gè)平臺合到一起,運(yùn)維平臺統(tǒng)一管理所有資產(chǎn),云管和運(yùn)維平臺耦合度太高,在運(yùn)維平臺有功能迭代時(shí),由于云管平臺依賴運(yùn)維平臺,不可避免的會影響云管平臺的功能,代價(jià)太大,所以個(gè)人不建議將兩個(gè)平臺融合到一起。
當(dāng)然,如果兩個(gè)平臺的體系架構(gòu)不融合,只是從一個(gè)統(tǒng)一界面做單點(diǎn)登錄,倒是也可以。
@he7yong Canway 研發(fā)工程師:
1. 是分是合?從業(yè)務(wù)現(xiàn)狀,業(yè)務(wù)目標(biāo),業(yè)務(wù)需求出發(fā),沒有最好,只有最合適;最佳實(shí)踐是:平臺不要太多,如果太多,平臺之間又會形成豎井,功能的打通和數(shù)據(jù)的打通會面臨問題。
2.我推薦的方案如下:選擇一個(gè)統(tǒng)一的運(yùn)維平臺(具備較強(qiáng)的集成能力和二次開發(fā)的能力),云管能力,CMDB能力,監(jiān)控能力,事件處理能力,大數(shù)據(jù)分析能力,運(yùn)維流程能力,甚至代碼管理能力,測試能力,構(gòu)建能力,制品庫管理能力,都可以作為通用能力模塊集成到“統(tǒng)一運(yùn)維平臺”。
3.面向用戶的資源交付服務(wù),云平臺管理服務(wù),運(yùn)維服務(wù),流程服務(wù),工單服務(wù)都可以運(yùn)用場景的理念,快速開發(fā)實(shí)現(xiàn)。
@Henry2017 金融行業(yè) 研發(fā)工程師:
云管和運(yùn)維是強(qiáng)耦合的,推薦放在一起做。
給不同用戶配置不同角色權(quán)限,普通用戶只能看到云資源操作的視圖,管理員能看到全平臺的視圖,包括監(jiān)控,日志,集群狀態(tài)等。
@jason2006xu 昆侖銀行 技術(shù)經(jīng)理:
1,從總體架構(gòu)規(guī)劃和設(shè)計(jì)原則來講,系統(tǒng)間應(yīng)該遵循高內(nèi)聚、低耦合的原則,所以云管平臺和運(yùn)維平臺應(yīng)該分開建設(shè),如果已經(jīng)整合在一起的話,建議按功能模塊分離,降低耦合度。
2、兩個(gè)平臺基本功能和定位不同,云管平臺的功能包括IAAS云平臺管理、PAAS云平臺管理,其中IAAS管理包括存儲、網(wǎng)絡(luò)、計(jì)算資源管理,PAAS云平臺管理主要包括容器云管理;運(yùn)維平臺包括監(jiān)控、ITIL、CMDB以及自動(dòng)化等。
3、云管平臺可以通過ESB與ITIL、CMDB、自動(dòng)化進(jìn)行報(bào)文交互及集成。
所以,建議選擇方案一。
@asdf-asdf cloudstone 研究學(xué)者:
云管模塊負(fù)責(zé)資源交付和基礎(chǔ)數(shù)據(jù)提供,自動(dòng)化運(yùn)維模塊負(fù)責(zé)持續(xù)運(yùn)維,版本發(fā)布都是后期自動(dòng)化平臺的工作,最后資源回收是云平臺模塊操作。分開開發(fā)可實(shí)現(xiàn)快速業(yè)務(wù)上線。