1.背景
云網(wǎng)管是基于阿里云網(wǎng)絡(luò)多年技術(shù)和經(jīng)驗(yàn)沉淀打造的云上智能網(wǎng)絡(luò)管理運(yùn)維平臺(tái),提供企業(yè)網(wǎng)絡(luò)全生命周期管理運(yùn)維的能力,讓部署更快捷、運(yùn)維更高效、網(wǎng)絡(luò)更透明。
1.1 用戶痛點(diǎn)
1.安裝部署難
傳統(tǒng)網(wǎng)管大多都是本地部署,用戶需要負(fù)責(zé)物理資源規(guī)劃、中間件安裝、安裝包部署等等工作,通常需要專業(yè)的網(wǎng)絡(luò)和IT維護(hù)人員數(shù)天甚至數(shù)周才能部署上線。
2.集中管理難
網(wǎng)絡(luò)設(shè)備自有的廠商網(wǎng)管,一般只能提供本地web訪問方式,不能集中管理,更做不到跨廠商管理,無法給用戶提供統(tǒng)一的管理視角,需要多套網(wǎng)管系統(tǒng)之間切換使用。
3.網(wǎng)絡(luò)擴(kuò)展難
辦公、零售場所隨著業(yè)務(wù)的擴(kuò)展,經(jīng)常需要全國各地快速開店,目前網(wǎng)絡(luò)的交付都是網(wǎng)絡(luò)工程師通過console口登錄一臺(tái)臺(tái)配置下發(fā),效率低下且容易出錯(cuò)。
2.產(chǎn)品介紹
2.1 網(wǎng)絡(luò)管理范圍
如下圖定義網(wǎng)絡(luò)管理的全生命周期,傳統(tǒng)的網(wǎng)管系統(tǒng),對網(wǎng)絡(luò)的管理主要針對網(wǎng)絡(luò)服役階段,面向的是已上線網(wǎng)元的資源管理和運(yùn)維監(jiān)控等,無法做到網(wǎng)絡(luò)設(shè)備的全生命周期管理。
圖1 網(wǎng)絡(luò)管理全生命周期
云網(wǎng)管對網(wǎng)絡(luò)的管理是貫穿整個(gè)生命周期的,在網(wǎng)絡(luò)未上線的時(shí)候,可以離線規(guī)劃設(shè)計(jì),定義網(wǎng)絡(luò)架構(gòu);在建設(shè)交付的時(shí)候,將定義好的網(wǎng)絡(luò)架構(gòu)以項(xiàng)目的方式進(jìn)行實(shí)施,整個(gè)交付過程流程可控,質(zhì)量可管;驗(yàn)收通過后,網(wǎng)絡(luò)正式進(jìn)入服役階段,在該階段網(wǎng)絡(luò)的核心訴求是穩(wěn)定運(yùn)行、少出故障以及故障發(fā)生后的快速定位和故障恢復(fù),云網(wǎng)管的監(jiān)控、變更、巡檢等模塊確保網(wǎng)絡(luò)服役階段的穩(wěn)定運(yùn)行直到網(wǎng)絡(luò)下線。在整個(gè)網(wǎng)絡(luò)生命周期中,資源管理確保網(wǎng)絡(luò)資源與真實(shí)網(wǎng)絡(luò)的一致性。
2.2 產(chǎn)品功能介紹
2.2.1 建設(shè)交付
架構(gòu)設(shè)計(jì)
在網(wǎng)絡(luò)尚未上線時(shí)可以預(yù)先進(jìn)行網(wǎng)絡(luò)規(guī)劃,網(wǎng)絡(luò)架構(gòu)用于定義網(wǎng)絡(luò)組網(wǎng)的互聯(lián)規(guī)范和技術(shù)規(guī)格,提供圖形化的架構(gòu)設(shè)計(jì)和管理功能,通過圖形化的方式進(jìn)行組網(wǎng)拓?fù)涞撵`活編排,并對各個(gè)網(wǎng)絡(luò)組件的具體規(guī)格進(jìn)行配置。
如圖通過可視化的方式進(jìn)行網(wǎng)絡(luò)架構(gòu)設(shè)計(jì),定義網(wǎng)絡(luò)模塊的數(shù)量和連接關(guān)系。
圖2 網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)
結(jié)合設(shè)計(jì)好的網(wǎng)絡(luò)規(guī)劃和配置規(guī)范,自動(dòng)生成可一鍵導(dǎo)入的標(biāo)準(zhǔn)配置文件。
圖3 配置文件生成
建設(shè)交付
建設(shè)交付是將網(wǎng)絡(luò)方案以項(xiàng)目的形式進(jìn)行設(shè)備下發(fā),在每個(gè)項(xiàng)目中以工單的形式控制交付過程和保障質(zhì)量。
圖4 建設(shè)交付項(xiàng)目實(shí)施
2.2.2 智能運(yùn)維
態(tài)勢感知
通過全局視角和分支視角對網(wǎng)絡(luò)整體狀態(tài)進(jìn)行實(shí)時(shí)感知。
健康度: 結(jié)合設(shè)備告警情況、網(wǎng)絡(luò)巡檢狀況、監(jiān)控覆蓋程度等多維度對網(wǎng)絡(luò)狀況進(jìn)行評分。
動(dòng)態(tài)拓?fù)? 通過LLDP和MAC掃描技術(shù)準(zhǔn)實(shí)時(shí)拓?fù)涓?,設(shè)備連接關(guān)系、端口信息等實(shí)時(shí)呈現(xiàn)。
一體化監(jiān)控
一個(gè)辦公分支或者門店的網(wǎng)絡(luò),一般是涵蓋了多個(gè)層次的網(wǎng)絡(luò),包含多種網(wǎng)絡(luò)形態(tài)的設(shè)備。通常包括接入運(yùn)營商的網(wǎng)關(guān)設(shè)備,進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā)的網(wǎng)絡(luò)設(shè)備(路由器或交換機(jī)),提供WLAN的無線設(shè)備以及五花八門的終端應(yīng)用。一套從網(wǎng)到端全鏈路覆蓋的監(jiān)控方案是必要的,因?yàn)橥藗?cè)的異常,可能是有線網(wǎng)絡(luò)的問題,有線側(cè)的故障,會(huì)影響下游端側(cè)多個(gè)終端或應(yīng)用的使用。
云網(wǎng)管針對有線網(wǎng)絡(luò)、無線網(wǎng)絡(luò)、終端應(yīng)用等不同網(wǎng)絡(luò)層次的設(shè)備,通過主動(dòng)采集、事件接收、插件部署、主動(dòng)撥測等多種監(jiān)控技術(shù),從網(wǎng)關(guān)到終端全鏈路監(jiān)控網(wǎng)絡(luò)運(yùn)行情況。在如下的監(jiān)控視圖里將交換機(jī)上聯(lián)口流量、到運(yùn)營商的出口流量、AP的終端連接數(shù)以及終端的監(jiān)控信息等有線和無線的指標(biāo)在一個(gè)視圖里完成監(jiān)控。
網(wǎng)絡(luò)編排
云網(wǎng)管提供可視化的流程編排引擎,用戶通過拖拽的方式將網(wǎng)絡(luò)操作的原子能力串聯(lián)起來,保障業(yè)務(wù)下發(fā)時(shí)的事務(wù)完整和安全。
1.完整業(yè)務(wù)流程編排定義
2.單步配置流程可視化下發(fā)
故障自愈
日常高頻的故障場景,基于云網(wǎng)管的網(wǎng)絡(luò)編排能力,可以將告警聯(lián)動(dòng)處理方案,快速實(shí)現(xiàn)故障止血和業(yè)務(wù)恢復(fù)。
3.架構(gòu)介紹
3.1 技術(shù)架構(gòu)
協(xié)議插件
云網(wǎng)管的協(xié)議插件集成了管理網(wǎng)絡(luò)所需要的ssh、telnet、netconf、snmp、grpc等協(xié)議,支持管理市面常見的商用網(wǎng)絡(luò)設(shè)備。
協(xié)議插件通過加密的安全通道與云端的采集控制實(shí)例進(jìn)行通信,高效執(zhí)行云端下發(fā)的設(shè)備操作指令和采集任務(wù),并將數(shù)據(jù)壓縮后實(shí)時(shí)反饋給云端進(jìn)行分析和展示。
協(xié)議插件的Agent支持以云網(wǎng)管自有硬件、軟件安裝包、集成SDWAN網(wǎng)關(guān)等多種方式輸出。
采集控制
采集控制實(shí)例在云端部署,在云網(wǎng)管的整體架構(gòu)中起承上啟下的作用。
調(diào)度引擎的工作流程:
1. 接收網(wǎng)絡(luò)編排下發(fā)的任務(wù),按任務(wù)優(yōu)先級、調(diào)度計(jì)劃等策略,將任務(wù)進(jìn)行合理拆解和調(diào)度。
2. 根據(jù)設(shè)備廠家型號(hào)等維度將指令通過模板翻譯映射為操作設(shè)備的具體指令。
3. 將指令下發(fā)到Agent執(zhí)行,等待接收執(zhí)行結(jié)果
4. 任務(wù)執(zhí)行結(jié)果分析和拼裝
模板管理: 模板分為“用戶模板”和“設(shè)備模板”兩類,“用戶模板”只具有業(yè)務(wù)含義,屏蔽了廠家差異,在網(wǎng)絡(luò)編排中直接引用,“設(shè)備模板”是細(xì)化到廠商、型號(hào)粒度,不同的廠商之間都有明顯差異。例如:“ACL策略”的設(shè)備模板,思科和華為是不同的指令。
網(wǎng)絡(luò)編排
網(wǎng)絡(luò)編排負(fù)責(zé)業(yè)務(wù)模型的統(tǒng)一抽象和定義,網(wǎng)絡(luò)編排將原子能力按業(yè)務(wù)流程進(jìn)行串連,形成具體的網(wǎng)絡(luò)方案。網(wǎng)絡(luò)方案通過流程引擎驅(qū)動(dòng)采集控制實(shí)例執(zhí)行每一步的原子操作,以工單的方式控制事務(wù)完整和鏈路追蹤。
應(yīng)用
網(wǎng)絡(luò)編排以API的形式對應(yīng)用提供能力和數(shù)據(jù)接口,應(yīng)用層實(shí)現(xiàn)具體的“資源管理”、“網(wǎng)絡(luò)巡檢”、“網(wǎng)絡(luò)變更”、“故障恢復(fù)”等能力,支持運(yùn)維人員進(jìn)行日常的網(wǎng)絡(luò)運(yùn)維、業(yè)務(wù)配置等工作。
3.2 部署架構(gòu)
云網(wǎng)管SaaS化部署,分鐘級開通云上網(wǎng)管實(shí)例,用戶側(cè)只用部署探針(硬件版只需要上電和網(wǎng)絡(luò)可達(dá))即可。
云網(wǎng)管的計(jì)算和存儲(chǔ)資源都是使用的阿里云資源,可以根據(jù)規(guī)格隨時(shí)擴(kuò)容,基于阿里云ASK集群實(shí)現(xiàn)的CI/CD功能,可以隨時(shí)迭代上線新功能。
4.總結(jié)
云網(wǎng)管致力于為復(fù)雜、異構(gòu)、分支眾多的線下網(wǎng)絡(luò)打造一款免部署、易上手、集中管理的SaaS化網(wǎng)絡(luò)運(yùn)維管理平臺(tái)。