上云熱潮之下,如何實(shí)現(xiàn)專有云運(yùn)維?
為幫助用戶實(shí)現(xiàn)高效云運(yùn)維,百度智能云將推出專有云運(yùn)維系列文章,分享運(yùn)維的技術(shù)要點(diǎn),助力用戶上云之路。本篇為第一篇,我們將重點(diǎn)解讀針對(duì)專有云運(yùn)維的關(guān)鍵難題,百度智能云的智能運(yùn)維平臺(tái)如何一一擊破,達(dá)到“更快、更準(zhǔn)、更穩(wěn)”。
面向云計(jì)算,這些困擾你有嗎?
平臺(tái)部署架構(gòu)是什么樣的?云上云下資源有哪些?具體資源使用情況如何?云平臺(tái)怎么穩(wěn)定升級(jí)變更,日常怎么運(yùn)維巡檢?等等,都需要用戶做到心中有數(shù)。
對(duì)大多數(shù)用戶來說,理想的運(yùn)維平臺(tái)是這樣的。
你想要的,盡在百度智能云智能運(yùn)維平臺(tái)
百度智能云智能運(yùn)維平臺(tái)致力于幫助客戶更快、更準(zhǔn)、更穩(wěn)的使用云平臺(tái)。
拒絕黑盒的配置管理中心
云計(jì)算場(chǎng)景下,運(yùn)維對(duì)象變得更加繁多和復(fù)雜,既有云下的機(jī)房、機(jī)柜、機(jī)架、服務(wù)器、網(wǎng)絡(luò)設(shè)備、安全設(shè)備、專線、配件等,也包括云上各類云服務(wù)器、云磁盤等云產(chǎn)品,再加上各類IP、NAT、DNS等。
這些對(duì)象的元信息、關(guān)聯(lián)信息如何維護(hù)?如何保證信息的準(zhǔn)確性?你是否還在手動(dòng)維護(hù)資產(chǎn)信息?你是否還在手動(dòng)查庫獲取信息?對(duì)于云平臺(tái)部署拓?fù)洹⑽锢硗負(fù)?、業(yè)務(wù)拓?fù)涫欠襁€是無法做到一覽眾山?。?/p>
百度智能云智能運(yùn)維平臺(tái)的統(tǒng)一配置管理中心可以收集全平臺(tái)各類運(yùn)維對(duì)象的元信息和關(guān)聯(lián)信息,從部署拓?fù)?、物理拓?fù)浜蜆I(yè)務(wù)拓?fù)涞确矫鏋槟愦蜷_云平臺(tái)黑盒,一一捋順其中細(xì)節(jié)。
拒絕繁瑣的運(yùn)維中心
“叮鈴鈴…叮鈴鈴…”一陣急促的電話鈴
“喂”
“我們正在做重要的業(yè)務(wù)變更,怎么虛機(jī)都登錄不上了,你們?cè)趺催\(yùn)維的”
“哦哦,我們馬上處理”
一陣雞飛狗跳之后,服務(wù)恢復(fù)了…你也成功的進(jìn)入了casestudy環(huán)節(jié)
業(yè)內(nèi)傳言,純?nèi)巳?、半自?dòng)化運(yùn)維的時(shí)期,沒有很好的監(jiān)控手段,經(jīng)常都是故障已經(jīng)影響到業(yè)務(wù)了,由業(yè)務(wù)部門投訴運(yùn)維才知道,只能是所謂的“救火”。
到目前為止,是不是可以轉(zhuǎn)變?yōu)?ldquo;防火”了呢?實(shí)際上,面對(duì)物理機(jī)、交換機(jī)、各類操作系統(tǒng)、容器、數(shù)據(jù)庫、中間件、網(wǎng)絡(luò)質(zhì)量等眾多對(duì)象,如何建立指標(biāo)監(jiān)控體系,保證指標(biāo)有效性、可靠性,避免漏報(bào)、誤報(bào),依然是當(dāng)前監(jiān)控面臨的一個(gè)較大的問題。
百度智能云智能運(yùn)維平臺(tái),依托百度內(nèi)部自用的監(jiān)控系統(tǒng),完美的繼承了百度將近20年的監(jiān)控經(jīng)驗(yàn)。什么對(duì)象,應(yīng)該監(jiān)控什么指標(biāo),怎么計(jì)算可用性都可以直接賦能客戶,幫助客戶建立監(jiān)控體系,再由百度駐場(chǎng)工程師與客戶一起根據(jù)實(shí)際業(yè)務(wù)進(jìn)行細(xì)微調(diào)整,即可達(dá)到開箱即用,開箱好用的目標(biāo)。
拒絕繁瑣的運(yùn)維中心
故障發(fā)生了,需要快速的對(duì)線上進(jìn)行及時(shí)止損操作;容量不足了,需要對(duì)平臺(tái)進(jìn)行快速擴(kuò)容操作;成百上千臺(tái)服務(wù)器需要批量進(jìn)行操作?云上虛機(jī)需要進(jìn)行冷熱遷移,當(dāng)面對(duì)這些運(yùn)維場(chǎng)景時(shí),是不是還要找找SOP,對(duì)著SOP一行行的敲著命令來實(shí)現(xiàn)呢?
在百度智能云智能運(yùn)維平臺(tái),所有常規(guī)運(yùn)維操作,物理機(jī)運(yùn)維、物理網(wǎng)絡(luò)運(yùn)維、云產(chǎn)品運(yùn)維、容災(zāi)演練、擴(kuò)容縮容等等,都產(chǎn)品化到運(yùn)維中心,拿來即用,提高效率的同時(shí),避免線上誤操作的發(fā)生。
拒絕非標(biāo)的操作中心
如果運(yùn)維中心的操作仍然不能滿足運(yùn)維需要,怎么辦呢?沒關(guān)系,自動(dòng)化操作中心來滿足。
在這里,你可以完全自定義的編寫或者導(dǎo)入自己的運(yùn)維腳本,并通過腳本庫進(jìn)行版本和質(zhì)量管理,避免非標(biāo)執(zhí)行。不止如此,還可以將多個(gè)原子化的腳本進(jìn)行自定義編排,形成復(fù)雜但是可控的運(yùn)維作業(yè)來實(shí)現(xiàn)個(gè)性化運(yùn)維需求。
拒絕混亂的服務(wù)中心
隨意的變更,隨意的處理,隨意的歸檔,永遠(yuǎn)無法沉淀下有效的運(yùn)維經(jīng)驗(yàn)。百度智能云智能運(yùn)維平臺(tái)的服務(wù)中心,遵循標(biāo)準(zhǔn)ITIL,設(shè)置服務(wù)臺(tái)、審批流、工單、事件單、問題單等,幫助進(jìn)行流程規(guī)范和知識(shí)沉淀。
此外,智能運(yùn)維平臺(tái)還有運(yùn)維知識(shí)庫,所有服務(wù)中心的工單和處理流程都將入庫保存,并基于自然語義理解,對(duì)外提供高效能搜索查詢。如果有類似的問題發(fā)生,不需要尋求他人幫助,運(yùn)維知識(shí)庫將成為你的第一手信息來源,幫你快速解決。
另外,在后續(xù)的專題中,我們還會(huì)繼續(xù)深挖知識(shí)庫的隱藏功能。
拒絕死板的可視化能力
運(yùn)維可視化,也是整個(gè)運(yùn)維過程的關(guān)鍵環(huán)節(jié)。一方面可視化將運(yùn)維數(shù)據(jù)公開、透明;另一方面,可視化在一定程度上反映出我們對(duì)運(yùn)維工作的理解程度。
可視化程度越高,運(yùn)維就越簡(jiǎn)單,運(yùn)維效率也就越高。百度智能云智能運(yùn)維平臺(tái),內(nèi)置了豐富的大盤、儀表盤和報(bào)表能力,同時(shí)還提供自定義大盤和自定義報(bào)表能力,客戶可以根據(jù)業(yè)務(wù)需要實(shí)現(xiàn)完全的自定義。
在諸多運(yùn)維挑戰(zhàn)面前,百度智能云智能運(yùn)維平臺(tái)以科學(xué)合理的設(shè)計(jì),幫助用戶實(shí)現(xiàn)高效運(yùn)維。此外,作為最適合跑AI的云,百度智能云還將AI融入云運(yùn)維之中,比如,智能異常檢測(cè)、智能故障收斂、智能根因診斷、智能分級(jí)發(fā)布、智能故障預(yù)測(cè)等等。