本文來自開源云中文社區(qū)。
對(duì)于今天的組織來說,現(xiàn)代化基礎(chǔ)設(shè)施勢在必行。技術(shù)領(lǐng)導(dǎo)者知道,為了推動(dòng)業(yè)務(wù)價(jià)值,必須改進(jìn)基礎(chǔ)設(shè)施,使其更高效、更靈活、更具成本效益。
云平臺(tái)上的無服務(wù)器計(jì)算和容器化等現(xiàn)代技術(shù)為實(shí)現(xiàn)這些目標(biāo)提供了引人注目的手段,也提供了大量潛在途徑——做什么是明確的;怎么做是不行的。
IT需要超越lifting and shifting,滿懷信心地遷移和現(xiàn)代化。本文將研究IT團(tuán)隊(duì)在遷移到新環(huán)境時(shí)面臨的三大挑戰(zhàn),更重要的是,如何解決這些挑戰(zhàn)。
現(xiàn)代化挑戰(zhàn)1:應(yīng)對(duì)云遷移的復(fù)雜性
云計(jì)算已經(jīng)成為未來的操作系統(tǒng)。對(duì)安全性和可靠性的擔(dān)憂已經(jīng)轉(zhuǎn)變?yōu)閷?duì)云能夠?qū)崿F(xiàn)創(chuàng)新、輕松適應(yīng)以及在正確操作時(shí)控制成本的贊賞。云計(jì)算服務(wù)的爆炸式發(fā)展超越了按需基礎(chǔ)設(shè)施選項(xiàng),為組織提供了無數(shù)交付現(xiàn)代應(yīng)用程序的方式。但隨著選擇而來的是復(fù)雜性。此外,從AWS到Azure,從IBM到GCP和Oracle Cloud Infrastructure,提供商和服務(wù)的組合令人望而卻步。
這種情況使IT處于眾所周知的困難境地。如果他們選擇一家供應(yīng)商,然后全力以赴地進(jìn)行標(biāo)準(zhǔn)的lift and shift,他們將失去優(yōu)化和充分利用平臺(tái)服務(wù)的能力。如果不進(jìn)行優(yōu)化,就很難實(shí)現(xiàn)最初推動(dòng)向云遷移的好處。然而,分析所有潛在的遷移可能性在時(shí)間和資源上都是困難的。構(gòu)建一個(gè)包含所有選項(xiàng)的矩陣將導(dǎo)致成百上千的排列組合。選擇正確的組合幾乎是不可能的。
這兩種選擇都使得IT很難達(dá)到最佳狀態(tài)。你不希望由于風(fēng)險(xiǎn)-性能問題而導(dǎo)致供應(yīng)不足,但過度供應(yīng)會(huì)浪費(fèi)資金。更不用說,云服務(wù)在不斷變化。遷移需要考慮到業(yè)務(wù)需求和新的服務(wù)可用性。如果沒有對(duì)當(dāng)前和未來工作負(fù)載進(jìn)行可視化、預(yù)測和優(yōu)化的能力,IT就無法充分利用云的潛力。
現(xiàn)代化挑戰(zhàn)2:正確調(diào)整容器大小和優(yōu)化容器環(huán)境
像Kubernetes這樣的容器環(huán)境提供了與云類似的好處和挑戰(zhàn)。容器使IT團(tuán)隊(duì)能夠提高效率、靈活性和速度,改進(jìn)應(yīng)用程序生命周期管理,并使現(xiàn)有應(yīng)用程序更快、更容易實(shí)現(xiàn)現(xiàn)代化。不過,與云一樣,容器也必須進(jìn)行優(yōu)化,以實(shí)現(xiàn)其降低成本和優(yōu)化性能的能力。
為了有效地編排容器,IT必須了解如何分配它們。與云資源調(diào)配一樣,容器資源分配不足可能會(huì)導(dǎo)致服務(wù)保證問題,而過度分配可能會(huì)導(dǎo)致浪費(fèi)開支,尤其是因?yàn)閱蝹€(gè)應(yīng)用程序團(tuán)隊(duì)往往會(huì)請求比安全所需更多的資源。當(dāng)容器用于管理波動(dòng)的業(yè)務(wù)需求對(duì)IT系統(tǒng)的影響時(shí),適當(dāng)調(diào)整容器環(huán)境的大小尤為重要。為當(dāng)前狀態(tài)優(yōu)化容器環(huán)境至關(guān)重要,但了解將要發(fā)生的事情也很重要,這樣可以相應(yīng)地分配資源。
現(xiàn)代化挑戰(zhàn)3:將業(yè)務(wù)驅(qū)動(dòng)與IT系統(tǒng)需求相關(guān)聯(lián)
容器和云不是唯一需要IT團(tuán)隊(duì)預(yù)測和規(guī)劃不斷變化的業(yè)務(wù)需求的系統(tǒng)。使IT基礎(chǔ)設(shè)施現(xiàn)代化需要清楚地了解內(nèi)部和外部驅(qū)動(dòng)因素的起伏如何影響所有系統(tǒng);如果沒有它,可能會(huì)對(duì)業(yè)務(wù)產(chǎn)生嚴(yán)重后果。
當(dāng)今環(huán)境的復(fù)雜性使這種相關(guān)性比以往任何時(shí)候都更具挑戰(zhàn)性。即使有合適的人員、專業(yè)知識(shí)和資源,能力規(guī)劃團(tuán)隊(duì)仍然無法跟上當(dāng)前市場的速度和不可預(yù)測性,也無法理解其對(duì)底層技術(shù)基礎(chǔ)設(shè)施和資源的影響。通過假設(shè)規(guī)劃將已知或計(jì)劃的事件和潛在業(yè)務(wù)場景考慮在內(nèi)對(duì)于主動(dòng)評(píng)估和管理風(fēng)險(xiǎn)至關(guān)重要。這樣可以提前采取行動(dòng),防止服務(wù)中斷或性能下降。
現(xiàn)代化基礎(chǔ)設(shè)施時(shí)需要尋找的關(guān)鍵功能
解決這三個(gè)挑戰(zhàn)需要以下能力:
——在選擇云服務(wù)提供商之前(而不是之后),根據(jù)組織獨(dú)特的基礎(chǔ)設(shè)施和使用情況進(jìn)行成本和資源需求比較,以評(píng)估和調(diào)整工作量遷移。
——從第三方解決方案中獲取指標(biāo)、事件和拓?fù)涞募?,以?shí)現(xiàn)廣泛的可觀察性。
——動(dòng)態(tài)服務(wù)建模,用于全面的服務(wù)拓?fù)湟晥D,支持以服務(wù)為中心的監(jiān)控,以連續(xù)查看業(yè)務(wù)服務(wù)的狀態(tài)。
——智能自動(dòng)化和分析,以確定自動(dòng)糾正措施的機(jī)會(huì),并在違反基線之前檢測趨勢、模式和異常。
——人工智能和機(jī)器學(xué)習(xí)驅(qū)動(dòng)的事件關(guān)聯(lián)、情況管理和根本原因隔離,以減少平均修復(fù)時(shí)間(MTTR)。
——跨多種數(shù)據(jù)源進(jìn)行日志分析和豐富,以早期診斷潛在問題并避免服務(wù)中斷。
——“假設(shè)”模擬,以查看不同業(yè)務(wù)驅(qū)動(dòng)因素的影響,調(diào)整Kubernete的大小并優(yōu)化容器環(huán)境,確保資源得到適當(dāng)?shù)恼{(diào)配和分配。
減少遷移到云的時(shí)間、復(fù)雜性和成本
IT領(lǐng)導(dǎo)者必須確保他們擁有當(dāng)今和未來服務(wù)保證所需的技術(shù)資源,無論他們的環(huán)境多么動(dòng)態(tài)、復(fù)雜或多樣。無論你是從內(nèi)部部署遷移到公共云、從一個(gè)云遷移到另一個(gè)云,還是在多云環(huán)境中的云之間遷移,通過AIOps、機(jī)器學(xué)習(xí)、高級(jí)分析和智能自動(dòng)化進(jìn)行預(yù)測,都可以提供需要的洞察,以平衡風(fēng)險(xiǎn)、效率和IT支出,同時(shí)優(yōu)化性能和可用性。