用于管理和故障排除的云計(jì)算自動(dòng)化用例

Terry Slattery
由于云計(jì)算基礎(chǔ)設(shè)施由云計(jì)算提供商擁有和運(yùn)營,因此組織對云計(jì)算環(huán)境進(jìn)行管理和故障排除可能具有挑戰(zhàn)性。以下了解一些使云計(jì)算管理變得更容易的方法。

由于云計(jì)算基礎(chǔ)設(shè)施由云計(jì)算提供商擁有和運(yùn)營,因此組織對云計(jì)算環(huán)境進(jìn)行管理和故障排除可能具有挑戰(zhàn)性。以下了解一些使云計(jì)算管理變得更容易的方法。

首先,考慮采用云計(jì)算自動(dòng)化用例。盡管所提供的特定功能將取決于云計(jì)算提供商,但它們可以簡化對云計(jì)算實(shí)施的監(jiān)督。有些供應(yīng)商隱藏了云計(jì)算API之間的差異,如果用戶考慮采用多云或混合云,那么這將成為一個(gè)好處。市場上有一些多云編排工具,對于那些希望自己開發(fā)工具的組織來說,也可以使用Ansible和Python等開源軟件包進(jìn)行開發(fā)。

無論采用哪種方法,都會(huì)充分掩蓋云計(jì)算提供商之間的差異。組織只需確保其選擇的工具不會(huì)隱藏太多細(xì)節(jié),以免掩蓋排除故障所需的可見性。

使用工作流程管理云計(jì)算

自動(dòng)化常見的工作流程是可以使用的最有價(jià)值的機(jī)制。資源調(diào)配、取消配置、審核以及故障排除等任務(wù)非常重要。已經(jīng)采用敏捷軟件開發(fā)的組織將使用支持持續(xù)集成和持續(xù)交付的工作流程。組織部署的自動(dòng)化程度越高,管理云計(jì)算資源所需的工作量就越少。

云計(jì)算管理應(yīng)集中在以下五個(gè)方面:

1.消減成本

使用云計(jì)算提供商提供的云計(jì)算服務(wù)的優(yōu)勢之一是,可以消除或減少擁有和運(yùn)營數(shù)據(jù)中心基礎(chǔ)設(shè)施相關(guān)的成本,但是這種好處只有在正確管理流程的情況下才能獲得回報(bào)。為此,必須將IT系統(tǒng)和流程設(shè)計(jì)為根據(jù)需要自動(dòng)配置或取消配置資源,從而將人工交互降至最低。

2. IT安全

人們對云計(jì)算的一個(gè)普遍誤解是,它在某種程度上比企業(yè)托管更安全。實(shí)際上,它們面臨了一些新的挑戰(zhàn)。為了確保組織的數(shù)據(jù)受到保護(hù),需要與安全服務(wù)提供商簽訂合同,這些組織可以提供經(jīng)過驗(yàn)證的技術(shù)或服務(wù)來保護(hù)正在傳輸?shù)臄?shù)據(jù)和存儲(chǔ)的數(shù)據(jù)。在所有的云計(jì)算自動(dòng)化用例中,創(chuàng)建和維護(hù)良好的云安全是最典型的用例。

3. 性能

如果沒有正確設(shè)計(jì)和實(shí)施云計(jì)算環(huán)境,則應(yīng)用程序性能可能會(huì)受到影響。應(yīng)用程序的關(guān)鍵部分應(yīng)由云計(jì)算提供商提供服務(wù),以最大程度地減少通信延遲??梢岳枚鄠€(gè)云計(jì)算實(shí)例的應(yīng)用程序可以優(yōu)化客戶端到云平臺(tái)的位置選擇。

監(jiān)視云計(jì)算性能的一種方法是采用OpenTelemetry云計(jì)算可觀察性框架。它是一個(gè)開源的、供應(yīng)商中立的系統(tǒng),用于從云計(jì)算系統(tǒng)收集數(shù)據(jù)。收集度量和日志的軟件代理加載到計(jì)算系統(tǒng)上。收集到的數(shù)據(jù)被轉(zhuǎn)發(fā)到各種分析系統(tǒng),在那里可以監(jiān)視系統(tǒng)性能。組織需要與其云計(jì)算提供商聯(lián)系以查看是否支持它。

4.彈性

出色的云計(jì)算設(shè)計(jì)將融合基礎(chǔ)設(shè)施,這要求在多個(gè)可用性區(qū)域或由多個(gè)云計(jì)算提供商運(yùn)行應(yīng)用程序。但是需要小心謹(jǐn)慎,因?yàn)楹苋菀壮鲥e(cuò),并且應(yīng)用程序通常依賴于被忽略的非冗余內(nèi)部組件。驗(yàn)證彈性的最佳方法是主動(dòng)測試?;蛲ㄟ^外部組織進(jìn)行驗(yàn)證測試。而用戶經(jīng)常看到測試快捷方式使彈性測試無效的情況。

5.故障排除

對組織無法擁有或控制的基礎(chǔ)設(shè)施進(jìn)行故障排除是一項(xiàng)挑戰(zhàn)。用于解決組織網(wǎng)絡(luò)故障的數(shù)據(jù)是不可用的。與其相反,組織必須依賴數(shù)字體驗(yàn)(DX)監(jiān)控,它是綜合事務(wù)處理和實(shí)時(shí)流量監(jiān)控的結(jié)合。

詳細(xì)的診斷信息由軟件代理捕獲并進(jìn)行關(guān)聯(lián),從而生成了客戶端到服務(wù)器應(yīng)用程序性能的全面視圖。組織使用數(shù)字體驗(yàn)(DX)工具來診斷各種問題,這些問題包括ISP路由協(xié)議問題和客戶端Wi-Fi信號強(qiáng)度,而所有這些都無法訪問所涉及的網(wǎng)絡(luò)和網(wǎng)絡(luò)設(shè)備。

采用最有效的方法

另一個(gè)步驟涉及使用ChatOps自動(dòng)化工作流來簡化故障排除過程并減少解決時(shí)間。當(dāng)檢測到問題時(shí),機(jī)器人會(huì)運(yùn)行預(yù)定的工作流程來收集診斷信息。這種機(jī)器人將診斷信息發(fā)布到Slack或Teams聊天空間中,例如,IT團(tuán)隊(duì)成員可以在其中排除故障??梢愿鶕?jù)需要?jiǎng)?chuàng)建更多的機(jī)器人工作流,從而使IT團(tuán)隊(duì)不必人工調(diào)查或收集性能數(shù)據(jù)。

總而言之,從內(nèi)部部署計(jì)算向云計(jì)算的轉(zhuǎn)變帶來了挑戰(zhàn)和機(jī)遇。組織可以將其業(yè)務(wù)和工作流程遷移到云平臺(tái)中,為此需要仔細(xì)評估云計(jì)算自動(dòng)化用例,以確定哪些工具將使其能夠按需擴(kuò)展資源,同時(shí)避免人工流程中固有的錯(cuò)誤。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論