導(dǎo)語
我們選擇云計算的一個重要原因是可以節(jié)省下運(yùn)維數(shù)據(jù)中心的資金和安置這些服務(wù)器的空間。如果使用云計算的方法不正確,那么結(jié)果可能會適得其反。本文中,我們將為讀者介紹如何避開這些坑。
如今,幾乎每個人都在使用云計算。Flexera的《2020年云狀態(tài)報告》稱,98%的企業(yè)至少在使用一種公有云或私有云。另外2%的企業(yè)仍正在使用Windows XP。調(diào)查顯示,在企業(yè)向云端遷移的原因中,排名首位的是為了節(jié)省資金。
如果只是將IT基礎(chǔ)設(shè)施簡單地由“自建數(shù)據(jù)中心”模式轉(zhuǎn)換為公有云模式并不省錢。Gartner杰出副總裁分析師David Smith稱:“云計算的一個很大誤區(qū)是它們可以省錢。我們只能說有時確實(shí)如此,但前提是用戶認(rèn)真地分析了自身的情況。”
大部分企業(yè)可能并沒有這樣做。網(wǎng)絡(luò)安全公司Coalfire發(fā)現(xiàn),盡管大多數(shù)企業(yè)希望借助云遷移來節(jié)省資金,但是實(shí)際上,只有36%的受訪者表示實(shí)現(xiàn)了節(jié)省成本的目標(biāo)。Coalfire將這種結(jié)果歸咎于缺乏計劃性。只有不到一半的受訪者在規(guī)劃階段進(jìn)行了云準(zhǔn)備狀態(tài)評估,這導(dǎo)致云部署不達(dá)標(biāo)的風(fēng)險大增。
Gartner預(yù)測,2020年云服務(wù)支出將達(dá)到2664億美元,增長17%。需要指出的是,Gartner是在新冠疫情爆發(fā)之前做出的這一預(yù)測結(jié)果。ParkMyCloud首席執(zhí)行官Jay Chapel認(rèn)為,在今年的云支出中,176億美元會被完全浪費(fèi)掉。
這可是一筆不小的開支。由于新冠疫情導(dǎo)致IT預(yù)算被大幅削減,即便是大型公司也無法承受這種浪費(fèi)。以下是一些如何避免云資源浪費(fèi)的方法。
1
識別并自動關(guān)閉閑置資源
幾乎所有云用戶都面臨資源閑置的問題。這些虛擬機(jī)雖然處于開機(jī)狀態(tài),但是卻無事可做。通常在開發(fā)、展示、測試或質(zhì)保工作完成之后,這些實(shí)例就變成了非生產(chǎn)資源被閑置了。
據(jù)ParkMyCloud統(tǒng)計,閑置云資源在2020年浪費(fèi)的資金將達(dá)到110億美元。那么用戶的業(yè)務(wù)損失是多少呢?ParkMyCloud的客戶發(fā)現(xiàn),他們的計算支出中約有44%是非生產(chǎn)資源。大多數(shù)非生產(chǎn)資源只在每天8小時工作時間(每周40小時工作時間)內(nèi)被使用,無需7×24小時全天候運(yùn)行。這意味著在每天的其他時段內(nèi)(每周128小時,閑置時間占全周時間的76%),這些資源都是處于閑置狀態(tài)的。
企業(yè)可以做的事情是提醒IT團(tuán)隊在離開之前清理他們的云工作區(qū),但是這還遠(yuǎn)遠(yuǎn)不夠。企業(yè)可以使用AWS中的監(jiān)視工具,以幫助識別被浪費(fèi)的計算實(shí)例和塊存儲。有了監(jiān)控數(shù)據(jù),用戶可以快速識別出被浪費(fèi)掉的資源并采取補(bǔ)救措施。
還有一種更主動的方法,那就是使用AWS Instance Scheduler、Azure Automation、Google Cloud Scheduler和ParkMyCloud之類的工具。這些工具可以幫助用戶識別閑置資源,并在產(chǎn)生費(fèi)用之前關(guān)閉它們。
2
防止過度配置資源
另一種常見的資源浪費(fèi)方式是過度配置基礎(chǔ)設(shè)施。許多企業(yè)之所以愿意為從不使用的資源付費(fèi),深層次的原因在于企業(yè)想確保自己在需要這些資源的時候能夠有得用。這種心態(tài)就像我們大量購買設(shè)備只為了以備不時之需一樣。
據(jù)估計,40%的實(shí)例規(guī)模至少比實(shí)際工作負(fù)載所需的要大一倍。如果將實(shí)例規(guī)??s小一倍,那么成本就會降低一半,縮小兩倍可以節(jié)省75%。
盡管為了追求速度和敏捷性才將應(yīng)用程序遷移到了云端,但是為了防止出現(xiàn)性能問題,許多企業(yè)都為應(yīng)用程序超額配置了資源。雖然“基礎(chǔ)設(shè)施即代碼”可以輕松地實(shí)現(xiàn)資源擴(kuò)展,但是用戶很難知道自己應(yīng)該在何處進(jìn)行優(yōu)化,以及怎樣配置實(shí)例才能滿足實(shí)際性能需求。
這個問題看似簡單,但是實(shí)際上并非如此。當(dāng)用戶開始使用云環(huán)境時基本上都會勾選立即“可適時調(diào)整規(guī)模”選項。但是由于無法分析資源消耗情況,也無法進(jìn)行費(fèi)用分?jǐn)?,因此這一選項實(shí)際上毫無意義。云應(yīng)用程序?qū)π阅芎腿萘康男枨髸S時間而變化,這不可避免地會導(dǎo)致資源未充分利用和閑置。
用戶應(yīng)當(dāng)使用云服務(wù)提供商的最佳實(shí)踐。但是需要注意的是,適時調(diào)整是一個持續(xù)不斷的過程,其需要可以減少過度配置的相關(guān)策略和邊界設(shè)置,能夠細(xì)化到部門使用情況的資源標(biāo)記,以及對CPU、內(nèi)存和I/O的監(jiān)控。只有這樣才能真正有效果。
那么,用戶如何正確設(shè)置規(guī)模才能避免因過度配置導(dǎo)致的資金浪費(fèi)呢?用戶首先要監(jiān)視云計算的使用,對數(shù)據(jù)進(jìn)行分析,然后再測試各種規(guī)模的實(shí)例,并從中找到最合適的實(shí)例。Densify、SolarWinds Virtualization Manager和Veeam ONE等云資源管理工具可以提供這方面的幫助。
用戶應(yīng)當(dāng)清理云端上的軟件,而不是進(jìn)行監(jiān)視和鏡像調(diào)整。利用云原生能力的重構(gòu)應(yīng)用程序可以有效降低成本。常見的誤區(qū)是用戶只能重構(gòu)自己編寫的應(yīng)用程序。實(shí)際上,大多數(shù)應(yīng)用程序和軟件廠商都允許自動部署和與基于標(biāo)準(zhǔn)的PaaS解決方案進(jìn)行整合。對于用戶的定制化應(yīng)用程序,優(yōu)化資源的最有效辦法是使用無服務(wù)器架構(gòu)。通過這種辦法,用戶只需要支付實(shí)際使用的費(fèi)用,不需要按月支付物理服務(wù)器或虛擬服務(wù)器的費(fèi)用。這樣用戶可以大幅降低成本,尤其是在考慮到人工成本和硬件成本之后。
3
預(yù)留實(shí)例
云計算的優(yōu)勢之一是用戶可以根據(jù)需要增減資源。每個用戶都想訂購最新產(chǎn)品嗎?沒問題,云服務(wù)隨時可以提供所需要的計算資源。今天沒人在你的網(wǎng)站購物?那么你可以減少虛擬機(jī)(VM),這樣就可以不用付費(fèi)了。如果工作負(fù)載長期處于穩(wěn)定狀態(tài),那么用戶可以通過預(yù)留實(shí)例來節(jié)省大量支出。
如果用戶選擇亞馬遜Amazon Web Services(AWS)Reserved Instances、微軟Azure Reserved VM Instances或谷歌的Google Cloud Committed Use Discounts,并簽訂1~3年的虛擬機(jī)使用合同,那么用戶提前支付費(fèi)用時可以享受巨大的折扣。無論用戶使用與否,這些預(yù)付費(fèi)的虛擬機(jī)均一起處于可用狀態(tài)。
一些云供應(yīng)商還提供了可以計算出這些保留鏡像能夠為用戶節(jié)約多少資金的工具。例如,VMware的CloudHealth可幫助用戶從第三方視角查看節(jié)省的費(fèi)用。
正確使用保留鏡像可以節(jié)省大量成本。云計算的靈活性對于任何需要快速部署或擴(kuò)展的場景來說極為有價值,但是靈活性也是有成本的。不過,有些情況下,云計算靈活性的成本是可以避免的。能夠評估自身需求的企業(yè)可以通過合理的資源投入和使用規(guī)劃來大幅節(jié)約資金。
為確保云計算支出不會超過應(yīng)有的水平,企業(yè)應(yīng)花時間收集當(dāng)前和近期的預(yù)測需求。要想獲得正確的產(chǎn)品和功能集,企業(yè)應(yīng)與其云供應(yīng)商一起推動這一過程。這一點(diǎn)至關(guān)重要。
用戶要首先回答的問題是,自己愿意承擔(dān)多大風(fēng)險以及對云增長的期望值。是保留80%的資源,還是20%?這個問題完全取決于用戶想要多大的靈活性以及愿意承擔(dān)多大的風(fēng)險。如果用戶能夠確定自己大致需要多少資源,以及今后三年的資源使用量,那么在2023年之前他們可以為今后的工作量預(yù)留70%的虛擬機(jī)。企業(yè)的云需求是否會迅速增長?如果是,那么用戶最好以合同的形式將10%的實(shí)例固定下來。
4
不要將云與數(shù)據(jù)中心混為一談
企業(yè)在向云計算遷移時遇到的主要問題是,他們用原來的數(shù)據(jù)中心思維在規(guī)劃公有云或混合云。
盡管私有云也是建立在用戶自有的硬件之上,但是用戶在規(guī)劃云服務(wù)時應(yīng)該打破原來的IT基礎(chǔ)設(shè)施經(jīng)驗的束縛。
企業(yè)在向云端遷移時犯的一個重大錯誤是,他們?nèi)韵窭^續(xù)運(yùn)行裸金屬服務(wù)器那樣進(jìn)行調(diào)配。幾十年來,用戶一直在努力確保自己的資源遠(yuǎn)遠(yuǎn)超過高峰時所需要的資源。盡管云服務(wù)可以根據(jù)需要及時調(diào)整,但是用戶幾十年形成的老觀念仍然沒有發(fā)生改變,最終他們不得不為沒有使用的資源買單。
如果用戶在云管理方面采用與本地服務(wù)器架構(gòu)相同的標(biāo)準(zhǔn)和控制方法,并部署外部設(shè)施,那么這樣不僅會帶來云計算費(fèi)用,還可能產(chǎn)生第三方許可證費(fèi)用和軟件費(fèi)用。在設(shè)計階段,了解自己的主要目標(biāo)至關(guān)重要。這樣使得用戶能夠適當(dāng)?shù)乩迷鷮傩院驮苹A(chǔ)設(shè)施降低許可證費(fèi)用和軟件成本。
如果企業(yè)還是在關(guān)注每臺服務(wù)器的成本或在不同位置運(yùn)行服務(wù)器的成本,那么他們還沒有形成頭部思維。他們應(yīng)該只為能帶來業(yè)務(wù)價值的功能付費(fèi)。如果企業(yè)僅簡單地將其本地服務(wù)器遷移至云端,那么這只是相當(dāng)于從一家設(shè)備供應(yīng)商換成另一家而已。
要節(jié)省資金,用戶必須先要在部署之前搞清楚云和傳統(tǒng)IT基礎(chǔ)設(shè)施的不同之處。有了這些知識,用戶還要找出哪些工作真正需要云服務(wù)資源,而不是一股腦地將服務(wù)器和應(yīng)用程序都遷移至云端。
以本地數(shù)據(jù)中心的部署方法來實(shí)施云應(yīng)用程序管理是不會減少開支的,并且還可能會造成更多的開支。為了快速實(shí)現(xiàn)云應(yīng)用程序部署,將服務(wù)器和應(yīng)用程序一股腦地都遷移至云端的企業(yè)并不在少數(shù)。雖然這種方法也不是不可以,但是對云遷移進(jìn)行評估可以確保成本得到優(yōu)化。
如果用戶選擇私有云,那么靈活的支付方式非常重要,尤其是在當(dāng)前的疫情時期。企業(yè)在保持充足的資金儲備的同時,讓IT系統(tǒng)保持敏捷性和競爭力也非常重要。當(dāng)用戶向云遷移時,他們應(yīng)該考慮部署帶有消費(fèi)模式的技術(shù),以便只支付使用產(chǎn)品的費(fèi)用。由于業(yè)務(wù)環(huán)境正在迅速變化,如果有短期低息的支付方案,降低總擁有成本的好辦法是對貸款采購云基礎(chǔ)設(shè)施和現(xiàn)金采購進(jìn)行比較。
5
進(jìn)行恰當(dāng)?shù)闹卫?/strong>
用戶的云服務(wù)由誰負(fù)責(zé)可不是一個簡單的問題,這實(shí)際上非常復(fù)雜。每個公有云平臺計量資源的方法都不一樣,因此用戶很難每月跟蹤他們的云預(yù)算,進(jìn)而導(dǎo)致出現(xiàn)費(fèi)用超支或資源未被充分利用的情況。云治理對于許多大型企業(yè)來說也并非易事,因為這其中既要考慮資源利用率和成本管理,又要考慮安全性和合規(guī)性。盡管如此,要想解決這一問題,關(guān)鍵還是要抓住可見性。公有云平臺中的應(yīng)用程序和工作負(fù)載的可見性以及用戶對成本和云支出費(fèi)用的洞察力可以幫助用戶控制自己的環(huán)境,并防止事情進(jìn)一步惡化。
大多數(shù)企業(yè)在這方面做得并不好。在當(dāng)前的疫情期間,為了讓員工能夠遠(yuǎn)程辦公,大多數(shù)企業(yè)都不得不加大云服務(wù)的使用量,這導(dǎo)致幾乎所有的人都在浪費(fèi)大量資金,但是他們自己卻對此一無所知。最近的研究顯示,只有30%的企業(yè)認(rèn)為自己在云服務(wù)使用量和成本方面的管理是成功的。
在技術(shù)方面,云治理并沒有什么捷徑可言。盡管所有的云服務(wù)提供商都提供了相關(guān)的工具,但是對于企業(yè)而言,明確職責(zé)和角色才是本質(zhì)。除了資產(chǎn)、財務(wù)和供應(yīng)商管理必須通力合作,架構(gòu)師和工程師也需密切協(xié)作,以便隨時處理可能出現(xiàn)的成本激增情況。
由于資本支出控制、對數(shù)據(jù)中心的物理訪問等手段已無法再防范影子IT,因此IT部門將面臨更加嚴(yán)峻的挑戰(zhàn)。企業(yè)中的所有員工都可以購買一個虛擬數(shù)據(jù)中心,并且這個數(shù)據(jù)中心的規(guī)模可以無限大。無論是否向云端遷移,企業(yè)都有必要建立起一個高效的治理模式,以便在賬務(wù)、運(yùn)維和安全風(fēng)險出現(xiàn)之前快速發(fā)現(xiàn)和阻止影子IT。
雖然管理職責(zé)最終是落在人員頭上,而不是技術(shù)上,但是成本透明性和干凈的財務(wù)數(shù)據(jù)是必需的,只有這樣管理人員才能發(fā)現(xiàn)節(jié)省支出和成本的機(jī)會。由于公有云提供商會提供大量有價值的賬單數(shù)據(jù),因此企業(yè)需要制定將這些數(shù)據(jù)與包括標(biāo)簽在內(nèi)其他的元數(shù)據(jù)關(guān)聯(lián)在一起的策略,以便于高效地使用這些信息。只有管理團(tuán)隊牢牢掌控住資源,企業(yè)才能有效地管理云計算成本。
云計算成本總結(jié)
云計算成本的管理并非易事,這里面既有開發(fā)人員需要解決的技術(shù)問題,也有需要DevOps管理專家處理的系統(tǒng)管理問題。企業(yè)的高層也要對此負(fù)起責(zé)任,不要認(rèn)為這些都是IT部門的事情。
云計算涉及到各個方面。只有所有的員工都能夠正確使用云計算,企業(yè)才有望實(shí)現(xiàn)削減IT成本的目標(biāo)。
作者:本文作者Steven J.Vaughan-Nichols早在上世紀(jì)七十年代,CP/M-80操作系統(tǒng)還是前沿技術(shù),300bps還算很快的網(wǎng)絡(luò)連接時,就已經(jīng)開始撰寫科技與商業(yè)文章了。
編譯:陳琳華
原文網(wǎng)址:https://www.idginsiderpro.com/article/3569769/5-ways-to-avoid-cloud-waste.html