羅馬不是一天建成的,數(shù)據(jù)中心也不是一天建成的。選址、挑電力和冷卻設(shè)備安裝、安裝服務(wù)器,需要幾個(gè)月的時(shí)間,而且還很貴。當(dāng)一個(gè)組織決定升級(jí)時(shí),時(shí)間和金錢成本還會(huì)增加。因此,對(duì)于那些不想為建設(shè)數(shù)據(jù)中心而苦惱的公司來說,內(nèi)部部署不是一個(gè)好選擇。云也有麻煩,因?yàn)閷?duì)于許多組織來說,遷移是一個(gè)棘手、乏味的過程。說到開源軟件解決方案,內(nèi)部平臺(tái)和云平臺(tái)都有各自的挑戰(zhàn)。Google Cloud分享了在大數(shù)據(jù)應(yīng)用方面,內(nèi)部部署和云都有哪些挑戰(zhàn)。
內(nèi)部部署和云都面臨著挑戰(zhàn)
供應(yīng)商鎖定
公司可能會(huì)發(fā)現(xiàn)自己被某個(gè)云服務(wù)提供商鎖住了。供應(yīng)商鎖定可能成為云計(jì)算中的一個(gè)問題,因?yàn)橐坏?shù)據(jù)庫(kù)建立起來就很難移動(dòng),尤其是在云遷移中,這涉及到將數(shù)據(jù)移動(dòng)到完全不同類型的環(huán)境中,并且可能需要重新格式化數(shù)據(jù)。供應(yīng)商鎖定是指切換到另一個(gè)供應(yīng)商的成本非常高,以至于客戶選擇堅(jiān)持原來的供應(yīng)商。
配置和約束管理
盡管應(yīng)用程序開發(fā)人員可以通過利用底層物理環(huán)境來利用內(nèi)部部署存儲(chǔ),但他們?nèi)匀幻媾R一些挑戰(zhàn)。由于大多數(shù)開源軟件依賴于標(biāo)準(zhǔn)化,所以對(duì)硬件配置進(jìn)行更改可能會(huì)造成破壞。
約束管理則是要找出正確的方法來優(yōu)化數(shù)據(jù)中心的能源和占地面積等資源,以實(shí)現(xiàn)最大的利用率優(yōu)化。
托管數(shù)據(jù)中心
數(shù)據(jù)遷移到網(wǎng)絡(luò)上既昂貴又耗時(shí)。為了避免重新定位數(shù)據(jù)和應(yīng)用程序的成本和工作量,用戶有時(shí)甚至手動(dòng)遷移硬件。例如,亞馬遜的Snowmobile是一個(gè)45英尺長(zhǎng)的加固運(yùn)輸集裝箱,由一輛半拖車卡車牽引,它提供EB級(jí)的數(shù)據(jù)傳輸服務(wù),每輛車的傳輸量高達(dá)100PB。
在內(nèi)部部署平臺(tái)掙扎的地方,云技術(shù)蓬勃發(fā)展。云計(jì)算允許數(shù)據(jù)開發(fā)人員根據(jù)其處理需求選擇定制環(huán)境,從而實(shí)現(xiàn)按需擴(kuò)展,使他們能夠更多地關(guān)注其數(shù)據(jù)應(yīng)用程序,而不需要過多關(guān)注底層基礎(chǔ)設(shè)施。
隨著工作負(fù)載隨著時(shí)間的推移而變化,需要管理服務(wù)級(jí)別目標(biāo)(slo)或服務(wù)提供商承諾的性能。數(shù)據(jù)峰值應(yīng)該在不破壞數(shù)據(jù)管道的情況下獨(dú)立處理。谷歌表示,盡管云技術(shù)消除了數(shù)據(jù)中心物流規(guī)劃的必要性,但集群配置的復(fù)雜任務(wù)仍然是一個(gè)挑戰(zhàn)。對(duì)于云用戶來說,優(yōu)化處理環(huán)境以了解工作負(fù)載特性仍然是一個(gè)挑戰(zhàn)。
無服務(wù)器的未來
盡管谷歌和其他頂級(jí)云提供商多年來進(jìn)行了創(chuàng)新,但挑戰(zhàn)依然存在。谷歌也知道這一點(diǎn)。Google Cloud的Big Query和Dataproc旨在增強(qiáng)OSS平臺(tái)的能力,同時(shí)也為無服務(wù)器的未來提供了一個(gè)入口。“無服務(wù)器對(duì)谷歌來說并不新鮮。我們多年來一直在開發(fā)我們的無服務(wù)器功能,甚至推出了第一個(gè)無服務(wù)器數(shù)據(jù)倉(cāng)庫(kù)BigQuery。”Google云的產(chǎn)品經(jīng)理Susheel Kaushik說。
例如,GCP的Dataproc能夠補(bǔ)充像Apache和Presto這樣的OSS平臺(tái)。像Facebook這樣需要處理PB級(jí)數(shù)據(jù)的公司在處理數(shù)據(jù)上依賴于Presto。在決定遷移到Google Cloud之前,Twitter也一直在用Presto。有了Dataproc平臺(tái),用戶可以管理、分析和充分利用數(shù)據(jù)和已經(jīng)在使用的OSS系統(tǒng)。
Apache也有一個(gè)叫做OpenWhisk的無服務(wù)器產(chǎn)品。Apache OpenWhisk是一個(gè)開源的分布式無服務(wù)器平臺(tái),它執(zhí)行功能以響應(yīng)任何規(guī)模的事件。OpenWhisk使用Docker容器管理基礎(chǔ)設(shè)施、服務(wù)器和擴(kuò)展,因此你可以專注于構(gòu)建高效應(yīng)用程序。隨著數(shù)據(jù)分析的優(yōu)勢(shì)越來越明顯,我們可以預(yù)期無服務(wù)器產(chǎn)品的快速增長(zhǎng)。
在無服務(wù)器的世界中,客戶可以專注于他們的工作負(fù)載,而不是基礎(chǔ)設(shè)施。配置是自動(dòng)的。“該輪到OSS了。”谷歌認(rèn)為,大數(shù)據(jù)操作系統(tǒng)的下一階段(無服務(wù)器)將幫助用戶加快上市時(shí)間,自動(dòng)優(yōu)化延遲和成本,并減少應(yīng)用程序開發(fā)周期的投資,從而使他們能夠更多地專注于構(gòu)建而不是維護(hù)。
原文鏈接:
https://adtmag.com/blogs/watersworks/2020/10/docker-update.aspx