企業(yè)是否準(zhǔn)備好使用混合云存儲(chǔ)做更多的事情?人們需了解如何集成這種技術(shù),并使所有硬件、軟件和服務(wù)有效地工作。
大多數(shù)企業(yè)都有某種形式的混合云策略。但是,許多策略都是可以快速展現(xiàn)投資回報(bào)率的簡(jiǎn)單項(xiàng)目。
諸如備份和長(zhǎng)期歸檔之類的應(yīng)用程序可以將原有的磁帶庫(kù)和異地租賃保管庫(kù)替換為AWS Glacier或Google Cloud Coldline之類的云計(jì)算冷存儲(chǔ)服務(wù),從而迅速獲得收益。他們通常使用易于理解的服務(wù)來(lái)替換需要技術(shù)升級(jí)的現(xiàn)有存儲(chǔ)系統(tǒng),該服務(wù)提供了分布式的高可用性基礎(chǔ)設(shè)施;基于使用量的定價(jià),以及所有云計(jì)算服務(wù)固有的內(nèi)置安全性。
企業(yè)混合云存儲(chǔ)發(fā)展的下一階段需要將云計(jì)算服務(wù)鏈接到現(xiàn)有應(yīng)用程序,以提供內(nèi)部部署基礎(chǔ)設(shè)施的擴(kuò)展。這種集成的混合云存儲(chǔ)方法要求私有系統(tǒng)和公共服務(wù)之間具有無(wú)縫接口,并且兩者之間的數(shù)據(jù)必須持續(xù)同步。目標(biāo)是使云計(jì)算成為企業(yè)容量的擴(kuò)展,并為應(yīng)用程序提供一個(gè)過(guò)渡區(qū)域,以使用更高級(jí)的云計(jì)算數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)、分析和機(jī)器學(xué)習(xí)服務(wù)。
以下是集成混合云存儲(chǔ)的各種用例、技術(shù)、硬件、軟件和服務(wù)的概述。
應(yīng)用程序使用場(chǎng)景
分布式存儲(chǔ)平臺(tái)提供商Hedvig公司的創(chuàng)始工程師Gaurav Yadav將混合云存儲(chǔ)定義為在內(nèi)部部署數(shù)據(jù)中心和公共云平臺(tái)混合運(yùn)營(yíng)環(huán)境運(yùn)行的存儲(chǔ)。他將多云存儲(chǔ)描述為跨多個(gè)公共云分布的存儲(chǔ),因此企業(yè)可以根據(jù)存儲(chǔ)需求選擇公共云,并在需要時(shí)跨越這些云平臺(tái)遷移數(shù)據(jù)。
混合云存儲(chǔ)的優(yōu)點(diǎn)之一是,它使企業(yè)能夠訪問(wèn)復(fù)雜的數(shù)據(jù)服務(wù),如Hadoop集群和Spark分析,這些數(shù)據(jù)服務(wù)一年可能只需要訪問(wèn)幾次。其他集成的混合存儲(chǔ)用例包括:
通過(guò)云計(jì)算對(duì)象和文件服務(wù)增強(qiáng)內(nèi)部存儲(chǔ)容量,以提供不經(jīng)常訪問(wèn)的冷數(shù)據(jù),同時(shí)為熱數(shù)據(jù)提供內(nèi)部部署副本。
相反,創(chuàng)建基于云計(jì)算的數(shù)據(jù)的內(nèi)部部署副本或緩存以實(shí)現(xiàn)低延遲的內(nèi)部部署訪問(wèn)。
使用提取、轉(zhuǎn)換和加載管道,數(shù)據(jù)倉(cāng)庫(kù)和分析引擎將內(nèi)部部署系統(tǒng)中的數(shù)據(jù)饋送到云計(jì)算數(shù)據(jù)庫(kù)或更高級(jí)的數(shù)據(jù)分析系統(tǒng),例如Azure現(xiàn)代數(shù)據(jù)倉(cāng)庫(kù)示例。
使用云存儲(chǔ)來(lái)同步和卸載多個(gè)分支機(jī)構(gòu)位置的數(shù)據(jù),例如使用Azure StorSimple的這種情況。
Microsoft Azure StorSimple如何為企業(yè)提供集成的混合云存儲(chǔ)解決方案。
?將內(nèi)部部署數(shù)據(jù)中心的數(shù)據(jù)饋送到云原生應(yīng)用程序和系統(tǒng),例如Web或電子商務(wù)站點(diǎn)、內(nèi)容交付網(wǎng)絡(luò)、記錄管理系統(tǒng),以及開發(fā)人員測(cè)試/開發(fā)環(huán)境。
當(dāng)然,用于基于云計(jì)算的應(yīng)用程序或活動(dòng)文件系統(tǒng)的任何基礎(chǔ)設(shè)施都同樣能夠提供備份和存檔系統(tǒng)的功能,因此以下基礎(chǔ)設(shè)施選項(xiàng)是這些云存儲(chǔ)基準(zhǔn)用途的自然演變。
集成的混合云存儲(chǔ)基礎(chǔ)設(shè)施選項(xiàng)
有多種集成內(nèi)部部署和云存儲(chǔ)的方法,它們的復(fù)雜性、技術(shù)成熟度和功能各不相同。最簡(jiǎn)單的方法是將云存儲(chǔ)變成組織存儲(chǔ)層次結(jié)構(gòu)的輔助層,而最先進(jìn)和最復(fù)雜的方法則是有效地創(chuàng)建跨多個(gè)環(huán)境的分布式存儲(chǔ)平臺(tái)。
以下是集成混合云存儲(chǔ)的四種流行方法。
具有內(nèi)置云計(jì)算集成的本地存儲(chǔ)系統(tǒng)。許多企業(yè)級(jí)存儲(chǔ)陣列,如Dell EMC Isilon、運(yùn)行Ontap的NetApp系統(tǒng)、Cohenity等,通常都具有可選功能,使它們能夠自動(dòng)將數(shù)據(jù)復(fù)制到云計(jì)算服務(wù)。盡管這些通常用于單向備份和存檔,但有些可以支持雙向同步,例如,允許應(yīng)用程序修改的云計(jì)算數(shù)據(jù)同步回內(nèi)部部署系統(tǒng)。
具有內(nèi)部部署文件系統(tǒng)的云計(jì)算緩存設(shè)備。這些專用硬件或軟件設(shè)備旨在內(nèi)部部署鏡像一部分基于云計(jì)算的數(shù)據(jù),從而通過(guò)減少延遲和增加吞吐量來(lái)提高應(yīng)用程序性能和可用性。其中許多產(chǎn)品(例如Microsoft Avere產(chǎn)品)包括更高級(jí)的功能,例如具有統(tǒng)一名稱空間的全球分布式網(wǎng)絡(luò)文件系統(tǒng),以創(chuàng)建可以跨越多個(gè)分支機(jī)構(gòu)、內(nèi)部部署數(shù)據(jù)中心和云計(jì)算服務(wù)的單個(gè)組織文件系統(tǒng)。
云存儲(chǔ)網(wǎng)關(guān)。它們使用網(wǎng)絡(luò)存儲(chǔ)協(xié)議(例如用于NAS的NFS和SMB,以及用于SAN的iSCSI)和數(shù)據(jù)塊卷來(lái)連接內(nèi)部部署系統(tǒng)和云計(jì)算服務(wù)。它們可以實(shí)現(xiàn)為在主機(jī)虛擬機(jī)上運(yùn)行的虛擬軟件,也可以作為在數(shù)據(jù)中心LAN和虛擬私有云之間充當(dāng)代理的硬件設(shè)備來(lái)實(shí)現(xiàn)。網(wǎng)關(guān)通常包括數(shù)據(jù)壓縮和WAN優(yōu)化設(shè)備中發(fā)現(xiàn)的其他網(wǎng)絡(luò)優(yōu)化技術(shù),以提高性能并減少傳輸?shù)臄?shù)據(jù)量。例如,AWS Storage Gateway具有用于文件、卷和磁帶的模式,并且可以連接到S3以進(jìn)行對(duì)象存儲(chǔ)、S3 Glacier/Glacier Deep歸檔、彈性塊存儲(chǔ)進(jìn)行塊存儲(chǔ)和AWS磁帶備份。
軟件定義存儲(chǔ)(SDS)系統(tǒng)。軟件定義存儲(chǔ)(SDS)系統(tǒng)創(chuàng)建一個(gè)軟件疊加層,這個(gè)疊加層將邏輯存儲(chǔ)配置與物理實(shí)例解耦。通過(guò)創(chuàng)建軟件抽象層,軟件定義存儲(chǔ)(SDS)系統(tǒng)使文件系統(tǒng)能夠透明地跨越內(nèi)部部署和云計(jì)算基礎(chǔ)設(shè)施,包括AWS可用性區(qū)域等多個(gè)位置。軟件定義存儲(chǔ)(SDS)系統(tǒng)還提供了一個(gè)集中的管理控制平臺(tái),其中包括一組企業(yè)存儲(chǔ)服務(wù),例如重復(fù)數(shù)據(jù)刪除、壓縮和快照,并且可以在內(nèi)部部署和云計(jì)算環(huán)境中自動(dòng)遷移、復(fù)制和同步塊卷。大型集成IT提供商(例如NetApp和VMware)以及專門從事軟件定義存儲(chǔ)(SDS)系統(tǒng)的小型公司(例如Hedvig、Qumulo和Scality)都可以使用軟件定義存儲(chǔ)(SDS)系統(tǒng)產(chǎn)品。
在這些云存儲(chǔ)集成技術(shù)中,云網(wǎng)關(guān)和云感知存儲(chǔ)系統(tǒng)是最容易實(shí)現(xiàn)且最成熟的,而軟件定義存儲(chǔ)(SDS)系統(tǒng)仍然是一種快速變化的技術(shù),其產(chǎn)品需要大量的規(guī)劃和實(shí)施和運(yùn)營(yíng)費(fèi)用。它們通常用于運(yùn)行管理和數(shù)據(jù)控制平臺(tái)所需的虛擬機(jī)。
使用和實(shí)施指南
大多數(shù)企業(yè)只是從真正的混合存儲(chǔ)架構(gòu)開始。根據(jù)調(diào)研機(jī)構(gòu)Gartner公司的調(diào)查,實(shí)時(shí)、雙向數(shù)據(jù)同步(更不用說(shuō)無(wú)縫的、支持SDS的混合文件系統(tǒng))尚未廣泛部署。
對(duì)于已經(jīng)使用云計(jì)算進(jìn)行備份的組織,合乎邏輯的第一步是添加存儲(chǔ)網(wǎng)關(guān),并在可用時(shí)利用提供云計(jì)算支持的存儲(chǔ)陣列中的功能。這些將更緊密地將內(nèi)部部署文件系統(tǒng)與云計(jì)算基礎(chǔ)設(shè)施集成在一起,并使個(gè)人和應(yīng)用程序能夠使用熟悉的網(wǎng)絡(luò)協(xié)議來(lái)訪問(wèn)云存儲(chǔ)服務(wù)。
對(duì)于許多混合用例而言,采用網(wǎng)關(guān)就足夠了,例如將數(shù)據(jù)提供給基于云計(jì)算的數(shù)據(jù)倉(cāng)庫(kù)或機(jī)器學(xué)習(xí)模型,以及將諸如用戶目錄和遠(yuǎn)程應(yīng)用程序之類的遠(yuǎn)程辦公室文件系統(tǒng)聚合到中央云存儲(chǔ)庫(kù)。
追求集成混合云存儲(chǔ)環(huán)境的企業(yè)應(yīng)首先評(píng)估其業(yè)務(wù)和應(yīng)用程序需求,以及現(xiàn)有存儲(chǔ)系統(tǒng)的局限性或不足之處,以優(yōu)先考慮功能并指導(dǎo)設(shè)計(jì)。在評(píng)估產(chǎn)品時(shí),最好采用那些支持標(biāo)準(zhǔn)協(xié)議和多個(gè)云計(jì)算供應(yīng)商的產(chǎn)品,例如AWS、Azure和谷歌云這三家全球主要的云計(jì)算供應(yīng)商,以最大化其基礎(chǔ)設(shè)施即服務(wù)(IaaS)選項(xiàng)并避免鎖定。
已經(jīng)委托特定云計(jì)算供應(yīng)商提供云備份或其他服務(wù)的企業(yè)應(yīng)從供應(yīng)商提供的產(chǎn)品開始,例如AWS Storage Gateway或Azure StorSimple,因?yàn)樗鼈兺ǔJ腔旌洗鎯?chǔ)集成中成本最低、最簡(jiǎn)單的選擇。