虛擬化和分布式:云儲(chǔ)存的手段與未來趨勢(shì)

西部數(shù)碼
佚名
將存儲(chǔ)資源虛擬化的概念由來已久。起初,云存儲(chǔ)是為了解決存儲(chǔ)的低成本、可擴(kuò)展和資源池化,從而實(shí)現(xiàn)所謂的按需所取,涉及的技術(shù)不僅有虛擬化、分布式,還有網(wǎng)絡(luò)與負(fù)載均衡等等。廣義來看,這種數(shù)據(jù)存儲(chǔ)即服務(wù)(DaaS)...

將存儲(chǔ)資源虛擬化的概念由來已久。起初,云存儲(chǔ)是為了解決存儲(chǔ)的低成本、可擴(kuò)展和資源池化,從而實(shí)現(xiàn)所謂的按需所取,涉及的技術(shù)不僅有虛擬化、分布式,還有網(wǎng)絡(luò)與負(fù)載均衡等等。廣義來看,這種數(shù)據(jù)存儲(chǔ)即服務(wù)(DaaS)的運(yùn)作方式大體可分為虛擬化存儲(chǔ)和分布式存儲(chǔ),前者是云存儲(chǔ)走到今天的必然手段,后者則是云存儲(chǔ)的未來趨勢(shì)。

傳統(tǒng)的存儲(chǔ)方案SAN或NAS無法滿足容量和性能的高并發(fā)需求,集成式的組件和接口限制了動(dòng)態(tài)擴(kuò)展能力,自然也就難以做到按需服務(wù),這恰恰是DaaS的主要優(yōu)勢(shì)。概括來說,云存儲(chǔ)就是存儲(chǔ)的虛擬化+自動(dòng)化,并且網(wǎng)絡(luò)在其中起到了不可或缺的作用。實(shí)現(xiàn)過程中,像數(shù)據(jù)塊、磁盤、磁帶庫、文件系統(tǒng)等都可以被虛擬化。

網(wǎng)絡(luò)之于云存儲(chǔ)是重要的,但其只是存儲(chǔ)虛擬化的一個(gè)功能。存儲(chǔ)虛擬化可以在系統(tǒng)架構(gòu)的各個(gè)層實(shí)現(xiàn),而在網(wǎng)絡(luò)層可以做到橫跨異構(gòu)磁盤陣列,相當(dāng)于在數(shù)據(jù)中心內(nèi)部構(gòu)建了一個(gè)大型的資源池。需要注意的是,池化時(shí)的異構(gòu)管理要確保存儲(chǔ)的標(biāo)準(zhǔn)化,原因是在多云多租戶的環(huán)境下,只有各家采用相同的規(guī)范才能做到被統(tǒng)一調(diào)用。

作為云存儲(chǔ)的基礎(chǔ),虛擬化存儲(chǔ)的本質(zhì)是實(shí)現(xiàn)了從物理存儲(chǔ)到邏輯存儲(chǔ)的轉(zhuǎn)變。在物理介質(zhì)和服務(wù)器之間,虛擬化的對(duì)象既可以是前文提到的網(wǎng)絡(luò),也可以是主機(jī)或存儲(chǔ)設(shè)備。當(dāng)然,這些方式各有利弊,例如在主機(jī)層虛擬化便于部署,但與存儲(chǔ)有關(guān)的軟件要運(yùn)行在同一個(gè)主機(jī)上,越權(quán)管理增加了核心數(shù)據(jù)的安全風(fēng)險(xiǎn),而把功能集中在存儲(chǔ)設(shè)備上則會(huì)過度消耗存儲(chǔ)控制器的資源。

以虛擬磁盤為例,通常的服務(wù)器擴(kuò)展存儲(chǔ)方案包括DAS、SAN、NAS。在虛擬化環(huán)境中,首先要把物理資源劃分為虛擬磁盤,之后“虛擬機(jī)管理員”會(huì)為多個(gè)虛擬化分配存儲(chǔ)空間。從物理層面來看,DAS直連虛擬機(jī)滿足不了磁盤的數(shù)量需求。從虛擬層面來看,邏輯單元也難以支撐大規(guī)模的虛擬機(jī)運(yùn)行??紤]到云環(huán)境的虛擬機(jī)要被隨時(shí)創(chuàng)建、銷毀、共享,傳統(tǒng)的存儲(chǔ)擴(kuò)展方式并不適用。

隨著x86系統(tǒng)性能的不斷提升,以此來構(gòu)建大規(guī)模存儲(chǔ)集群變?yōu)榭赡堋J聦?shí)上,分布式存儲(chǔ)早在云計(jì)算之前就出現(xiàn)了,在云時(shí)代又煥發(fā)了新顏。借助分布式文件系統(tǒng),不僅可以提供彈性存儲(chǔ)資源,還能根據(jù)應(yīng)用需求提供各類接口,例如分布式對(duì)象存儲(chǔ)的http接口讓用戶無需操心文件的存放位置或是否丟失,像AWS的S3就有多層驗(yàn)證機(jī)制。

對(duì)象存儲(chǔ)、塊存儲(chǔ)、文件存儲(chǔ)是分布式存儲(chǔ)的三大利器,三者的接口是不一樣的,因此適用的業(yè)務(wù)形態(tài)也不同。塊存儲(chǔ)可以直接掛在主機(jī)上,直接讀寫磁盤空間的某段地址即可訪問數(shù)據(jù),資源調(diào)取效率較高,像一些大規(guī)模數(shù)據(jù)庫多采用這種部署;文件存儲(chǔ)通常用于應(yīng)用層,通過TCP/IP協(xié)議訪問,需要使用者專門對(duì)文件寫腳本,因此延時(shí)要高于塊存儲(chǔ),可借助NAS虛擬化處理非結(jié)構(gòu)化數(shù)據(jù);對(duì)象存儲(chǔ)具備二者的優(yōu)點(diǎn),兼顧高速、共享、智能,并且引入了容器技術(shù),打包交付和擴(kuò)展能力較強(qiáng)。

當(dāng)然,考慮到部署成本和某些特定場(chǎng)景,對(duì)象存儲(chǔ)并不能完全取代塊存儲(chǔ)或文件存儲(chǔ)。例如數(shù)據(jù)庫有時(shí)要直接向裸盤映射,更適合塊存儲(chǔ)的方案。此外,如果對(duì)數(shù)據(jù)量的存儲(chǔ)要求不高,只是想實(shí)現(xiàn)共享數(shù)據(jù),文件存儲(chǔ)就可以滿足要求。不管怎樣,分布式存儲(chǔ)要比傳統(tǒng)的虛擬化存儲(chǔ)方案更加靈活,適用范圍也更廣。

如今,存儲(chǔ)方案已經(jīng)從傳統(tǒng)架構(gòu)向云架構(gòu)演變,企業(yè)客戶在業(yè)務(wù)部署時(shí)要基于業(yè)務(wù)的實(shí)際需求,結(jié)合數(shù)據(jù)結(jié)構(gòu)和規(guī)模的特點(diǎn),選擇相對(duì)應(yīng)的存儲(chǔ)方案,不能冒進(jìn)全面替換新架構(gòu)而加大額外的成本支出。不過從長(zhǎng)期來看,基于x86的分布式存儲(chǔ),以其集群架構(gòu)實(shí)現(xiàn)的橫向擴(kuò)展能力將成為云存儲(chǔ)領(lǐng)域的主角。

THEEND