還記得過(guò)往選擇比較少的時(shí)候嗎?要么就是NAS,要么就是SAN系統(tǒng)。但那樣的日子已經(jīng)一去不復(fù)返了,如今的存儲(chǔ)管理人員們有許多存儲(chǔ)格式選項(xiàng)可供選擇,比如塊、對(duì)象、文件和NAS,如果把目標(biāo)定位到云端,那選擇范圍還可以繼續(xù)擴(kuò)大。
在選擇最適合自身數(shù)據(jù)和工作流需求的格式時(shí),正確的選擇可能并不是你想象中的那個(gè),但正確的選擇對(duì)組織的整體成功至關(guān)重要。而一個(gè)糟糕的選擇可能會(huì)導(dǎo)致數(shù)據(jù)和應(yīng)用程序服務(wù)延遲、成本失控、擴(kuò)展性缺失、管理框架的復(fù)雜化以及其他一系列的問(wèn)題。以下,我們會(huì)深入研究以下其中的某些格式,以及其最適合的工作流。
塊存儲(chǔ)
第一種格式是歷史悠久的塊存儲(chǔ)。它是指將數(shù)據(jù)存儲(chǔ)的原始卷提供給服務(wù)器,通常來(lái)自通過(guò)FC、SAS或iSCS存儲(chǔ)附加網(wǎng)絡(luò)(SAN)進(jìn)行訪問(wèn)。每個(gè)卷塊可以作為一個(gè)單獨(dú)的硬盤(pán)驅(qū)動(dòng)器;可以將其想象為一個(gè)插在筆記本上的U盤(pán),其只是一個(gè)外接的存儲(chǔ)卷,供文件系統(tǒng)或數(shù)據(jù)庫(kù)使用。
塊存儲(chǔ)的格式是單純的1和0;沒(méi)有可用于跟蹤和可視化數(shù)據(jù)的文件系統(tǒng)或元數(shù)據(jù);操作系統(tǒng)必須處理所有塊的讀/寫(xiě)。這個(gè)存儲(chǔ)格式的優(yōu)點(diǎn)在于良好的吞吐量性能、低延遲和高IOPS。通常來(lái)說(shuō),塊存儲(chǔ)最適合用于支持虛擬基礎(chǔ)設(shè)施(虛擬機(jī)監(jiān)控程序)和數(shù)據(jù)庫(kù),因?yàn)樗母咝阅芴卣?。盡管塊存儲(chǔ)非常通用,但其缺乏描述數(shù)據(jù)的元數(shù)據(jù)功能和文件層面上的存儲(chǔ)管理與分配的能力,這使得它不太適合那些以文件為中心的工作流。
文件存儲(chǔ)
與塊存儲(chǔ)不同,基于文件的存儲(chǔ)(NAS、文件系統(tǒng)、對(duì)象)的復(fù)雜性會(huì)低很多。由于塊存儲(chǔ)缺乏高級(jí)的數(shù)據(jù)組織功能,因而對(duì)其的管理較為復(fù)雜,而NAS系統(tǒng),簡(jiǎn)單來(lái)說(shuō),可被視為是連接在網(wǎng)絡(luò)上的驅(qū)動(dòng)器一樣,它在存儲(chǔ)和管理文件的方面表現(xiàn)更佳?;谖募拇鎯?chǔ)在主目錄和主流IT文件共享中是常見(jiàn)的,這是因?yàn)槠淠軌蜉p松實(shí)現(xiàn)跨網(wǎng)絡(luò)的文件共享,且具備良好的擴(kuò)展性能。
基于文件的存儲(chǔ)在數(shù)據(jù)密集型工作流中的受關(guān)注度正在逐漸升高,例如在M&E、能源以及科學(xué)研究領(lǐng)域的應(yīng)用。這主要是因?yàn)閿?shù)據(jù)的此類數(shù)據(jù)的訪問(wèn)多需要以文件的形式,而不是以塊或1和0的形式進(jìn)行。這也有助于基于文件的存儲(chǔ)可以從昂貴的光纖通道解放出來(lái),轉(zhuǎn)移到高性能、低成本的100Gbe網(wǎng)絡(luò)?;谖募拇鎯?chǔ)在擴(kuò)展性、共享性和總體擁有成本結(jié)構(gòu)方面的優(yōu)勢(shì),使其在以文件為中心的工作流中占據(jù)著主流的地位。
對(duì)象存儲(chǔ)
這一“年輕”的存儲(chǔ)格式正在向文件存儲(chǔ)世界發(fā)起一場(chǎng)價(jià)格戰(zhàn),而且對(duì)象存儲(chǔ)技術(shù)是非常適合我們現(xiàn)在所生活的數(shù)據(jù)密集、信息互聯(lián)的社會(huì)大環(huán)境。
在亞馬遜S3和Glacier的推廣下,對(duì)象存儲(chǔ)正在迅速成為諸多行業(yè)的標(biāo)準(zhǔn)選擇,比如科學(xué)應(yīng)用程序中需要存儲(chǔ)的大量非結(jié)構(gòu)化數(shù)據(jù)、互聯(lián)網(wǎng)行業(yè)中海量的音樂(lè)或照片保存、基因組研究數(shù)據(jù)、自動(dòng)駕駛車輛的工作流的AI/ML數(shù)據(jù)等等的存儲(chǔ)需求。那么,是什么讓對(duì)象存儲(chǔ)看上去這么與眾不同呢?首先,它內(nèi)核概念非常簡(jiǎn)單:將數(shù)據(jù)作為具有豐富的、可搜索的元數(shù)據(jù)和惟一ID號(hào)的對(duì)象,來(lái)進(jìn)行轉(zhuǎn)變和交付。
與在目錄和文件樹(shù)中完成組織工作的文件存儲(chǔ)不同,對(duì)象可被放置在大規(guī)模、扁平化、高度持久和可用的存儲(chǔ)桶或存儲(chǔ)池中,這樣的容器可以布置在本地、云端、或者是跨越式地進(jìn)行分布。每個(gè)對(duì)象中的元數(shù)據(jù)非常關(guān)鍵,因?yàn)檎腔谒?,?yīng)用程序和用戶才能夠針對(duì)非常大規(guī)模的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)庫(kù),進(jìn)行快速的搜索和運(yùn)行分析。對(duì)象存儲(chǔ)在本質(zhì)上也是非常安全的——通過(guò)糾刪碼技術(shù),對(duì)象存儲(chǔ)可以實(shí)現(xiàn)非常高的數(shù)據(jù)持久性,通常超過(guò)10-15個(gè)9。這基本意味著,一旦一個(gè)對(duì)象被創(chuàng)建,它就會(huì)永遠(yuǎn)地存在。這使得對(duì)象存儲(chǔ)非常適合備份或歸檔任務(wù),成為達(dá)成數(shù)據(jù)無(wú)損化保存的一套關(guān)鍵組件。最后,從財(cái)務(wù)的角度出發(fā),上述技術(shù)名詞基本可被視為是性價(jià)比一詞的同義替換,除了歷史悠久卻不失風(fēng)華的磁帶存儲(chǔ)之外,對(duì)象存儲(chǔ)是你可以部署的成本最低的存儲(chǔ)解決方案之一。
何種存儲(chǔ)格式符合您的需求?
正如您在下方的圖表和上述的段落中可以看到,存儲(chǔ)的部署有著許多不同的方法,并且每種方法對(duì)于不同的實(shí)際用例都有著獨(dú)特的優(yōu)勢(shì)。專注數(shù)據(jù)庫(kù)類型——結(jié)構(gòu)化應(yīng)用程序的性能?可考慮塊存儲(chǔ);大規(guī)模的用戶共享文件?NAS可能更為合適;為攻克某種罕見(jiàn)病或開(kāi)發(fā)陸空兩用的自動(dòng)駕駛工具而建立一套數(shù)據(jù)存儲(chǔ)庫(kù)?對(duì)象存儲(chǔ)很可能才是正途。畢竟并不是所有的存儲(chǔ)都是平等創(chuàng)建的,您的數(shù)據(jù)中心可能需要整合不同解決方案來(lái)滿足您的具體需求。