回顧過(guò)去,數(shù)據(jù)存儲(chǔ)技術(shù)從90年代的DAS存儲(chǔ)發(fā)展到今天的分布式軟件定義存儲(chǔ),伴隨著成本、可靠性、擴(kuò)展性這幾個(gè)核心因素的平衡,可謂是風(fēng)風(fēng)雨雨經(jīng)歷了幾十年。在這段漫長(zhǎng)的歲月當(dāng)中,存儲(chǔ)架構(gòu)的發(fā)展經(jīng)歷了從短暫的DAS架構(gòu)迅速過(guò)度到以SAN架構(gòu)和NAS架構(gòu)混合存在的時(shí)代,SAN存儲(chǔ)可謂主宰乾坤幾十載;物理存儲(chǔ)介質(zhì)從軟盤、光盤、機(jī)械盤發(fā)展到今天的固態(tài)盤,其中SAS接口的機(jī)械硬盤伴隨著SAN存儲(chǔ)架構(gòu)的存在也可謂主宰乾坤幾十載;存儲(chǔ)軟件功能上,從最開始的單純讀寫服務(wù)發(fā)展到分級(jí)、分層、壓縮、虛擬化等等,再到今天的各種軟件定義。應(yīng)該講,數(shù)據(jù)存儲(chǔ)的發(fā)展可謂是迅速走過(guò)工業(yè)時(shí)代,長(zhǎng)久信息化時(shí)代,惆悵于互聯(lián)網(wǎng)時(shí)代。未來(lái)十年的發(fā)展道路上,個(gè)人認(rèn)為數(shù)據(jù)存儲(chǔ)技術(shù)的會(huì)呈現(xiàn)出以下幾個(gè)明顯特征。
1.存儲(chǔ)架構(gòu)會(huì)由集中式為主的時(shí)代發(fā)展為混合模式時(shí)代。
從市場(chǎng)數(shù)據(jù)上看,根據(jù)Gartner對(duì)于2020年全球外置存儲(chǔ)市場(chǎng)統(tǒng)計(jì)來(lái)看,分布式存儲(chǔ)發(fā)貨容量13ZB、銷售額33億$。2018年到2023年期間,中國(guó)分布式存儲(chǔ)市場(chǎng)年均復(fù)合增長(zhǎng)率將達(dá)到22.4%。不難看出,在數(shù)據(jù)量不斷暴漲和國(guó)產(chǎn)化趨勢(shì)的雙重驅(qū)動(dòng)下,未來(lái)十年分布式存儲(chǔ)逐漸會(huì)成為企業(yè)追求的重要目標(biāo)。從應(yīng)用發(fā)展模式上看,伴隨著Web1.0、2.0、3.0的飛速發(fā)展,越來(lái)越多的業(yè)務(wù)模式轉(zhuǎn)變?yōu)锽S模式,業(yè)務(wù)訪問(wèn)的并發(fā)量上發(fā)生了有史以來(lái)最大量級(jí)的升級(jí)。業(yè)務(wù)特性上,分析類業(yè)務(wù)劇增,依靠數(shù)據(jù)分析挖掘商機(jī)的時(shí)代到來(lái)。大數(shù)據(jù)、BI等新型業(yè)務(wù)系統(tǒng)紛紛在企業(yè)信息系統(tǒng)群中上線,數(shù)據(jù)本身的再生產(chǎn)價(jià)值能力受到空前的重視。集中式架構(gòu)已經(jīng)無(wú)法滿足這些新需求帶來(lái)的挑戰(zhàn)。從數(shù)據(jù)發(fā)展的特點(diǎn)上來(lái)看,越來(lái)越多的非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)形態(tài)涌入企業(yè)應(yīng)用系統(tǒng);數(shù)據(jù)量級(jí)呈爆發(fā)式的增長(zhǎng);數(shù)據(jù)生命周期管理由原來(lái)的在線離線為主的模式轉(zhuǎn)變?yōu)槎嗌芷诘哪J?;?shù)據(jù)分析成為企業(yè)必備的核心后臺(tái)。這些從數(shù)據(jù)結(jié)構(gòu)到數(shù)據(jù)量以及數(shù)據(jù)訪問(wèn)特點(diǎn)上的變化都會(huì)驅(qū)動(dòng)著分布式存儲(chǔ)架構(gòu)體系的建設(shè)。
2.數(shù)據(jù)存儲(chǔ)平臺(tái)會(huì)從獨(dú)立分散的狀態(tài)發(fā)展為統(tǒng)一融合化平臺(tái)。
目前來(lái)看,大多數(shù)的企業(yè)是沒(méi)有完善統(tǒng)一的數(shù)據(jù)平臺(tái)架構(gòu)的。傳統(tǒng)應(yīng)用有傳統(tǒng)應(yīng)用的關(guān)系型數(shù)據(jù)存儲(chǔ)平臺(tái),數(shù)倉(cāng)及分析類業(yè)務(wù)有自己獨(dú)立的數(shù)據(jù)存儲(chǔ)平臺(tái),系統(tǒng)之間通過(guò)特定的應(yīng)用接口來(lái)進(jìn)行數(shù)據(jù)的下沉和上浮。但是互聯(lián)網(wǎng)平臺(tái)的基礎(chǔ)之上,企業(yè)的業(yè)務(wù)會(huì)出現(xiàn)極高的融合度,企業(yè)對(duì)數(shù)據(jù)的利用會(huì)提高到戰(zhàn)略高度。因此越來(lái)越多的數(shù)據(jù)分析和人工智能元素會(huì)融入到數(shù)據(jù)的整合利用當(dāng)中。企業(yè)急需要將分散的數(shù)據(jù)通過(guò)采集、傳輸、過(guò)濾、加工、分析、匯總等系列過(guò)程進(jìn)行不同維度的再利用,那么統(tǒng)一的數(shù)據(jù)中臺(tái)、后臺(tái)就會(huì)成為數(shù)據(jù)存儲(chǔ)技術(shù)發(fā)展過(guò)程當(dāng)中必不可少的關(guān)鍵因素。而這個(gè)數(shù)據(jù)的整合匯總平臺(tái)一定是一個(gè)將硬件介質(zhì)、存儲(chǔ)架構(gòu)、軟件功能、應(yīng)用處理融合為一體的體系化建設(shè)工程。在金融行業(yè)當(dāng)中,已經(jīng)有很多企業(yè)在建設(shè)自己的數(shù)據(jù)中臺(tái)、后臺(tái)等,只是大家在建設(shè)的策略方面還未到足夠成熟階段。相信未來(lái)十年,越來(lái)越多行業(yè)會(huì)步金融行業(yè)的后塵建設(shè)自己行業(yè)的數(shù)據(jù)平臺(tái)。
3.在軟件定義的基礎(chǔ)之上,智能化的元素會(huì)不斷融入新的存儲(chǔ)產(chǎn)品當(dāng)中。
谷歌在2003、2004、2006年僅以學(xué)術(shù)共享形式發(fā)表的Google FS、MapReduce、BigTable三篇論文,十年之后卻成為互聯(lián)網(wǎng)企業(yè)實(shí)際應(yīng)用的先驅(qū)模板。而且隨著企業(yè)業(yè)務(wù)模式的不斷發(fā)展,這些源代碼經(jīng)歷了多次有針對(duì)性的優(yōu)化和改造,解決了很多新的場(chǎng)景問(wèn)題。從市場(chǎng)數(shù)據(jù)上看,2014到2019的五年時(shí)間內(nèi),軟件定義存儲(chǔ)的市場(chǎng)將從14億美元增長(zhǎng)到62億美元以上,年復(fù)合增長(zhǎng)率高達(dá)35%。伴隨著軟件化的不斷發(fā)展,企業(yè)對(duì)數(shù)據(jù)存儲(chǔ)的智能化程度要求越來(lái)越高。數(shù)據(jù)存儲(chǔ)規(guī)劃方面,越來(lái)越多的企業(yè)無(wú)法對(duì)未來(lái)發(fā)展的數(shù)據(jù)特點(diǎn)、量級(jí)、性能等要求作出準(zhǔn)確設(shè)計(jì),因此他們希望數(shù)據(jù)存儲(chǔ)的軟件功能具備根據(jù)動(dòng)態(tài)運(yùn)維數(shù)據(jù)提出優(yōu)化建議并可自動(dòng)執(zhí)行的能力。數(shù)據(jù)存儲(chǔ)使用方面,工程師更希望存儲(chǔ)可以通過(guò)數(shù)據(jù)訪問(wèn)的基礎(chǔ)運(yùn)維數(shù)據(jù)來(lái)動(dòng)態(tài)調(diào)整端口、帶寬、緩存以及其他一些列存儲(chǔ)資源的利用策略,以達(dá)到優(yōu)化存儲(chǔ)資源利用均衡化的目的。數(shù)據(jù)存儲(chǔ)配置方面,架構(gòu)師希望在紛繁復(fù)雜的基礎(chǔ)運(yùn)維數(shù)據(jù)當(dāng)中,存儲(chǔ)設(shè)備可以幫他找到數(shù)據(jù)之間的聯(lián)系,分析出最優(yōu)的性能配置策略、空間使用策略、安全配置策略以及最優(yōu)的技術(shù)參數(shù)體系。事實(shí)上,很多的數(shù)據(jù)存儲(chǔ)產(chǎn)品也在有意無(wú)意將人工智能的元素融入到數(shù)據(jù)存儲(chǔ)的新產(chǎn)品當(dāng)中。
4.云存儲(chǔ)技術(shù)會(huì)成為數(shù)據(jù)存儲(chǔ)領(lǐng)域又一顆璀璨的明星。
隨著云計(jì)算的不斷發(fā)展,云存儲(chǔ)已經(jīng)從最開始的網(wǎng)盤模式發(fā)展為社會(huì)生活當(dāng)中必不可少的關(guān)鍵對(duì)象,未來(lái)也一定會(huì)充斥著社會(huì)經(jīng)濟(jì)生活當(dāng)中的各個(gè)角落。從云計(jì)算帶動(dòng)的信息革命角度來(lái)看,正是有了云計(jì)算的存在,才會(huì)有今天以及未來(lái)各行各業(yè)的革命性創(chuàng)新。從智能交通到智慧城市,這里面會(huì)有無(wú)法計(jì)量的并且數(shù)據(jù)結(jié)構(gòu)、狀態(tài)、特點(diǎn)呈現(xiàn)五花八門形態(tài)的海量數(shù)據(jù),這些數(shù)據(jù)來(lái)自于城市當(dāng)中的每一個(gè)職能部門和企業(yè),同時(shí)又為所有的社會(huì)群體服務(wù),那么數(shù)據(jù)的存儲(chǔ)和利用必然走向云化特征。從企業(yè)的數(shù)據(jù)戰(zhàn)略高度來(lái)看,企業(yè)未來(lái)生死輸贏的先決條件就是它對(duì)數(shù)據(jù)的利用能力如何,無(wú)論是金融行業(yè)還是零售行業(yè),大數(shù)據(jù)分析戰(zhàn)略已經(jīng)是企業(yè)必不可少的建設(shè)目標(biāo)了。在利用好企業(yè)自身積淀的數(shù)據(jù)基礎(chǔ)之上,它們開始研究利用云平臺(tái)上的社會(huì)共有數(shù)據(jù),大家都在處心積慮圍繞著客戶這條線索建立一套屬于自己的完整商業(yè)數(shù)據(jù)畫像。因此云存儲(chǔ)是這一戰(zhàn)略唯一可選的數(shù)據(jù)存儲(chǔ)方案。據(jù)IDC數(shù)據(jù)顯示,到2025年,全球創(chuàng)建、獲取和復(fù)制的數(shù)據(jù)量將增至175ZB,其中,企業(yè)存儲(chǔ)的數(shù)據(jù)量將會(huì)占據(jù)全球總數(shù)據(jù)量80%以上。這一數(shù)據(jù)表明企業(yè)正迅速成為生產(chǎn)數(shù)據(jù)和管理數(shù)據(jù)的主要載體,加上目前我國(guó)正處于云計(jì)算的高速發(fā)展時(shí)期,企業(yè)上云成為必然趨勢(shì)。越來(lái)越多的企業(yè)選擇將自己的日常辦公數(shù)據(jù)、備份數(shù)據(jù)、歸檔數(shù)據(jù)、靜態(tài)歷史數(shù)據(jù)等活動(dòng)性不強(qiáng)的海量數(shù)據(jù)移入云存儲(chǔ)資源池甚至直接推向云端。
5.存儲(chǔ)硬件技術(shù)會(huì)向綠色節(jié)能方向不斷演進(jìn)。
2016年4月8日,由工業(yè)和信息化部、國(guó)家機(jī)關(guān)事務(wù)管理局、國(guó)家能源局聯(lián)合召開“國(guó)家綠色數(shù)據(jù)中心試點(diǎn)工作推進(jìn)會(huì)暨京津冀綠色數(shù)據(jù)中心協(xié)同發(fā)展論壇”。在這次會(huì)議上,強(qiáng)調(diào)了開展綠色數(shù)據(jù)中心試點(diǎn)地區(qū)的重要性,并對(duì)下一步的工作思路和任務(wù)做出了明確清晰的回應(yīng),工業(yè)和信息化部相關(guān)負(fù)責(zé)人也指出了試點(diǎn)單位應(yīng)對(duì)創(chuàng)新工作的創(chuàng)建做好準(zhǔn)備。未來(lái)降低能耗將成為數(shù)據(jù)中心建設(shè)的首要目標(biāo),通過(guò)使用可代替可再生能源將成為數(shù)據(jù)中心主要的電力能源。新一代綠色數(shù)據(jù)中心需要新型綠色節(jié)能技術(shù)的支持。同樣存儲(chǔ)設(shè)備作為數(shù)據(jù)中心所有IT設(shè)備當(dāng)中最耗能源的設(shè)備,也必須與這個(gè)整體目標(biāo)相符發(fā)展。從存儲(chǔ)產(chǎn)品的硬件層面來(lái)實(shí)現(xiàn)節(jié)能無(wú)非需要從架構(gòu)設(shè)計(jì)、芯片使用以及硬盤介質(zhì)等幾個(gè)方面來(lái)推進(jìn)。從目前的技術(shù)參數(shù)對(duì)比來(lái)看,從時(shí)延、功耗、返還率等重要技術(shù)參數(shù)對(duì)比來(lái)看,固態(tài)硬盤都要遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)機(jī)械硬盤,未來(lái)隨著TCO不斷降低固態(tài)硬盤會(huì)取代機(jī)械硬盤的霸主地位;更節(jié)能高效的非易失性內(nèi)存技術(shù)填補(bǔ)了從硬盤到DRAM之間的性能、成本、能耗等方面的不平衡性。也定會(huì)成為未來(lái)新型存儲(chǔ)產(chǎn)品必不可少的關(guān)鍵技術(shù)。
6.存儲(chǔ)協(xié)議會(huì)從AHCI為主的模式演變?yōu)镹VMe的天下。
在存儲(chǔ)系統(tǒng)當(dāng)中,HDD和SSD早期的傳輸協(xié)議都是AHCI(Advanced Host Controller Interface),AHCI為單隊(duì)列模式,也就是說(shuō)服務(wù)器和硬盤之間的數(shù)據(jù)傳輸為單隊(duì)列模式。早期數(shù)據(jù)存儲(chǔ)的性能主要受限于HDD硬盤本身,因此AHCI的性能瓶頸也就不是主要矛盾了。但是隨著SSD介質(zhì)技術(shù)的不斷應(yīng)用,AHCI的單隊(duì)列模式已經(jīng)嚴(yán)重制約SSD介質(zhì)的并發(fā)訪問(wèn)性能的發(fā)揮了。因此NVMe(NVM Experess)協(xié)議應(yīng)用而生,它旨在降低時(shí)延的同時(shí)提高IOPS,可以達(dá)到16Gbps的吞吐量,部分基于NVMe的驅(qū)動(dòng)器可以達(dá)到200萬(wàn)甚至1000萬(wàn)的IOPS。從數(shù)據(jù)上來(lái)看,憑借其卓越性能優(yōu)勢(shì),NVMe SSD產(chǎn)品在2018-2023年間以38%的復(fù)合年增長(zhǎng)率持續(xù)增長(zhǎng),2021年占據(jù)企業(yè)級(jí)SSD出貨量的55%以上。未來(lái)十年的存儲(chǔ)技術(shù)發(fā)展,伴隨著NVMe本身的分支技術(shù)發(fā)展,它一定會(huì)主宰未來(lái)存儲(chǔ)協(xié)議。
總之,隨著數(shù)字經(jīng)濟(jì)時(shí)代的不斷深入發(fā)展,企業(yè)數(shù)據(jù)的價(jià)值被進(jìn)一步重視和挖掘,數(shù)據(jù)存儲(chǔ)技術(shù)的應(yīng)用和發(fā)展會(huì)向多元化、智能化、體系化、綠色化等方向逐步發(fā)展,在這個(gè)過(guò)程當(dāng)中也會(huì)有更多的新型軟件及硬件技術(shù)誕生并應(yīng)用到未來(lái)的存儲(chǔ)產(chǎn)品當(dāng)中。相信存儲(chǔ)產(chǎn)業(yè)經(jīng)濟(jì)的發(fā)展模式也會(huì)從客戶適應(yīng)產(chǎn)品的通用產(chǎn)品模式逐步發(fā)展為圍繞客戶需求定制化的個(gè)性化產(chǎn)品經(jīng)濟(jì)模式。