從原始社會的結繩記事,到之后的竹簡紙張,近代時人們用磁帶和光盤,而現(xiàn)在最為常見的還有閃存和硬盤……生活在被數(shù)據(jù)包圍的世界,人類從未停止追求高效便捷的信息存儲方式。
早前物聯(lián)傳媒對全球存儲領導企業(yè)西部數(shù)據(jù)進行采訪,了解到業(yè)界正預測到2021年,全球聯(lián)網(wǎng)設備將達到300億個,全球每年產生的數(shù)據(jù)量將從33ZB增長到2025年的175ZB。海量設備、天量數(shù)據(jù),這樣的現(xiàn)實推動人類尋找更大的存儲空間。
除了對硅制程工藝作出迭代以外,存儲生物遺傳密碼的介質——DNA開始進入眾多科技公司和研究機構的視野。
原理上是可行的
數(shù)據(jù)存儲的本質,實際上就是用一連串的1和0來編碼信息。對應到DNA存儲,則是將原本用0和1來表示的內容,換成用堿基A、C、G、T來表示,數(shù)據(jù)編碼就是合成序列,解碼就是進行DNA測序解讀。
再加上堿基有四個,相比于原本的0和1,能夠表達的狀態(tài)更多,比如用A代表00,C代表01,G代表10,T代表11。
此外,一個堿基只有幾個原子大小,且堿基之間的密度更大,因此DNA作為存儲介質整體的體積較于傳統(tǒng)的硬盤將更小,現(xiàn)有技術也可以支持DNA存儲的穩(wěn)定性。
加速推進DNA存儲的研發(fā)
關于DNA存儲技術的探索在好幾年前就開始了。
2015年,在哈佛大學實驗室,研究人員把一幅“奔跑的駿馬”的動圖放進了活大腸桿菌的DNA中,并以90%的準確度測序解碼了出來。
2016年,華盛頓大學和微軟研究院在頂級期刊《Nature biotechnology》上發(fā)表DNA存儲的研究成果,表示成功用技術將莎士比亞的十四行詩、馬丁路德金的演講原聲、醫(yī)學論文等資料編碼成DNA序列并存儲起來。
2017年,國外還出現(xiàn)文章,表示如果采用DNA存儲技術,只需要1公斤DNA物質就可以把當時全世界高達30ZB的數(shù)據(jù)全部存儲下來,一時掀起諸多爭論。
到2019年,來自歐洲的研究團隊發(fā)文,宣布首次將DNA作為信息存儲工具,注入到了一只3D打印的兔子中。并且,切下兔子身體的任何一部分,就能創(chuàng)建另一只相同的兔子。這項技術的革新在于,無生命特征的兔子也擁有了DNA,擁有了3.7億份描述它輪廓的數(shù)據(jù)文件。
2020年,關于DNA存儲的討論和研究還在繼續(xù),這項技術在實際生活中究竟能派上多大用場?商用路上最大的困難——成本高和效率低的問題該如何解決?如何避免DNA受到外部環(huán)境影響而變質?每個研究者和參與公司在這條路上付出了無數(shù)的努力。
當然,即便一項超前的技術開始到來,其并不能快速將既有成熟有效的技術取代,甚至它們將有機會在未來共同存在。
正確的存儲方案對從數(shù)據(jù)中獲取最大價值至關重要
DNA存儲的優(yōu)點,在于體積小,數(shù)據(jù)存儲的容量大,數(shù)據(jù)保存的耐久性;
但DNA存儲的不足,在于其多用于“冷”數(shù)據(jù)的歸檔保存,替代磁帶存儲的可能性更大一些,實際在一些時延要求較高的場景,比如車聯(lián)網(wǎng),智慧工廠、視頻監(jiān)控,并不是可選用的存儲方案。
在這之中,閃存正是各項存儲介質中最受到關注的一大領域,其從擅長的消費市場中萌芽,正在往更多的物聯(lián)網(wǎng)細分場景覆蓋蔓延。
而具體如何為存儲方案做好選型,獲取隱藏在數(shù)據(jù)中的寶貴價值,這是所有企業(yè)客戶的期許,也是存儲廠商長久努力的方向。