新型分子數(shù)據(jù)存儲(chǔ)系統(tǒng)研究有新進(jìn)展

中國(guó)存儲(chǔ)網(wǎng)
隨著數(shù)據(jù)領(lǐng)域的不斷擴(kuò)展,正在做大量工作來尋找新的和更緊湊的存儲(chǔ)方式。通過在分子中編碼數(shù)據(jù),有可能在僅幾毫米的空間中存儲(chǔ)相當(dāng)于TB級(jí)的數(shù)據(jù)。

在《自然通訊》上發(fā)表的一項(xiàng)研究中,研究小組以一系列包含定制合成的小分子的混合物的形式存儲(chǔ)了各種圖像文件-畢加索繪畫,埃及神阿努比斯和其他人的圖像。研究人員總共存儲(chǔ)了200千字節(jié)的數(shù)據(jù),他們說這是迄今為止使用小分子存儲(chǔ)的最多數(shù)據(jù)。研究人員說,與傳統(tǒng)的存儲(chǔ)方式相比,這不是很多數(shù)據(jù),但是在小分子存儲(chǔ)方面,這是一個(gè)重大進(jìn)步。

布朗的工程學(xué)院助理教授,該研究的作者雅各布·羅森斯坦說: “ 我認(rèn)為這是向前邁出的重要一步。” “ 大量獨(dú)特的小分子,我們可以存儲(chǔ)的數(shù)據(jù)量以及數(shù)據(jù)讀取的可靠性顯示了進(jìn)一步擴(kuò)大這一規(guī)模的真正希望。”

隨著數(shù)據(jù)領(lǐng)域的不斷擴(kuò)展,正在做大量工作來尋找新的和更緊湊的存儲(chǔ)方式。通過在分子中編碼數(shù)據(jù),有可能在僅幾毫米的空間中存儲(chǔ)相當(dāng)于TB級(jí)的數(shù)據(jù)。大多數(shù)有關(guān)分子存儲(chǔ)的研究都集中在長(zhǎng)鏈聚合物(如DNA)上,而DNA是眾所周知的生物學(xué)數(shù)據(jù)載體。但是,與長(zhǎng)聚合物相比,使用小分子具有潛在的優(yōu)勢(shì)。與合成DNA相比,小分子的生產(chǎn)可能更容易且更便宜,并且理論上具有更高的存儲(chǔ)容量。

布朗研究小組在化學(xué)教授布倫達(dá)·魯賓斯坦(Brenda Rubenstein)領(lǐng)導(dǎo)的美國(guó)國(guó)防高級(jí)研究計(jì)劃局(DARPA)資助下,一直在努力尋找使小分子數(shù)據(jù)存儲(chǔ)可行且可擴(kuò)展的方法。

為了存儲(chǔ)數(shù)據(jù),該團(tuán)隊(duì)使用了小金屬板,這些金屬板上排列著1500個(gè)直徑小于一毫米的小點(diǎn)。每個(gè)斑點(diǎn)包含分子的混合物。每種混合物中是否存在不同分子指示了數(shù)字?jǐn)?shù)據(jù)。每個(gè)混合物中的位數(shù)可以和可用于混合的不同分子庫一樣大。然后可以使用質(zhì)譜儀讀取數(shù)據(jù),質(zhì)譜儀可以識(shí)別每個(gè)孔中存在的分子。

在去年發(fā)表的一篇論文中,布朗團(tuán)隊(duì)表明,他們可以使用一些常見的代謝物(生物體用來調(diào)節(jié)新陳代謝的分子)將圖像文件存儲(chǔ)在千字節(jié)范圍內(nèi)。對(duì)于這項(xiàng)新工作,研究人員能夠通過合成自己的分子,極大地?cái)U(kuò)展其庫的大小,從而擴(kuò)展其可以編碼的文件的大小。

該團(tuán)隊(duì)利用Ugi反應(yīng)制造了分子。Ugi反應(yīng)是制藥行業(yè)常用的一種技術(shù),用于快速生產(chǎn)大量不同的化合物。Ugi反應(yīng)將四大類試劑(胺,醛或酮,羧酸和異氰酸酯)組合成一個(gè)新分子。通過使用每種類別的不同試劑,研究人員可以快速產(chǎn)生各種各樣的不同分子。對(duì)于這項(xiàng)工作,研究小組使用了五種不同的胺,五種醛,十二種羧酸和五種異氰酸酯,以不同的組合生成了1,500種不同的化合物。

“ 這里的優(yōu)勢(shì)是庫的潛在可伸縮性,” Rubenstein說。“ 我們僅使用27種不同的成分就可以在一天之內(nèi)制作出一個(gè)1,500分子的文庫。這意味著我們不必出去尋找1,500個(gè)獨(dú)特分子。”

從那里開始,研究小組使用化合物的子庫對(duì)圖像進(jìn)行編碼。32位化合物庫用于存儲(chǔ)埃及神阿努比斯的二進(jìn)制圖像。575化合物庫用于編碼0.88兆像素的畢加索小提琴繪畫。

用于化學(xué)文庫的大量分子也使研究人員能夠探索替代的編碼方案,從而使數(shù)據(jù)的讀取更加可靠。質(zhì)譜法非常精確,但并不完美。因此,與用于存儲(chǔ)或傳輸數(shù)據(jù)的任何系統(tǒng)一樣,該系統(tǒng)將需要某種形式的錯(cuò)誤校正。

論文第一作者布朗大學(xué)研究生克里斯·阿卡迪亞(Chris Arcadia)說: “ 我們?cè)O(shè)計(jì)庫和讀取數(shù)據(jù)的方式包括使我們能夠糾正某些錯(cuò)誤的額外信息。” “ 這幫助我們簡(jiǎn)化了實(shí)驗(yàn)流程,并且仍然獲得了高達(dá)99%的準(zhǔn)確率。”

研究人員說,還需要做更多的工作才能使這個(gè)想法達(dá)到有用的規(guī)模。但是,創(chuàng)建大型化學(xué)庫并將其用于編碼更大文件的能力表明該方法確實(shí)可以擴(kuò)大規(guī)模。

羅森斯坦說: “ 我們不再受限于化學(xué)庫的大小,這確實(shí)很重要,” “ 這是這里向前邁出的最大一步。幾年前,當(dāng)我們開始這個(gè)項(xiàng)目時(shí),我們就這種規(guī)模的東西在實(shí)驗(yàn)上是否可行進(jìn)行了一些辯論。因此,我們能夠做到這一點(diǎn)真是令人鼓舞。”

論文的其他共同作者是Eamonn Kennedy,Joseph Geiser,Amanda Dombroski,Kady Oakley,Shui-Ling Chen,Leonard Sprague,Mustafa Ozmen,Jason Sello,Peter M.Weber,Sherief Reda,Christopher Rose和Eunsuk Kim。

這項(xiàng)工作是由DARPA(W911NF-18-2-0031)和國(guó)家科學(xué)基金會(huì)(1941344)資助的。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論