CNET和CBS News的高級(jí)制作人Dan Patterson采訪了從事DNA數(shù)據(jù)存儲(chǔ)的Catalog公司的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Hyunjun Park。以下是他們倆的談話內(nèi)容,已經(jīng)過編輯。
Hyunjun Park:為了便于討論,數(shù)據(jù)是指我們?cè)谌澜缟傻娜魏晤愋偷男畔ⅰ5蔷痛鎯?chǔ)目的而言,數(shù)據(jù)在我們眼里實(shí)際上就是一連串1和0。這是一長(zhǎng)串的1和0,您通常使用計(jì)算機(jī)將這二進(jìn)制數(shù)據(jù)存儲(chǔ)在硬盤驅(qū)動(dòng)器和閃存驅(qū)動(dòng)器之類的介質(zhì)上。現(xiàn)在,我們?cè)噲D存儲(chǔ)在新介質(zhì)DNA上。
我們現(xiàn)正在使用合成DNA來存儲(chǔ)數(shù)據(jù),不過將來可能會(huì)使用有機(jī)DNA,但實(shí)際上,如果您考慮一下,那是相反的。我們已經(jīng)在體內(nèi)使用有機(jī)DNA。我們已經(jīng)使用它存儲(chǔ)數(shù)據(jù)。那就是染色體,即人體細(xì)胞內(nèi)的DNA。它以非常數(shù)字化的方式存儲(chǔ)信息,不過我們正嘗試使用我們模仿的合成DNA分子來復(fù)制該存儲(chǔ)方案。我們現(xiàn)在模仿大自然,使用這種新介質(zhì)存儲(chǔ)信息。
何謂合成DNA?說到底,它與有機(jī)DNA一模一樣,只不過我們從合成和人工的角度來探討。我們使用化學(xué)方法使分子看起來完全像人體內(nèi)的有機(jī)DNA。
人體已經(jīng)在使用DNA以非常數(shù)字化的方式存儲(chǔ)信息。我的意思是,四種不同的單位組成DNA。四個(gè)不同的堿基:A、T、G和C以及那些堿基對(duì)的順序決定了存儲(chǔ)在其中的信息。這是人體存儲(chǔ)信息的一種非常數(shù)字化的方式。因此我們從中得到了靈感,充分利用DNA的所有特征來存儲(chǔ)數(shù)字信息,而不是遺傳信息。這將發(fā)生在試管或?qū)嶒?yàn)室中,而不是在細(xì)胞內(nèi)。
現(xiàn)在,我提到的優(yōu)點(diǎn)包括不可思議的信息密度。由于人體要將大量的遺傳信息塞到一個(gè)小小的細(xì)胞內(nèi),這意味著您可以在很小的體積中存儲(chǔ)大量信息。這就是信息密度。如果您考慮DNA的信息密度,每克DNA相當(dāng)于存儲(chǔ)200 PB左右的數(shù)據(jù)。
這意味著含有EB級(jí)數(shù)據(jù)的數(shù)據(jù)中心可以存儲(chǔ)在一塊方糖大小的DNA中。信息密度很大。另一個(gè)優(yōu)點(diǎn)是這些分子很穩(wěn)定。我們已經(jīng)能夠?qū)υ谟谰脙鐾林斜4媪?0萬年的馬匹的基因組進(jìn)行測(cè)序。利用DNA的信息存儲(chǔ),您可以將信息一次性放入該介質(zhì)中,基本上可以永遠(yuǎn)保存。您可以將其存儲(chǔ)在室溫下的試管中,它是一種非常穩(wěn)定的信息存儲(chǔ)形式。
聽起來很牽強(qiáng),但我不敢邀功,我們不是第一個(gè)提出將信息存儲(chǔ)在DNA中或?qū)?shù)字信息存儲(chǔ)在DNA中的想法。這個(gè)想法已存在了數(shù)十年,甚至早在50年代就有了。之前使用DNA來存儲(chǔ)大量信息之所以不可能,是由于將信息寫入這些分子中的成本非常高昂。
我們Catalog所做的全新工作是,開發(fā)出了一個(gè)平臺(tái),能夠從事基因存儲(chǔ),比現(xiàn)有技術(shù)便宜得多、快速得多。我們填補(bǔ)了這一空白。
這項(xiàng)技術(shù)在實(shí)際生活中能派怎樣的用場(chǎng)?去年我們做了演示,使用我們研發(fā)的可打印分子的新型打印機(jī),將維基百科的所有英文文本存儲(chǔ)到DNA中。您可以想象在不久的將來,我們可以將這些機(jī)器連接到數(shù)據(jù)中心;針對(duì)需要長(zhǎng)期歸檔或高度并行處理的數(shù)據(jù),我們可以以DNA形式存儲(chǔ)這些信息,并根據(jù)需要進(jìn)行查詢;如果需要,還可以創(chuàng)建成千上萬個(gè)副本。這也是DNA作為存儲(chǔ)介質(zhì)大有優(yōu)勢(shì)的另一個(gè)特點(diǎn)。