大數據分析和人工智能的最新進展為企業(yè)積累有關其業(yè)務各個可衡量方面的信息提供了強大的動力,這不足為奇?,F在,財務法規(guī)要求組織保留記錄的時間比過去要長得多。因此,各行各業(yè)的公司和機構都在堅持越來越多。
研究表明[PDF]記錄的數據量正在以每年30%到40%的速度增加。與此同時,用于存儲大部分數據的現代硬盤驅動器的容量正在以不到一半的速度增長。幸運的是,大部分信息不需要立即訪問。對于這些事情,磁帶是完美的解決方案。
事實上,世界上的大部分數據仍然保存在磁帶上,包括基礎科學的數據,如粒子物理學和射電天文學、人類遺產和國家檔案、主要電影、銀行、保險、石油勘探等等。甚至有一群人(包括我,受過材料科學、工程或物理學培訓)的工作是不斷改進磁帶存儲。
磁帶已經存在很長時間了,是的,但該技術并沒有被及時凍結。恰恰相反。就像硬盤和晶體管一樣,磁帶在過去幾十年里取得了巨大的進步。
第一個商業(yè)數字磁帶存儲系統(tǒng),IBM的726型,可以在一個磁帶卷上存儲大約1.1兆字節(jié)的數據。今天,一個現代磁帶盒可以容納15 TB。單個機械手磁帶庫最多可包含278 PB的數據。將如此多的數據存儲在光盤上將需要超過3.97億個,如果堆疊起來將形成超過476公里高的塔。
確實,磁帶無法提供硬盤或半導體存儲器的快速訪問速度。盡管如此,該媒體的優(yōu)勢還是很多的。首先,磁帶存儲更節(jié)能:一旦所有數據都被記錄下來,盒式磁帶就可以靜靜地放在機器人庫的插槽中,根本不消耗任何電力。磁帶也非??煽?,錯誤率比硬盤低四到五個數量級。磁帶非常安全,具有內置的動態(tài)加密和由介質本身的性質提供的額外安全性。畢竟,如果磁帶未安裝在驅動器中,則無法訪問或修改數據。鑒于通過網絡攻擊竊取數據的速度不斷增加,這種“氣隙”尤其具有吸引力。
磁帶的離線特性還提供了一道額外的防線來抵御有缺陷的軟件。例如,在2011年,軟件更新中的一個缺陷導致谷歌意外刪除了大約40,000個Gmail帳戶中保存的電子郵件。盡管跨多個數據中心的硬盤驅動器上存儲了多個數據副本,但還是發(fā)生了這種丟失。幸運的是,數據也記錄在磁帶上,谷歌最終可以從備份中恢復所有丟失的數據。
2011年的Gmail事件是首次披露云服務提供商使用磁帶進行運營的事件之一。最近,微軟宣布其Azure存檔存儲使用IBM磁帶存儲設備。
照片:貝特曼/蓋蒂圖片社
1951年:磁帶首次用于在計算機(Univac)上記錄數據。
盡管有所有這些優(yōu)點,但公司使用磁帶的主要原因通常是簡單的經濟學。磁帶存儲的成本是在磁盤上保存相同數量的數據所必須支付的費用的六分之一,這就是為什么您幾乎可以在存儲大量數據的任何地方找到磁帶系統(tǒng)。但是由于磁帶現在已經完全從消費級產品中消失了,大多數人都不知道它的存在,更不用說磁帶錄音技術近年來取得的巨大進步,并且在可預見的未來還會繼續(xù)取得進步。
所有這一切都是說磁帶已經存在了幾十年,并且將在未來幾十年繼續(xù)存在。我怎么能這么確定?繼續(xù)閱讀。
磁帶之所以能存活多久,是因為一個基本原因:它便宜。而且它一直在變得更便宜。但情況會一直如此嗎?
您可能會認為,如果將更多數據塞入磁盤的能力正在減弱,那么磁帶也必須如此,它使用相同的基本技術但更老。令人驚訝的現實是,對于磁帶而言,這種容量的擴大并沒有顯示出放緩的跡象。事實上,它應該會以每年約33%的歷史速度持續(xù)多年,這意味著您可以預期大約每兩到三年容量翻一番。將其視為磁帶的摩爾定律。
對于必須在保持不變的存儲預算下處理數據爆炸的任何人來說,這都是個好消息。要了解為什么磁帶相對于硬盤驅動器仍然具有如此大的潛力,請考慮磁帶和硬盤驅動器的發(fā)展方式。
兩者都依賴相同的基本物理機制來存儲數字數據。它們以磁性材料薄膜中的窄軌道形式實現,其中磁性在兩種極性狀態(tài)之間切換。該信息被編碼為一系列位,由沿軌道特定點的磁極性轉變的存在或不存在來表示。自從1950年代推出磁帶和硬盤驅動器以來,兩者的制造商一直受到“更密集、更快、更便宜”的口號的推動。因此,兩者的成本(以每GB容量為單位)都下降了許多數量級。
這些成本降低是磁性基板每平方毫米上可記錄的信息密度呈指數增長的結果。該面密度是沿數據磁道的記錄密度與沿垂直方向的磁道密度的乘積。
早期,磁帶和硬盤驅動器的面密度相似。但是硬盤驅動器銷售帶來的更大的市場規(guī)模和收入為更大的研發(fā)工作提供了資金,這使他們的制造商能夠更積極地擴大規(guī)模。因此,當前大容量硬盤驅動器的面密度大約是最新磁帶驅動器的100倍。
然而,由于它們具有更大的可用于記錄的表面積,最先進的磁帶系統(tǒng)提供高達15 TB的本機磁帶容量—大于市場上容量最大的硬盤驅動器。即使兩種設備占用的空間大致相同,也是如此。
內外:現代線性開帶(LTO)磁帶盒由單個卷軸組成。插入磁帶后,磁帶會自動送入驅動機構內置的卷軸。照片:維克多普拉多
除了容量之外,磁帶和硬盤驅動器的性能特征當然大不相同。盒式磁帶中的長磁帶(通常為數百米)導致平均數據訪問時間為50到60秒,而硬盤驅動器的平均數據訪問時間僅為5到10毫秒。但令人驚訝的是,數據寫入磁帶的速度是寫入磁盤速度的兩倍多。
在過去幾年中,硬盤上數據的面密度縮放已從其歷史平均每年40%左右放緩至10%到15%之間。原因與一些基本物理學有關:要在給定區(qū)域中記錄更多數據,您需要為每個位分配一個較小的區(qū)域。反過來,這會減少您在閱讀時獲得的信號。如果您過多地減少信號,它就會在由覆蓋磁盤的磁性顆粒的顆粒性質產生的噪聲中丟失。
可以通過使這些顆粒變小來減少背景噪音。但是很難將磁性顆??s小到超過一定的尺寸而不損害它們以穩(wěn)定方式保持磁性狀態(tài)的能力??捎糜诖庞涗浀淖钚〕叽缭谠撔袠I(yè)中被稱為超順磁極限。磁盤制造商已經達到了它。
直到最近,這種放緩對消費者來說還不是很明顯,因為磁盤驅動器制造商能夠通過在每個單元中添加更多的磁頭和盤片來進行補償,從而在相同尺寸的封裝中實現更高的容量。但是現在可用空間和增加更多磁頭和盤片的成本都限制了驅動器制造商可以取得的收益,并且平穩(wěn)期開始變得明顯。
有一些技術正在開發(fā)中,可以使硬盤驅動器擴展到超越當今的超順磁性極限。這些包括熱輔助磁記錄(HAMR)和微波輔助磁記錄(MAMR),這些技術可以使用較小的晶粒,從而允許磁化磁盤的較小區(qū)域。但是這些方法會增加成本并帶來棘手的工程挑戰(zhàn)。即使它們成功了,根據制造商的說法,它們提供的擴展可能仍然有限。例如,西部數據公司(Western Digital Corp.)最近宣布可能會在2019年開始出貨MAMR硬盤,預計這項技術將使面密度每年僅增長15%左右。
相比之下,磁帶存儲設備目前在遠低于超順磁極限的面密度下運行。因此磁帶的摩爾定律可以持續(xù)10年或更長時間,而不會遇到來自基礎物理學的此類障礙。
盡管如此,磁帶仍然是一項棘手的技術。它的可拆卸特性、使用薄聚合物基板而不是硬磁盤以及同時并行記錄多達32條軌道為設計人員帶來了重大障礙。這就是為什么我在IBM Research-Zurich實驗室的研究團隊一直在努力尋找方法來實現磁帶的持續(xù)擴展,要么通過調整硬盤驅動器技術,要么通過發(fā)明全新的方法。
2015年,我們和我們在FujiFilm公司的合作者表明,通過使用垂直于磁帶取向的超小鋇鐵氧體顆粒,可以以當今商業(yè)技術可實現的密度的12倍以上來記錄數據。最近,我們與Sony Storage Media Solutions合作,展示了以大約是最先進磁帶驅動器當前數字20倍的面密度記錄數據的可能性。從這個角度來看,如果這項技術要商業(yè)化,現在可能需要十幾個磁帶盒來存檔大預算電影的所有數字組件的電影制片廠將能夠將所有這些組件安裝在一個磁帶。
數據洪流:現代磁帶庫可以存儲數百PB,而1952年推出的IBM 726(右)只能存儲幾兆字節(jié)。照片:大衛(wèi)帕克/科學來源;右:IBM
為了實現這種程度的擴展,我們必須取得一系列技術進步。一方面,我們改進了讀寫磁頭跟隨磁帶上細長磁道的能力,在我們最新的演示中,這些磁道只有100納米左右的寬度。
我們還必須將數據讀取器(一種用于讀回記錄數據軌道的磁阻傳感器)的寬度從目前的微米尺寸減小到小于50納米。結果,我們可以用這么小的閱讀器接收到的信號非常嘈雜。我們通過增加介質固有的信噪比來進行補償,該信噪比是磁性粒子的大小和方向及其組成以及磁帶表面的光滑度和光滑度的函數。為了進一步提供幫助,我們改進了設備采用的信號處理和糾錯方案。
為確保我們的新原型介質能夠將記錄的數據保留數十年,我們改變了記錄層中磁性顆粒的性質,使其更加穩(wěn)定。但這種變化首先使記錄數據變得更加困難,以至于普通磁帶傳感器無法可靠地寫入新媒體。因此,我們使用了一種特殊的寫入磁頭,它產生的磁場比傳統(tǒng)磁頭所能提供的磁場強得多。
結合這些技術,我們能夠在我們的實驗室系統(tǒng)中以每英寸818,000位的線性密度讀取和寫入數據。(由于歷史原因,世界各地的磁帶工程師以英寸為單位測量數據密度。)結合新技術可以處理的每英寸246,200個磁道,我們的原型單元實現了每平方英寸201吉比特的面密度。假設一個盒式磁帶可以容納1,140米的磁帶——這是一個合理的假設,基于我們使用的新磁帶介質的厚度減小——這個面密度對應于高達330 TB的盒式磁帶容量。這意味著單個磁帶盒可以記錄與裝滿硬盤的獨輪車一樣多的數據。
在2015年,在信息存儲產業(yè)聯盟,包括惠普企業(yè),IBM,甲骨文和Quantum,與學術研究團體的擺沿著一個組織,發(fā)布了它所謂的“國際磁帶存儲路線圖。”該預測預測到2025年磁帶存儲的面積密度將達到每平方英寸91 Gb。根據這一趨勢推斷,到2028年它將超過每平方英寸200 Gb。
該路線圖的作者每個人都對磁帶存儲的未來感興趣。但你不必擔心他們過于樂觀。我和我的同事最近進行的實驗室實驗表明,每平方英寸200 Gb是完全可能的。因此,在我看來,將磁帶保持在至少十年的增長路徑上的可行性是有保證的。
事實上,磁帶可能是最后一個遵循摩爾定律式縮放的信息技術之一,即使不是更久,也可以在未來十年內保持這種縮放。而這種連勝反過來只會增加磁帶相對于硬盤驅動器和其他存儲技術的成本優(yōu)勢。因此,盡管您可能很少在黑白電影之外看到它,但磁帶雖然很舊,但在未來幾年仍會存在。
本文作為“磁帶存儲卷土重來”出現在2018年9月的印刷版中。
關于作者
Mark Lantz是IBM Research Zurich的高級磁帶技術經理。