互聯(lián)網(wǎng)時代,我們每天需要花費大量的時間訪問數(shù)據(jù),這些數(shù)據(jù)包含圖片、視頻、文件等。訪問的數(shù)據(jù)主要存儲在中央服務(wù)器上。這種集中式的模式,統(tǒng)治著當今數(shù)據(jù)存儲的世界。隨著去中心化創(chuàng)新的蔓延,出現(xiàn)了一些有趣的替代方案,比如說區(qū)塊鏈技術(shù)。但是,以幾美元的價格在以太坊智能合約上存儲1kb數(shù)據(jù),價格也是相當昂貴的。
而IPFS的誕生就解決了這個問題,它利用自身的分布式存儲技術(shù)顛覆我們現(xiàn)有存儲和訪問數(shù)據(jù)模式,打破舊有的存儲弊端和中心化限制,讓用戶更加安全、高效、低成本地存取和共享數(shù)據(jù)。
IPFS數(shù)據(jù)存儲主要表現(xiàn)在以下幾個方面:
對等節(jié)點文件系統(tǒng)
IPFS有兩個關(guān)鍵屬性。首先,它是一個分布式文件系統(tǒng);其次,它是一個版本化的文件系統(tǒng),不僅可以存儲文件,還可以跟蹤它們的版本。這兩個屬性的組合是IPFS提出的新模型,與HTTP相比具有很多優(yōu)點。
HTTP是請求-響應協(xié)議。每臺計算機都會輸入自己的請求,然后連接到服務(wù)器進行檢索數(shù)據(jù)。在HTTP中訪問相同內(nèi)容的計算機,與物理距離的遠近是不相關(guān)的。而IPFS則不同:我們將文件添加到IPFS時,它們會被賦予一個加密哈希。這意味著當你查找文件時,可以要求網(wǎng)絡(luò)查找,存儲唯一哈希后面的內(nèi)容的節(jié)點。唯一哈希充當?shù)刂?,類似于在HTTP中鍵入網(wǎng)絡(luò)地址的方式。還應用了一個稱為IPNS的分散命名系統(tǒng),以便每個文件都具有一個可讀的名稱。通過使用此系統(tǒng),IPFS可以利用物理的鄰近性。
舉例如果一個生物醫(yī)學班的100名學生,都被告知訪問同一網(wǎng)頁,通過HTTP訪問他們都需要單獨連接到中央服務(wù)器;如果完全依賴于中央服務(wù)器來訪問內(nèi)容,這可能會導致一些問題。但是使用IPFS,相同的節(jié)點之間可以相互提取數(shù)據(jù),所需要的只是訪問數(shù)據(jù)的起點,即加密哈希。這就是IPFS如何利用物理距離,并實現(xiàn)比HTTP更高效的系統(tǒng)。
分散式云文件存儲
對于那些使用過Dropbox的用戶來說,分散式云存儲可以被認為與其是相同的,除了內(nèi)容是存儲在用戶的硬盤上,而不是在中央服務(wù)器上。用戶基本上出租了他們的硬盤空間,并且開發(fā)了許多加密技術(shù)以促進這種商業(yè)模式。
分散式云存儲旨在實現(xiàn)分散的好處,例如沒有單點故障和審查阻力。在典型的集中模型(如Google、Amazon和Dropbox運行的服務(wù))中,如果服務(wù)器出現(xiàn)問題,則可以限制對數(shù)據(jù)的訪問。在這些模型中,數(shù)據(jù)的隱私也值得懷疑。分散式模型沒有單點故障,可以提供對數(shù)據(jù)的無限制訪問,并使用加密來增強隱私。
分布式數(shù)據(jù)庫技術(shù)
分布式數(shù)據(jù)庫是這些大型企業(yè)用戶(如電商、金融、制造、零售等)承載核心業(yè)務(wù)的重要技術(shù)選型方向之一,是幫助企業(yè)處理大規(guī)模結(jié)構(gòu)化數(shù)據(jù)的重要技術(shù)平臺?;贗PFS平臺研發(fā)的新一代分布式關(guān)系型數(shù)據(jù)庫,規(guī)??蔁o限水平擴展,支持分布式事務(wù),具備金融級數(shù)據(jù)強一致性,滿足企業(yè)級核心數(shù)據(jù)庫對大容量、高并發(fā)、高可靠及高可用的苛刻要求。
分散式技術(shù)能否在數(shù)據(jù)存儲行業(yè)中大規(guī)模采用,仍有待觀察。提出的不同模式,包括:對等節(jié)點文件系統(tǒng)、分散式云存儲和分布式數(shù)據(jù)庫技術(shù);其中一個關(guān)鍵限制是在可擴展性、安全性和分散性之間進行權(quán)衡。為了提高吞吐量,分布式系統(tǒng)通常需要犧牲安全性和分散性。在加密領(lǐng)域,提出了不同解決方案,包括:文件分片和改變共識機制。
這些分散式的系統(tǒng),在其集中式系統(tǒng)之上提供了許多優(yōu)勢。集中型模式仍然是當前的主導模式,但隨著越來越多的用戶和開發(fā)人員嘗試使用分布式系統(tǒng),分散式存儲模式將會是數(shù)據(jù)存儲的未來。