分布式存儲類項目,早年有Sia、storj,到2020年即將上線的Filecoin。以及因為分布式存儲使用硬盤挖礦,間接催生和促進了PoC機制硬盤挖礦的一些項目,尤其是在2019年,比如BHD。
備注:PoC和分布式存儲是兩個概念,不過,因為都使用硬盤,總是被人弄混淆。今天講的是分布式存儲
分布式存儲以及重要項目Filecoin風頭一時無兩,不過很多項目關(guān)注者、分布式存儲愛好者、準礦工更多的是關(guān)注這個項目本身的商業(yè)價值,就是有沒有很好的投資收益。其實對分布式存儲的現(xiàn)狀和未來缺乏一些初步的認知。
了解一個事物的簡單方法論是:What?Why?How?是什么?為什么?怎么做?今天我們以很通俗易懂的語言來為大家講解下:
分布式存儲是什么?
為什么存儲要分布式?
用什么樣的機制去實現(xiàn)?(下一篇文章講解)
分布式存儲的最終目的是什么?(下一篇文章講解)
01背景知識
計算機互聯(lián)網(wǎng)絡(luò)的上有三個重要的底層邏輯:存儲、計算、分發(fā)。我們簡單說一下這些概念,對后面的內(nèi)容很有幫助。
存儲就是存儲數(shù)據(jù)、信息。涉及到硬盤、存儲服務(wù)器等設(shè)施;
計算就是對數(shù)據(jù)進行處理運算得到結(jié)果信息。這個就是計算機的名字由來,就是用來做計算的,CPU,GPU等等硬件也是處理數(shù)據(jù)的核心單元;
分發(fā)是將信息分發(fā)出去。這一點比起上面的內(nèi)容稍微需要多說一下,分發(fā)網(wǎng)絡(luò)也叫CDN(Content Delivery Network)是指內(nèi)容分發(fā)網(wǎng)絡(luò),硬件涉及交換機、路由器、內(nèi)容管理系統(tǒng)等等。
如果上述內(nèi)容不好記,大家記住一個事兒就好,華為公司創(chuàng)業(yè)初期的時候做的就是交換機領(lǐng)域的生意,也就是分發(fā)領(lǐng)域;然后到通信基站、到手機,再到現(xiàn)在自主研發(fā)芯片,這就到了計算領(lǐng)域。
有了這個底層認知,我們可以看到,存儲、計算和分發(fā),都很重要,但是相對來說計算更酷,存儲更保守,分發(fā)更沒存在感。技術(shù)實現(xiàn)難度有高低,對于網(wǎng)絡(luò)的重要性是同等的。
02中心化存儲與分布式存儲
家里的筆記本電腦、臺式機目前一般1T存儲空間基本夠用,成本也不大,買一塊硬盤或者一臺電腦,最多加個移動硬盤,夠用好幾年了。但是,對于存儲大量數(shù)據(jù)的機構(gòu)來說,這已經(jīng)是巨大的開銷。
最近常有人引用一句話,叫做“時代的一?;遥涞揭粋€人頭上就是一座山”,逆向思維,每個人的一點數(shù)據(jù),匯聚起來對于機構(gòu)來說就是一座山,有人說是新時代的數(shù)據(jù)就是石油和金礦——前提是你作為機構(gòu)得能扛得住這個金山。
以美國航天局NASA為例,NASA到2025年將擁有247 PB的數(shù)據(jù)處理能力,遠遠高于目前的32PB。NASA計劃每月向AWS支付543.9萬美元,即每年6513萬美元的費用。到2025年,除6500萬美元的原有交易額外,NASA每年還得額外向AWS支付約3000萬美元的新增云服務(wù)的費用。(此項信息,百度、google搜索“NASA信息存儲量”就可以獲得相關(guān)公開信息)
搞笑的事情是,聽說NASA這樣的機構(gòu)居然也只算了存儲在亞馬遜云AWS的費用,訪問和下載費用沒有算進去。這是后話。
所以,中心化的存儲,總有一個物理上限,NASA每天數(shù)據(jù)用卡車拉著硬盤去存,已經(jīng)頂不住了。而亞馬遜云、阿里云等等公司的百萬臺級別的存儲服務(wù)器還在不段增加,即使目前是可以的,未來也有物理極限,要么刪除數(shù)據(jù)、要么找更多的硬盤更大的場地去存東西。
數(shù)據(jù)越來越多,人類不能失去記憶,但是,你能想象未來美國在一百年后,劃出來一個州的面積去放存儲服務(wù)器嗎?
怎么辦?如果存儲可以分布式,也就是說,把中心化的存儲分出來(一部分)給每個擁有電腦的個人用不完的電腦、手機空間去存儲,這個問題就可以解決。這就是為什么會有分布式存儲?以及什么是分布式存儲。
簡單理解為:東西在一個地兒存不下了,所以要找別的人,多弄幾個地兒存。去中心化后,分散到每個參與者的電腦里。
當然,網(wǎng)上可以看到很多信息,說中心化拿了我們的數(shù)據(jù),會作惡,不夠安全沒加密。很多身邊朋友的手機密碼、門禁卡、銀行卡密碼都是自己的生日或者手機號后六位,這些日常更加重要的東西,你也沒有想著來個加密算法保護一下,本質(zhì)原因是許多聲音改變了你的想法,讓你覺得中心化存數(shù)據(jù)就是不好,不安全,如果地震了怎么辦?如果火災(zāi)了怎么辦?對于大多數(shù)人來說,這些事兒吧,不會發(fā)生,如果發(fā)生了,你擔心的不應(yīng)該是自己的數(shù)據(jù),而是自己的生命以及數(shù)據(jù)中心工作人員的人身安全。本質(zhì)就是在一個地兒存成本太高了,來個共享經(jīng)濟多好。
03為什么要用區(qū)塊鏈?
上文已經(jīng)說了,現(xiàn)在中心化的存儲要分布在每個人的電腦、手機等存儲設(shè)備中,靈魂拷問來了,我為什么要給你存東西?
答案是:幫我存東西,有錢賺。
區(qū)塊鏈或者叫做公鏈項目有一個東西非常重要,就是激勵機制,簡單的說就是你對網(wǎng)絡(luò)有貢獻就會有激勵,就可以拿到幣,然后變成錢??梢运伎既绻忍貛啪W(wǎng)絡(luò)沒有了激勵機制,誰還去做礦工,礦工是維護比特幣網(wǎng)絡(luò)的重要組成部分,礦工不挖了,這個網(wǎng)絡(luò)也就不安全了。
假設(shè)現(xiàn)在礦工都不挖了,世界上還有幾臺筆記本電腦在挖比特幣,我簡單調(diào)用一些云服務(wù)器就可以攻擊你比特幣的網(wǎng)絡(luò),分布式存儲是一個道理,讓別人幫你存東西,必須有償服務(wù)。不給錢了,立即中止合作,停止存儲。
所以區(qū)塊鏈是最適合做分布式存儲的底層架構(gòu)。