分布式存儲類項(xiàng)目,早年有Sia、storj,到2020年即將上線的Filecoin。以及因?yàn)榉植际酱鎯κ褂糜脖P挖礦,間接催生和促進(jìn)了PoC機(jī)制硬盤挖礦的一些項(xiàng)目,尤其是在2019年,比如BHD。
備注:PoC和分布式存儲是兩個(gè)概念,不過,因?yàn)槎际褂糜脖P,總是被人弄混淆。今天講的是分布式存儲
分布式存儲以及重要項(xiàng)目Filecoin風(fēng)頭一時(shí)無兩,不過很多項(xiàng)目關(guān)注者、分布式存儲愛好者、準(zhǔn)礦工更多的是關(guān)注這個(gè)項(xiàng)目本身的商業(yè)價(jià)值,就是有沒有很好的投資收益。其實(shí)對分布式存儲的現(xiàn)狀和未來缺乏一些初步的認(rèn)知。
了解一個(gè)事物的簡單方法論是:What?Why?How?是什么?為什么?怎么做?今天我們以很通俗易懂的語言來為大家講解下:
分布式存儲是什么?
為什么存儲要分布式?
01背景知識
計(jì)算機(jī)互聯(lián)網(wǎng)絡(luò)的上有三個(gè)重要的底層邏輯:存儲、計(jì)算、分發(fā)。我們簡單說一下這些概念,對后面的內(nèi)容很有幫助。
存儲就是存儲數(shù)據(jù)、信息。涉及到硬盤、存儲服務(wù)器等設(shè)施;
計(jì)算就是對數(shù)據(jù)進(jìn)行處理運(yùn)算得到結(jié)果信息。這個(gè)就是計(jì)算機(jī)的名字由來,就是用來做計(jì)算的,CPU,GPU等等硬件也是處理數(shù)據(jù)的核心單元;
分發(fā)是將信息分發(fā)出去。這一點(diǎn)比起上面的內(nèi)容稍微需要多說一下,分發(fā)網(wǎng)絡(luò)也叫CDN(Content Delivery Network)是指內(nèi)容分發(fā)網(wǎng)絡(luò),硬件涉及交換機(jī)、路由器、內(nèi)容管理系統(tǒng)等等。
如果上述內(nèi)容不好記,大家記住一個(gè)事兒就好,華為公司創(chuàng)業(yè)初期的時(shí)候做的就是交換機(jī)領(lǐng)域的生意,也就是分發(fā)領(lǐng)域;然后到通信基站、到手機(jī),再到現(xiàn)在自主研發(fā)芯片,這就到了計(jì)算領(lǐng)域。
有了這個(gè)底層認(rèn)知,我們可以看到,存儲、計(jì)算和分發(fā),都很重要,但是相對來說計(jì)算更酷,存儲更保守,分發(fā)更沒存在感。技術(shù)實(shí)現(xiàn)難度有高低,對于網(wǎng)絡(luò)的重要性是同等的。
02中心化存儲與分布式存儲
家里的筆記本電腦、臺式機(jī)目前一般1T存儲空間基本夠用,成本也不大,買一塊硬盤或者一臺電腦,最多加個(gè)移動硬盤,夠用好幾年了。但是,對于存儲大量數(shù)據(jù)的機(jī)構(gòu)來說,這已經(jīng)是巨大的開銷。
最近常有人引用一句話,叫做“時(shí)代的一粒灰,落到一個(gè)人頭上就是一座山”,逆向思維,每個(gè)人的一點(diǎn)數(shù)據(jù),匯聚起來對于機(jī)構(gòu)來說就是一座山,有人說是新時(shí)代的數(shù)據(jù)就是石油和金礦——前提是你作為機(jī)構(gòu)得能扛得住這個(gè)金山。
以美國航天局NASA為例,NASA到2025年將擁有247 PB的數(shù)據(jù)處理能力,遠(yuǎn)遠(yuǎn)高于目前的32PB。NASA計(jì)劃每月向AWS支付543.9萬美元,即每年6513萬美元的費(fèi)用。到2025年,除6500萬美元的原有交易額外,NASA每年還得額外向AWS支付約3000萬美元的新增云服務(wù)的費(fèi)用。(此項(xiàng)信息,百度、google搜索“NASA信息存儲量”就可以獲得相關(guān)公開信息)
搞笑的事情是,聽說NASA這樣的機(jī)構(gòu)居然也只算了存儲在亞馬遜云AWS的費(fèi)用,訪問和下載費(fèi)用沒有算進(jìn)去。這是后話。
所以,中心化的存儲,總有一個(gè)物理上限,NASA每天數(shù)據(jù)用卡車?yán)脖P去存,已經(jīng)頂不住了。而亞馬遜云、阿里云等等公司的百萬臺級別的存儲服務(wù)器還在不斷增加,即使目前是可以的,未來也有物理極限,要么刪除數(shù)據(jù)、要么找更多的硬盤更大的場地去存東西。
數(shù)據(jù)越來越多,人類不能失去記憶,但是,你能想象未來美國在一百年后,劃出來一個(gè)州的面積去放存儲服務(wù)器嗎?
怎么辦?如果存儲可以分布式,也就是說,把中心化的存儲分出來(一部分)給每個(gè)擁有電腦的個(gè)人用不完的電腦、手機(jī)空間去存儲,這個(gè)問題就可以解決。這就是為什么會有分布式存儲?以及什么是分布式存儲。
簡單理解為:東西在一個(gè)地兒存不下了,所以要找別的人,多弄幾個(gè)地兒存。去中心化后,分散到每個(gè)參與者的電腦里。
當(dāng)然,網(wǎng)上可以看到很多信息,說中心化拿了我們的數(shù)據(jù),會作惡,不夠安全沒加密。很多身邊朋友的手機(jī)密碼、門禁卡、銀行卡密碼都是自己的生日或者手機(jī)號后六位,這些日常更加重要的東西,你也沒有想著來個(gè)加密算法保護(hù)一下,本質(zhì)原因是許多聲音改變了你的想法,讓你覺得中心化存數(shù)據(jù)就是不好,不安全,如果地震了怎么辦?如果火災(zāi)了怎么辦?對于大多數(shù)人來說,這些事兒吧,不會發(fā)生,如果發(fā)生了,你擔(dān)心的不應(yīng)該是自己的數(shù)據(jù),而是自己的生命以及數(shù)據(jù)中心工作人員的人身安全。本質(zhì)就是在一個(gè)地兒存成本太高了,來個(gè)共享經(jīng)濟(jì)多好。
03為什么要用區(qū)塊鏈?
上文已經(jīng)說了,現(xiàn)在中心化的存儲要分布在每個(gè)人的電腦、手機(jī)等存儲設(shè)備中,靈魂拷問來了,我為什么要給你存東西?
答案是:幫我存東西,有錢賺。
區(qū)塊鏈或者叫做公鏈項(xiàng)目有一個(gè)東西非常重要,就是激勵機(jī)制,簡單的說就是你對網(wǎng)絡(luò)有貢獻(xiàn)就會有激勵,就可以拿到幣,然后變成錢??梢运伎既绻忍貛啪W(wǎng)絡(luò)沒有了激勵機(jī)制,誰還去做礦工,礦工是維護(hù)比特幣網(wǎng)絡(luò)的重要組成部分,礦工不挖了,這個(gè)網(wǎng)絡(luò)也就不安全了。
假設(shè)現(xiàn)在礦工都不挖了,世界上還有幾臺筆記本電腦在挖比特幣,我簡單調(diào)用一些云服務(wù)器就可以攻擊你比特幣的網(wǎng)絡(luò),分布式存儲是一個(gè)道理,讓別人幫你存東西,必須有償服務(wù)。不給錢了,立即中止合作,停止存儲。
所以區(qū)塊鏈?zhǔn)亲钸m合做分布式存儲的底層架構(gòu)。