數(shù)據(jù),代表著人類活動的歷史紀(jì)錄,是馬云口中的“DT時代”的“石油”。數(shù)據(jù)的存儲其實(shí)有許多需求沒有被滿足,無論是存儲的時間跨度、存儲的安全性、隱私性、可訪問性速度等,都還有較大的局限性,而一種全新的數(shù)據(jù)存儲即將到來,改變當(dāng)前數(shù)據(jù)存儲問題。
數(shù)據(jù)存儲的需求
雖然現(xiàn)代社會,我們擁有了海量的磁盤空間存儲信息,但是,我們遠(yuǎn)遠(yuǎn)低估了數(shù)據(jù)存儲的需求,數(shù)據(jù)的存儲,絕不僅僅只應(yīng)該是存放了而已。有多少數(shù)據(jù),我們只是放在了那里,但是有一天它會消失。
我們應(yīng)該從更遠(yuǎn)的歷史看,從遠(yuǎn)古時代起,古人發(fā)明了文字和繪畫,即使只是將這些信息留下來,也為我們提供了非常大的考古和文化價值,而且,遠(yuǎn)古的開創(chuàng)者,發(fā)明文字的倉頡,被人們奉為神靈。我們知道了我們的文字從何而來,我們通過石刻、甲骨文、竹簡、書卷窺得了歷史的模樣,這還只是部分流傳的情況。如果沒有這些數(shù)據(jù),那么我們應(yīng)該會變成Know Nothing。
除了存儲,我們其實(shí)還有很多額外的需求:
1、儲存的時間長度,能否真正做到永久存儲
2、儲存的安全性,該數(shù)據(jù)是否能夠不丟失、且能按照意愿保護(hù)隱私安全
3、數(shù)據(jù)的可訪問性,數(shù)據(jù)能否快速訪問
在當(dāng)前的互聯(lián)網(wǎng)以上三種需求,都是數(shù)據(jù)的某個維度最大化的推理,做到絕對的永久存儲、安全、隨時快速訪問,是不可能的,而做到滿足人們需求,還是可以的。
個人數(shù)據(jù)
拿個人數(shù)據(jù)來說,我們對于數(shù)據(jù)的存儲,其實(shí)是有很多潛在需求的,但是目前,這些潛在的需求都被壓抑了,比如說:人們甚至連自己的相冊都沒有地方統(tǒng)一存儲和管理,無論是網(wǎng)盤、QQ空間還是Google的相冊,都無法做到永久保存我們珍藏的照片,這樣導(dǎo)致我們不可能在一個地方存儲所有的照片,它們會變得分散。即使有一些管理工具,也沒有辦法快速地從所有照片中找到我們想要的照片。這些照片,它們的價值,對于拍了很多照片的我們來說,可能其中的一張,價值并不大,但如果它是你最喜歡的一張,或者你想看到曾經(jīng)的生活的模樣,你卻看不到,只能任憑它在記憶中消逝,那是多么可惜。
時間不可倒流,對于偌長的時間洪流來說,你的一張照片把真實(shí)發(fā)生的一瞬間給定格住了。然而,你留不住它,總有一些被你遺失了,留下來的很只是一部分。也許對于我們來說,生存比較重要,歷史不太重要,但是我們死去的時間更久,我們可以活在歷史中。
企業(yè)數(shù)據(jù)
此外,對于企業(yè)來說,數(shù)據(jù)更是舉足輕重。但是數(shù)據(jù)的存儲,卻又痛點(diǎn)繁多。一方面,數(shù)據(jù)存儲較為散亂,有的數(shù)據(jù)是以紙面方式記載,有的數(shù)據(jù)錄入了數(shù)據(jù)庫,然而卻隨著程序的迭代更新,逐漸不兼容,老數(shù)據(jù)留在歷史的灰塵堆里。這里有兩個主要矛盾:
數(shù)據(jù)載體不一致
不同的數(shù)據(jù)格式,也給數(shù)據(jù)的管理和訪問帶來問題,公司往往沒有過多的精力做數(shù)據(jù)的遷移,也沒有精力去兼容老的數(shù)據(jù)協(xié)議,故而久而久之,往往只有現(xiàn)在正在用的軟件系統(tǒng),保留了大部分新數(shù)據(jù)。儲戶存折的錢不翼而飛,銀行丟失了用戶存款數(shù)據(jù)的新聞,每年都在發(fā)生。銀行尚且如此,更不用說,其它中小企業(yè)了。
然而歷史的洪流,裹挾了這些中小企業(yè),如果他們收集數(shù)據(jù)的能力不強(qiáng),收集的數(shù)據(jù)再不進(jìn)行有效的組織和利用,則必將被時代所淘汰。正如馬云所說,以后是一個DT(Data Technology)的時代,一切的生產(chǎn)都是圍繞數(shù)據(jù)進(jìn)行的,數(shù)據(jù)代表著用戶,數(shù)據(jù)代表著業(yè)務(wù)。有數(shù)據(jù),沒有加以利用,那么等于沒有數(shù)據(jù)。
你掌握的數(shù)據(jù)與知識的差別,就在于,知識是你自己的東西,想要用的時候,能夠隨時調(diào)取,但數(shù)據(jù),不一定。這不僅對人很重要,對于機(jī)器來說,一樣重要,因?yàn)樗鼈兏枰R。
數(shù)據(jù)存儲的發(fā)展
數(shù)據(jù)存儲,因載體和結(jié)構(gòu)不同,分為許多種類型。
按照載體劃分,從古至今有:
石刻、銅刻
甲骨文
竹簡
絲帛
紙張
紙帶
磁帶
晶體管
磁盤、光盤
硬盤、固態(tài)硬盤
基因存儲...
載體的變化,使得信息的記載變得更加自由方便,以前得費(fèi)勁去刻,現(xiàn)在鍵盤敲兩下就好了;而且存儲的容量在漸漸增大,以前寫一部《史記》得用幾個車子裝,非常難永久完整保存下來,而現(xiàn)在一個SD卡可以裝幾萬部史記;訪問的便利性也逐漸增大,以前得在檔案館里找,現(xiàn)在,聯(lián)網(wǎng)一搜就有了。
數(shù)據(jù)都是有一個結(jié)構(gòu)的,從一開始手寫的文字,延續(xù)了幾千年到現(xiàn)在,發(fā)展到有各種各樣的文件類型:
文本文字
圖片
音頻
視頻
應(yīng)用程序文件(嚴(yán)格來說,上面四種皆屬于這一種)
數(shù)據(jù)需要被正確地解析,就需要有一定的格式約定,電腦上的數(shù)據(jù)都是以二進(jìn)制的方式,按照程序規(guī)定的格式存儲。存儲下來以后,還要進(jìn)行方便的管理,數(shù)據(jù)庫的誕生,為人們存儲和組織數(shù)據(jù)提供了非常大的便利,直至現(xiàn)在,人們到處都在使用數(shù)據(jù)庫,無論是你手機(jī)App里的SQLite,還是服務(wù)器運(yùn)行的Redis、MySQL、Oracle、LevelDB、MongoDB,還是Google等企業(yè)的大型分布式數(shù)據(jù)庫。都在發(fā)揮著存儲海量信息,并讓快速查找信息的作用。數(shù)據(jù)庫的核心作用,是將這些數(shù)據(jù)文件按照一定的方式索引,讓訪問變得快速而容易。
然而,這還不夠,一個人的電腦,始終有限,一個公司的計(jì)算機(jī)系統(tǒng)存儲,始終有限。
IPFS橫空出世
諸如以上所述,如果集合全人類的存儲,相互共享,這個是可以是無限的。故而分布式存儲、點(diǎn)對點(diǎn)傳輸?shù)确绞街饾u成為未來,于是IPFS(星際文件系統(tǒng))誕生了。IPFS具有低成本、更高效、更安全、永久性、更高隱私性的優(yōu)勢,被認(rèn)為最有可能取代當(dāng)今的互聯(lián)網(wǎng)HTTP協(xié)議,成為Web3.0互聯(lián)網(wǎng)分布式存儲時代的基石。這樣的東西誕生:
存儲時間;從一段時間變成永久
存儲內(nèi)容;從一個文件變成海量數(shù)據(jù)
存儲訪問;從難以獲取變成彈指可讀