大數(shù)據(jù)時(shí)代,我們每天都會(huì)產(chǎn)生大量數(shù)據(jù)。根據(jù)IBM(國(guó)際機(jī)器商業(yè)公司)記錄,人類(lèi)每天會(huì)產(chǎn)生2.5萬(wàn)億字節(jié)的數(shù)據(jù),這相當(dāng)于一堆DVD到達(dá)月球又返回來(lái)。隨著數(shù)據(jù)的不斷激增,傳統(tǒng)的存儲(chǔ)技術(shù)已經(jīng)跟不上時(shí)代發(fā)展的步伐,這時(shí)候云存儲(chǔ)技術(shù)適時(shí)應(yīng)運(yùn)而生。
相較于傳統(tǒng)的通過(guò)社交網(wǎng)絡(luò)人為的產(chǎn)生數(shù)據(jù),大數(shù)據(jù)時(shí)代的數(shù)據(jù)采集來(lái)源主要在于機(jī)器數(shù)據(jù),如傳感器數(shù)據(jù)、射頻ID以及移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)和網(wǎng)絡(luò)點(diǎn)擊等等。對(duì)于這些數(shù)據(jù)的重視和認(rèn)真比對(duì)是物聯(lián)時(shí)代的智能趨勢(shì)。
借由此也促進(jìn)了數(shù)據(jù)采集技術(shù)的革新,比如發(fā)展建設(shè)系統(tǒng)日志采集、垂直搜索、深度流檢測(cè)等諸多方面,都體現(xiàn)出了數(shù)據(jù)采集的重要性和發(fā)展方向。對(duì)于已經(jīng)采集的數(shù)據(jù)信息,大數(shù)據(jù)時(shí)代還可以利用非結(jié)構(gòu)化和半結(jié)構(gòu)化的信息特點(diǎn)來(lái)進(jìn)行數(shù)據(jù)集成操作,在已有數(shù)據(jù)基礎(chǔ)上按照邏輯對(duì)數(shù)據(jù)統(tǒng)一組織規(guī)劃。
隨著數(shù)據(jù)量不斷增大,傳統(tǒng)的存儲(chǔ)技術(shù)已經(jīng)跟不上時(shí)代發(fā)展,云存儲(chǔ)技術(shù)開(kāi)始興起并廣泛為人所熟知和使用。云存儲(chǔ)技術(shù)具有大規(guī)模化和非結(jié)構(gòu)化的特點(diǎn),利用存儲(chǔ)技術(shù),用戶可以對(duì)存儲(chǔ)內(nèi)容進(jìn)行存儲(chǔ)、訪問(wèn)、歸檔等操作。
在優(yōu)化存儲(chǔ)方式的基礎(chǔ)上可以對(duì)數(shù)據(jù)進(jìn)行分析和挖掘,數(shù)據(jù)不斷涌現(xiàn),已經(jīng)出現(xiàn)了有實(shí)時(shí)數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)、web數(shù)據(jù)和時(shí)空數(shù)據(jù)等多種數(shù)據(jù)形式,需要分析者認(rèn)真對(duì)比,加以區(qū)分,根據(jù)不同的分析方法進(jìn)行分析和挖掘,從中獲得數(shù)據(jù)內(nèi)容。
(原標(biāo)題:隨著數(shù)據(jù)量不斷增大,傳統(tǒng)的存儲(chǔ)技術(shù)已經(jīng)跟不上時(shí)代發(fā)展)