互聯(lián)網(wǎng)時(shí)代,我們的一舉一動(dòng)都會(huì)產(chǎn)生大量的數(shù)據(jù)。隨著時(shí)代的不斷發(fā)展,我們已經(jīng)進(jìn)入了一個(gè)前所未有、無(wú)法回避的大數(shù)據(jù)時(shí)代。那么,大數(shù)據(jù)時(shí)代的加速到來(lái)究竟與什么因素有關(guān)系呢?
人類從數(shù)千年前就開(kāi)始分析數(shù)據(jù),古代美索不達(dá)米亞平原的記賬人員為了有效地跟蹤記錄信息發(fā)明了書(shū)寫(xiě)。
自從圣經(jīng)時(shí)代開(kāi)始,政府就通過(guò)人口普查來(lái)建立大型的國(guó)民數(shù)據(jù)庫(kù)。
兩百年以來(lái),精算師們也一直通過(guò)搜集大量的數(shù)據(jù)來(lái)進(jìn)行風(fēng)險(xiǎn)規(guī)避。
模擬時(shí)代的數(shù)據(jù)收集和分析極其耗時(shí)耗力,新問(wèn)題的出現(xiàn)通常要求我們重新收集和分析數(shù)據(jù)。
數(shù)字化的到來(lái)使得數(shù)據(jù)管理效率又向前邁出了重要的一步。數(shù)字化將模擬數(shù)據(jù)轉(zhuǎn)換成計(jì)算機(jī)可以讀取的數(shù)字?jǐn)?shù)據(jù),使得存儲(chǔ)和處理這些數(shù)據(jù)變得便宜又簡(jiǎn)單,從而大大提高了數(shù)據(jù)管理效率。
過(guò)去可能需要幾年時(shí)間才能完成的數(shù)據(jù)搜集,現(xiàn)在只要幾天就能完成。但是,光有改變還遠(yuǎn)遠(yuǎn)不夠。數(shù)據(jù)分析者太沉浸于模擬數(shù)據(jù)時(shí)代的設(shè)想,即數(shù)據(jù)庫(kù)只有單一的用途和價(jià)值,而正是我們使用的技術(shù)和方法加深了這種偏見(jiàn)。
雖然數(shù)字化是促成向大數(shù)據(jù)轉(zhuǎn)變的重要原因,但僅有計(jì)算機(jī)的存在卻不足以實(shí)現(xiàn)大數(shù)據(jù)。
我們沒(méi)有辦法準(zhǔn)確描述現(xiàn)在正在發(fā)生的一切,但是“數(shù)據(jù)化”這個(gè)概念大概可以幫助我們了解這次變革。
數(shù)據(jù)化意味著我們要從一切太陽(yáng)底下的事物中汲取信息,甚至包括很多我們以前認(rèn)為和“信息”根本搭不上邊的事情。
比方說(shuō),一個(gè)人所在的位置、引擎的振動(dòng)、橋梁的承重等。
我們要通過(guò)量化的方法把這些內(nèi)容轉(zhuǎn)化為數(shù)據(jù)。這就使得我們可以嘗試許多以前無(wú)法做到的事情,如根據(jù)引擎的散熱和振動(dòng)來(lái)預(yù)測(cè)引擎是否會(huì)出現(xiàn)故障。這樣,我們就激發(fā)出了這些數(shù)據(jù)此前未被挖掘的潛在價(jià)值。
大數(shù)據(jù)時(shí)代開(kāi)啟了一場(chǎng)尋寶游戲,而人們對(duì)數(shù)據(jù)的看法以及由因果關(guān)系向相關(guān)關(guān)系轉(zhuǎn)化時(shí)釋放出的潛在價(jià)值的態(tài)度,正是主宰這場(chǎng)游戲的關(guān)鍵。
新興技術(shù)工具的使用使這一切成為可能。寶貝不止這一件,每個(gè)數(shù)據(jù)集內(nèi)部都隱藏著某些未被發(fā)掘的價(jià)值。這場(chǎng)發(fā)掘和利用數(shù)據(jù)價(jià)值的競(jìng)賽正開(kāi)始在全球上演。
(原標(biāo)題:數(shù)字化是促成向大數(shù)據(jù)轉(zhuǎn)變的重要原因)