各行各業(yè)都有自己特有的思維方式,大數(shù)據(jù)行業(yè)也不例外。面對來勢洶洶的大數(shù)據(jù)時代,我們應(yīng)該正視大數(shù)據(jù),轉(zhuǎn)變思維,培養(yǎng)一種大數(shù)據(jù)思維方式。本文將詳細為大家闡述下大數(shù)據(jù)思維的原理及具體內(nèi)容。
第一,大數(shù)據(jù)的全樣思維
“大數(shù)據(jù)”與“小數(shù)據(jù)”的根本區(qū)別在于大數(shù)據(jù)采用全樣思維方式,小數(shù)據(jù)強調(diào)抽樣。抽樣是數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)技術(shù)達不到實際要求,或成本遠超過預(yù)期的情況下的權(quán)宜之計。
隨著技術(shù)的發(fā)展,在過去不可能獲取全樣數(shù)據(jù),不可能存儲和分析全樣數(shù)據(jù)的情況都將一去不復(fù)返。大數(shù)據(jù)年代是全樣的年代,抽樣的場景將有利于小,最終消失在歷史長河中。
第二,大數(shù)據(jù)的容錯思維
在小數(shù)據(jù)年代,我們習(xí)慣了抽樣。由于抽樣從理論上講結(jié)論就是不穩(wěn)定的。一般來說,全樣的樣本數(shù)量比抽樣樣本數(shù)量的很多倍,因此抽樣的一丁點錯誤,就容易導(dǎo)致結(jié)論的“失之毫厘謬以千里”。為保證抽樣得出的結(jié)論相對靠譜,人們對抽樣的數(shù)據(jù)精益求精,容不得半點差錯。
大數(shù)據(jù)年代,因為我們采集了全樣數(shù)據(jù),而不是一部分?jǐn)?shù)據(jù),數(shù)據(jù)中的異常、紕漏、疏忽、錯誤都是數(shù)據(jù)的實際情況,我們沒有必要進行任何清晰,其結(jié)果是最接近客觀事實的。
第三,大數(shù)據(jù)的相關(guān)思維
在大數(shù)據(jù)年代,我們不追求抽樣,而追求全樣。當(dāng)全部數(shù)據(jù)都加入分析的時候,由于只要有一個反例,因果關(guān)系就不成立,因此在大數(shù)據(jù)時代,因果關(guān)系變得幾乎不可能。而另一種關(guān)系就進入大數(shù)據(jù)專家的眼里:相關(guān)關(guān)系。
比如說很多男人去超市買了啤酒后會順便買紙尿褲,但不是買啤酒就一定買紙尿褲。因此,啤酒喝紙尿褲的關(guān)系不能算因果關(guān)系,而只能是一種相關(guān)關(guān)系。同樣,女孩子裙子的長短與經(jīng)濟熱度、摩天大廈與經(jīng)濟危機的關(guān)系都是一種相關(guān)關(guān)系,不是因果關(guān)系。
(原標(biāo)題:大數(shù)據(jù)思維原理,你了解多少?)