隨著大數(shù)據(jù)時(shí)代的到來,我們生活中的方方面面也都離不開大數(shù)據(jù)的存在,那么關(guān)于大數(shù)據(jù)我們真的了解嗎?或許在很多方面我們都對大數(shù)據(jù)有一定錯(cuò)誤的認(rèn)知,今天就隨千鋒小編一起來看看關(guān)于大數(shù)據(jù)的常見無解有哪些。
數(shù)據(jù)不等于信息
經(jīng)常有人把數(shù)據(jù)和信息當(dāng)作同義詞來用。其實(shí)不然,數(shù)據(jù)指的是一個(gè)原始的數(shù)據(jù)點(diǎn)(無論是通過數(shù)字,文字,圖片還是視頻等等),信息則直接與內(nèi)容掛鉤,需要有資訊性(informative)。數(shù)據(jù)越多,不一定就能代表信息越多,更不能代表信息就會(huì)成比例增多。有個(gè)簡單的例子:
備份,很多人如今已經(jīng)會(huì)定期的對自己的硬盤進(jìn)行備份。這個(gè)沒什么好多解釋的,每次備份都會(huì)創(chuàng)造出一組新的數(shù)據(jù),但信息并沒有增多。
信息不等于智慧
現(xiàn)在我們?nèi)コ藬?shù)據(jù)中所有重復(fù)的部分,也整合了內(nèi)容類似的數(shù)據(jù),現(xiàn)在我們剩下的全是信息了,這對我們就一定有用嗎?不一定,信息要能轉(zhuǎn)化成智慧,至少要滿足一下三個(gè)標(biāo)準(zhǔn):
第一,可破譯性。這可能是個(gè)大數(shù)據(jù)時(shí)代特有的問題,越來越多的企業(yè)每天都會(huì)生產(chǎn)出大量的數(shù)據(jù),卻還沒想好怎么用,因此,他們就將這些數(shù)據(jù)暫時(shí)非結(jié)構(gòu)化的存儲(chǔ)起來。這些非結(jié)構(gòu)化的數(shù)據(jù)卻不一定可破譯。
第二,關(guān)聯(lián)性。無關(guān)的信息,至多只是噪音。
第三,新穎性。這里的新穎性很多時(shí)候無法僅僅根據(jù)我們手上的數(shù)據(jù)和信息進(jìn)行判斷。舉個(gè)例子,某電子商務(wù)公司通過一組數(shù)據(jù)/信息,分析出了客戶愿意為當(dāng)天送貨的產(chǎn)品多支付10塊錢,然后又通過另一組完全獨(dú)立的數(shù)據(jù)/信息得到了同樣的內(nèi)容,這樣的情況下,后者就不具備新穎性。不幸的是,很多時(shí)候,我們只有在處理了大量的數(shù)據(jù)和信息以后,才能判斷它們的新穎性。
其實(shí),對于大數(shù)據(jù)的問題涉及到很多層面!