千萬不要將“大數(shù)據(jù)”神化

千尋生活
佚名
近年來,大數(shù)據(jù)發(fā)展的如火如荼,各企業(yè)紛紛發(fā)力大數(shù)據(jù)產(chǎn)業(yè)。確實,大數(shù)據(jù)為"信息獲取"開辟了無數(shù)的通道,以往實現(xiàn)不了的如今通過大數(shù)據(jù)都可以實現(xiàn)。但“大數(shù)據(jù)”不是萬能的,伴隨著大數(shù)據(jù)的應(yīng)用...

近年來,大數(shù)據(jù)發(fā)展的如火如荼,各企業(yè)紛紛發(fā)力大數(shù)據(jù)產(chǎn)業(yè)。確實,大數(shù)據(jù)為"信息獲取"開辟了無數(shù)的通道,以往實現(xiàn)不了的如今通過大數(shù)據(jù)都可以實現(xiàn)。但“大數(shù)據(jù)”不是萬能的,伴隨著大數(shù)據(jù)的應(yīng)用,越來越多的數(shù)據(jù)被“濫用”,數(shù)據(jù)泄露事件日益凸顯,大數(shù)據(jù)安全岌岌可危。

大數(shù)據(jù)的"無所不能"

無論是傳統(tǒng)工業(yè)時代,還是大數(shù)據(jù)時代,信息是決策的基礎(chǔ):更優(yōu)的決策,需要更多、更及時的信息--大數(shù)據(jù)的價值核心,是"消除信息不對稱",即提升人或程序?qū)κ挛锏恼J(rèn)知。

因此,大數(shù)據(jù)可以做很多事情:

除了以上為企業(yè)帶來切實利益的大數(shù)據(jù)應(yīng)用,伴隨著機(jī)器學(xué)習(xí)、人工智能的發(fā)展,大數(shù)據(jù)也為我們展開了更宏偉的藍(lán)圖:

一言概之,大數(shù)據(jù)為"信息獲取"開辟了無數(shù)的通道,引領(lǐng)我們一路高歌猛進(jìn),依靠大數(shù)據(jù),我們對周圍的世界、對自身、對事物之間的關(guān)系都有了更深入的認(rèn)知,也有了以前想都不敢想的各種處理方案,讓我們"無所不能"。

但理想總是"豐滿",現(xiàn)實卻是"骨感",看上去"無所不能"的大數(shù)據(jù),本身就帶著諸多的"無能為力"。

大數(shù)據(jù)的"無能為力"

數(shù)據(jù)質(zhì)量

伴隨"多"的是"無序",伴隨"更多的信息"而來的,可能是"信息冗余"。數(shù)據(jù)質(zhì)量,是數(shù)據(jù)應(yīng)用之初與生俱來的問題。

要判斷移動設(shè)備的常駐城市,可能從數(shù)據(jù)源A得到的是北京,從數(shù)據(jù)源B得到的天津,而我們壓根兒沒有明確的標(biāo)準(zhǔn),來判斷數(shù)據(jù)源A和B到底哪個正確,因為,正是因為不知道才需要尋求外部數(shù)據(jù)源幫助!

也許你會說,找已知樣本測試就可以了。但事實上,很多數(shù)據(jù)且不說能不能找得到樣本,即便能找得到,用作標(biāo)準(zhǔn)的樣本本身有多大可信性,也是一個需要驗證的問題。

隱私與安全

伴隨著大數(shù)據(jù)的應(yīng)用,越來越多的數(shù)據(jù)被"濫用",隱私被泄漏的問題被曝光。數(shù)據(jù)應(yīng)用的程度越高,經(jīng)過的驗證和磨礪越多,準(zhǔn)確性越高,所受的監(jiān)管也就越強(qiáng),使用過程中所受限制就越多。

對于數(shù)據(jù)應(yīng)用方來說,面臨的可能是不斷的尋找數(shù)據(jù)源、驗證數(shù)據(jù)有效性、接受監(jiān)管并調(diào)整、尋找新的數(shù)據(jù)源的過程。

站在數(shù)據(jù)應(yīng)用方角度,面臨客戶隱私與數(shù)據(jù)安全,會時不時的有深深的"無力感";但站在整個社會責(zé)任的角度,數(shù)據(jù)隱私與安全則是必須要守住的底線。

邊界與壁壘

我們數(shù)據(jù)應(yīng)用中的很多設(shè)想,都建立在各方數(shù)據(jù)可無縫打通和關(guān)聯(lián)的基礎(chǔ)上,但實際數(shù)據(jù)應(yīng)用中,因為數(shù)據(jù)產(chǎn)生于不同的企業(yè)主體、有不同的處理流程和架構(gòu),"關(guān)聯(lián)"并不是"無縫"的。

如何減少大數(shù)據(jù)的"無能為力"

首先,建立數(shù)據(jù)流通標(biāo)準(zhǔn)。"標(biāo)準(zhǔn)"可以在很大程度上解決"質(zhì)量"的問題,也可以讓供需雙方更好的對話,降低數(shù)據(jù)流通的成本;

其次,劃定數(shù)據(jù)安全基線。有"基線",就有了"基線"范圍內(nèi)的自由和法律保護(hù),將"隱私與安全"作為每一個市場玩家的底線,就不會在安全加碼時束手無措倍受打擊;

再次,構(gòu)建數(shù)據(jù)流通平臺。"平臺"可以有效承載數(shù)據(jù)流通的標(biāo)準(zhǔn),同時更好的打破供需雙方的邊界壁壘,實現(xiàn)供需有效結(jié)合。

TalkingData智能數(shù)據(jù)服務(wù)商城,致力于為數(shù)據(jù)供應(yīng)方和數(shù)據(jù)需求方提供平臺,實現(xiàn)數(shù)據(jù)流通過程中的標(biāo)準(zhǔn)化交付、質(zhì)量評估、實時計量等公共能力,降低數(shù)據(jù)交易流通成本。

讓理解照進(jìn)現(xiàn)實,實現(xiàn)大數(shù)據(jù)的"無所不能",我們一直在努力。

(原標(biāo)題:大數(shù)據(jù)的"無所不能"與"無能為力")

THEEND