近兩年,大數(shù)據(jù)被炒的火熱,甚至于將它神化。很多人認為大數(shù)據(jù)能夠預(yù)測一切,認為它無所不能。其實不然,大數(shù)據(jù)雖然有用,但它至多只是個體選擇目標(biāo)或手段時的一個輔助工具,大數(shù)據(jù)并不能解決所有問題,例如“知識”問題。
數(shù)據(jù),信息和知識三者的關(guān)系是“人們利用知識,處理數(shù)據(jù),獲得信息”,這種關(guān)系不能倒過來,也就是說,數(shù)據(jù)本身不意味著信息,也不意味著知識。大數(shù)據(jù)雖然有用,但它至多只是個體選擇目標(biāo)或手段時的一個輔助工具。
自從馬云說出“大數(shù)據(jù)將使計劃經(jīng)濟越來越大”以來,很多經(jīng)濟學(xué)家都做了批駁,指出“大數(shù)據(jù)烏托邦”的謬誤。但最近筆者發(fā)現(xiàn)還是有人不明白其中的道理。為此,筆者覺得有必要再寫一篇來澄清這個問題。這個問題之所以重要,是因為“大數(shù)據(jù)烏托邦”的觀念將可能是導(dǎo)致改革停滯甚至后退的一個因素。
我們認為,假如我們理解了數(shù)據(jù)、信息和知識這三者的區(qū)別,那么“大數(shù)據(jù)不能導(dǎo)向計劃經(jīng)濟”這一結(jié)論是很容易理解的。而且,對于很多人來說,他們確實沒有弄清楚這三者的區(qū)別,往往會把這三種混為一談。
我們把數(shù)據(jù)視為客觀的符號,是人們行為的歷史記錄,由數(shù)字或文字組成,數(shù)據(jù)可以是經(jīng)過處理的,也可以是沒有經(jīng)過處理的。相比之下,信息是主觀的,信息意味著相關(guān)主體獲得了某種認識,數(shù)據(jù)是否構(gòu)成信息,構(gòu)成什么樣的信息,都是因人而異。把一堆經(jīng)濟運行數(shù)據(jù)放在經(jīng)濟學(xué)家面前和放在醫(yī)生面前,對他們來說,這堆數(shù)據(jù)的信息蘊意是完全不同的。同樣,醫(yī)療數(shù)據(jù)對經(jīng)濟學(xué)家和醫(yī)生也意味著不同的信息,這不僅與他們專業(yè)能力的差異有關(guān),也與使用數(shù)據(jù)的目的有關(guān)。最為明顯的例子是“價格”。在“價格”這種數(shù)據(jù)面前,不同的人就會有不同的反應(yīng),有的人買進,有的人賣出。顯然,同樣的價格數(shù)據(jù)對不同人而言有不同的含義。
以上的論述表明,數(shù)據(jù)要通過個體的頭腦,經(jīng)過他的理解才能轉(zhuǎn)變成他的信息。數(shù)據(jù)變成什么樣的信息,因人而異,因地而異,也因時而異。數(shù)據(jù)轉(zhuǎn)化成什么信息,又與個體的知識有關(guān)。也就是說,在個體使用數(shù)據(jù),將數(shù)據(jù)變成“他的信息”之前,必須事先擁有某種知識。那么什么是“知識”呢?我們說,“知識”可以理解為“因果關(guān)系的邏輯”。比如市場的成交量是數(shù)據(jù),但幫助他從成交量中得出某個結(jié)論的邏輯是知識。
個體運用他認為有助于達到他目的的知識來處理數(shù)據(jù),獲得信息。由于知識必然與“他認為是否有助于達到他的目的”相關(guān),所以,知識也是主觀的。知識是被個體“調(diào)用”的,他用什么知識,不用什么知識,都與他自己的判斷相關(guān)。換句話說,知識不是由他人塞到他腦子中,然后由他人來決定他應(yīng)該使用什么知識的。概而言之,個體運用他的知識來使用數(shù)據(jù),將數(shù)據(jù)變成信息。
通過數(shù)據(jù)分析,可以獲知相關(guān)關(guān)系,但數(shù)據(jù)分析不能自動地揭示因果關(guān)系,后者是個體通過經(jīng)驗和理論方面的學(xué)習(xí)得到的。還有,因果關(guān)系作為知識,是與特定情境相關(guān)的,在不同的情境下,個體會使用不同的因果關(guān)系來達到他的目的。相關(guān)關(guān)系不會告訴個體在特定情境下他應(yīng)該使用什么樣的因果關(guān)系。換句話說,有關(guān)因果關(guān)系的知識并不是以“客觀的”方式存在于個體頭腦中的。
舉個例子,比如開水燙,不能喝,這是有關(guān)因果關(guān)系的知識。一個口渴的人,面對一杯熱的開水,他會怎么做?他可能會等一段時間,等水涼了再喝,也可以對著開水吹氣,使之快點涼。那么,個體究竟會選擇哪一種方法呢?大數(shù)據(jù)能給出答案嗎?我們說,雖然通過大數(shù)據(jù)或許能夠得知這個人喜歡喝涼開水,不喜歡喝熱開水,但無從得知他究竟會選擇哪種方法,因為這牽涉到他在那個情境下對涼開水的需求有多迫切。假如他很急迫,他或許會選擇后面這種方法,相反,假如他不急迫,那么他會選擇前者。
這種有關(guān)“他是否急迫”的知識是主觀的與個人的,也是大數(shù)據(jù)無法收集到的。比如,他突然想起醫(yī)生說的話,要多喝涼開水,這樣他就會等待更長時間,或吹更長時間。知識的主觀性和情境性使大數(shù)據(jù)無能為力,比如在這個例子中,大數(shù)據(jù)不能事先判斷出他是否會突然想起醫(yī)生的話。每個個體在特定的情境中使用他自己認為重要的因果關(guān)系去解決他們當(dāng)時的問題。所以,個體在特定情境下會遇到什么問題,或他想解決什么問題,大數(shù)據(jù)并不能給出回答。這意味著大數(shù)據(jù)永遠都只是一種解決問題的輔助手段??梢姡髷?shù)據(jù)本身不構(gòu)成“思維”,“思維”總是“人”的思維,比如某個人的思維,數(shù)據(jù)本身不會思維。
大數(shù)據(jù)不能解決“知識”問題,其原因還在于自然界的因果關(guān)系和人類社會的因果關(guān)系具有不同的性質(zhì)。我們可以通過對實驗數(shù)據(jù)的分析,獲知自然界的因果關(guān)系,但對于人類社會的因果關(guān)系,卻不能通過數(shù)據(jù)分析的方法獲得,而要通過對人和人的行為的理解才能獲得。
概而言之,數(shù)據(jù),信息和知識三者的關(guān)系是“人們利用知識,處理數(shù)據(jù),獲得信息”,這種關(guān)系不能倒過來,也就是說,數(shù)據(jù)本身不意味著信息,也不意味著知識。大數(shù)據(jù)雖然有用,但它至多只是個體選擇目標(biāo)或手段時的一個輔助工具。(作者系浙江工商大學(xué)教授)
(原標(biāo)題:大數(shù)據(jù)不能解決“知識”問題)