大數(shù)據(jù)的混沌與無(wú)力

未來(lái)商業(yè)評(píng)論
周伯通
數(shù)據(jù)背后的人在創(chuàng)造數(shù)據(jù)的過(guò)程中,以及平臺(tái)獲取在這個(gè)過(guò)程中,我們?cè)趺茨鼙WC網(wǎng)站收集到的數(shù)據(jù)是人們實(shí)際行為和自然情緒?比如說(shuō)人有出于社交需求的偽裝。而網(wǎng)站本身則代表一定的利益方,這就很難保證數(shù)據(jù)的生產(chǎn)到獲取是中立的。

NetFlix出品的迷你劇《黑鏡》第三季節(jié)中講述過(guò)這樣的一個(gè)場(chǎng)景:

“在不遠(yuǎn)的將來(lái),我們基于和人互動(dòng)所產(chǎn)生的社交分?jǐn)?shù),會(huì)決定我們?cè)谶@個(gè)世界上的基本生活權(quán)利。劇中的成員是被抽離成一個(gè)個(gè)5分制評(píng)分的人,他們必須通過(guò)在社交網(wǎng)絡(luò)上表現(xiàn)良好,在生活中展現(xiàn)精致的一面而獲得好評(píng)。

人們的打分僅僅是基于表面的印象,為了維持5分,人不得不去做許多表面上的功夫,如假裝熱情友善,擺拍出各種“歲月靜好”的社交狀態(tài),我們看不到這些高分人士?jī)?nèi)心的陰暗和丑陋;而每一個(gè)低分者所經(jīng)歷的各種曲折,則沒(méi)有人關(guān)心,他們只因?yàn)榈头直惚皇廊诉z棄……”

數(shù)據(jù)崇拜

科幻故事往往折射人類內(nèi)心恐懼與欲望。我們對(duì)數(shù)據(jù)的恐懼來(lái)源于 “數(shù)據(jù)化”作為一種表面上的技術(shù),正在逐漸對(duì)人們的意識(shí)觀念和社會(huì)制度結(jié)構(gòu)進(jìn)行解構(gòu)”,并成為一種被廣泛接受的新范式。

互聯(lián)網(wǎng)界有個(gè)新興詞——ABC,它集合了當(dāng)下三大技術(shù)熱點(diǎn)概念的詞:人工智能AI,大數(shù)據(jù)Big Data和云計(jì)算Cloud Computing。黑鏡中的畫(huà)面便與這里的“BigData”息息相關(guān)。

從2012年開(kāi)始,大數(shù)據(jù)的概念被學(xué)界與商界輪番地提及。也標(biāo)志著人類已經(jīng)察覺(jué),自己在不經(jīng)意之間進(jìn)入了充滿革新氛圍的“大數(shù)據(jù)”時(shí)代。

相比人工智能和云計(jì)算是兩個(gè)稍微偏技術(shù)型的概念,而大數(shù)據(jù)則在更大程度上超出了技術(shù)范疇,它有著社會(huì)學(xué)的意義,也更能讓我們思考“黑鏡中所講述的場(chǎng)景會(huì)不會(huì)在”明天“來(lái)臨那一天,幻境成真?還是明天已經(jīng)來(lái)臨?”

舉個(gè)栗子:當(dāng)下數(shù)據(jù)已經(jīng)成為一種常規(guī)“貨幣”,公民們用它來(lái)支付所享受到的溝通服務(wù)和安全;平臺(tái)則通過(guò)提供服務(wù)獲取數(shù)據(jù)進(jìn)行商業(yè)變現(xiàn)。而對(duì)于這種交換,大多數(shù)人都已經(jīng)習(xí)以為常了。

事實(shí)上,近幾年商界對(duì)“大數(shù)據(jù)”的崇拜達(dá)到前所未有的高度,很多企業(yè)家、學(xué)者公開(kāi)宣稱:未來(lái)的生意都是數(shù)據(jù)生意。

數(shù)據(jù)之于商業(yè)從未如今天般重要:通過(guò)聚合、分析大量的消費(fèi)、社交數(shù)據(jù),繪制用戶肖像,并據(jù)此提供精準(zhǔn)的個(gè)性化產(chǎn)品和服務(wù)推薦,已經(jīng)成為了很多企業(yè)營(yíng)銷的新模式。

不管是在剛剛過(guò)去的雙十一中,各個(gè)電商app根據(jù)用戶的歷史瀏覽數(shù)據(jù)主推相關(guān)品牌,還是刷分,打榜,控評(píng)……這些制造“好”數(shù)據(jù)的行動(dòng)將明星推上流量神壇的行為。數(shù)據(jù)成為我們這個(gè)時(shí)代一個(gè)影響力巨大的神,它人的習(xí)慣和商業(yè)行為皆發(fā)生改變。

瓦爾·赫拉利在他的的演講中曾提到,也許有一天,人們?cè)诮Y(jié)婚之前,不再會(huì)征詢父母的或其他人意見(jiàn),而是向谷歌等企業(yè)咨詢。因?yàn)?,在它們的?shù)據(jù)庫(kù)里擁有所有人產(chǎn)生的數(shù)據(jù),通過(guò)對(duì)數(shù)據(jù)的整合、分析,可以準(zhǔn)確預(yù)測(cè)未來(lái)的婚姻狀況,并給出合適的建議。

今天,大量的創(chuàng)業(yè)者和互聯(lián)公司的領(lǐng)導(dǎo)人或號(hào)稱自己公司(業(yè)務(wù))是由數(shù)據(jù)來(lái)驅(qū)動(dòng)的。市場(chǎng)部用它,自媒體用它,公司經(jīng)營(yíng)者也在用它,數(shù)據(jù)被用來(lái)當(dāng)作證明某些結(jié)論的終極證據(jù)——但是要警惕數(shù)據(jù)崇拜,它可以起到輔助作用,作為制定決策時(shí)的參考因素之一,但不應(yīng)該由它來(lái)引領(lǐng)一個(gè)公司的策略性決定。

雖然,數(shù)據(jù)技術(shù)對(duì)人類社會(huì)的影響是革命性、顛覆性的。它使人類的創(chuàng)造性活動(dòng)達(dá)到巔峰,并能有效解決既往無(wú)法解決、也不敢想象會(huì)被解決的諸多問(wèn)題。但是 “數(shù)據(jù)技術(shù)”將一切理解為數(shù)據(jù),其中不管是人的行為產(chǎn)生的數(shù)據(jù)、還是人在獲取數(shù)據(jù)、清洗數(shù)據(jù)、利用數(shù)據(jù)中扮演的角色亦不例外??蓡?wèn)題是,人這種智慧生物并不是二進(jìn)制。這就導(dǎo)致數(shù)據(jù)技術(shù)不可避免的有一些先天性缺陷。

數(shù)據(jù)真的靠譜嘛?

數(shù)據(jù)會(huì)撒慌

克雷克里斯坦森(Clay Christensen)教授曾講過(guò)一個(gè)有關(guān)天堂旅游的笑話。“這里怎么沒(méi)有數(shù)據(jù)呢?”這位哈佛教授問(wèn)他的天堂向?qū)А?ldquo;因?yàn)閿?shù)據(jù)撒謊,”對(duì)方回答說(shuō)??死锼固股淌诮又v,所以“每當(dāng)有人說(shuō)‘把數(shù)據(jù)拿給我看’時(shí),我就會(huì)說(shuō)‘下地獄去’”。

經(jīng)營(yíng)者需要謹(jǐn)防大數(shù)據(jù)中的忽悠成分。數(shù)據(jù)的樣本很多時(shí)候會(huì)說(shuō)謊,要知道最準(zhǔn)確的數(shù)據(jù)集不僅要很大,還很廣泛。

在其新書(shū)《大數(shù)據(jù)主義》中提到,歷史上90%的數(shù)據(jù)都產(chǎn)生于過(guò)去兩年。2014年,國(guó)際數(shù)據(jù)公司推算出全世界的數(shù)據(jù)總量有即4.4萬(wàn)億兆字節(jié)。數(shù)據(jù)總量如此之大,是數(shù)碼圖片與數(shù)碼影像的興起產(chǎn)生的結(jié)果?,F(xiàn)在大家用智能設(shè)備照相變得十分簡(jiǎn)單,這樣就形成了大量的數(shù)碼圖片和影像的信息流。

圖片來(lái)源于網(wǎng)絡(luò)

樣本缺乏代表還有——幸存者偏差。我們可以用一個(gè)具體的案例來(lái)解釋:二戰(zhàn)時(shí)軍方對(duì)戰(zhàn)機(jī)損毀的原因進(jìn)行分析得出機(jī)翼受員是造成飛機(jī)損壞的最重要原因,然后展開(kāi)行動(dòng)改進(jìn)機(jī)翼以求減少飛機(jī)的損毀,但收效并不明顯,為什么?真正的原因是由于數(shù)據(jù)抽樣不正確:受損分機(jī)簡(jiǎn)單可以分為兩類,一類是受損后仍可以返航的;另一類是受損后無(wú)法返航的;而用來(lái)做統(tǒng)計(jì)的分析來(lái)自于第一類數(shù)據(jù),即能夠返航的飛機(jī),而嚴(yán)重受損無(wú)法返航的卻未被計(jì)算在內(nèi),有缺陷的數(shù)據(jù)源便是說(shuō)謊”的原因。

數(shù)據(jù)鴻溝

1995年,美國(guó)商業(yè)部電信與信息局(NTIA)發(fā)布了一份名為《被互聯(lián)網(wǎng)遺忘的角落---一項(xiàng)有關(guān)美國(guó)城鄉(xiāng)信息窮人的調(diào)查報(bào)告》,報(bào)告中提到的“數(shù)字鴻溝”這個(gè)概念。

數(shù)字鴻溝是指人們?cè)跀?shù)字化生存過(guò)程中利用媒介的機(jī)會(huì)與能力上存在的差異。社會(huì)中的某些個(gè)人或群體會(huì)因?yàn)樨毟F、數(shù)字媒體使用技能的不足等原因而無(wú)法成為數(shù)據(jù)的貢獻(xiàn)者,從“而被忽視或未被充分的代表(overlooked orunderrepresented)“。而平臺(tái)則會(huì)基于數(shù)據(jù)做出歧視性的決策,這里面最經(jīng)典案例莫過(guò)于“五環(huán)外的拼多多”。

拼多多剛出現(xiàn)的時(shí)候,被很多人笑稱五環(huán)外的APP,有人調(diào)侃“拼多多,拼得多,騙的多,假的多”。然而近三年拼多多的發(fā)展成績(jī)遠(yuǎn)超一些發(fā)展10年的電商企業(yè),令不少人大跌眼鏡。

這背后有一個(gè)重要的原因就是數(shù)字鴻溝:盡管電商已經(jīng)發(fā)展了十幾年,但是,以紅米為代表的低價(jià)智能手機(jī)普及,快速地讓三到六線用戶上了網(wǎng),農(nóng)村互聯(lián)網(wǎng)的滲透率提升。2017年,36%的農(nóng)村人口已經(jīng)成為了網(wǎng)民。這是拼多多的基本盤(pán)!

而在此之前,廣大農(nóng)村和城市遠(yuǎn)郊地區(qū)的消費(fèi)者們完全沒(méi)有經(jīng)歷過(guò)這場(chǎng)變更。他們的數(shù)據(jù)是接近空白的,創(chuàng)業(yè)者聽(tīng)不到他們的聲音,他們成了被忽視被歧視的市場(chǎng)和人群。

數(shù)據(jù)是否保持”中立“ 不變”

人們常常說(shuō)數(shù)據(jù)不會(huì)說(shuō)謊,但是數(shù)據(jù)的背后是人和平臺(tái)。就像那句俗語(yǔ) “有用的知識(shí)”本身就不是中立的,它天然就隱含了利益主體。數(shù)據(jù)背后的人在創(chuàng)造數(shù)據(jù)的過(guò)程中,以及平臺(tái)獲取在這個(gè)過(guò)程中,我們?cè)趺茨鼙WC網(wǎng)站收集到的數(shù)據(jù)是人們實(shí)際行為和自然情緒?比如說(shuō)人有出于社交需求的偽裝。而網(wǎng)站本身則代表一定的利益方,這就很難保證數(shù)據(jù)的生產(chǎn)到獲取是中立的。

比起中立,人這個(gè)變量是個(gè)更大的問(wèn)題。要知道一個(gè)統(tǒng)計(jì)數(shù)據(jù)只是在這個(gè)不停改變的大環(huán)境里的一粒塵埃。人會(huì)變,態(tài)度和行為方式會(huì)變,品味會(huì)變,經(jīng)濟(jì)形勢(shì)會(huì)變,人心、體型、彼此關(guān)系以及關(guān)注的事物都會(huì)變。根據(jù)物理學(xué)中的“觀察者效應(yīng)”理論,僅僅是“觀察”的這個(gè)行為,也可能改變被觀察的對(duì)象。

數(shù)據(jù)“中立”和變量“問(wèn)題,在金融投資領(lǐng)域的應(yīng)用尤為明顯。2011年,高盛集團(tuán)前任寬客、物理學(xué)家伊曼紐爾·德曼在《失靈:為什么看起來(lái)可靠的模型最終都會(huì)失效》一書(shū)中分析了在金融領(lǐng)域采用數(shù)學(xué)模型的危險(xiǎn)性:“在物理學(xué)研究領(lǐng)域,我們面對(duì)的是上帝,上帝制定了一條條規(guī)則之后,一般不會(huì)朝令夕改。但是在金融領(lǐng)域,我們面對(duì)的是上帝創(chuàng)造的人,他們估計(jì)金融資產(chǎn)價(jià)值的依據(jù)就是自己的直覺(jué)。”人在投資中是經(jīng)常會(huì)變化的,這是研究與人相關(guān)的學(xué)科時(shí)必須要特別注意的

反思:數(shù)據(jù)中的“大”字確實(shí)重要,但是遠(yuǎn)沒(méi)有很多人想象的那么重要。正如海洋里的水也非常多,但是我們無(wú)法直接飲用。因此,我們需要意識(shí)到,用大數(shù)據(jù)來(lái)做長(zhǎng)期的戰(zhàn)略、做全局的考慮,其中的內(nèi)生缺陷性。

到結(jié)尾,筆者更想要強(qiáng)調(diào)是數(shù)據(jù)紛繁龐雜之下,決策者任何時(shí)候都應(yīng)該提醒自己的初衷“是為了什么做的決策”,不然被一些概念繞暈,丟了本心。老子在《道德經(jīng)》里就說(shuō)過(guò):“其出彌遠(yuǎn),其知彌少”。說(shuō)的是如果不先行了解自然界運(yùn)行法則的,即使到處游蕩,到處見(jiàn)識(shí),滿目盡是人間瑣事,反而會(huì)使自己受到蒙蔽。這樣,向外探索得越遠(yuǎn),對(duì)事物真相的了解就愈少。

同樣,對(duì)于創(chuàng)業(yè)者而言,不要人云亦云,對(duì)于大數(shù)據(jù)這樣的新興技術(shù)需要回歸到他們本源中去探究,從數(shù)據(jù)樣本、數(shù)據(jù)獲取這個(gè)些基本的角度去探究,會(huì)有不一樣的看法和思考。

參考資料:

Auerbach, D. (2015). We Can’t Control WhatBig Data Knows About Us. Big Data Can’t Control It Either. [online] SlateMagazine. Available at:

《The JoylessWorld of Data-Driven Startups》

《DATA-ISM: TheRevolution Transforming Decision Making, Consumer Behavior, and AlmostEverything Else》

《數(shù)據(jù)化,數(shù)據(jù)主義和數(shù)據(jù)監(jiān)控:在科學(xué)范式和意識(shí)觀念之間的大數(shù)據(jù)》

《失靈:為什么看起來(lái)可靠的模型最終都會(huì)失效》

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論