為什么數(shù)據(jù)專家很難去做大數(shù)據(jù)?

智酷科技
實際上,未來大數(shù)據(jù)的核心叫“社會化大數(shù)據(jù)”,就是把各種數(shù)據(jù)和人關(guān)聯(lián)在一起,然后再把人和人的關(guān)系搞清楚。就是因為這個理論,美國就有好多人覺得Google的價值不如Facebook。

大數(shù)據(jù)是相當(dāng)?shù)臒帷S嘘P(guān)大數(shù)據(jù)的故事也非常精彩和神奇,比如說它既能告訴你超市里嬰兒尿布和啤酒之間的關(guān)系,也能幫美國政府抓住本?拉登。著名投資人王煜全從投資和創(chuàng)業(yè)的角度給大家展現(xiàn)了大數(shù)據(jù)的另一面。

他認(rèn)為只看大數(shù)據(jù)是不夠的,實際上,未來大數(shù)據(jù)的核心叫“社會化大數(shù)據(jù)”,就是把各種數(shù)據(jù)和人關(guān)聯(lián)在一起,然后再把人和人的關(guān)系搞清楚。就是因為這個理論,美國就有好多人覺得Google的價值不如Facebook。你想啊,Google掌握的只是每個散開的點,每個人都搜索了什么,但是卻不知道電腦后面那個人是誰,也不知道這些人互相之間的關(guān)系,但Facebook就牛了,它上面積累的所有數(shù)據(jù),關(guān)系都是很清晰的。雖然數(shù)據(jù)量未必比Google大,但它的數(shù)據(jù)都是和人之間的關(guān)系,反映的也是人的互動。

美國有個專家,是大數(shù)據(jù)預(yù)測領(lǐng)域最前沿的科學(xué)家。他利用社會化數(shù)據(jù)預(yù)測電影票房啊、歌星前途啊、哪首歌會大賣啊等等這些事。最牛的是,他能對社會化數(shù)據(jù)進(jìn)行分析,然后預(yù)測股市的走向。做過股市預(yù)測的都知道,股市預(yù)測最難的其實不是個股,最難的是對趨勢的分析,對未來整個股市大趨勢和方向的判斷。通過分析,他就發(fā)現(xiàn),股市的趨勢變化和一個詞在社交網(wǎng)絡(luò)上出現(xiàn)的熱度是高度相關(guān)的,什么詞呢?就是CALM,C-A-L-M,冷靜的意思。這也就是說,股市的變動其實和經(jīng)濟(jì)形勢好壞什么的關(guān)系不大,而是和民意有很大關(guān)系。如果投資者情緒穩(wěn)定,那股市就會越來越好;如果老百姓緊張了、恐慌了,股市就容易下滑。CALM這個詞就反映了民意,它出現(xiàn)的頻率高,就代表老百姓的心情比較平靜,這個時候股市就會升。出現(xiàn)頻率下降,就說明老百姓比較焦慮,股市就會跌。所以你看,大數(shù)據(jù)的特點不在數(shù)據(jù)本身,而是數(shù)據(jù)的洞察力。

未來大數(shù)據(jù)這么有用,你說我的數(shù)學(xué)和計算機(jī)都還不錯,那我是不是可以找個和大數(shù)據(jù)相關(guān)的項目開始創(chuàng)業(yè)了呢?遺憾的是,王煜全說了,大數(shù)據(jù)領(lǐng)域并不是有了洞察力就能解決問題的,因為大數(shù)據(jù),尤其是社會化數(shù)據(jù)有天然的壁壘,這就會導(dǎo)致一個問題,那就是巧婦難為無米之炊啊。

比如說好幾年以前有個經(jīng)典案例,就是騰訊提供過這么一個服務(wù),它幫你把你的QQ好友分組。這個分組的準(zhǔn)確程度會讓你覺得可怕,你會突然發(fā)現(xiàn),騰訊幫我分出來的這一組人,就全都是我的小學(xué)同學(xué)嘛,而那一組人就都是我的初中同學(xué)嘛。為啥騰訊知道的這么詳細(xì)、這么精準(zhǔn)呢?它開了天眼嗎?當(dāng)然不是,騰訊其實只是利用了一個參數(shù),就是看你加好友的時間,通過這個判斷出來的。因為QQ是伴著我們一起成長的,十年前你在上小學(xué)的時候,好友就是那些人;到七八年前你上初中了,就新加了一批好友;到上高中了,又新加了一批。以此類推,騰訊就知道你在某一個時間段里集中新加的好友是有特殊意義的。所以這就看出來了,騰訊的社交網(wǎng)絡(luò)分析和數(shù)據(jù)分析能力稱不上有多強(qiáng),但是只要能掌握數(shù)據(jù),也能做出讓人覺得匪夷所思的事。

整個社會化數(shù)據(jù)分兩類,一類是開放的,比如Facebook,你可以自由地訪問一個你不認(rèn)識的人。另一類像微信,是封閉數(shù)據(jù),就是說你不認(rèn)識的人,他的主頁也好,信息也好,你是訪問不了的,連你和另一個人的互動聊天,對第三方來說都是加密的,別人看不到。這就意味著,除了騰訊以外,沒人能掌握這些互動數(shù)據(jù)和積累的信息。因此,大數(shù)據(jù)的門檻是非常非常高的,尤其是到了今天,十個人都已經(jīng)知道數(shù)據(jù)有很大的價值了,就相當(dāng)于說每個人都知道數(shù)據(jù)里有金子。那這時候,大多數(shù)公司就會采取相對封閉的辦法,雖然我的掘金能力還不夠強(qiáng),但是這金礦我得先占著,而且還不讓別人來采。比如說當(dāng)初中國移動,它的用戶價值巨大,它就不讓別人來給這些用戶提供服務(wù),哪怕說我現(xiàn)在的服務(wù)不好,但是我也不能允許別人隨便來搶我的金礦,就是這種心態(tài)。

但恰恰就是這種心態(tài),正阻礙著行業(yè)的發(fā)展。那些最優(yōu)秀的專家就沒有機(jī)會獲得他們需要的數(shù)據(jù)。而擁有這些數(shù)據(jù)的人和機(jī)構(gòu),就會擁兵自重。尤其最近這幾年,人工智能也發(fā)展起來了,我們要用數(shù)據(jù)訓(xùn)練人工智能,就需要行業(yè)的大數(shù)據(jù)來做訓(xùn)練集。這就又進(jìn)一步提升了數(shù)據(jù)的價值,在壟斷問題沒解決的時候,價值又增加了,所以未來數(shù)據(jù)壟斷這個問題反而會更嚴(yán)重,更凸顯。

最典型的例子就是《奇點臨近》這本書的作者庫茲韋爾,他本身在美國就是個非常成功的企業(yè)家和發(fā)明家,而且特別有錢。但是他前一段加入了Google公司,頭銜很低。他都這么有錢了,何必非得為了這么個頭銜加入一家公司呢?

實際上,他并不想加入Google,也不是為了那個頭銜或者那份薪水,他就是想利用Google的數(shù)據(jù)。他發(fā)現(xiàn),要研究人工智能,要取得突破,必須得有強(qiáng)大的數(shù)據(jù)做支持,那全世界最好的數(shù)據(jù)在哪呢?在Google那。所以他就去找Google的創(chuàng)始人去談,說我能不能利用你的數(shù)據(jù)去做人工智能???Google的創(chuàng)始人也是一個比較有情懷的人,但是情懷歸情懷,商業(yè)歸商業(yè)。Google創(chuàng)始人就說,我們非常愿意支持你的研發(fā),也愿意把數(shù)據(jù)提供給你。但是數(shù)據(jù)呢是我們公司的核心資產(chǎn),不能交給外人。所以你要是想利用Google的數(shù)據(jù),就必須得加盟Google。

類似的情況還有很多,美國有幾個很著名的研究社交網(wǎng)絡(luò)的大數(shù)據(jù)專家,都紛紛加入了Google,加入了Facebook。在人工智能領(lǐng)域和深度學(xué)習(xí)領(lǐng)域,大學(xué)教授不需要加入什么公司,就能做出很深刻的研究。但在大數(shù)據(jù)領(lǐng)域,你只是一個大學(xué)教授,根本沒機(jī)會拿到數(shù)據(jù),那還做啥研究。只有加盟Facebook,加盟Google這些掌握著大數(shù)據(jù)的企業(yè),你才有機(jī)會拿到數(shù)據(jù),才能去做更深入的研究。所以王煜全很無奈的說,這其實是一個很悲哀的現(xiàn)狀。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論