01 怎樣結(jié)構(gòu)大數(shù)據(jù)?
首先,大數(shù)據(jù)就是互聯(lián)網(wǎng)發(fā)展到現(xiàn)今階段的一種表象或特征而已,沒有必要神話它或?qū)λ3志次分?,在以云計算為代表的技術(shù)創(chuàng)新大幕的襯托下,這些原本很難收集和使用的數(shù)據(jù)開始容易被利用起來了,通過各行各業(yè)的不斷創(chuàng)新,大數(shù)據(jù)會逐步為人類創(chuàng)造更多的價值。其次,想要系統(tǒng)的認(rèn)知大數(shù)據(jù),必須要全面而細(xì)致的分解它,本文從三個層面來展開:
第一層面是理論,理論是認(rèn)知的必經(jīng)途徑,也是被廣泛認(rèn)同和傳播的基線。我會從大數(shù)據(jù)的特征定義理解行業(yè)對大數(shù)據(jù)的整體描繪和定性;從對大數(shù)據(jù)價值的探討來深入解析大數(shù)據(jù)的珍貴所在;從對大數(shù)據(jù)的現(xiàn)在和未來去洞悉大數(shù)據(jù)的發(fā)展趨勢;從大數(shù)據(jù)隱私這個特別而重要的視角審視人和數(shù)據(jù)之間的長久博弈。
第二層面是技術(shù),技術(shù)是大數(shù)據(jù)價值體現(xiàn)的手段和前進(jìn)的基石。我將分別從云計算、分布式處理技術(shù)、存儲技術(shù)和感知技術(shù)的發(fā)展來說明大數(shù)據(jù)從采集、處理、存儲到形成結(jié)果的整個過程。
第三層面是實踐,實踐是大數(shù)據(jù)的最終價值體現(xiàn)。我將分別從互聯(lián)網(wǎng)的大數(shù)據(jù),政府的大數(shù)據(jù),企業(yè)的大數(shù)據(jù)和個人的大數(shù)據(jù)四個方面來描繪大數(shù)據(jù)已經(jīng)展現(xiàn)的美好景象及即將實現(xiàn)的藍(lán)圖。
02 和大數(shù)據(jù)相關(guān)的理論
(1)特征定義
最早提出大數(shù)據(jù)時代到來的是麥肯錫:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。”
業(yè)界(IBM最早定義)將大數(shù)據(jù)的特征歸納為4個“V”(量Volume,多樣Variety,價值Value,速Velocity),或者說特點有四個層面:第一,數(shù)據(jù)體量巨大。大數(shù)據(jù)的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T);第二,數(shù)據(jù)類型繁多。比如,網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等。第三,價值密度低,商業(yè)價值高。第四,處理速度快。最后這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。
古語云:三分技術(shù),七分?jǐn)?shù)據(jù),得數(shù)據(jù)者得天下。先不論誰說的,但是這句話的正確性已經(jīng)不用去論證了。維克托·邁爾-舍恩伯格在《大數(shù)據(jù)時代》一書中舉了百般例證,都是為了說明一個道理:在大數(shù)據(jù)時代已經(jīng)到來的時候要用大數(shù)據(jù)思維去發(fā)掘大數(shù)據(jù)的潛在價值。
有人把數(shù)據(jù)比喻為蘊(yùn)藏能量的煤礦。煤炭按照性質(zhì)有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數(shù)據(jù)并不在“大”,而在于“有用”。價值含量、挖掘成本比數(shù)量更為重要。
(2)價值探討
大數(shù)據(jù)是什么?投資者眼里是金光閃閃的兩個字:資產(chǎn)。比如,F(xiàn)acebook上市時,評估機(jī)構(gòu)評定的有效資產(chǎn)中大部分都是其社交網(wǎng)站上的數(shù)據(jù)。如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
(3)從大數(shù)據(jù)的價值鏈條來分析,存在三種模式:
1- 手握大數(shù)據(jù),但是沒有利用好;比較典型的是金融機(jī)構(gòu),電信行業(yè),政府機(jī)構(gòu)等。
2- 沒有數(shù)據(jù),但是知道如何幫助有數(shù)據(jù)的人利用它;比較典型的是IT咨詢和服務(wù)企業(yè),比如,埃森哲,IBM,Oracle等。
3- 既有數(shù)據(jù),又有大數(shù)據(jù)思維;比較典型的是Google,Amazon,Mastercard等。
未來在大數(shù)據(jù)領(lǐng)域最具有價值的是兩種事物:1-擁有大數(shù)據(jù)思維的人,這種人可以將大數(shù)據(jù)的潛在價值轉(zhuǎn)化為實際利益;2-還未有被大數(shù)據(jù)觸及過的業(yè)務(wù)領(lǐng)域。這些是還未被挖掘的油井,金礦,是所謂的藍(lán)海。
03 現(xiàn)在和未來
我們先看看大數(shù)據(jù)在當(dāng)下有怎樣的杰出表現(xiàn):大數(shù)據(jù)幫助政府實現(xiàn)市場經(jīng)濟(jì)調(diào)控、公共衛(wèi)生安全防范、災(zāi)難預(yù)警、社會輿論監(jiān)督;大數(shù)據(jù)幫助城市預(yù)防犯罪,實現(xiàn)智慧交通,提升緊急應(yīng)急能力;
大數(shù)據(jù)幫助醫(yī)療機(jī)構(gòu)建立患者的疾病風(fēng)險跟蹤機(jī)制,幫助醫(yī)藥企業(yè)提升藥品的臨床使用效果,幫助艾滋病研究機(jī)構(gòu)為患者提供定制的藥物;
大數(shù)據(jù)幫助航空公司節(jié)省運營成本,幫助電信企業(yè)實現(xiàn)售后服務(wù)質(zhì)量提升,幫助保險企業(yè)識別欺詐騙保行為,幫助快遞公司監(jiān)測分析運輸車輛的故障險情以提前預(yù)警維修,幫助電力公司有效識別預(yù)警即將發(fā)生故障的設(shè)備;
大數(shù)據(jù)幫助電商公司向用戶推薦商品和服務(wù),幫助旅游網(wǎng)站為旅游者提供心儀的旅游路線,幫助二手市場的買賣雙方找到最合適的交易目標(biāo),幫助用戶找到最合適的商品購買時期、商家和最優(yōu)惠價格;
大數(shù)據(jù)幫助企業(yè)提升營銷的針對性,降低物流和庫存的成本,減少投資的風(fēng)險,以及幫助企業(yè)提升廣告投放精準(zhǔn)度;
大數(shù)據(jù)幫助娛樂行業(yè)預(yù)測歌手,歌曲,電影,電視劇的受歡迎程度,并為投資者分析評估拍一部電影需要投入多少錢才最合適,否則就有可能收不回成本;
大數(shù)據(jù)幫助社交網(wǎng)站提供更準(zhǔn)確的好友推薦,為用戶提供更精準(zhǔn)的企業(yè)招聘信息,向用戶推薦可能喜歡的游戲以及適合購買的商品。
其實,這些還遠(yuǎn)遠(yuǎn)不夠,未來大數(shù)據(jù)的身影應(yīng)該無處不在,就算無法準(zhǔn)確預(yù)測大數(shù)據(jù)終會將人類社會帶往到哪種最終形態(tài),但我相信只要發(fā)展腳步在繼續(xù),因大數(shù)據(jù)而產(chǎn)生的變革浪潮將很快淹沒地球的每一個角落。
比如,Amazon的最終期望是:“最成功的書籍推薦應(yīng)該只有一本書,就是用戶要買的下一本書。”Google也希望當(dāng)用戶在搜索時,最好的體驗是搜索結(jié)果只包含用戶所需要的內(nèi)容,而這并不需要用戶給予Google太多的提示。
而當(dāng)物聯(lián)網(wǎng)發(fā)展到達(dá)一定規(guī)模時,借助條形碼、二維碼、RFID等能夠唯一標(biāo)識產(chǎn)品,傳感器、可穿戴設(shè)備、智能感知、視頻采集、增強(qiáng)現(xiàn)實等技術(shù)可實現(xiàn)實時的信息采集和分析,這些數(shù)據(jù)能夠支撐智慧城市,智慧交通,智慧能源,智慧醫(yī)療,智慧環(huán)保的理念需要,這些都所謂的智慧將是大數(shù)據(jù)的采集數(shù)據(jù)來源和服務(wù)范圍。
未來的大數(shù)據(jù)除了將更好的解決社會問題,商業(yè)營銷問題,科學(xué)技術(shù)問題,還有一個可預(yù)見的趨勢是以人為本的大數(shù)據(jù)方針。人才是地球的主宰,大部分的數(shù)據(jù)都與人類有關(guān),要通過大數(shù)據(jù)解決人的問題。