“大數(shù)據(jù)”這個詞,不知道從什么時候起,在我們的生活與工作中風靡。成為炙手可熱的一個行業(yè),如果你懂得大數(shù)據(jù),不少人都會向你投來好奇的目光。當你了解了大數(shù)據(jù)的一些知識,你的朋友往往會問你:“大數(shù)據(jù)是什么?”。雖然你知道他是什么,也有表達不清楚或者不能通俗的表達的尷尬。
那么,面對這樣處境時,是否有一些會急切想把大數(shù)據(jù)了解個徹徹底底,也許可以從《大數(shù)據(jù)時代》一書中得到些許啟發(fā)。
一、思維變革
1.MORE更多:不是隨機樣本,而是全體數(shù)據(jù)
①小數(shù)據(jù)時代的隨機采樣:穿孔卡片、美國的人口普查
②全數(shù)據(jù)模式,樣本=總體:Xoom與跨境匯款異常交易報警、日本“相撲”運動非法操縱比賽結果、巴西巴拉與第一次全社會層面的網(wǎng)絡分析
2.MESSY不是精確性,而是混雜性
①允許不精確:微軟與語料庫數(shù)據(jù)添加、IBM Candidate計算機翻譯項目
②更有效的大數(shù)據(jù)簡單算法:無所不包的谷歌翻譯系統(tǒng)
③紛繁的數(shù)據(jù)越多越好:英國石油公司與無感感應器、麻省理工與通貨緊縮預測軟件
④混雜性是標準途徑:Flickr由用戶隨意貼標簽分類照片、Facebook的“喜歡”按鈕和谷歌的Gmail在數(shù)據(jù)變大時只顯示近似值
⑤新數(shù)據(jù)庫設計的誕生:Hadoop與VISA的十三分鐘
3.CORRELATION:不是因果關系,而是相關關系
①林登與亞馬遜推薦系統(tǒng)
②關聯(lián)物、預測的關鍵:沃爾瑪,請把蛋撻與颶風一篇擺在一起;FICO,“我們知道你明天會做什么”
③美國零售商塔吉特與懷孕預測
④UPS與汽車修理預測
⑤大數(shù)據(jù)預測早產兒病情
二、商業(yè)變革
1.DATAFICATION數(shù)據(jù)化:一切皆可“量化”
①莫里的導航圖,大數(shù)據(jù)的最早實踐之一
②從最不可能的地方提取數(shù)據(jù):日本先進工業(yè)技術研究所的坐姿研究與汽車防盜系統(tǒng)
③數(shù)據(jù)化,不是數(shù)字化
④量化一切,數(shù)據(jù)化的核心
⑤當數(shù)字變成數(shù)據(jù):谷歌的數(shù)字圖書館
⑥當方位變成數(shù)據(jù):多效地定位與GPS的最佳行車路徑;Foursquare,讓用戶在地方“check in”
⑦讓手機數(shù)據(jù)預測疾病傳播和城市繁榮
⑧當溝通變成數(shù)據(jù):新浪微博對沖基金公司,用微博數(shù)據(jù)預測股市投資時機;微博關聯(lián)與疫苗接種
⑨世間萬物數(shù)據(jù)化:睡眠活動數(shù)據(jù)庫和睡眠測試;GPS感應器,判斷環(huán)境因素對哮喘病的影響
2.VALU價值:“取之不盡,用之不竭”的數(shù)據(jù)創(chuàng)新
①ReCaptcha與數(shù)據(jù)再利用
②數(shù)據(jù)的潛在價值:IBM,電動汽車動力與電力供應系統(tǒng)的優(yōu)化預測
③數(shù)據(jù)創(chuàng)新:數(shù)據(jù)再利用、重組數(shù)據(jù)、可擴展數(shù)據(jù)、數(shù)據(jù)的折舊值、數(shù)據(jù)廢氣、開放數(shù)據(jù)
④數(shù)據(jù)估值:Facebook,從66億到1040億;DataMarket與InfoChimps,提供免費與付費數(shù)據(jù)
3.ROLE角色定位:數(shù)據(jù)、技術與思維的三足鼎立
①Decide.com與產品價格預測
②大數(shù)據(jù)價值的三大構成:三種公司,基于數(shù)據(jù)且為大數(shù)據(jù)掌控的公司,基于近且為大數(shù)據(jù)技術公司,基于思維且為大數(shù)據(jù)思維公司;個人;谷歌與亞馬遜三種皆倍的
③全新的數(shù)據(jù)中間商
④專家的消亡與數(shù)據(jù)科學家的崛起
⑤大數(shù)據(jù)決定數(shù)據(jù)競爭力
三、管理變革
1.RISKS風險:讓數(shù)據(jù)主宰一切的隱憂
①無處不在的“第三只眼”
②我們的隱私被二次利用了
③預測與懲罰,不是因為“所做”,而是因為“將做”
④數(shù)據(jù)獨裁
⑤掙脫大數(shù)據(jù)的困境
2.CONTROL掌控:責任與自由并舉的信息管理
①一場管理規(guī)范的變革
②管理變革:個人隱私保護、個人動因VS預測分析、大數(shù)據(jù)算法師的崛起、反數(shù)據(jù)壟斷大亨
四、結語
正在發(fā)生的未來,價值非凡;凡是過去的,皆為序曲。大數(shù)據(jù)時代,是一個名副其實的“信息社會”,數(shù)據(jù)的來源在哪里?是人的本身。
大數(shù)據(jù)并不是一個充斥著算法和機器的冰冷世界,人類的作用依然是機器無法完全取代的。大數(shù)據(jù)為我們提供幫助是暫時的,更好的方法和答案,應該在不遠的將來。