本文是近年來不同行業(yè)、不同領(lǐng)域的大數(shù)據(jù)公司的一些經(jīng)典案例總結(jié)。盡管有些已經(jīng)是幾年前的案例,但其中的深層邏輯對于未來仍有啟發(fā)。
本文力圖從企業(yè)運營和管理的角度,梳理出發(fā)掘大數(shù)據(jù)價值的一般規(guī)律:一是以數(shù)據(jù)驅(qū)動的決策,主要通過提高預(yù)測概率,來提高決策成功率;二是以數(shù)據(jù)驅(qū)動的流程,主要是形成營銷閉環(huán)戰(zhàn)略,提高銷售漏斗的轉(zhuǎn)化率;三是以數(shù)據(jù)驅(qū)動的產(chǎn)品,在產(chǎn)品設(shè)計階段,強調(diào)個性化;在產(chǎn)品運營階段,則強調(diào)迭代式創(chuàng)新。
下面就是這些天然大數(shù)據(jù)公司的挖掘價值的典型案例。
1. 亞馬遜的“信息公司”
如果全球哪家公司從大數(shù)據(jù)發(fā)掘出了最大價值,截至目前,答案可能非亞馬遜莫屬。亞馬遜也要處理海量數(shù)據(jù),這些交易數(shù)據(jù)的直接價值更大。
作為一家“信息公司”,亞馬遜不僅從每個用戶的購買行為中獲得信息,還將每個用戶在其網(wǎng)站上的所有行為都記錄下來:頁面停留時間、用戶是否查看評論、每個搜索的關(guān)鍵詞、瀏覽的商品等等。這種對數(shù)據(jù)價值的高度敏感和重視,以及強大的挖掘能力,使得亞馬遜早已遠遠超出了它的傳統(tǒng)運營方式。
亞馬遜CTO Werner Vogels在CeBIT上關(guān)于大數(shù)據(jù)的演講,向與會者描述了亞馬遜在大數(shù)據(jù)時代的商業(yè)藍圖。長期以來,亞馬遜一直通過大數(shù)據(jù)分析,嘗試定位客戶和和獲取客戶反饋。
“在此過程中,你會發(fā)現(xiàn)數(shù)據(jù)越大,結(jié)果越好。為什么有的企業(yè)在商業(yè)上不斷犯錯?那是因為他們沒有足夠的數(shù)據(jù)對運營和決策提供支持,”Vogels說,“一旦進入大數(shù)據(jù)的世界,企業(yè)的手中將握有無限可能。”從支撐新興技術(shù)企業(yè)的基礎(chǔ)設(shè)施到消費內(nèi)容的移動設(shè)備,亞馬遜的觸角已觸及到更為廣闊的領(lǐng)域。
亞馬遜推薦:亞馬遜的各個業(yè)務(wù)環(huán)節(jié)都離不開“數(shù)據(jù)驅(qū)動”的身影。在亞馬遜上買過東西的朋友可能對它的推薦功能都很熟悉,“買過X商品的人,也同時買過Y商品”的推薦功能看上去很簡單,卻非常有效,同時這些精準(zhǔn)推薦結(jié)果的得出過程也非常復(fù)雜。
亞馬遜預(yù)測:用戶需求預(yù)測是通過歷史數(shù)據(jù)來預(yù)測用戶未來的需求。對于書、手機、家電這些東西——亞馬遜內(nèi)部叫硬需求的產(chǎn)品,你可以認為是“標(biāo)品”——預(yù)測是比較準(zhǔn)的,甚至可以預(yù)測到相關(guān)產(chǎn)品屬性的需求。但是對于服裝這樣軟需求產(chǎn)品,亞馬遜干了十多年都沒有辦法預(yù)測得很好,因為這類東西受到的干擾因素太多了,比如:用戶的對顏色款式的喜好,穿上去合不合身,愛人朋友喜不喜歡…… 這類東西太易變,買得人多反而會賣不好,所以需要更為復(fù)雜的預(yù)測模型。
亞馬遜測試:你會認為亞馬遜網(wǎng)站上的某段頁面文字只是碰巧出現(xiàn)的嗎?其實,亞馬遜會在網(wǎng)站上持續(xù)不斷地測試新的設(shè)計方案,從而找出轉(zhuǎn)化率最高的方案。整個網(wǎng)站的布局、字體大小、顏色、按鈕以及其他所有的設(shè)計,其實都是在多次審慎測試后的最優(yōu)結(jié)果。
亞馬遜記錄:亞馬遜的移動應(yīng)用讓用戶有一個流暢的無處不在的體驗的同時,也通過收集手機上的數(shù)據(jù)深入地了解了每個用戶的喜好信息;更值得一提的是Kindle Fire,內(nèi)嵌的Silk瀏覽器可以將用戶的行為數(shù)據(jù)一一記錄下來。
以數(shù)據(jù)為導(dǎo)向的方法并不僅限于以上領(lǐng)域,亞馬遜的企業(yè)文化就是冷冰冰的數(shù)據(jù)導(dǎo)向型文化。對于亞馬遜來說,大數(shù)據(jù)意味著大銷售量。數(shù)據(jù)顯示出什么是有效的、什么是無效的,新的商業(yè)投資項目必須要有數(shù)據(jù)的支撐。對數(shù)據(jù)的長期專注讓亞馬遜能夠以更低的售價提供更好的服務(wù)。
2. 谷歌的意圖
如果說有一家科技公司準(zhǔn)確定義了“大數(shù)據(jù)”概念的話,那一定是谷歌。根據(jù)搜索研究公司comScore的數(shù)據(jù),僅2012年3月一個月的時間,谷歌處理的搜索詞條數(shù)量就高達122億條。谷歌的體量和規(guī)模,使它擁有比其他大多數(shù)企業(yè)更多的應(yīng)用大數(shù)據(jù)的途徑。
谷歌搜索引擎本身的設(shè)計,就旨在讓它能夠無縫鏈接成千上萬的服務(wù)器。如果出現(xiàn)更多的處理或存儲需要,抑或某臺服務(wù)器崩潰,谷歌的工程師們只要再添加更多的服務(wù)器就能輕松搞定。將所有這些數(shù)據(jù)集合在一起所帶來的結(jié)果是:企業(yè)不僅從最好的技術(shù)中獲益,同樣還可以從最好的信息中獲益。下面選擇谷歌公司的其中三個亮點。
谷歌意圖:谷歌不僅存儲了搜索結(jié)果中出現(xiàn)的網(wǎng)絡(luò)連接,還會儲存用戶搜索關(guān)鍵詞的行為,它能夠精準(zhǔn)地記錄下人們進行搜索行為的時間、內(nèi)容和方式,坐擁人們在谷歌網(wǎng)站進行搜索及經(jīng)過其網(wǎng)絡(luò)時所產(chǎn)生的大量機器數(shù)據(jù)。這些數(shù)據(jù)能夠讓谷歌優(yōu)化廣告排序,并將搜索流量轉(zhuǎn)化為盈利模式。谷歌不僅能追蹤人們的搜索行為,而且還能夠預(yù)測出搜索者下一步將要做什么。用戶所輸入的每一個搜索請求,都會讓谷歌知道他在尋找什么,所有人類行為都會在互聯(lián)網(wǎng)上留下痕跡路徑,谷歌占領(lǐng)了一個絕佳的點位來捕捉和分析該路徑。換言之,谷歌能在你意識到自己要找什么之前預(yù)測出你的意圖。這種抓取、存儲并對海量人機數(shù)據(jù)進行分析,然后據(jù)此進行預(yù)測的能力,就是數(shù)據(jù)驅(qū)動的產(chǎn)品。
谷歌分析:谷歌在搜索之外還有更多獲取數(shù)據(jù)的途徑。企業(yè)安裝“谷歌分析”之類的產(chǎn)品來追蹤訪問者在其站點的足跡,而谷歌也可獲得這些數(shù)據(jù)。網(wǎng)站還使用“谷歌廣告聯(lián)盟”,將來自谷歌廣告客戶網(wǎng)的廣告展示在其站點,因此,谷歌不僅可以洞察自己網(wǎng)站上廣告的展示效果,同樣還可以對其他廣告發(fā)布站點的展示效果一覽無余。
谷歌趨勢:既然搜索本身是網(wǎng)民的“意圖數(shù)據(jù)庫”,當(dāng)然可以根據(jù)某一專題搜索量的漲跌,預(yù)測下一步的走勢。谷歌趨勢可以預(yù)測旅游、地產(chǎn)、汽車的銷售。此類預(yù)測最著名的就是谷歌流感趨勢,跟蹤全球范圍的流感等病疫傳播,依據(jù)網(wǎng)民搜索,分析全球范圍內(nèi)流感等病疫的傳播狀況。
3. eBay的分析平臺
早在2006年,eBay就成立了大數(shù)據(jù)分析平臺。為了準(zhǔn)確分析用戶的購物行為,eBay定義了超過500種類型的數(shù)據(jù),對顧客的行為進行跟蹤分析。eBay分析平臺高級總監(jiān)Oliver Ratzesberger說:“在這個平臺上,可以將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)結(jié)合在一起,通過分析促進eBay的業(yè)務(wù)創(chuàng)新和利潤增長。”
eBay行為分析:在早期,eBay網(wǎng)頁上的每一個功能的更改,通常由對該功能非常了解的產(chǎn)品經(jīng)理決定,判斷的依據(jù)主要是產(chǎn)品經(jīng)理的個人經(jīng)驗。而通過對用戶行為數(shù)據(jù)的分析,網(wǎng)頁上任何功能的修改都交由用戶去決定。“每當(dāng)有一個不錯的創(chuàng)意或者點子,我們都會在網(wǎng)站上選定一定范圍的用戶進行測試。通過對這些用戶的行為分析,來看這個創(chuàng)意是否帶來了預(yù)期的效果。”
eBay廣告分析:更顯著的變化反映在廣告費上。eBay對互聯(lián)網(wǎng)廣告的投入一直很大,通過購買一些網(wǎng)頁搜索的關(guān)鍵字,將潛在客戶引入eBay網(wǎng)站。
4. 塔吉特的“數(shù)據(jù)關(guān)聯(lián)挖掘”
利用先進的統(tǒng)計方法,商家可以通過用戶的購買歷史記錄分析來建立模型,預(yù)測未來的購買行為,進而設(shè)計促銷活動和個性服務(wù)避免用戶流失到其他競爭對手那邊。
美國第三大零售商塔吉特,通過分析所有女性客戶購買記錄,可以“猜出”哪些是孕婦。其發(fā)現(xiàn)女性客戶會在懷孕四個月左右,大量購買無香味乳液。由此挖掘出25項與懷孕高度相關(guān)的商品,制作“懷孕預(yù)測”指數(shù)。推算出預(yù)產(chǎn)期后,就能搶先一步,將孕婦裝、嬰兒床等折扣券寄給客戶。
塔吉特還創(chuàng)建了一套購買女性行為在懷孕期間產(chǎn)生變化的模型,不僅如此,如果用戶從它們的店鋪中購買了嬰兒用品,它們在接下來的幾年中會根據(jù)嬰兒的生長周期定期給這些顧客推送相關(guān)產(chǎn)品,使這些客戶形成長期的忠誠度。
5. 中國移動的數(shù)據(jù)化運營
通過大數(shù)據(jù)分析,中國移動能夠?qū)ζ髽I(yè)運營的全業(yè)務(wù)進行針對性的監(jiān)控、預(yù)警、跟蹤。大數(shù)據(jù)系統(tǒng)可以在第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責(zé)人,使他在最短時間內(nèi)獲知市場行情。
客戶流失預(yù)警:一個客戶使用最新款的諾基亞手機,每月準(zhǔn)時繳費、平均一年致電客服3次,使用WEP和彩信業(yè)務(wù)。如果按照傳統(tǒng)的數(shù)據(jù)分析,可能這是一位客戶滿意度非常高、流失概率非常低的客戶。事實上,當(dāng)搜集了包括微博、社交網(wǎng)絡(luò)等新型來源的客戶數(shù)據(jù)之后,這位客戶的真實情況可能是這樣的:客戶在國外購買的這款手機,手機中的部分功能在國內(nèi)無法使用,在某個固定地點手機經(jīng)常斷線,彩信無法使用——他的使用體驗極差,正在面臨流失風(fēng)險。這就是中國移動一個大數(shù)據(jù)分析的應(yīng)用場景。通過全面獲取業(yè)務(wù)信息,可能顛覆常規(guī)分析思路下做出的結(jié)論,打破傳統(tǒng)數(shù)據(jù)源的邊界,注重社交媒體等新型數(shù)據(jù)來源,通過各種渠道獲取盡可能多的客戶反饋信息,并從這些數(shù)據(jù)中挖掘更多的價值。
數(shù)據(jù)增值應(yīng)用:對運營商來說,數(shù)據(jù)分析在政府服務(wù)市場上前景巨大。運營商也可以在交通、應(yīng)對突發(fā)災(zāi)害、維穩(wěn)等工作中使大數(shù)據(jù)技術(shù)發(fā)揮更大的作用。運營商處在一個數(shù)據(jù)交換中心的地位,在掌握用戶行為方面具有先天的優(yōu)勢。作為信息技術(shù)的又一次變革,大數(shù)據(jù)的出現(xiàn)正在給技術(shù)進步和社會發(fā)展帶來全新的方向,而誰掌握了這一方向,誰就可能成功。對于運營商來說,在數(shù)據(jù)處理分析上,需要轉(zhuǎn)型的不僅是技巧和法律問題,更需要轉(zhuǎn)變思維方式,以商業(yè)化角度思考大數(shù)據(jù)營銷。
6. Twitter中的興趣和情緒
Twitter興趣聚類:通過過濾用戶歸屬地、發(fā)推位置和相關(guān)關(guān)鍵詞,Twitter建立了一系列定制化的客戶數(shù)據(jù)流。比如,通過過濾電影片名、位置和情緒標(biāo)簽,你可以知道洛杉磯、紐約和倫敦等城市最受歡迎的電影是哪些。而根據(jù)用戶發(fā)布的個人行為描述,你甚至能搜索到那些在加拿大滑雪的日本游客。從這個視角看,Twitter的興趣圖譜的效率優(yōu)于Facebook的社交圖譜。Twitter的用戶數(shù)據(jù)所能產(chǎn)生的潛在價值同樣令人驚嘆。在社交媒體網(wǎng)站正在收集越來越多的數(shù)據(jù)的形勢下,它們或許能找到更好的方式來利用這些數(shù)據(jù)盈利,并使其取代廣告成為自身提高收入的主要方式。這些社交網(wǎng)站真正的價值可能在于數(shù)據(jù)本身。相信在不久的將來,如果尋找到既能充分利用用戶數(shù)據(jù),又可合理規(guī)避對用戶隱私的威脅,社交數(shù)據(jù)所蘊藏的巨大能量將會徹底被開啟。
Twitter情緒分析:Twitter自己并不經(jīng)營每一款數(shù)據(jù)產(chǎn)品,但它把數(shù)據(jù)授權(quán)給了像DataSift這樣的數(shù)據(jù)服務(wù)公司,很多公司利用Twitter社交數(shù)據(jù),做出了各種讓人吃驚的應(yīng)用,從社交監(jiān)測到醫(yī)療應(yīng)用,甚至可以去追蹤流感疫情爆發(fā),社交媒體監(jiān)測平臺DataSift還創(chuàng)造了一款金融數(shù)據(jù)產(chǎn)品。華爾街“德溫特資本市場”公司首席執(zhí)行官保羅·霍廷每天的工作之一,就是利用電腦程序分析全球3.4億微博賬戶的留言,進而判斷民眾情緒,再以“1”到“50”進行打分。根據(jù)打分結(jié)果,霍廷再決定如何處理手中數(shù)以百萬美元計的股票?;敉⒌呐袛嘣瓌t很簡單:如果所有人似乎都高興,那就買入;如果大家的焦慮情緒上升,那就拋售。一些媒體公司會把觀眾收視率數(shù)據(jù)打包到產(chǎn)品里,再轉(zhuǎn)賣給頻道制作人和內(nèi)容創(chuàng)造者。
精確的數(shù)據(jù)一旦與社交媒體數(shù)據(jù)相結(jié)合,對未來的預(yù)測會非常準(zhǔn)。
7. 特易購的精準(zhǔn)定向
聰明的商家通過用戶的購買歷史記錄分析來建立模型,為他們量身預(yù)測未來的購物清單,進而設(shè)計促銷活動和個性服務(wù),讓他們源源不斷地為之買單。
特易購是全球利潤第二大的零售商,這家英國超級市場巨人從用戶行為分析中獲得了巨大的利益。從其會員卡的用戶購買記錄中,特易購可以了解一個用戶是什么“類別”的客人,如速食者、單身、有上學(xué)孩子的家庭等等。
這樣的分類可以為提供很大的市場回報,比如,通過郵件或信件寄給用戶的促銷可以變得十分個性化,店內(nèi)的促銷也可以根據(jù)周圍人群的喜好、消費的時段來更加有針對性,從而提高貨品的流通。這樣的做法為特易購獲得了豐厚的回報,僅在市場宣傳一項,就能幫助特易購每年節(jié)省3.5億英鎊的費用。
Tesco的優(yōu)惠券:特易購每季會為顧客量身定做6張優(yōu)惠券。其中4張是客戶經(jīng)常購買的貨品,而另外2張則是根據(jù)該客戶以往的消費行為數(shù)據(jù)分析,極有可能在未來會購買的產(chǎn)品。僅在1999年,特易購就送出了14.5萬份面向不同的細分客戶群的購物指南雜志和優(yōu)惠券組合。更妙的是,這樣的低價無損公司整體的盈利水平。通過追蹤這些短期優(yōu)惠券的回籠率,了解到客戶在所有門店的消費情況,特易購還可以精確地計算出投資回報。發(fā)放優(yōu)惠券吸引顧客其實已經(jīng)是很老套的做法了,而且許多的促銷活動實際只是來掠奪公司未來的銷售額。然而,依賴于扎實的數(shù)據(jù)分析來定向發(fā)放優(yōu)惠券的特易購,卻可以維持每年超過1億英鎊的銷售額增長。
特易購?fù)瑯佑袝T數(shù)據(jù)庫,通過已有的數(shù)據(jù),就能找到那些對價格敏感的客戶,然后在公司可以接受的最低成本水平上,為這類顧客傾向購買的商品確定一個最低價。這樣的好處一是吸引了這部分顧客,二是不必在其他商品上浪費錢降價促銷。
特易購的精準(zhǔn)運營:這家連鎖超市在其數(shù)據(jù)倉庫中收集了700萬部冰箱的數(shù)據(jù)。通過對這些數(shù)據(jù)的分析,進行更全面的監(jiān)控并進行主動的維修以降低整體能耗。
8. Facebook的好友推薦
Facebook是社交網(wǎng)絡(luò)巨擎,但是在挖掘大數(shù)據(jù)價值方面,好像辦法不多,值得一提的就是好友推薦。
Facebook使用大數(shù)據(jù)來追蹤用戶在其網(wǎng)絡(luò)的行為,通過識別你在它的網(wǎng)絡(luò)中的好友,從而給出新的好友推薦建議,用戶擁有越多的好友,他們與Facebook之間的黏度就越高。更多的好友意味著用戶會分享更多照片、發(fā)布更多狀態(tài)更新、玩更多的游戲。
9. LinkedIn的獵頭價值
LinkedIn網(wǎng)站使用大數(shù)據(jù)在求職者和招聘職位之間建立關(guān)聯(lián)。有了LinkedIn,獵頭們再也不用向潛在的受聘者打陌生電話來碰運氣,而可以通過簡單的搜索找出潛在受聘者并聯(lián)系他們。
與此相似,求職者也可以通過聯(lián)系網(wǎng)站上其他人,自然而然地將自己推銷給潛在的雇主。有兩個例子能夠生動呈現(xiàn)LinkedIn的數(shù)據(jù)價值:幾年前,LinkedIn忽然發(fā)現(xiàn)近期雷曼兄弟的來訪者多了起來,當(dāng)時并沒引起重視,過了不久,雷曼兄弟宣布倒閉;而在谷歌宣布退出中國的前一個月,在LinkedIn發(fā)現(xiàn)了一些平時很少見的谷歌產(chǎn)品經(jīng)理在線,這也是相同的道理。
10. 沃爾瑪?shù)臄?shù)據(jù)基因
早在1969年沃爾瑪就開始使用計算機來跟蹤存貨,1974年就將其分銷中心與各家商場運用計算機進行庫存控制。1983年,沃爾瑪所有門店都開始采用條形碼掃描系統(tǒng)。
1987年,沃爾瑪完成了公司內(nèi)部的衛(wèi)星系統(tǒng)的安裝,該系統(tǒng)使得總部,分銷中心和各個商場之間可以實現(xiàn)實時,雙向的數(shù)據(jù)和聲音傳輸。采用這些在當(dāng)時還是小眾和超前的信息技術(shù)來搜集運營數(shù)據(jù)為沃爾瑪最近20年的崛起打下了堅實的地基,從而發(fā)現(xiàn)了“啤酒與尿布”關(guān)聯(lián)。
如今,沃爾瑪擁有著全世界最大的數(shù)據(jù)倉庫,在數(shù)據(jù)倉庫中存儲著沃爾瑪數(shù)千家連鎖店在65周內(nèi)每一筆銷售的詳細記錄,這使得業(yè)務(wù)人員可以通過分析購買行為更加了解他們的客戶。
通過這些數(shù)據(jù),業(yè)務(wù)員可以分析顧客的購買行為,從而供應(yīng)最佳的銷售服務(wù)。沃爾瑪一直致力于改善自身的數(shù)據(jù)收集技術(shù),從條形碼掃描,到安裝衛(wèi)星系統(tǒng)實現(xiàn)雙向數(shù)據(jù)傳輸,整個公司都充滿了數(shù)據(jù)基因。
2012年4月,沃爾瑪又收購了一家研究網(wǎng)絡(luò)社交基因的公司Kosmix,在數(shù)據(jù)基因的基礎(chǔ)上,又增加了社交基因。
11. 阿里小貸和聚石塔
雖然阿里系的余額寶如日中天,但其實阿里小貸才真正體現(xiàn)出了大數(shù)據(jù)的價值。早在2010年阿里就已經(jīng)建立了“淘寶小貸”,通過對貸款客戶下游訂單、上游供應(yīng)商、經(jīng)營信用等全方位的評估,就可以在沒有見面情況下,給客戶放款,這當(dāng)然是對阿里平臺上大數(shù)據(jù)的挖掘。
數(shù)據(jù)來源于“聚石塔”——一個大型的數(shù)據(jù)分享平臺,它通過共享阿里巴巴旗下各個子公司的數(shù)據(jù)資源來創(chuàng)造商業(yè)價值。這款產(chǎn)品就是大數(shù)據(jù)團隊把淘寶交易流程各個環(huán)節(jié)的數(shù)據(jù)整合互聯(lián),然后基于商業(yè)理解對信息進行分類儲存和分析加工,并與決策行為連接起來所產(chǎn)生的效果。
12. 西爾斯的數(shù)據(jù)大集成
在過去,美國零售巨頭西爾斯控股公司,需要八周時間才能制定出個性化的銷售方案,但往往做出來的時候,它已不再是最佳方案。
痛定思痛,決定整合其專售的三個品牌——Sears、Craftsman、Lands'End的客戶、產(chǎn)品以及銷售數(shù)據(jù),使用群集收集來自不同品牌的數(shù)據(jù),并在群集上直接分析數(shù)據(jù),而不是像以前那樣先存入數(shù)據(jù)倉庫,避免了浪費時間——先把來自各處的數(shù)據(jù)合并之后再做分析。
這種調(diào)整讓公司的推銷方案更快、更精準(zhǔn),可以從海量信息中挖掘價值,但是價值巨大,困難也巨大:這些數(shù)據(jù)需要超大規(guī)模分析,且分散在不同品牌的數(shù)據(jù)庫與數(shù)據(jù)倉庫中,不僅數(shù)量龐大而且支離破碎。
西爾斯的困境,在傳統(tǒng)企業(yè)中非常普遍,這些企業(yè)家一直想不通,既然互聯(lián)網(wǎng)零售商亞馬遜可以推薦閱讀書目、推薦電影、推薦可供購買的產(chǎn)品,為什么他們所在的企業(yè)卻做不到類似的事情。
西爾斯公司首席技術(shù)官菲里·謝利(Phil Shelley)說:如果要制定一系列復(fù)雜推薦方案質(zhì)量更高,需要更及時、更細致、更個性化的數(shù)據(jù),傳統(tǒng)企業(yè)的IT架構(gòu)根本不能完成這些任務(wù),需要痛下決心,才能完成轉(zhuǎn)型。
13. PredPol的犯罪預(yù)測
PredPol公司通過與洛杉磯和圣克魯斯的警方以及一群研究人員合作,基于地震預(yù)測算法的變體和犯罪數(shù)據(jù)來預(yù)測犯罪發(fā)生的幾率,可以精確到500平方英尺的范圍內(nèi)。在洛杉磯運用該算法的地區(qū),盜竊罪和暴力犯罪分布下降了33%和21%。
14. Tipp24 AG的賭徒行為預(yù)測
Tipp24 AG針對歐洲博彩業(yè)構(gòu)建的下注和預(yù)測平臺。該公司用KXEN軟件來分析數(shù)十億計的交易以及客戶的特性,然后通過預(yù)測模型對特定用戶進行動態(tài)的營銷活動。這項舉措減少了90%的預(yù)測模型構(gòu)建時間。SAP公司正在試圖收購KXEN,“SAP想通過這次收購來扭轉(zhuǎn)其長久以來在預(yù)測分析方面的劣勢”。
15. Inrix的堵車預(yù)言
交通的參與者多種多樣,是大數(shù)據(jù)最能發(fā)揮價值的領(lǐng)域。交通流量數(shù)據(jù)公司Inrix依靠分析歷史和實時路況數(shù)據(jù),能給出及時的路況報告,以幫助司機避開正在堵車的路段,并且?guī)退麄兲崆耙?guī)劃好行程。汽車制造商、移動應(yīng)用開發(fā)者、運輸企業(yè)以及各類互聯(lián)網(wǎng)企業(yè)都需要Inrix的路況報告。奧迪、福特、日產(chǎn)、微軟等巨頭都是Inrix的客戶。
16. 潘吉瓦的時尚預(yù)測
消費者追尋意見領(lǐng)袖的生活方式。潘吉瓦公司就是用數(shù)據(jù)分析來預(yù)測流行趨勢,以此為基礎(chǔ)甚至撬動全球貿(mào)易。比如,它們通過41次追蹤《暮光之城》的徽章、襪子的運輸情況,分析在這部電影中主角的服飾對流行趨勢有多大影響率,并將分析結(jié)果告知用戶,建議他們對自己的行動做出恰當(dāng)?shù)恼{(diào)整。
17. 潘多拉的音樂推薦
美國在線音樂網(wǎng)站潘多拉特別聘請一些音樂專家,讓他們每個人平均花上20分鐘去分析一首歌曲,并賦予每首歌400種不同的屬性。如果你表示喜歡一首歌,程序會自動尋找跟這首歌“基因”相同的歌曲,猜測你也會喜歡并采用推薦引擎技術(shù)推薦給你。借助這種人海戰(zhàn)術(shù),潘多拉網(wǎng)站已經(jīng)分析了74萬首歌曲。
18. Futrix Health的醫(yī)療方案
Futrix Health是一家專注于用通過數(shù)據(jù)為患者制定醫(yī)療解決方案的公司,從安裝在智能手機上的個人健康應(yīng)用,到診所、醫(yī)院里醫(yī)生使用的電子健康記錄儀,甚至是革命性的數(shù)字化基因組數(shù)據(jù),均連接到后端數(shù)據(jù)倉庫上。從而為患者制定最佳的醫(yī)院選擇、醫(yī)藥選擇。
該如何將采集到醫(yī)療保健機構(gòu)的大量操作信息,分析患者情況或治療效果,實施任何高效率的措施,使之更具有意義——大數(shù)據(jù)時代提供的機會,不再是簡單地收集這些數(shù)據(jù),而是如何運用數(shù)據(jù)來更好地認知這個世界。
19. Retention Science的用戶粘性
在零售領(lǐng)域,創(chuàng)業(yè)公司Retention Science發(fā)布了一個為電子商務(wù)企業(yè)提供增強用戶粘性的數(shù)據(jù)分析及市場策略設(shè)計的平臺,它的用戶建模引擎具備自學(xué)習(xí)功能,通過使用算法和統(tǒng)計模型來設(shè)計優(yōu)化用戶粘性的策略。
平臺的用戶數(shù)據(jù)分析都是實時進行,以確保用戶行為預(yù)測總是符合實際用戶行為更新;同時,動態(tài)的根據(jù)這些行為預(yù)測來設(shè)計一些促銷策略。RS目前已獲得Baroda Ventures, Mohr Davidow Ventures, Double M Partners及一些著名天使投資人130萬美金的投資。
20. 眾瀛的婚嫁后推薦
江蘇眾瀛聯(lián)合數(shù)據(jù)科技有限公司構(gòu)建了這樣一個大數(shù)據(jù)平臺——將準(zhǔn)備結(jié)婚的新人作為目標(biāo)消費者,并把與結(jié)婚購物相關(guān)的商家加入其中。
一對新人到薇薇新娘婚紗影樓拍了婚紗照,在實名登記了自己的信息后會被上傳到大數(shù)據(jù)平臺上。大數(shù)據(jù)平臺能根據(jù)新人在婚紗影樓的消費情況和偏好風(fēng)格,大致分析判斷出新人后續(xù)消費需求,即時發(fā)送獎勵和促銷短信。
比如邀請他們到紅星美凱龍購買家具、到紅豆家紡選購床上用品、到國美電器選購家用電器、到希爾頓酒店擺酒席……如果新人在紅星美凱龍購買了中式家具,說明他們偏好中國傳統(tǒng)文化,就推薦他們購買紅豆家紡的中式家居用品。
21. Takadu的數(shù)字馴水
水,向來是個不好管理的東西:自來水公司發(fā)現(xiàn)某個水壓計出現(xiàn)問題,可能需要花上很長的時間排查共用一個水壓計的若干水管。等找到的時侯,大量的水已經(jīng)被浪費了。以色列一家名為Takadu的水系統(tǒng)預(yù)警服務(wù)公司解決了這個問題。
Takadu把埋在地下的自來水管道水壓計、用水量和天氣等檢測數(shù)據(jù)搜集起來,通過亞馬遜的云服務(wù)傳回Takadu公司的電腦進行算法分析,如果發(fā)現(xiàn)城市某處地下自來水管道出現(xiàn)爆水管、滲水以及水壓不足等異常狀況,就會用大約10分鐘完成分析生成一份報告,發(fā)回給這片自來水管道的維修部門。
報告中,除了提供異常狀況類型以及水管的損壞狀況——每秒漏出多少立方米的水,還能相對精確地標(biāo)出問題水管具體在哪里。檢測每千米“水路”,Takadu的月收費是1萬美元。
22. 百合網(wǎng)的婚戀匹配
電商行業(yè)的現(xiàn)金收入源自數(shù)據(jù),而婚戀網(wǎng)站的商業(yè)模型更是根植于對數(shù)據(jù)的研究。比如,作為一家婚戀網(wǎng)站,百合網(wǎng)不僅需要經(jīng)常做一些研究報告,分析注冊用戶的年齡、地域、學(xué)歷、經(jīng)濟收入等數(shù)據(jù),即便是每名注冊用戶小小的頭像照片,這背后也大有挖掘的價值。
百合網(wǎng)研究規(guī)劃部李琦曾經(jīng)對百合網(wǎng)上海量注冊用戶的頭像信息進行分析,發(fā)現(xiàn)那些受歡迎頭像照片不僅與照片主人的長相有關(guān),同時照片上人物的表情、臉部比例、清晰度等因素也在很大程度上決定了照片主人受歡迎的程度。
例如,對于女性會員,微笑的表情、直視前方的眼神和淡淡的妝容能增加自己受歡迎的概率,而那些臉部比例占照片1/2、穿著正式、眼神直視沒有多余pose的男性則更可能成為婚戀網(wǎng)站上的寵兒。
23. Prismatic的新聞外衣
Prismatic是一款個性化新聞應(yīng)用,只有4名創(chuàng)始員工,憑借互聯(lián)網(wǎng)數(shù)據(jù)爬蟲和社交網(wǎng)絡(luò)開發(fā)平臺的數(shù)據(jù),依托亞馬遜的云計算平臺,實現(xiàn)了大數(shù)據(jù)的精益創(chuàng)業(yè)。
Prismatic不提供統(tǒng)一的設(shè)計精良的新聞訂閱或推薦界面,而是根據(jù)分析用戶的Facebook 或Twitter資料,為用戶做一對一的數(shù)據(jù)分析和推薦。
從盈利模式來看,Prismatic不是依靠廣告費生存下來,也不是傳統(tǒng)的新聞媒介,而是一個披著新聞應(yīng)用外衣的電子商務(wù)公司。名義上為了給用戶個性化推薦新聞而得到用戶的個人信息進行數(shù)據(jù)分析,針對性的推出推薦商品,從而從電子商務(wù)中盈利。
24. Opower的對比激勵
人類都有和同類對比的天性,例如,一家政府機構(gòu)收集不同地點從事同類工作的多組員工的數(shù)據(jù),僅僅將這些信息公諸于眾就促使落后員工提高了績效。
在能源行業(yè),Opower使用數(shù)據(jù)對比來提高消費用電的能效,并取得了顯著的成功。作為一家SaaS的創(chuàng)新公司,Opower與多家電力公司合作,分析美國家庭用電費用并將之與周圍的鄰居用電情況進行對比,被服務(wù)的家庭每個月都會受到一份對比的報告,顯示自家用電在整個區(qū)域或全美類似家庭所處水平,以鼓勵節(jié)約用電。
Opower的服務(wù)以覆蓋了美國幾百萬戶居民家庭,預(yù)計將為美國消費用電每年節(jié)省5億美元。Opower報告信封,看上去像賬單,它們使用行為技術(shù)輕輕地說服公用事業(yè)客戶降低消耗。
Opower已經(jīng)推出了它的大數(shù)據(jù)平臺 Opower4 ,通過分析各種智能電表和用電行為,電力公司等公用事業(yè)單位成為Opower的盈利來源。而對一般用戶而言,Opower完全是免費的。
25. Chango和Uniqlick的點擊消費
使用新的數(shù)據(jù)技術(shù),諸如美國的Chango公司和中國的Uniqlick公司正在數(shù)字廣告行業(yè)中探索新的商業(yè)模式——實時競拍數(shù)字廣告。
通過了解互聯(lián)網(wǎng)用戶在網(wǎng)絡(luò)的搜索、瀏覽等行為,這些公司可以為廣告主提供最有可能對其商品感興趣的用戶群,從而進行精準(zhǔn)營銷;更長期的趨勢是,將廣告投放給最有可能購買的用戶群。
這樣的做法對于廣告主來說,可以獲得更高的轉(zhuǎn)換率,而對于發(fā)布廣告的網(wǎng)站來說,也提高了廣告位的價值。
26. 眾趣的行為辯析
眾趣是國內(nèi)第一家社交媒體數(shù)據(jù)管理平臺,目前國內(nèi)主要的社交開放平臺在用戶數(shù)據(jù)的開放性方面仍比較保守,身為第三方數(shù)據(jù)分析公司,能夠獲得的用戶數(shù)據(jù)還十分有限,要使用這些用戶數(shù)據(jù)需獲得用戶許可。
眾趣通過運營統(tǒng)計學(xué)等相關(guān)數(shù)據(jù)分析原理對用戶數(shù)據(jù)進行過濾,最終完成的是對一個用戶的行為、動作等個體特征的描述。這些描述可以幫助品牌營銷者了解消費者的消費習(xí)慣及需求;也可以幫助企業(yè)的領(lǐng)導(dǎo)增強對自己員工的了解。除了對個體以及群體行為特征的描述外,這些數(shù)據(jù)分析結(jié)果還可用于對用戶群體的行為預(yù)測,從而為營銷者提供一些前瞻性的市場分析。
眾趣數(shù)據(jù)分析的結(jié)果只能精準(zhǔn)到群組而無法達到個人。此類的用戶數(shù)據(jù)研究除在市場營銷領(lǐng)域具有一定的參考價之外,目前大多還主要用于配合一些小調(diào)研。此外,這些數(shù)據(jù)還可以實現(xiàn)對用戶甚至企業(yè)機構(gòu)的信用評級,在金融領(lǐng)域也有一定程度的使用。
27. 拖拉網(wǎng)的明天猜想
導(dǎo)購電商的拖拉網(wǎng)制作了“明天穿什么”這一應(yīng)用。在這個應(yīng)用當(dāng)中,眾多時裝圈權(quán)威人士輸送時裝搭配與風(fēng)格單品,由用戶任意打分,根據(jù)用戶的打分偏好,拖拉網(wǎng)便能猜到明天她們想穿什么,然后為她在數(shù)十萬件網(wǎng)購時裝中推薦單品,并且實現(xiàn)直通購買下單。在獲取客戶數(shù)據(jù)后,后臺分析也是各顯神通。
拖拉網(wǎng)加入了更多變量來考核自己的推薦模式。比如有消費者明天要參加一個聚會,不知道要穿什么風(fēng)格,也沒有看天氣預(yù)報,希望導(dǎo)購網(wǎng)站能幫她把這些場景和自己的信息組合起來,給出一整套的解決方案。
于是日期、地域、場合、風(fēng)格,這些都成為穿衣搭配解決方案的變量,經(jīng)過不斷的組合呈現(xiàn)給用戶,據(jù)拖拉網(wǎng)數(shù)據(jù),用戶在看到一個比較優(yōu)質(zhì)的搭配,并有場景性引導(dǎo)的時候,點擊到最后頁面完成購買的轉(zhuǎn)化率會比單品推薦高40%。
28. SeeChange的基因健康
現(xiàn)在人們有了把人類基因檔案序列化的能力,這允許醫(yī)生和科學(xué)家去預(yù)測病人對于某些疾病的易感染性和其他不利的條件,可以減少治療過程的時間和花費。
位于舊金山的SeeChange公司創(chuàng)建了一套新的健康保險模式。該公司通過分析客戶的個人健康記錄、醫(yī)療報銷記錄、以及藥店的數(shù)據(jù),來判斷該客戶對于慢性病的易感性,并判斷該客戶是否有可能從一些定制的康復(fù)套餐中獲利。
SeeChange同時設(shè)計健康計劃,并設(shè)立獎勵機制鼓勵客戶主動完成健康行動,全過程都通過其數(shù)據(jù)分析引擎來監(jiān)控。
29. Given Imaging的圖像診斷
以色列的Given Imaging公司發(fā)明了一種膠囊,內(nèi)置攝像頭,患者服用后膠囊能以大約每秒14張照片的頻率拍攝消化道內(nèi)的情況,并同時傳回外置的圖像接收器,患者病征通過配套的軟件被錄入數(shù)據(jù)庫,在4至6小時內(nèi)膠囊相機將通過人體排泄離開體外。
一般來說,醫(yī)生都是在靠自己的個人經(jīng)驗進行病征判斷,難免會對一些疑似陰影拿捏不準(zhǔn)甚至延誤病人治療。現(xiàn)在通過Given Imaging的數(shù)據(jù)庫,當(dāng)醫(yī)生發(fā)現(xiàn)一個可疑的腫瘤時,雙擊當(dāng)前圖像后,過去其他醫(yī)生拍攝過的類似圖像和他們的診斷結(jié)果都會悉數(shù)被提取出來。
可以說,一個病人的問題不再是一個醫(yī)生在看,而是成千上萬個醫(yī)生在同時給出意見,并由來自大量其他病人的圖像給出佐證。這樣的數(shù)據(jù)對比,不但提高了醫(yī)生診斷的效率,還提升了準(zhǔn)確度。
30. Entelo的“前獵頭”
真正的技術(shù)人才永遠是各大公司的搶手貨,絕對不要坐等他們向你投簡歷,因為在他們還沒有機會寫簡歷之前很可能已經(jīng)被其他公司搶走了。Entelo公司能替企業(yè)家們推薦那些才剛剛萌發(fā)跳槽動機的高級技術(shù)人才,以便先下手為強。
Entelo的數(shù)據(jù)庫里目前有3億份簡歷。而如何判斷高級人才的跳槽傾向,Entelo有一套正在申請專利的算法。這套算法有70多個指標(biāo)用于判定跳槽傾向。某公司的股價下跌、高層大換血、剛被另一大公司收購,這些都會被Entelo看作是導(dǎo)致該公司人才跳槽的可能性因素。
于是Entelo就會立刻把該公司里的高級人才的信息推送給訂閱了自己服務(wù)的企業(yè)家們。企業(yè)家們收到的簡歷跟一般的簡歷還不一樣。Entelo抓取了這些人才在各大社交網(wǎng)絡(luò)的信息。這樣企業(yè)家們可以了解該人提交過哪些代碼,在網(wǎng)上都回答了些什么樣的問題,在Twitter上都發(fā)表的是些什么樣的信息。
總之,這些準(zhǔn)備“挖角”的企業(yè)家能夠看到一個活生生的目標(biāo)人才站在面前。
31. FlightCaster和Passur的延誤預(yù)測
航空業(yè)分秒必爭,尤其是航班抵達的準(zhǔn)確時間。如果一班飛機提前到達,地勤人員還沒準(zhǔn)備好,乘客和乘務(wù)員就會被困在飛機上白白耽誤時間;如果一班飛機延誤,地勤人員就只能坐著干等,白白消耗成本。
美國一家大航空公司從其內(nèi)部報告中發(fā)現(xiàn),大約10%的航班的實際到達時間與預(yù)計到達時間相差10分鐘以上,30%的航班相差5分鐘以上。FlightCaster是一家提供航班延誤信息預(yù)測的公司,主要根據(jù)航空公司的航班運行情況進行預(yù)測。
與航空公司所擁有的類似航班運行情況的專有信息一樣,該公司擁有大量國內(nèi)航班飛行和航班實時運行狀況的歷史數(shù)據(jù)。Flightcaster的秘訣就是其對大數(shù)據(jù)分析的有效利用和使用適當(dāng)?shù)能浖ぞ邔Ξa(chǎn)出數(shù)據(jù)進行實時管理。
Passur Aerospace是專門為航空業(yè)提供決策支持的技術(shù)公司。通過搜集天氣、航班日程表等公開數(shù)據(jù),結(jié)合自己獨立收集的其他影響航班因素的非公開數(shù)據(jù),綜合預(yù)測航班到港時間。時至2012年,Passur公司已經(jīng)擁有超過155處雷達接收站,每4.6秒就收集一次雷達上每架飛機的一系列信息,這會持續(xù)地帶來海量數(shù)據(jù)。
不僅如此,經(jīng)過長期的數(shù)據(jù)收集,Passur擁有了一個超過十年的巨大的多維信息載體,為透徹的分析和恰當(dāng)?shù)臄?shù)據(jù)模型提供了可能。Passur公司相信,航空公司依據(jù)它們提供的航班到達時間做計劃,能為每個機場每年節(jié)省數(shù)百萬美元。
32. Climate的農(nóng)業(yè)保險
一家名為氣候公司的創(chuàng)業(yè)企業(yè)每天都會對美國境內(nèi)超過100萬個地點、未來兩年的天氣情況進行超過1萬次模擬,其數(shù)據(jù)量龐大、動態(tài)、實時。隨后,該公司將根系結(jié)構(gòu)和土壤孔隙度的相關(guān)數(shù)據(jù),與模擬結(jié)果相結(jié)合,為成千上萬的農(nóng)民提供農(nóng)作物保險。
通過遙感獲取土壤數(shù)據(jù),這和我們過去所熟悉的通過網(wǎng)絡(luò)服務(wù)獲取用戶網(wǎng)絡(luò)行為數(shù)據(jù)不是一回事,數(shù)據(jù)的概念得以極大的擴充。要想對每塊田地提供精準(zhǔn)的保險服務(wù),肯定還需要與土地數(shù)據(jù)相配套的農(nóng)產(chǎn)品期貨、氣候預(yù)測、國際貿(mào)易、國際政治和軍事安全、國民經(jīng)濟,產(chǎn)業(yè)競爭等等各方面的數(shù)。
在如此龐雜的大數(shù)據(jù)基礎(chǔ)上推出的商業(yè)模式是創(chuàng)新的,同現(xiàn)有農(nóng)作物保險方式相比具備極大競爭力,并且是可持續(xù)和規(guī)?;?。更妙的是,這家公司基于大數(shù)據(jù)的運營,完全沒有進行高額的網(wǎng)絡(luò)設(shè)施投資,只是租用了亞馬遜的公共云服務(wù),一個月幾萬美元而已。
33. Hiptype的記錄閱讀
幾乎所有的收費電子書都會提供部分章節(jié)讓讀者試讀,其實,出版商需要弄清楚人們讀到了哪里、讀完后有沒有購買,以及其他各種體驗,才能賣出更多的電子書。
美國創(chuàng)業(yè)公司Hiptype開發(fā)了一套電子書閱讀分析工具,其商業(yè)模式就在試圖解決這一難題。Hiptype自稱為“面向電子書的Google Analytics”,能夠提供與電子書有關(guān)的豐富數(shù)據(jù)。它不僅能統(tǒng)計電子書的試讀和購買次數(shù),還能繪制出“讀者圖譜”,包括用戶的年齡、收入和地理位置等。
此外,它還能告訴出版商讀者在看完免費章節(jié)后是否進行了購買,有多少讀者看完了整本書,以及讀者平均看了多少頁,讀者最喜歡從哪個章節(jié)開始看,又在哪個章節(jié)半途而廢,等等。
Hiptype能夠與電子書整合在一起,出版商無論選擇哪種渠道,總是能夠獲得用戶數(shù)據(jù)。Hiptype收集的所有數(shù)據(jù)都是匿名的。用戶在下載了內(nèi)置Hiptype服務(wù)的電子書時,會得到一個提示,可以選擇將其屏蔽。
34. 安客誠的“人網(wǎng)合一”
網(wǎng)絡(luò)營銷存在一個巨大問題,如何獲知在網(wǎng)上使用幾個不同名稱的人是否是同一個人?安誠客推出了一種名為“觀眾操作系統(tǒng)”的技術(shù)方案解決了這個問題。它允許市場營銷者與你的 “數(shù)字人物”綁定,即使你由于婚姻換了名字,或者使用昵稱,或者偶爾使用中名,它也照樣能夠解答那個已經(jīng)換了地址或者電話號碼的人是否是同一個人的問題。
AOS 可以匯集不同數(shù)據(jù)庫中的信息,這些數(shù)據(jù)或離線或在線,是公司可能在不同場合針對個人而收集的。通過使用AbiliTec——一種Acxiom也擁有的數(shù)字化“身份識別”技術(shù)——AOS將客戶信息刪繁就簡,得到簡單單一的結(jié)果。AOS幫助安誠客的廣告客戶使用他們的數(shù)據(jù)在Facebook上找到廣告投放目標(biāo)用戶。
35. 數(shù)據(jù)關(guān)聯(lián)分析
某公司團隊曾經(jīng)使用來自手機的位置數(shù)據(jù),來推測美國圣誕節(jié)購物季開始那一天有多少人在梅西百貨公司的停車場停車,進而可以預(yù)測其當(dāng)天的銷售額,這遠早于梅西百貨自己統(tǒng)計出的銷售記錄。無論是華爾街的分析師或者傳統(tǒng)產(chǎn)業(yè)的高管,都會因這種敏銳的洞察力獲得極大的競爭優(yōu)勢。
對于稅務(wù)部門來說,稅務(wù)欺騙正在日益的被關(guān)注,這時大數(shù)據(jù)可以用于增加政府識別詐騙的流程。在隱私允許的地方,政府部門可以綜合各個方面的數(shù)據(jù)比如車輛的登記,海外旅游的數(shù)據(jù)來發(fā)現(xiàn)個人的花費模式,使稅務(wù)貢獻不被疊加。同時一個可疑的問題出現(xiàn)了,這并沒有直接的證據(jù)指向詐騙,這些結(jié)論并不能用來去控告?zhèn)€人。但是他可以幫助政府部門去明確他們的審計和其他的審核以及一些流程。
36. 數(shù)據(jù)廢氣
物流公司的數(shù)據(jù)原來只服務(wù)于運營需要,但一經(jīng)再利用,物流公司就華麗轉(zhuǎn)身為金融公司,數(shù)據(jù)用以評估客戶的信用,提供無抵押貸款,或者拿運送途中的貨品作為抵押提供貸款;物流公司甚至可以轉(zhuǎn)變?yōu)榻鹑谛畔⒎?wù)公司來判斷各個細分經(jīng)濟領(lǐng)域的運行和走勢。
有公司已經(jīng)在大數(shù)據(jù)中有接近“上帝俯視”的感覺,美國洛杉磯的一家企業(yè)宣稱,他們將全球夜景的歷史數(shù)據(jù)建立模型,在過濾掉波動之后,做出了投資房地產(chǎn)和消費的研究報告。
麥當(dāng)勞則通過外送服務(wù),在售賣漢堡的同時獲得了用戶的精準(zhǔn)地址,這些地址數(shù)據(jù)匯集之后,就變成了一份絕妙的房地產(chǎn)業(yè)的內(nèi)部數(shù)據(jù)。
37. 黑暗數(shù)據(jù)
在特定情況下,黑暗數(shù)據(jù)可以用作其他用途。Infinity Property & Casualty公司用累積的理賠師報告來分析欺詐案例,通過算法挽回了1200萬美元的代位追償金額。一家電氣銷售公司,通過積累10年ERP銷售數(shù)據(jù)分析,按照電氣設(shè)備的生命周期,給5年前的老客戶逐一拜訪,獲得了1000萬元以上電氣設(shè)備維修訂單,順利地進入MRO市場。
38. 客戶流失分析
美國運通以前只能實現(xiàn)事后諸葛亮式的報告和滯后的預(yù)測,傳統(tǒng)的BI已經(jīng)無法滿足其業(yè)務(wù)發(fā)展的需要。
于是,AmEx開始構(gòu)建真正能夠預(yù)測客戶忠誠度的模型,基于歷史交易數(shù)據(jù),用115個變量來進行分析預(yù)測。該公司表示,對于澳大利亞將于之后4個月中流失的客戶,已經(jīng)能夠識別出其中的24%。這樣的客戶流失分析,當(dāng)然可以用于挽留客戶。
酒店業(yè)可以為消費者定制相應(yīng)的獨特的個性房間,甚至可以在墻紙上放上消費者的微博的旅游心情等等。旅游業(yè)可以根據(jù)大數(shù)據(jù)為消費者提供其可能會喜好的本地特色產(chǎn)品、活動、小而美的小眾景點等等來挽回游客的心。
39. 快餐業(yè)的視頻分析
快餐業(yè)的公司可以通過視頻分析等候隊列的長度,然后自動變化電子菜單顯示的內(nèi)容。如果隊列較長,則顯示可以快速供給的食物;如果隊列較短,則顯示那些利潤較高但準(zhǔn)備時間相對長的食品。
40. 大數(shù)據(jù)競選
2012年,參與競選的奧巴馬團隊確定了三個最根本的目標(biāo):讓更多的人掏更多的錢,讓更多的選民投票給奧巴馬,讓更多的人參與進來!
這需要“微觀”層面的認知:每個選民最有可能被什么因素說服?每個選民在什么情況下最有可能掏腰包?什么樣的廣告投放渠道能夠最高效獲取目標(biāo)選民?如競選總指揮吉姆·梅西納所說,在整個競選活中,沒有數(shù)據(jù)做支撐的假設(shè)不能存在。
為了籌到10億美元的競選款,奧巴馬的數(shù)據(jù)挖掘團隊在過去兩年搜集、存儲和分析了大量數(shù)據(jù)。他們注意到,影星喬治·克魯尼對美國西海岸40歲至49歲的女性具有非常大的吸引力:她們無疑是最有可能為了在好萊塢與克魯尼和奧巴馬共進晚餐而不惜自掏腰包的一個群體??唆斈嵩谧约液勒e辦的籌款宴會上,為奧巴馬籌集到數(shù)百萬美元的競選資金。
此后,當(dāng)奧巴馬團隊決定在東海岸物色一位對于這個女性群體具有相同號召力的影星時,數(shù)據(jù)團隊發(fā)現(xiàn)莎拉·杰西卡·帕克的粉絲們也同樣喜歡競賽、小型宴會和名人。“克魯尼效應(yīng)”被成功地復(fù)制到了東海岸。
在整個的競選中,奧巴馬團隊的廣告費用花了不到3億美元,而羅姆尼團隊則花了近4億美元卻落敗,其中一個重要的原因在于,奧巴馬的數(shù)據(jù)團隊對于廣告購買的決策,是經(jīng)過縝密的數(shù)據(jù)分析之后才制定的。一項民調(diào)顯示,80%的美國選民認為奧巴馬比羅姆尼讓他們感覺更加重視自己。
結(jié)果是,奧巴馬團隊籌得的第一個1億美元中,98%來自于小于250美元的小額捐款,而羅姆尼團隊在籌得相同數(shù)額捐款的情況下,這一比例僅為31%。
41. 監(jiān)控非法改建
“私搭亂建”在哪個國家都是一件鬧心的事,而且容易引起火災(zāi)。非法在屋內(nèi)打隔斷的建筑物著火的可能性比其他建筑物高很多。紐約市每年接到2.5萬宗有關(guān)房屋住得過于擁擠的投訴,但市里只有200名處理投訴的巡視員。
市長辦公室一個分析專家小組覺得大數(shù)據(jù)可以幫助解決這一需求與資源的落差。該小組建立了一個市內(nèi)全部90萬座建筑物的數(shù)據(jù)庫,并在其中加入市里19個部門所收集到的數(shù)據(jù):欠稅扣押記錄、水電使用異常、繳費拖欠、服務(wù)切斷、救護車使用、當(dāng)?shù)胤缸锫省⑹蠡纪对V等等。
接下來,他們將這一數(shù)據(jù)庫與過去5年中按嚴(yán)重程度排列的建筑物著火記錄進行比較,希望找出相關(guān)性。果然,建筑物類型和建造年份是與火災(zāi)相關(guān)的因素。不過,一個沒怎么預(yù)料到的結(jié)果是,獲得外磚墻施工許可的建筑物與較低的嚴(yán)重火災(zāi)發(fā)生率之間存在相關(guān)性。
利用所有這些數(shù)據(jù),該小組建立了一個可以幫助他們確定哪些住房擁擠投訴需要緊急處理的系統(tǒng)。他們所記錄的建筑物的各種特征數(shù)據(jù)都不是導(dǎo)致火災(zāi)的原因,但這些數(shù)據(jù)與火災(zāi)隱患的增加或降低存在相關(guān)性。這種知識被證明是極具價值的:過去房屋巡視員出現(xiàn)場時簽發(fā)房屋騰空令的比例只有13%,在采用新辦法之后,這個比例上升到了70%。
42. 榨菜指數(shù)
負責(zé)起草《全國促進城鎮(zhèn)化健康發(fā)展規(guī)劃(2011-2020年)》(以下簡稱“城鎮(zhèn)化規(guī)劃”)的國家發(fā)改委規(guī)劃司官員需要精確知道人口的流動,怎么統(tǒng)計出這些流動人口成為難題。
榨菜,屬于低質(zhì)易耗品,收入增長對于榨菜的消費幾乎沒有影響。一般情況下,城市常住人口對于方便面和榨菜等方便食品的消費量,基本上是恒定的。銷量的變化,主要由流動人口造成。
據(jù)國家發(fā)改委官員的說法,涪陵榨菜這幾年在全國各地區(qū)銷售份額變化,能夠反映人口流動趨勢,一個被稱為“榨菜指數(shù)”的宏觀經(jīng)濟指標(biāo)就誕生了。國家發(fā)改委規(guī)劃司官員發(fā)現(xiàn),涪陵榨菜在華南地區(qū)銷售份額由2007年的49%、2008年的48%、2009年的47.58%、2010年的38.50%下滑到2011年的29.99%。
這個數(shù)據(jù)表明,華南地區(qū)人口流出速度非???。他們依據(jù)“榨菜指標(biāo)”,將全國分為人口流入?yún)^(qū)和人口流出區(qū)兩部分,針對兩個區(qū)的不同人口結(jié)構(gòu),在政策制定上將會有所不同。
43. 天氣賬單
常言道,“天有不測之風(fēng)云”,遇到過出門旅游、重要戶外路演、舉辦婚禮等重要時刻卻被糟糕的天氣弄壞心情甚至造成經(jīng)濟損失的情況嗎?
全球第一家氣象保險公司“天氣賬單”能為用戶提供各類氣候擔(dān)保??蛻舻卿?ldquo;天氣賬單”公司網(wǎng)站,然后給出在某個特定時間段里不希望遇到的溫度或雨量范圍。“天氣賬單”網(wǎng)站會在100毫秒內(nèi)查詢出客戶指定地區(qū)的天氣預(yù)報,以及美國國家氣象局記載的該地區(qū)以往30年的天氣數(shù)據(jù)。通過計算分析天氣數(shù)據(jù),網(wǎng)站會以承保人的身份給出保單的價格。這項服務(wù)不僅個人用戶需要,一些公司,比如旅行社也很樂意參與。
一家全球性飲料企業(yè)將外部合作伙伴的每日天氣預(yù)報信息集成,錄入其需求和存貨規(guī)劃流程。通過分析特定日子的溫度、降水和日照時間等3個數(shù)據(jù)點,該公司減少了在歐洲一個關(guān)鍵市場的存貨量,同時使預(yù)測準(zhǔn)確度提高了大約5%。
44. 歷史情景再現(xiàn)
微軟和以色列理工學(xué)院的研究人員已開發(fā)出一款軟件,能根據(jù)過去20年《紐約時報》的文章以及其他在線數(shù)據(jù)預(yù)測傳染病或者其他社會問題可能會于何時何地爆發(fā)。
在利用歷史數(shù)據(jù)進行測試時,該系統(tǒng)的表現(xiàn)十分驚人。例如,根據(jù)2006年對安哥拉干旱的報道,該系統(tǒng)預(yù)測安哥拉很可能發(fā)生霍亂。這是由于,通過此前發(fā)生的多起事件,該系統(tǒng)了解到在干旱出現(xiàn)的幾年后霍亂爆發(fā)的可能性將上升。
此外,該系統(tǒng)根據(jù)對2007年初非洲大型颶風(fēng)的報道,再次對安哥拉發(fā)生霍亂做出預(yù)警。而在不到一周之后,報道顯示安哥拉確實發(fā)生了霍亂。在其他測試,例如對疾病、暴力事件及傷亡人數(shù)的預(yù)測中,該系統(tǒng)的準(zhǔn)確率達到70%至90%。
該系統(tǒng)的信息來自過去22年中《紐約時報》的報道存檔,具體時間為1986年至2007年。不過,該系統(tǒng)也利用了網(wǎng)絡(luò)上的其他一些數(shù)據(jù),了解什么樣的事件會帶來特定的社會問題。這些信息來源提供了不存在于新聞文章但卻有價值的內(nèi)容,有助于確定不同事件之間的因果關(guān)系或前后關(guān)系。
例如,該系統(tǒng)能夠推斷盧旺達和安哥拉城市之間所發(fā)生事件的關(guān)系,因為這兩個國家都位于非洲,有著類似的GDP,其他一些因素也很相似。根據(jù)這種方法,該系統(tǒng)認為,在預(yù)測霍亂爆發(fā)方面,應(yīng)當(dāng)考慮國家或城市的位置,國土面積有多少是水域,人口密度和GDP是多少,以及近幾年是否發(fā)生過干旱。
負責(zé)此項研發(fā)工作的Horvitz表示,近幾十年來,世界的許多方面都發(fā)生了改變,不過人類的本性和環(huán)境的許多方面仍然未變,因此軟件可以從以往的數(shù)據(jù)中了解事情發(fā)生的模式,從而預(yù)測未來會發(fā)生什么。他表示:“對于回溯更久之前的數(shù)據(jù),我個人很感興趣。”
此類預(yù)測工具的市場正在形成。例如,一家名為RecordedFuture的創(chuàng)業(yè)公司根據(jù)網(wǎng)上的前瞻性報道和其他信息來源預(yù)測未來事件,該公司的客戶包括政府情報部門。該公司CEOChristopherAhlberg表示,利用“硬數(shù)據(jù)”來進行預(yù)測是可行的,但從原型系統(tǒng)到商用產(chǎn)品還有很長的路要走。
45. Nike+傳感鞋
耐克憑借一種名為Nike+的新產(chǎn)品變身為大數(shù)據(jù)營銷的創(chuàng)新公司。所謂Nike+,是一種以“Nike跑鞋或腕帶+傳感器”的產(chǎn)品,只要運動者穿著Nike+的跑鞋運動,iPod就可以存儲并顯示運動日期,時間、距離、熱量消耗值等數(shù)據(jù)。用戶上傳數(shù)據(jù)到耐克社區(qū),就能和同好分享討論。
耐克和Facebook達成協(xié)議,用戶上傳的跑步狀態(tài)會實時更新到賬戶里,朋友可以評論并點擊一個“鼓掌”按鈕——神奇的是,這樣你在跑步的時候便能夠在音樂中聽到朋友們的鼓掌聲。
隨著跑步者不斷上傳自己的跑步路線,耐克由此掌握了主要城市里最佳跑步路線的數(shù)據(jù)庫。有了Nike+,耐克組織的城市跑步活動效果更好。參賽者在規(guī)定時間內(nèi)將自己的跑步數(shù)據(jù)上傳,看哪個城市累積的距離長。
憑借運動者上傳的數(shù)據(jù),耐克公司已經(jīng)成功建立了全球最大的運動網(wǎng)上社區(qū),超過500萬活躍的用戶,每天不停地上傳數(shù)據(jù),耐克借此與消費者建立前所未有的牢固關(guān)系。海量的數(shù)據(jù)對于耐克了解用戶習(xí)慣、改進產(chǎn)品、精準(zhǔn)投放和精準(zhǔn)營銷又起到了不可替代的作用。
46. 沃爾沃的工業(yè)互聯(lián)網(wǎng)
在沃爾沃集團,通過在卡車產(chǎn)品中安裝傳感器和嵌入式CPU,從剎車到中央門鎖系統(tǒng)等形形色色的車輛使用信息,正源源不斷地傳輸?shù)轿譅栁旨瘓F總部。
“對這些數(shù)據(jù)進行分析,不僅可以幫助我們制造更好的汽車,還可以幫助客戶們獲取更好體驗。”沃爾沃集團CIORichStrader說。這些數(shù)據(jù)正在被用來優(yōu)化生產(chǎn)流程,以提升客戶體驗和提升安全性。
將來自不同客戶的使用數(shù)據(jù)進行分析,可以讓產(chǎn)品部門提早發(fā)現(xiàn)產(chǎn)品潛在的問題,并在這些問題發(fā)生之前提前向客戶預(yù)警。“產(chǎn)品設(shè)計方面的缺陷,此前可能需要有50萬臺銷量的時候才能暴露出來,而現(xiàn)在只需要1000臺,我們就能發(fā)現(xiàn)潛在的缺陷。”
47. McKesson的動態(tài)供應(yīng)鏈
在美國最大的醫(yī)藥貿(mào)易商McKesson公司,對大數(shù)據(jù)的應(yīng)用也已經(jīng)遠遠領(lǐng)先于大多數(shù)企業(yè),將先進的分析能力融合到每天處理200萬個訂單的供應(yīng)鏈業(yè)務(wù)中,并且監(jiān)督超過80億美元的存貨。
對于在途存貨的管理,McKesson開發(fā)了一種供應(yīng)鏈模型,它根據(jù)產(chǎn)品線、運輸費用甚至碳排放量而提供了極為準(zhǔn)確的維護成本視圖。據(jù)公司流程改造副總裁RobertGooby說,這些詳細信息使公司能夠更加真實地了解任意時間點的運營情況。
McKesson利用先進分析技術(shù)的另一個領(lǐng)域是對配送中心內(nèi)的物理存貨配置進行模擬和自動化處理。評估政策和供應(yīng)鏈變化的能力幫助公司增強了對客戶的響應(yīng)能力,同時減少了流動資金??傮w來講,McKesson的供應(yīng)鏈轉(zhuǎn)型使公司節(jié)省了超過1億美元的流動資金。
48. 紙牌屋與電影業(yè)
《紙牌屋》最大的特點在于,與以往電視劇的制作流程不同,這是一部“網(wǎng)絡(luò)劇”。簡而言之,不僅傳播渠道是互聯(lián)網(wǎng)觀看,這部劇從誕生之初就是一部根據(jù)“大數(shù)據(jù)”,即互聯(lián)網(wǎng)觀眾欣賞口味來設(shè)計的產(chǎn)品。
Netflix成功之處在于其強大的推薦系統(tǒng)Cinematch,該系統(tǒng)基于用戶視頻點播的基礎(chǔ)數(shù)據(jù)如評分、播放、快進、時間、地點、終端等,儲存在數(shù)據(jù)庫后通過數(shù)據(jù)分析,計算出用戶可能喜愛的影片,并為他提供定制化的推薦。為此他們開設(shè)了年Netflix大獎(點擊查看獲獎算法),用百萬美元懸賞,獎勵能夠?qū)⑵潆娪巴扑]算法準(zhǔn)確性提高至少10%的人。
未來的電影制作成本將大幅降低,一千粉絲足以使電影成功。還是像《技術(shù)元素》里說:“目光聚集的地方,金錢必將追隨。”
49. 點評與餐飲業(yè)
美國很多州政府在與餐飲點評網(wǎng)lep展開合作,監(jiān)督餐飲行業(yè)的衛(wèi)生情況,效果非常好。人們不再像以前那樣從窗口去看餐館里的情況,而是從手機APP里的評論!在中國的本地化O2O點評比如大眾點評、番茄點等等,消費者可以對任何商家進行評判,同時商家也可以通過這些評判來提升自己的服務(wù)能力,在環(huán)節(jié)上進行更大力度的效率優(yōu)化。
未來的餐飲行業(yè)將會由互聯(lián)網(wǎng)和社會化媒體上所產(chǎn)生和承載的數(shù)據(jù)徹底帶動起來,會有越來越多的人加入點評中,餐館優(yōu)勝劣汰的速度將會大幅加快。