數(shù)據(jù)是新時(shí)代的石油,是本世紀(jì)最寶貴的資源。如今隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展與應(yīng)用,它已經(jīng)逐漸滲透至各行各業(yè),例如,制造業(yè)、醫(yī)療保健業(yè)、農(nóng)業(yè)、零售、交通、經(jīng)濟(jì)等。
1.經(jīng)濟(jì)、金融
2013年,英國華威商學(xué)院和美國波士頓大學(xué)物理系的研究發(fā)現(xiàn),用戶通過谷歌搜索的金融關(guān)鍵詞或許可以把脈金融市場(chǎng)的走向,相應(yīng)投資戰(zhàn)略收益高達(dá)326%。而此前,也有專家嘗試通過Twitter博文來預(yù)測(cè)股市波動(dòng)。從預(yù)測(cè)的原理上來看,穩(wěn)定發(fā)展的美國股市是比較適合大數(shù)據(jù)預(yù)測(cè)發(fā)揮其作用的。
對(duì)國內(nèi)而言,百度推出的中小企業(yè)景氣指數(shù)預(yù)測(cè),應(yīng)用百度海量的搜索數(shù)據(jù)來刻畫我國中小企業(yè)運(yùn)行發(fā)展的景氣狀態(tài),以期能夠及時(shí)、有效地反映中小企業(yè)運(yùn)行狀況,提高經(jīng)濟(jì)監(jiān)測(cè)的全面性和及時(shí)性。目前該功能已經(jīng)上線投入應(yīng)用。
2.市場(chǎng)物價(jià)
CPI表征已經(jīng)發(fā)生的物價(jià)浮動(dòng)情況,但統(tǒng)計(jì)局?jǐn)?shù)據(jù)并不權(quán)威。但大數(shù)據(jù)則可能幫助人們了解未來物價(jià)走向,提前預(yù)知通貨膨脹或經(jīng)濟(jì)危機(jī)。單個(gè)商品的價(jià)格預(yù)測(cè)更加容易,尤其是機(jī)票這樣的標(biāo)準(zhǔn)化產(chǎn)品,去哪兒提供的“機(jī)票日歷”就是價(jià)格預(yù)測(cè),可以告知你幾個(gè)月后機(jī)票的大概價(jià)位。商品的生產(chǎn)、渠道成本和大概毛利在充分競(jìng)爭(zhēng)的市場(chǎng)中是相對(duì)穩(wěn)定的,與價(jià)格相關(guān)的變量相對(duì)固定,商品的供需關(guān)系在電子商務(wù)平臺(tái)可實(shí)時(shí)監(jiān)控,因此價(jià)格可以預(yù)測(cè),基于預(yù)測(cè)結(jié)果可提供購買時(shí)間建議,或者指導(dǎo)商家進(jìn)行動(dòng)態(tài)價(jià)格調(diào)整和營銷活動(dòng)以利益最大化。
3.用戶行為
基于用戶搜索行為、瀏覽行為、評(píng)論歷史和個(gè)人資料等數(shù)據(jù),互聯(lián)網(wǎng)業(yè)務(wù)可以洞察消費(fèi)者的整體需求,進(jìn)而進(jìn)行針對(duì)性的產(chǎn)品生產(chǎn)、改進(jìn)和營銷。百度基于對(duì)海量大數(shù)據(jù)的智能分析,可以對(duì)使用百度產(chǎn)品的用戶進(jìn)行畫像,即通過用戶輸入的搜索詞來理解用戶的意圖,從而就能實(shí)現(xiàn)個(gè)性化的精準(zhǔn)廣告推薦提升用戶對(duì)廣告的點(diǎn)擊率和對(duì)產(chǎn)品的訂單轉(zhuǎn)化率。
此外,受益于傳感器技術(shù)和物聯(lián)網(wǎng)的發(fā)展,線下的用戶行為洞察正在醞釀。免費(fèi)商用WIFI、ibeacon技術(shù)、攝像頭影像監(jiān)控、室內(nèi)定位技術(shù)、NFC傳感器網(wǎng)絡(luò)、排隊(duì)叫號(hào)系統(tǒng),可以探知用戶線下的移動(dòng)、停留、出行規(guī)律等數(shù)據(jù),進(jìn)行精準(zhǔn)營銷或者產(chǎn)品定制。
4.能源消耗
加州電網(wǎng)系統(tǒng)運(yùn)營中心管理著加州超過80%的電網(wǎng),向3500萬用戶每年輸送2.89億兆瓦電力,電力線長(zhǎng)度超過25000英里。該中心采用了Space-Time Insight的軟件進(jìn)行智能管理,綜合分析來自包括天氣、傳感器、計(jì)量設(shè)備等各種數(shù)據(jù)源的海量數(shù)據(jù),預(yù)測(cè)各地的能源需求變化,進(jìn)行智能電能調(diào)度,平衡全網(wǎng)的電力供應(yīng)和需求,并對(duì)潛在危機(jī)做出快速響應(yīng)。中國智能電網(wǎng)業(yè)已在嘗試類似大數(shù)據(jù)預(yù)測(cè)應(yīng)用。
5.醫(yī)療疾病
大數(shù)據(jù)應(yīng)用案例之醫(yī)療行業(yè)——Seton Healthcare是采用IBM最新沃森技術(shù)醫(yī)療保健內(nèi)容分析預(yù)測(cè)的首個(gè)客戶。該技術(shù)允許企業(yè)找到大量病人相關(guān)的臨床醫(yī)療信息,通過大數(shù)據(jù)處理,更好地分析病人的信息。
在加拿大多倫多的一家醫(yī)院,針對(duì)早產(chǎn)嬰兒,每秒鐘有超過3000次的數(shù)據(jù)讀取。通過這些數(shù)據(jù)分析,醫(yī)院能夠提前知道哪些早產(chǎn)兒出現(xiàn)問題并且有針對(duì)性地采取措施,避免早產(chǎn)嬰兒夭折。
6.公路交通
大數(shù)據(jù)應(yīng)用案例之公路交通——在洛杉磯開過車的人一定都經(jīng)歷過那里噩夢(mèng)般的交通擁堵情況。目前政府在I-10和I-110州際公路上建立了一條了收費(fèi)的快速通道。政府可通過大數(shù)據(jù)引導(dǎo)駕駛?cè)藛T在該通道上的行駛情況,保證交通暢通。
施樂就是參與此次項(xiàng)目的公司,它的抗擁塞項(xiàng)目,包括用ExpressLanes、動(dòng)態(tài)定價(jià),上升的需求等等以維持某種秩序的想法。施樂公司的首席技術(shù)執(zhí)行官表示,如果司機(jī)支付給駕駛熱車道(高占用收費(fèi)系統(tǒng)),他必須保證車速每小時(shí)45英里左右。如果交通開始擁堵,私家汽車的支付價(jià)格將上升,以減少他們進(jìn)入,而將車道用于高占用率的車輛,例如公共汽車和大巴車。
7.體育行業(yè)
世界杯期間,谷歌、百度、微軟和高盛等公司都推出了比賽結(jié)果預(yù)測(cè)平臺(tái)。其中,百度在小組賽階段的表現(xiàn)最為亮眼,而進(jìn)入淘汰賽階段,百度與微軟則以16場(chǎng)比賽15場(chǎng)準(zhǔn)確預(yù)測(cè)的成績(jī)讓人們見識(shí)到大數(shù)據(jù)在預(yù)測(cè)領(lǐng)域的魅力。
從互聯(lián)網(wǎng)公司的經(jīng)驗(yàn)來看,只要有體育賽事相關(guān)的歷史數(shù)據(jù),并且與指數(shù)公司進(jìn)行多方合作,就可以在賽事預(yù)測(cè)領(lǐng)域取得不錯(cuò)的成績(jī)。
8.社交網(wǎng)絡(luò)
大數(shù)據(jù)應(yīng)用案例之社交網(wǎng)絡(luò)——數(shù)據(jù)基礎(chǔ)設(shè)施工程部高級(jí)主管Ghosh描繪的LinkedIn數(shù)據(jù)構(gòu)建圖,其中就包括Hadoop戰(zhàn)略部署。
幾年前,LinkedIn只是一家普通的科技公司。而現(xiàn)在,其儼然成為一個(gè)工程強(qiáng)國。LinkedIn建成的一個(gè)最重要的數(shù)據(jù)庫是Espresso。不像Voldemort,這是繼亞馬遜Dynamo數(shù)據(jù)庫之后的一個(gè)最終一致性關(guān)鍵值存儲(chǔ),用于高速存儲(chǔ)某些確定數(shù)據(jù),Espresso作為一個(gè)事務(wù)一致性文件存儲(chǔ),通過對(duì)整個(gè)公司的網(wǎng)絡(luò)操作將取代遺留的Oracle數(shù)據(jù)庫。
它最初的設(shè)計(jì)就是為了提供LinkedIn InMail消息服務(wù)的可用性,該公司計(jì)劃今年晚些時(shí)候?qū)⑼瞥鲩_源Espresso。
(原標(biāo)題:大數(shù)據(jù)改變了什么)