大數(shù)據(jù)是什么:大數(shù)據(jù)(big data)是指無法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)有五大特點(diǎn),即大量(Volume)、高速(Velocity)、多樣(Variety)、低價(jià)值密度(Value)、真實(shí)性(Veracity)。它并沒有統(tǒng)計(jì)學(xué)的抽樣方法,只是觀察和追蹤發(fā)生的事情。
大數(shù)據(jù)的用法傾向于預(yù)測分析、用戶行為分析或某些其他高級(jí)數(shù)據(jù)分析方法的使用。
大數(shù)據(jù)有什么用?
個(gè)人觀點(diǎn):大數(shù)據(jù)的作用可以幫助世界各個(gè)企業(yè)根據(jù)廣泛收集的信息做出決策,以多種多樣不同的方式使用,但有一些常見的和基本的方式,商業(yè)世界利用大數(shù)據(jù)集來通知和指導(dǎo)業(yè)務(wù)流程。
大數(shù)據(jù)為企業(yè)做的一件重要事情就是告訴他們有關(guān)客戶或客戶的信息(數(shù)據(jù)采集)。使用客戶關(guān)系管理等工具,大數(shù)據(jù)集可以顯示客戶是誰,他們的行為方式以及他們與業(yè)務(wù)的互動(dòng)方式。通常,復(fù)雜的客戶關(guān)系管理(CRM)系統(tǒng)在易于使用的可視化界面中提供來自大數(shù)據(jù)集的精心挖掘的數(shù)據(jù),以支持銷售或推動(dòng)其他工作。
大數(shù)據(jù)通常也會(huì)控制企業(yè)供應(yīng)鏈。大數(shù)據(jù)集可用于管理庫存,處理原材料采購,推動(dòng)產(chǎn)品出貨策略或處理復(fù)雜供應(yīng)鏈的任何部分。通過使用特定的大數(shù)據(jù)結(jié)果,管理人員可以實(shí)施即時(shí)庫存等策略,從而為企業(yè)節(jié)省大量資金和資源。
企業(yè)還可以使用大數(shù)據(jù)集來識(shí)別性能標(biāo)準(zhǔn),或者幫助進(jìn)行勞動(dòng)力管理。大數(shù)據(jù)集可以向企業(yè)展示更多有關(guān)性能趨勢以及特定業(yè)務(wù)位置或成本中心發(fā)生的情況。大數(shù)據(jù)集可以幫助實(shí)現(xiàn)業(yè)務(wù)流程的自動(dòng)化,實(shí)現(xiàn)遠(yuǎn)程工作和其他新形式的業(yè)務(wù)運(yùn)營。
除上述所有內(nèi)容外,大數(shù)據(jù)還可以幫助企業(yè)設(shè)定價(jià)格或在市場環(huán)境中工作。不同類型的數(shù)據(jù)收集可以更好地鳥瞰企業(yè)在其市場中的表現(xiàn)。專業(yè)人士經(jīng)常談?wù)摯髷?shù)據(jù)應(yīng)用于業(yè)務(wù)分析或商業(yè)智能。這可能涉及為交易或決策提供背景,并幫助企業(yè)聯(lián)網(wǎng)或幫助提高廣告或其他運(yùn)營效率。
從本質(zhì)上講,大數(shù)據(jù)通過提供一種與現(xiàn)有操作和預(yù)測結(jié)果有關(guān)的調(diào)查的無形原材料來服務(wù)于業(yè)務(wù)目標(biāo)和目標(biāo)。
“大數(shù)據(jù)”的四大特點(diǎn):
據(jù)悉,大數(shù)據(jù)(Big Data)是指“無法用現(xiàn)有的軟件工具提取、存儲(chǔ)、搜索、共享、分析和處理的海量的、復(fù)雜的數(shù)據(jù)集合。”業(yè)界通常用4個(gè)V(Volume、Variety、Value、Velocity)來概括大數(shù)據(jù)的特征。
1:是數(shù)據(jù)體量巨大(Volume)。截至目前,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB(1PB=210TB),而歷史上全人類說過的所有的話的數(shù)據(jù)量大約是5EB(1EB=210PB)。當(dāng)前,典型個(gè)人計(jì)算機(jī)硬盤的容量為TB量級(jí),而一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級(jí)。
2:是數(shù)據(jù)類型繁多(Variety)。這種類型的多樣性也讓數(shù)據(jù)被分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。相對(duì)于以往便于存儲(chǔ)的以文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等,這些多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高要求。
3:是價(jià)值密度低(Value)。價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比。以視頻為例,一部1小時(shí)的視頻,在連續(xù)不間斷的監(jiān)控中,有用數(shù)據(jù)可能僅有一二秒。如何通過強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”成為目前大數(shù)據(jù)背景下亟待解決的難題。
4:是處理速度快(Velocity)。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。根據(jù)IDC的“數(shù)字宇宙”的報(bào)告,預(yù)計(jì)到2020年,全球數(shù)據(jù)使用量將達(dá)到35.2ZB。在如此海量的數(shù)據(jù)面前,處理數(shù)據(jù)的效率就是企業(yè)的生命。
“大數(shù)據(jù)”的用途
第1:對(duì)大數(shù)據(jù)的處理分析正成為新一代信息技術(shù)融合應(yīng)用的結(jié)點(diǎn)。移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、數(shù)字家庭、電子商務(wù)等是新一代信息技術(shù)的應(yīng)用形態(tài),這些應(yīng)用不斷產(chǎn)生大數(shù)據(jù)(萬物互聯(lián))。云計(jì)算為這些海量、多樣化的大數(shù)據(jù)提供存儲(chǔ)和運(yùn)算平臺(tái)。通過對(duì)不同來源數(shù)據(jù)的管理、處理、分析與優(yōu)化,將結(jié)果反饋到上述應(yīng)用中,將創(chuàng)造出巨大的經(jīng)濟(jì)和社會(huì)價(jià)值。
大數(shù)據(jù)具有催生社會(huì)變革的能量。但釋放這種能量,需要嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)治理、富有洞見的數(shù)據(jù)分析和激發(fā)管理創(chuàng)新的環(huán)境(Ramayya Krishnan,卡內(nèi)基·梅隆大學(xué)海因茲學(xué)院院長)。
第2:大數(shù)據(jù)是信息產(chǎn)業(yè)持續(xù)高速增長的新引擎。面向大數(shù)據(jù)市場的新技術(shù)、新產(chǎn)品、新服務(wù)、新業(yè)態(tài)會(huì)不斷涌現(xiàn)。在硬件與集成設(shè)備領(lǐng)域,大數(shù)據(jù)將對(duì)芯片、存儲(chǔ)產(chǎn)業(yè)產(chǎn)生重要影響,還將催生一體化數(shù)據(jù)存儲(chǔ)處理服務(wù)器、內(nèi)存計(jì)算等市場。在軟件與服務(wù)領(lǐng)域,大數(shù)據(jù)將引發(fā)數(shù)據(jù)快速處理分析、數(shù)據(jù)挖掘技術(shù)和軟件產(chǎn)品的發(fā)展。
第3:大數(shù)據(jù)利用將成為提高核心競爭力的關(guān)鍵因素。各行各業(yè)的決策正在從“業(yè)務(wù)驅(qū)動(dòng)”轉(zhuǎn)變“數(shù)據(jù)驅(qū)動(dòng)”。
對(duì)大數(shù)據(jù)的分析可以使零售商實(shí)時(shí)掌握市場動(dòng)態(tài)并迅速做出應(yīng)對(duì);可以為商家制定更加精準(zhǔn)有效的營銷策略提供決策支持;可以幫助企業(yè)為消費(fèi)者提供更加及時(shí)和個(gè)性化的服務(wù);在醫(yī)療領(lǐng)域,可提高診斷準(zhǔn)確性和藥物有效性;在公共事業(yè)領(lǐng)域,大數(shù)據(jù)也開始發(fā)揮促進(jìn)經(jīng)濟(jì)發(fā)展、維護(hù)社會(huì)穩(wěn)定等方面的重要作用。
第4:大數(shù)據(jù)時(shí)代科學(xué)研究的方法手段將發(fā)生重大改變。例如,抽樣調(diào)查是社會(huì)科學(xué)的基本研究方法。在大數(shù)據(jù)時(shí)代,可通過實(shí)時(shí)監(jiān)測、跟蹤研究對(duì)象在互聯(lián)網(wǎng)上產(chǎn)生的海量行為數(shù)據(jù),進(jìn)行挖掘分析,揭示出規(guī)律性的東西,提出研究結(jié)論和對(duì)策。