大數(shù)據(jù)概論及應(yīng)用場景

java與大數(shù)據(jù)架構(gòu)
大數(shù)據(jù)是指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新的處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。

大數(shù)據(jù)是指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新的處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。

主要解決,海量數(shù)據(jù)的存儲和海量數(shù)據(jù)的分析計(jì)算問題。

大數(shù)據(jù)的四個(gè)特點(diǎn):

在了解大數(shù)據(jù)之前補(bǔ)充點(diǎn)存儲單位的知識點(diǎn):

按順序從小到大的數(shù)據(jù)存儲單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

1Byte=8bit 1K=1024Byte 1MB=1024K

1G=1024M1T=1024G 1P=1024T

一般公司的數(shù)據(jù)量在TB PB EB級別

1、Volume(大量)

截至目前,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,而歷史上全人類總共說過的話的數(shù)據(jù)量大約是5EB。當(dāng)前,典型個(gè)人計(jì)算機(jī)硬盤的容量為TB量級,而一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級。

2、Velocity(高速)

這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。根據(jù)DC的“數(shù)字宇宙"的報(bào)告,預(yù)計(jì)到2025年,全球數(shù)據(jù)使用量將達(dá)到163ZB。在如此海量的數(shù)據(jù)面前,處理數(shù)據(jù)的效率就是企業(yè)的生命。

3、Variety(多樣)

這種類型的多樣性也讓數(shù)據(jù)被分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。相對于以往便于存儲的以數(shù)據(jù)庫/文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等,這些多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高要求。

4、Value(低價(jià)值密度)

價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比。比如,在道路監(jiān)控視頻中,我們只關(guān)心出現(xiàn)交通事故的那幾分鐘的視頻,如何快速對有價(jià)值數(shù)據(jù)“提純"成為目前大數(shù)據(jù)背景下待解決的難題。

大數(shù)據(jù)應(yīng)用場景

1.物流倉儲:

大數(shù)據(jù)分析系統(tǒng)助力商家精細(xì)化運(yùn)營、提升銷量、節(jié)約成本。

如某某物流:上午下單下午送達(dá)、下午下單次日上午送達(dá)

2、零售:

分析用戶消費(fèi)習(xí)慣,為用戶購買商品提供方便,從而提升商品銷量。

經(jīng)典案例,子尿布+啤酒。

3、旅游:

深度結(jié)合大數(shù)據(jù)能力與旅游行業(yè)需求,共建旅游產(chǎn)業(yè)智慧管理、智慧服務(wù)和智慧營銷的未來。

4、商品廣告推薦:給用戶推薦可能喜歡的商品

5、保險(xiǎn):

海量數(shù)據(jù)挖掘及風(fēng)險(xiǎn)預(yù)測,助力保險(xiǎn)行業(yè)精準(zhǔn)營銷,提升精細(xì)化定價(jià)能力。

6、金融:

多維度體現(xiàn)用戶特征,幫助金融機(jī)構(gòu)推薦優(yōu)質(zhì)客戶,防范欺詐風(fēng)險(xiǎn)。

7、房產(chǎn):

大數(shù)據(jù)全面助力房地產(chǎn)行業(yè),打造精準(zhǔn)投策與營銷,選出更合適的地,建造更合適的樓,賣始更合適的人。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論