隨著大數(shù)據(jù)技術(shù)熱度的持續(xù)走高,大數(shù)據(jù)己經(jīng)滲透到每一個行業(yè)和領(lǐng)域,大數(shù)據(jù)技術(shù)己經(jīng)成為對社會具有重大影響的生產(chǎn)因素。
1、數(shù)據(jù)體量大
數(shù)據(jù)處理的基本單位從以前的MB轉(zhuǎn)變?yōu)楝F(xiàn)在的TB,甚至是PB。影響經(jīng)濟周期與用戶需求的因素有很多,如經(jīng)濟發(fā)展、社會發(fā)展、科技發(fā)展能源環(huán)境和政治環(huán)境等,把所有影響兩者周期關(guān)系的因素收集起來將是GB級甚至是TB級的數(shù)據(jù)量。
2、數(shù)據(jù)種類多
數(shù)據(jù)種類有像數(shù)字、符號這樣的結(jié)構(gòu)化數(shù)據(jù),更多的是像網(wǎng)頁、社交網(wǎng)絡、日志、音頻、視頻、圖像、位置這樣的非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù)。在研究經(jīng)濟周期與用戶需求周期的過程中,要想進行系統(tǒng)全面的分析,就要把所有影響因素的所有類型數(shù)據(jù)全部收集并處理。
3、數(shù)據(jù)價值密度低
大數(shù)據(jù)技術(shù)的本質(zhì)是從容量龐大、類型各異的數(shù)據(jù)中迅速獲得有效信息,這些信息經(jīng)過一系列的加工和處理,最終以有價值的形式展現(xiàn)在用戶面前。一般,大數(shù)據(jù)范圍內(nèi)數(shù)據(jù)量大但價值密度低,需要價值提純。由于影響經(jīng)濟周期與用戶需求周期的數(shù)據(jù)具有數(shù)量大、結(jié)構(gòu)復雜等特點,導致數(shù)據(jù)價值密度低。
4、數(shù)據(jù)高速化
數(shù)據(jù)每時每刻都在生成和處理、對時效性要求也很高,靜態(tài)數(shù)據(jù)只是其中的一小部分,動態(tài)實時數(shù)據(jù)占絕大部分。影響經(jīng)濟周期和用戶需求周期的數(shù)據(jù)隨時都在產(chǎn)生,要保證信息具有更高的價值并避免時效性較強的數(shù)據(jù)失去價值,就需要大幅提高數(shù)據(jù)傳輸、存儲和處理的速度。