“大數(shù)據(jù)”是近年來IT行業(yè)的熱詞,大數(shù)據(jù)在各個行業(yè)的應(yīng)用逐漸變得廣泛起來,那么,什么是大數(shù)據(jù)呢?什么是大數(shù)據(jù)概念呢?大數(shù)據(jù)概念怎么理解呢?今天就一起來拔出你心中最困惑的刺!
什么是大數(shù)據(jù)
大數(shù)據(jù)(big data),又稱巨量資料,指的是所涉及的數(shù)據(jù)資料量規(guī)模巨大到無法通過人腦甚至主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。
簡而言之,大數(shù)據(jù)就是數(shù)據(jù)量非常大、數(shù)據(jù)種類繁多、無法用常規(guī)歸類方法應(yīng)用計算的數(shù)據(jù)集成。大數(shù)據(jù)的收集、開發(fā)和利用,已經(jīng)成為了當今社會的潮流之一,人們都認為,對于大數(shù)據(jù)的分析應(yīng)用,對于政府和企業(yè)的決策是非常積極的,影響也是非常深遠的。
大數(shù)據(jù)概念的發(fā)展歷史
“大數(shù)據(jù)”這個術(shù)語最早期的引用可追溯到apache org的開源項目Nutch。當時,大數(shù)據(jù)用來描述為更新網(wǎng)絡(luò)搜索索引需要同時進行批量處理或分析的大量數(shù)據(jù)集。隨著谷歌MapReduce和Google File System(GFS)的發(fā)布,大數(shù)據(jù)不再僅用來描述大量的數(shù)據(jù),還涵蓋了處理數(shù)據(jù)的速度。
早在1980年,著名未來學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數(shù)據(jù)熱情地贊頌為“第三次浪潮的華彩樂章”。不過,大約從2009年開始,“163大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。美國互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。此外,數(shù)據(jù)又并非單純指人們在互聯(lián)網(wǎng)上發(fā)布的信息,全世界的工業(yè)設(shè)備、汽車、電表上有著無數(shù)的數(shù)碼傳感器,隨時測量和傳遞著有關(guān)位置、運動、震動、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。
大數(shù)據(jù)的作用
對于一般的企業(yè)而言,大數(shù)據(jù)的作用主要表現(xiàn)在兩個方面,分別是數(shù)據(jù)的分析使用與進行二次開發(fā)項目。通過對大數(shù)據(jù)進行分析,不僅能把隱藏的數(shù)據(jù)挖掘出來,還能通過這些隱藏的訊息,通過實體的銷售,提升自己的客戶源。至于對數(shù)據(jù)進行二次開發(fā),在網(wǎng)絡(luò)服務(wù)項目中被運用的比較多,通過將這些信息進行總結(jié)與分析,從而制定出符合客戶需要的個性化方案,并營造出一種全新的廣告營銷方式,在這里,你需要明白的是,通過大數(shù)據(jù)的分析,將產(chǎn)品與服務(wù)進行結(jié)合起來的并不是偶然事件,實現(xiàn)這種的往往是數(shù)據(jù)時代的領(lǐng)導(dǎo)者。
綜上所述,大數(shù)據(jù)的運用,不僅標志著時代的進步,同時還激勵著人們進行更深領(lǐng)域的探究。此外,針對大數(shù)據(jù)的研究,除了上述內(nèi)容外,還需要了解大數(shù)據(jù)的三個特征,分別是規(guī)模大、運轉(zhuǎn)速度快及數(shù)據(jù)多樣性。通過對這三個方面的研究,不僅可以更容易的觀察到數(shù)據(jù)的本質(zhì),更有利于軟件處理平臺的有效運轉(zhuǎn)。