什么是大數(shù)據(jù)?在大眾認為大數(shù)據(jù)是可以實現(xiàn)的應用可以概括為兩個方向,一個是精準化定制,第二個是預測。比如像通過搜索引擎搜索同樣的內(nèi)容,每個人的結(jié)果卻是大不相同的。再比如精準營銷、百度的推廣、淘寶的喜歡推薦,或者你到了一個地方,自動給你推薦周邊的消費設施等等。
大數(shù)據(jù)(big data),IT行業(yè)術語,他的提出者是全球知名咨詢公司的麥肯錫,是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。IBM認為大數(shù)據(jù)的5V特點:Volume(大量) Velocity(高速) Variety(多樣) Value(低價值密度) Veracity(真實性)。
有人把數(shù)據(jù)比喻為蘊藏能量的煤礦。煤炭按照性質(zhì)有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數(shù)據(jù)并不在“大”,而在于“有用”。價值含量、挖掘成本比數(shù)量更為重要。
大數(shù)據(jù)技術的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
大數(shù)據(jù)需要特殊的技術,以有效地處理大量的容忍經(jīng)過時間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術,包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴展的存儲系統(tǒng)。
2019年11月11日零點,第11個天貓雙11正式開啟。1分36秒,平臺交易額突破100億元。一個小時后,這個數(shù)據(jù)突破1000億。截止至11日24:00,天貓總成交額為2684億,同比增長約25.7%,物流訂單達到12.92億,再度刷新商業(yè)記錄。這一“新紀錄”也離不開大數(shù)據(jù)的作用。
利的背面也是弊端的衍生,大數(shù)據(jù)也同時存很多問題刻不容緩。
社會安全問題,中國網(wǎng)民已經(jīng)接近6億,每時每刻都產(chǎn)生著大量的數(shù)據(jù),也消費著大量的數(shù)據(jù),網(wǎng)絡的放大效應、傳播的速度和動員的能力越來越大,各種社會的矛盾疊加,致使社會群體性事件頻發(fā);
個人隱私問題,人們可以利用的信息技術工具無處不在,有關個人的各種信息也同樣無處不在。在網(wǎng)絡空間里,身份越來越虛擬,隱私也越來越重要。根據(jù)哈佛大學近期發(fā)布的一項研究報告,只要有一個人的年齡、性別和郵編,就能從公開的數(shù)據(jù)當中搜索到這個人約87%的個人信息。
公共安全問題,堪稱智能交通、智慧電網(wǎng)的國民經(jīng)濟運行和智能社會發(fā)展高度依賴信息基礎,這些重要的信息基礎設施、網(wǎng)絡化智能化的程度越高,安全也就越脆弱。
大數(shù)據(jù)存在的問題遠遠不止這些,值得我們注意的不僅僅是大數(shù)據(jù)帶給我們便捷,更應該引起我們注意的是隱藏在它身后的弊端。