一、數(shù)據(jù)中心是全球協(xié)作的特定設備網(wǎng)絡,用來在Internet網(wǎng)絡基礎設施上傳遞、加速、展示、計算、存儲數(shù)據(jù)信息。它不僅包括計算機系統(tǒng)和其它與之配套的設備,還包含冗余的數(shù)據(jù)通信連接、環(huán)境控制設備、監(jiān)控設備以及各種安全裝置。
二、而云計算是什么?一般說來,它是基于互聯(lián)網(wǎng)的相關服務的增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動態(tài)易擴展且經(jīng)常是虛擬化的資源。云計算是一種按使用量付費的IT服務模式,這種模式提供可用的、便捷的、按需的網(wǎng)絡訪問,進入可配置的計算資源共享池(資源包括網(wǎng)絡,服務器,存儲,應用軟件,服務),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。那么云計算的定義中有一個最重要的關鍵詞:按需。云計算提供商是根據(jù)用戶需求,按需提供計算資源的,另外就是云計算架構具有很大的彈性,和擴展性,因為所有的實際物理資源都被虛擬化(抽象化),可配置和可管理。
云計算技術包括分布式文件系統(tǒng)、分布式計算、分布式數(shù)據(jù)存儲等?;谠朴嬎慵軜?,可以實現(xiàn)高并發(fā)處理系統(tǒng)來處理海量請求,也可以搭建存儲海量數(shù)據(jù)的云存儲系統(tǒng),也可以搭建分布式計算系統(tǒng)來對數(shù)據(jù)進行挖掘。生活化一點,包括我們所熟知的搜索引擎、網(wǎng)絡視頻、電子商務、電子郵件、地圖導航等都屬于云計算的范疇。
三、大數(shù)據(jù)是什么?在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中提出:大數(shù)據(jù)指不用隨機分析法(抽樣調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進行分析處理。
那么究竟多大的數(shù)據(jù)算是大數(shù)據(jù),這個其實并沒有明確的定義。不過IBM提出了大數(shù)據(jù)的5V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。這也是目前大家比較公認的大數(shù)據(jù)的特征。
這個5V的特點,反映了大數(shù)據(jù)數(shù)據(jù)量大、產(chǎn)生的速度快且多樣,同時大數(shù)據(jù)具有低價值密度的特點,同時大數(shù)據(jù)也可能會夾雜一些干擾,影響數(shù)據(jù)的真實性。因此需要一些技術手段能夠快速處理海量數(shù)據(jù),并且能夠從大數(shù)據(jù)中挖掘有價值的信息。