什么是大數據、數據分析和數據挖掘?

數據分析是指用適當的統(tǒng)計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。在使用中,數據分析可幫助人們作出判斷,以便采取適當行動。

大數據(big data)指無法在可承受的時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產;在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)Veracity(真實性)。

數據分析是指用適當的統(tǒng)計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。在使用中,數據分析可幫助人們作出判斷,以便采取適當行動。數據分析的數學基礎在20世紀早期就已確立,但直到計算機的出現才使得實際操作成為可能,并使得數據分析得以推廣,數據分析是數學與計算機科學相結合的產物。

數據挖掘(英語:Datamining)又譯為資料探勘、數據采礦,它是數據庫知識發(fā)現(英語:Knowledge Discoveryin Databases,簡稱:KDD)中的一個步驟。數據挖掘一般是指從大量的數據中通過算法搜索隱藏于其中信息的過程,數據挖掘通常與計算機科學有關,并通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論