大數(shù)據(jù)和數(shù)據(jù)挖掘是兩件事。兩者都與使用大數(shù)據(jù)集來處理為企業(yè)或其他收件人服務(wù)的數(shù)據(jù)的收集或報(bào)告有關(guān)。但是,這兩個(gè)術(shù)語用于這種操作的兩個(gè)不同元素。
大數(shù)據(jù)
大數(shù)據(jù)是大數(shù)據(jù)集的術(shù)語。大數(shù)據(jù)集是那些已經(jīng)超出了早期使用的簡單數(shù)據(jù)庫和數(shù)據(jù)處理架構(gòu)的數(shù)據(jù)集,當(dāng)時(shí)大數(shù)據(jù)更昂貴,更不可行。例如,太大而無法在Microsoft Excel電子表格中輕松處理的數(shù)據(jù)集可稱為大數(shù)據(jù)集。
數(shù)據(jù)挖掘是指遍歷大數(shù)據(jù)集以查找相關(guān)或相關(guān)信息的活動。這種類型的活動確實(shí)是一個(gè)古老的公理“在大海撈針中尋找針頭”的好例子。這個(gè)想法是企業(yè)收集大量可能是同類或自動收集的數(shù)據(jù)。決策者需要訪問那些大型集中的較小,更具體的數(shù)據(jù)。他們使用數(shù)據(jù)挖掘來發(fā)現(xiàn)信息,這些信息將為領(lǐng)導(dǎo)層提供信息并幫助制定業(yè)務(wù)計(jì)劃。
數(shù)據(jù)挖掘可能涉及使用不同種類的軟件包,例如分析工具。它可以是自動化的,也可以在很大程度上是勞動密集型的,其中單個(gè)工人將對信息的特定查詢發(fā)送到存檔或數(shù)據(jù)庫。通常,數(shù)據(jù)挖掘是指涉及返回目標(biāo)和特定結(jié)果的相對復(fù)雜的搜索操作的操作。例如,數(shù)據(jù)挖掘工具可能會瀏覽數(shù)十年的會計(jì)信息,以查找特定營業(yè)年度的費(fèi)用或應(yīng)收賬款的特定列。
簡而言之,大數(shù)據(jù)是資產(chǎn),數(shù)據(jù)挖掘是其中的“處理者”,用于提供有益的結(jié)果。