數(shù)據(jù)分析的定義
數(shù)據(jù)分析是一門專注于從數(shù)據(jù)中提取見解的學(xué)科。它包括數(shù)據(jù)分析和管理的過程、工具和技術(shù),其中包括數(shù)據(jù)的收集、組織和存儲。數(shù)據(jù)分析的主要目的是對數(shù)據(jù)應(yīng)用統(tǒng)計分析和技術(shù)以發(fā)現(xiàn)趨勢并解決問題。作為分析和調(diào)整業(yè)務(wù)流程并改善決策和業(yè)務(wù)結(jié)果的一種手段,數(shù)據(jù)分析在企業(yè)中變得越來越重要。
數(shù)據(jù)分析來自包括計算機編程、數(shù)學(xué)、統(tǒng)計在內(nèi)的一系列學(xué)科,可以對數(shù)據(jù)進行分析,以描述、預(yù)測和改進性能。為確??煽康姆治?,數(shù)據(jù)分析團隊利用一系列數(shù)據(jù)管理技術(shù),其中包括數(shù)據(jù)挖掘、數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)建模等。
數(shù)據(jù)分析與數(shù)字分析
(1)數(shù)據(jù)分析vs.數(shù)字分析
盡管術(shù)語“數(shù)據(jù)分析”和“數(shù)字分析”經(jīng)?;Q使用,但是數(shù)字分析是數(shù)據(jù)分析的子集,涉及檢查、清理、轉(zhuǎn)換和建模數(shù)據(jù)以得出結(jié)論。數(shù)據(jù)分析包括用于執(zhí)行數(shù)字分析的工具和技術(shù)。
(2)數(shù)據(jù)分析vs.數(shù)據(jù)科學(xué)
數(shù)據(jù)分析和數(shù)據(jù)科學(xué)密切相關(guān)。數(shù)據(jù)分析是數(shù)據(jù)科學(xué)的組成部分,用于了解組織數(shù)據(jù)的外觀。通常情況下,數(shù)據(jù)分析的輸出是報告和可視化。數(shù)據(jù)科學(xué)利用分析的結(jié)果來研究和解決問題。
數(shù)據(jù)分析和數(shù)據(jù)科學(xué)之間的差異通常被視為時間尺度的差異。數(shù)據(jù)分析描述現(xiàn)實的當(dāng)前或歷史狀態(tài),而數(shù)據(jù)科學(xué)則使用這些數(shù)據(jù)來預(yù)測或理解未來。
(3)數(shù)據(jù)分析vs.業(yè)務(wù)分析
業(yè)務(wù)分析是數(shù)據(jù)分析的另一個子集。業(yè)務(wù)分析使用數(shù)據(jù)分析技術(shù),包括數(shù)據(jù)挖掘、統(tǒng)計分析和預(yù)測建模,以推動更好的業(yè)務(wù)決策。調(diào)研機構(gòu)Gartner公司將業(yè)務(wù)分析定義為“用于構(gòu)建分析模型和模擬以創(chuàng)建場景、了解現(xiàn)實和預(yù)測未來狀態(tài)的解決方案。”
數(shù)據(jù)分析的類型
以下有四種分析類型:
(1)描述性分析:發(fā)生了什么,現(xiàn)在正在發(fā)生什么?描述性分析通過識別趨勢和模式,使用來自多個來源的歷史和當(dāng)前數(shù)據(jù)來描述當(dāng)前狀態(tài)。而在業(yè)務(wù)分析中,這是商業(yè)智能(BI)發(fā)揮的作用。
(2)診斷分析:為什么會發(fā)生?診斷分析使用數(shù)據(jù)(通常通過描述性分析生成)來發(fā)現(xiàn)性能的因素或原因。
(3)預(yù)測分析:將來可能會發(fā)生什么?預(yù)測分析將統(tǒng)計建模、預(yù)測和機器學(xué)習(xí)等技術(shù)應(yīng)用于描述性和診斷分析的輸出,以對未來結(jié)果進行預(yù)測。預(yù)測分析通常被認為是一種“高級分析”,通常依賴于機器學(xué)習(xí)或深度學(xué)習(xí)。
(4)規(guī)范分析:需要做什么?規(guī)范分析是一種高級分析,涉及測試和其他技術(shù)的應(yīng)用,以推薦可提供預(yù)期結(jié)果的特定解決方案。在業(yè)務(wù)中,預(yù)測分析使用機器學(xué)習(xí)、業(yè)務(wù)規(guī)則和算法。
數(shù)據(jù)分析方法和技術(shù)
數(shù)據(jù)分析人員使用多種方法和技術(shù)來分析數(shù)據(jù)。CareerFoundry執(zhí)行編輯Emily Stevens指出了最受歡迎的七個類別,其中包括:
(1)回歸分析:回歸分析是一組統(tǒng)計過程,用于估計變量之間的關(guān)系,以確定一個或多個變量的變化如何影響另一個變量。例如,社交媒體的支出如何影響銷售?
(2)蒙特卡羅模擬:蒙特卡羅模擬用于模擬由于隨機變量的干預(yù)而不易預(yù)測的過程中不同結(jié)果的概率。它經(jīng)常用于風(fēng)險分析。
(3)因子分析:因子分析是一種統(tǒng)計方法,用于獲取大量數(shù)據(jù)集,并將其縮減為更小、更易于管理的數(shù)據(jù)集。這有一個額外的好處,就是經(jīng)常發(fā)現(xiàn)隱藏的模式。在業(yè)務(wù)環(huán)境中,因子分析通常用于探索諸如客戶忠誠度之類的東西。
(4)隊列分析:隊列分析用于將數(shù)據(jù)集分解為具有共同特征的組或隊列進行分析。這通常用于了解客戶細分。
(5)聚類分析:Statistics Solutions公司將聚類分析定義為“用于將對象或案例分類為稱為聚類的相對組的一類技術(shù)。”它可以用來揭示數(shù)據(jù)中的結(jié)構(gòu)。例如,保險公司可以使用聚類分析來研究為什么某些地點與特定的保險索賠相關(guān)聯(lián)。
(6)時間序列分析:Statistics Solutions公司將時間序列分析定義為“處理時間序列數(shù)據(jù)或趨勢分析的統(tǒng)計技術(shù)”。時間序列數(shù)據(jù)是指數(shù)據(jù)在一系列特定的時間段或間隔內(nèi)。時間序列分析可用于確定隨時間變化的趨勢和周期,例如每周的銷售數(shù)字。它經(jīng)常用于經(jīng)濟和銷售預(yù)測。
(7)情感分析:情感分析使用自然語言處理、文本分析、計算語言學(xué)等工具,了解數(shù)據(jù)中表達的情感。前六種方法試圖分析定量數(shù)據(jù)(可以測量的數(shù)據(jù)),而情緒分析則試圖通過將定性數(shù)據(jù)組織成主題來解釋和分類定性數(shù)據(jù)。它經(jīng)常被用來理解顧客對品牌、產(chǎn)品或服務(wù)的感受。
數(shù)據(jù)分析示例
所有行業(yè)的組織都在利用數(shù)據(jù)分析來改進運營、增加收入和促進數(shù)字化轉(zhuǎn)型。以下是三個例子:
(1)國際家具零售商La-Z-Boy公司使用數(shù)據(jù)分析來改善運營:該公司已經(jīng)使用分析來改善其20個部門的運營,其中包括人力資源、財務(wù)、供應(yīng)鏈、銷售等部門。數(shù)據(jù)分析可以幫助該公司管理價格、SKU性能、保修、運輸和其他信息,以及預(yù)測庫存水平。
(2)預(yù)測分析可幫助制造商Owens Corning公司開發(fā)和生產(chǎn)渦輪葉片:該公司借助其卓越的分析中心,已使用預(yù)測分析簡化了測試用于制造風(fēng)力渦輪機葉片的玻璃纖維織物中的粘合劑的過程。數(shù)據(jù)分析幫助該公司將任何給定新材料的測試時間從10天減少到了大約2個小時。
(3)Kaiser Permanente公司通過分析減少了等待時間:該公司自2015年以來一直使用數(shù)據(jù)分析、機器學(xué)習(xí)和人工智能的組合來實施其在美國的39家醫(yī)院和700多家醫(yī)療機構(gòu)的數(shù)據(jù)運營。該公司使用數(shù)據(jù)分析來更好地預(yù)測和解決潛在的瓶頸,使它能夠提供更好的患者護理,同時提高日常操作的效率。
數(shù)據(jù)分析人員的薪酬
根據(jù)PayScale公司的數(shù)據(jù),以下是一些與數(shù)據(jù)分析相關(guān)的最受歡迎的職位,以及每個職位的平均年薪:
•分析經(jīng)理:68000~127000美元
•業(yè)務(wù)分析師:46000~82000美元
•IT業(yè)務(wù)分析師:50000~98000美元
•商業(yè)智能分析師:50000~95000美元
•數(shù)據(jù)分析師:43000~85000美元
•市場研究分析師:41000~75000美元
•運營研究分析師:49000~122000美元
•定量分析師:58000~131000美元
•高級業(yè)務(wù)分析師:63000~115000美元
•統(tǒng)計員:50000~108000美元