一個(gè)典型的數(shù)據(jù)分析項(xiàng)目將分為幾個(gè)不同的階段。一般有五個(gè),可以一起來(lái)了解一下。
階段1:定義問(wèn)題
第一個(gè)階段是最重要的階段,在這個(gè)階段,你提出問(wèn)題并具體說(shuō)明。
比如:你對(duì)從數(shù)據(jù)中學(xué)習(xí)感興趣嗎?現(xiàn)在,詳細(xì)說(shuō)明這個(gè)問(wèn)題并隨著時(shí)間的推移不斷完善它,這非常重要,因?yàn)樗罱K將指導(dǎo)你獲得的數(shù)據(jù)和你所做的的分析類型。你可以問(wèn)六種類型的問(wèn)題從描述性的,到探索性的,到推理性的,到因果性的,預(yù)測(cè)性的和機(jī)械性的。
所以,弄清楚你在問(wèn)是什么類型的問(wèn)題,以及問(wèn)題的類型到底是什么真的很有影響力。你應(yīng)該花很多時(shí)間思考這個(gè)問(wèn)題。
階段2:探索性數(shù)據(jù)分析
探索性數(shù)據(jù)分析有兩個(gè)主要目標(biāo)。首先是你要知道你擁有的數(shù)據(jù)是否適合回答你的問(wèn)題。“數(shù)據(jù)夠嗎?”“缺失值太多了嗎?”我是否遺漏了某些變量,或者我是否需要收集更多數(shù)據(jù)來(lái)獲取這些變量等?
探索性數(shù)據(jù)分析的第二個(gè)目標(biāo)是制定解決方案的草圖。
階段3:形式化建模
下一階段是關(guān)于形式建模的第三階段。如果你的草圖沒問(wèn)題并且可能有效,那么你已經(jīng)獲得了正確的數(shù)據(jù),并且可以繼續(xù)前進(jìn)。正式的建模階段是明確寫下你所問(wèn)的問(wèn)題和你試圖估計(jì)的參數(shù)的方式。挑戰(zhàn)你的模型并開發(fā)一個(gè)正式的框架對(duì)于確保你能夠?yàn)榛卮鹉愕膯?wèn)題開發(fā)可靠的證據(jù)是非常重要的。這有助于檢查他們對(duì)不同假設(shè)的敏感度。
第4階段:解釋
完成分析和正式建模后,需要考慮如何解釋結(jié)果。你可能已經(jīng)進(jìn)行了許多不同的分析,可能擬合了許多不同的模型。因此,你需要考慮許多不同的信息。解釋階段的部分挑戰(zhàn)是收集所有信息并權(quán)衡每個(gè)不同的證據(jù)。你知道哪些部分更可靠,哪些部分比其他部分更不確定,哪些部分比其他部分更重要,以了解與回答問(wèn)題相關(guān)的全部證據(jù)。
階段5:溝通
最后一個(gè)階段是交流階段。任何成功的數(shù)據(jù)科學(xué)項(xiàng)目都希望將其發(fā)現(xiàn)傳達(dá)給某種受眾。該受眾可能是組織內(nèi)部的,也可能是外部的,可能是大量的觀眾,甚至只是少數(shù)人。
數(shù)據(jù)科學(xué)實(shí)驗(yàn)的輸出
數(shù)據(jù)分析實(shí)驗(yàn)的輸出形式有很多種。最常出現(xiàn)四種一般類型的輸出。
報(bào)告
演示文稿
交互式網(wǎng)頁(yè)
應(yīng)用程序