數(shù)據(jù)是客觀的,但解讀數(shù)據(jù)的人是主觀的。同一份數(shù)據(jù),受經(jīng)驗(yàn)、思維、心態(tài)的影響,由不同的數(shù)據(jù)分析師得出的結(jié)果很可能截然不同。
想提高數(shù)據(jù)分析水平,一方面需要有益經(jīng)驗(yàn)的積累,另一方面要盡量規(guī)避錯誤的方法和思維。
本文列舉5個做數(shù)據(jù)分析時常會陷入的誤區(qū),幫助大家在以后的分析中少走彎路。
1、數(shù)據(jù)一定客觀
數(shù)據(jù)是會騙人的。
舉個有名的例子,二戰(zhàn)時英軍發(fā)現(xiàn),從戰(zhàn)場飛回來的戰(zhàn)機(jī),機(jī)身上的彈孔比引擎和油箱上的要多得多,根據(jù)這個數(shù)據(jù),我們很容易得出要加強(qiáng)機(jī)身的防護(hù)的建議。
但事實(shí)的真相卻是,那些引擎和油箱上中彈的飛機(jī)已經(jīng)回不來了,我們更應(yīng)加強(qiáng)引擎和油箱的防護(hù),這就是常說的“幸存者偏差”。
再者,數(shù)據(jù)是可能被人為操縱的。比如店鋪的評論,比如電影的評分,比如某公司發(fā)布的關(guān)于其所在行業(yè)的分析報(bào)告,都具有一定的主觀性。
基于錯誤的數(shù)據(jù),做出的分析結(jié)論是無益甚至是有害的。所以在數(shù)據(jù)分析前,我們先要考證數(shù)據(jù)的來源及可信度,還要關(guān)注不符合常理的數(shù)據(jù)變化,對數(shù)據(jù)采集方法進(jìn)行調(diào)整。
2、過度依賴數(shù)據(jù)
對于業(yè)務(wù)決策來說,數(shù)據(jù)分析只是輔助手段,而不是核心推動力。
許多數(shù)據(jù)是無意義的,過度依賴數(shù)據(jù)于決策無益甚至?xí)龑?dǎo)上級做出錯誤的決策。
在書籍《大數(shù)據(jù)時代》中,提到了這樣一種情況:
瑪麗莎·邁爾在任谷歌高管期間,有時會要求員工測試41種藍(lán)色的陰影效果,哪種被人們使用最頻繁,從而決定網(wǎng)頁工具欄的顏色。
這是陷入“數(shù)據(jù)之上”的誤區(qū),這樣的數(shù)據(jù)是毫無意義的,訪客能不能看出細(xì)微的差別不說,幾乎沒有人會因?yàn)殛幱靶Ч牟煌鴽Q定訪問/不訪問這一網(wǎng)頁。
所以,一份靠譜的分析結(jié)論,既來源于對關(guān)鍵數(shù)據(jù)的分析,也來源于經(jīng)驗(yàn)的積累,來源于分析師對業(yè)務(wù)的認(rèn)識。如果簡單地把論證過程簡單地簡化為數(shù)據(jù)分析過程,事實(shí)上是一種偷懶行為。
3、輕視業(yè)務(wù)
這是數(shù)據(jù)分析初學(xué)者極易犯的錯誤,只懂技術(shù)不懂業(yè)務(wù),就不能真正理解業(yè)務(wù)需求。很多新手認(rèn)為工作中只需要勤勤懇懇敲代碼就行——無數(shù)SQL boy/girl就是這么誕生的。
最好的分析師一定是既懂技術(shù)又懂業(yè)務(wù)的。因?yàn)榧夹g(shù)是為業(yè)務(wù)服務(wù)的,公司衡量技術(shù)的價值,不在于分析技術(shù)有多高超,而是對業(yè)務(wù)有沒有貢獻(xiàn)。
所以,數(shù)據(jù)分析師也要多去一線了解業(yè)務(wù)運(yùn)作,幫助解決業(yè)務(wù)運(yùn)營中遇到的各種問題。
除了深入了解業(yè)務(wù),我們還需要積累豐富的數(shù)據(jù)分析模型庫以應(yīng)對各種業(yè)務(wù)場景,比如金字塔模型、KANO分析模型、RFM模型、購物籃分析模型、四象限模型......這些經(jīng)典且廣泛應(yīng)用的模型。
當(dāng)然,這些模型如果用傳統(tǒng)工具搭建,通常需要花費(fèi)大量時間,而且不夠靈活,一點(diǎn)小的調(diào)整就帶來大量的工作量,很不友好。
好的數(shù)據(jù)分析師擅于用好的工具,如果借助FineBI,只需通過鼠標(biāo)操作就能快速搭建出各種模型,而且可以根據(jù)需要隨時調(diào)整,進(jìn)行探索式分析。數(shù)據(jù)分析做成這樣,還有誰會說對業(yè)務(wù)沒有價值呢!
4、忽略效率
數(shù)據(jù)分析是整個商業(yè)活動的一環(huán),而商業(yè)是追求效率的。很多新人容易陷入追求完美算法的陷阱,放著簡單的方案不用,非要花大量時間在鉆數(shù)據(jù)算法的牛角尖上,最后交出一份領(lǐng)導(dǎo)懶得看的長文報(bào)告。
對企業(yè)來說,這樣的工作態(tài)度并不可取。
推動分析結(jié)論落地是數(shù)據(jù)分析價值的體現(xiàn),數(shù)據(jù)分析師除了要用最具效率的算法,還需要拿出讓決策層和執(zhí)行層都信服的分析報(bào)告。
前面說到的FineBI工具不僅有豐富的圖表樣式滿足各種分析場景,還可以用多個圖表搭建駕駛艙,通過圖表聯(lián)動和上探下鉆,讓用戶自由探索數(shù)據(jù)背后的價值,制作和應(yīng)用的效率都很高。
5、“套路式”分析
在數(shù)據(jù)分析學(xué)習(xí)時我們或許習(xí)慣了各種解題套路,但在實(shí)操時其實(shí)并不存在通用的分析套路。不同的行業(yè)、不同的業(yè)務(wù),不同的階段,哪怕用的是同一種分析方法,結(jié)論都應(yīng)有所區(qū)別。
比如to C和to B行業(yè)的客戶運(yùn)營就是不一樣的,比如互聯(lián)網(wǎng)初創(chuàng)公司可能追求用戶增長,步入成熟期后追求利潤率提高。
對待每一次分析,我們應(yīng)該結(jié)合業(yè)務(wù)場景中思考,結(jié)論要有針對性,不能被套路束縛住,也不能簡單依賴過往的類似案例。
大數(shù)據(jù)時代,企業(yè)的數(shù)據(jù)體量不斷擴(kuò)大,業(yè)務(wù)需求不斷變化,數(shù)據(jù)分析的環(huán)境也不斷變化。我們要實(shí)時更新知識和工具庫,也要警惕和避免踩中上面這些數(shù)據(jù)分析的誤區(qū)。