在IT領(lǐng)域,炒作越大,誤解越多,數(shù)據(jù)分析也不例外。分析是當(dāng)今信息技術(shù)最熱門的方面之一,可以帶來巨大的商業(yè)收益,但錯誤的觀念可能會阻礙分析能力順利和及時的流轉(zhuǎn),從而使商業(yè)用戶和最終客戶受益。當(dāng)企業(yè)創(chuàng)建或擴大他們的分析戰(zhàn)略時,以下是他們可能要記住的誤區(qū)。
誤區(qū)1:數(shù)據(jù)分析需要重大投資
這些天來,似乎每一項技術(shù)努力都必須經(jīng)過健全性財務(wù)的過濾。當(dāng)IT和業(yè)務(wù)經(jīng)理提議啟動一個項目或部署一個新的工具時,"它將花費多少錢?"是他們首先得到的問題之一。
有些人認(rèn)為,數(shù)據(jù)分析本質(zhì)上是一項昂貴的工作,因此只限于擁有大額預(yù)算或大量內(nèi)部資源的組織。但并不是所有的數(shù)據(jù)分析工作都需要重大投資,移動和在線房地產(chǎn)服務(wù)提供商Trulia的工程副總裁Deep Varma說。
"現(xiàn)在市場上有很多開源以及其他工具,可以幫助你開始展示數(shù)據(jù)分析的價值,"Varma說。"你需要對你的內(nèi)部數(shù)據(jù)存儲以及你要解決的問題有一個很好的了解。云計算也讓你很容易嘗試分析解決一個商業(yè)問題"。
現(xiàn)代分析"基于云系統(tǒng)和大數(shù)據(jù)架構(gòu),顧名思義,比傳統(tǒng)的數(shù)據(jù)倉庫系統(tǒng)要便宜不少,"咨詢公司EY的分析學(xué)全球領(lǐng)導(dǎo)人Beatriz Sanz Saiz補充說。
"另外,數(shù)據(jù)和分析的應(yīng)用通常是為了實現(xiàn)三個結(jié)果:提高流程效率、收入增長和主動風(fēng)險管理,"Saiz說。"所以總的來說,數(shù)據(jù)和分析的應(yīng)用給任何公司都帶來了巨大的成本效益。"
誤區(qū)2:您需要大數(shù)據(jù)來執(zhí)行分析
對許多人來說,大數(shù)據(jù)和分析的概念是相輔相成的。他們的想法是,企業(yè)在進(jìn)行分析之前需要收集大量的數(shù)據(jù),以產(chǎn)生商業(yè)洞察力,改善決策等。
當(dāng)然,大數(shù)據(jù)分析的好處已經(jīng)被充分證實,擁有資源的公司確實可以通過利用其數(shù)據(jù)存儲作為分析工作的一部分來獲得巨大的競爭優(yōu)勢。但認(rèn)為大數(shù)據(jù)是分析工作的必要條件的想法并不正確。
"很多時候,人們試圖捕捉盡可能多的數(shù)據(jù);他們聽到'大數(shù)據(jù)'就會感到興奮,"人事公司Allegis Global Solutions的商業(yè)智能執(zhí)行總監(jiān)Tim Johnson說。"人們的誤解是,數(shù)據(jù)越多越好,機器會把它全部整理出來。"
然而,分析師需要的不是更多的數(shù)據(jù),而是具體的數(shù)據(jù)。"約翰遜說:"95%的用戶正在尋找與他們的工作相關(guān)的信息,并支持決策和改善績效。與其關(guān)注更多的數(shù)據(jù),企業(yè)必須考慮業(yè)務(wù)用戶,不僅要確定他們需要訪問什么數(shù)據(jù),還要確定數(shù)據(jù)的呈現(xiàn)方式。"
約翰遜說:"以多種格式提供對每一點信息的訪問可能會讓人不知所措,而且實際上會扼殺采用。"相反,要找出什么對他們來說是重要的,以及你如何以最簡單的格式向他們展示這些信息"。
誤區(qū)3:分析消除了人為偏見
自動化系統(tǒng)的執(zhí)行方式不應(yīng)該是有偏見的。但技術(shù)是由人類建立的,所以消除所有偏見幾乎是不可能的。有些人認(rèn)為分析和機器學(xué)習(xí)消除了人類的偏見。
"不幸的是,這完全不是事實,"全球技術(shù)咨詢公司ThoughtWorks的技術(shù)主管邁克-梅森說。"算法和分析是使用'訓(xùn)練數(shù)據(jù)'進(jìn)行調(diào)整的,并且會重現(xiàn)訓(xùn)練數(shù)據(jù)所具有的任何特征。"
梅森說,在某些情況下,這將給分析結(jié)果帶來良性偏差;在其他情況下,則會出現(xiàn)更嚴(yán)重的偏差。"他說:"僅僅因為'算法這么說'并不意味著答案是公平或有用的。
誤區(qū)4:最好的算法總是贏家
實際上,事實證明,只要有足夠的數(shù)據(jù),"有時算法并不重要",梅森說。在他引用的一篇IEEE文章"數(shù)據(jù)的不合理的有效性"中,谷歌工程師認(rèn)為,簡單的統(tǒng)計模型,加上極其大量的數(shù)據(jù),比包含大量特征和總結(jié)的"智力超群"的模型取得更好的結(jié)果。
"在某些情況下,只要壓縮更大的數(shù)據(jù)堆就能取得最好的結(jié)果,"梅森說。
誤區(qū)5:算法是故障安全的
約翰遜說,人們固有的對統(tǒng)計模型和算法的信任程度很高,而且隨著企業(yè)建立他們的分析項目,他們越來越依賴復(fù)雜的模型來支持決策。
"因為人們不了解模型、算法和其他先進(jìn)的數(shù)據(jù)科學(xué)實踐,所以他們對它們信任,"約翰遜說。用戶不覺得他們有知識來挑戰(zhàn)這些模型,所以他們必須相信建立這些模型的"聰明人",他說。
"在過去的50到60年里,我們聽說人工智能將在20年內(nèi)接管這一切,而且我們將繼續(xù)聽到人們這樣說,"約翰遜說。"在我們可以公然相信機器學(xué)習(xí)和結(jié)果之前,還有很多地方需要覆蓋。在此之前,我們需要挑戰(zhàn)那些建立算法和模型的人,讓他們解釋答案是如何得出的。這并不是說我們不能依賴結(jié)果;而是說我們需要透明度,以便我們能夠信任和驗證分析結(jié)果。
誤區(qū)6:數(shù)據(jù)科學(xué)是一門神秘的"黑色藝術(shù)"
近年來,數(shù)據(jù)科學(xué)這門學(xué)科受到了很多關(guān)注,有時會讓人對它到底是什么產(chǎn)生混淆?;旧希婕笆褂盟惴▉韺ふ覕?shù)據(jù)中的模式。
"數(shù)據(jù)科學(xué)似乎很神秘,因為這些算法能夠分析更多的變量和更大的數(shù)據(jù)集,而不是人的大腦所能理解的,"數(shù)據(jù)存儲公司美光的首席信息官Trevor Schulze說。
"Schulze說:"隨著近年來計算能力和內(nèi)存的擴展,我們現(xiàn)在能夠快速解決那些在10年前用任何技術(shù)都無法解決的問題。"數(shù)據(jù)科學(xué)是統(tǒng)計推理技術(shù)的自然演變,這些技術(shù)幾十年來一直被人們所熟知。一旦你理解了數(shù)學(xué),數(shù)據(jù)科學(xué)就沒有什么神秘的。
誤區(qū)7:要做更多的數(shù)據(jù)科學(xué),你需要更多的數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家是如今所有技術(shù)專業(yè)人員中需求量最大的。如果他們重新指導(dǎo)他們的工作內(nèi)容,也許組織可以用更少的這些專業(yè)人員。
"梅森說:"很多數(shù)據(jù)科學(xué)家的時間都花在了非增值活動上,比如尋找數(shù)據(jù)集,把數(shù)據(jù)帶到可以工作的地方,以及轉(zhuǎn)換和清理數(shù)據(jù)。"鑒于雇用數(shù)據(jù)科學(xué)家有多難,這些低價值的任務(wù)并不是你希望他們從事的。
"Uber的米開朗基羅平臺允許數(shù)據(jù)科學(xué)家專注于特征工程、提取和分析,而不是到處搬運數(shù)據(jù),因此允許他們大規(guī)模地提高生產(chǎn)力,"梅森說。
誤區(qū)8:分析時間太長
如今,快速完成工作——無論是將產(chǎn)品或服務(wù)推向市場,還是近乎實時地回應(yīng)客戶的詢問,都是公司的一個重要競爭考慮。分析聽起來像是需要很長時間才能完成的事情,與實現(xiàn)速度和敏捷性的目標(biāo)相悖。
Saiz說:"仍然存在這樣的神話,即這些類型的項目需要太長的時間,而且相當(dāng)復(fù)雜。"在一天結(jié)束時,你會發(fā)現(xiàn)這一切都與人才有關(guān)。有了正確的技能組合和敏捷方法的應(yīng)用,大問題可以在幾天或幾周內(nèi)得到解答,而不是幾個月。"
誤區(qū)9:技術(shù)是困難的部分
隨著當(dāng)今可用技術(shù)數(shù)量的不斷增加,選擇正確的工具組合來部署和集成以從分析團隊獲得所需的結(jié)果并不是一件容易的事,咨詢公司ISG的IT采購和數(shù)字咨詢服務(wù)總監(jiān)James Burke說。
然而,真正困難的部分是"將組織結(jié)構(gòu)和運營模式放在一起,將人員,流程,技術(shù)角度所需的所有內(nèi)容放在一起,"Burke說。"此外,你如何在現(xiàn)有組織內(nèi)部或'旁邊'做到這一點,對于組織來說似乎是最困難的。
同樣重要的是,不要假設(shè)分析工具將完成所有工作。"僅靠技術(shù)永遠(yuǎn)無法解決任何業(yè)務(wù)問題,"咨詢公司W(wǎng)est Monroe技術(shù)實踐的高級主管Greg Layok說。"在急于創(chuàng)建數(shù)據(jù)湖的過程中,組織反而陷入了沼澤,或者這可能是任何人都難以弄清楚的信息泥沼。
技術(shù)并不能解決分析問題,Layok說。"首先,確定一個業(yè)務(wù)問題,然后問,'我需要什么數(shù)據(jù)來解決這個問題?'"他說。"這將幫助您識別組織內(nèi)的數(shù)據(jù)差距。"
誤區(qū)10:數(shù)據(jù)分析應(yīng)該是一個獨立的部門
咨詢和數(shù)據(jù)收集公司Delvinia的總裁兼首席創(chuàng)新官Steven Mast說,在一些組織中,數(shù)據(jù)分析作為一個部門獨立運作,而在其他組織中,它被深深嵌入到一個跨職能的團隊中。
"馬斯特說:"然而,鑒于所有業(yè)務(wù)領(lǐng)域的數(shù)據(jù)爆炸和變化的速度,部門模式是行不通的。"隨著組織變得更加以客戶為中心,數(shù)據(jù)驅(qū)動的分析專家應(yīng)該是一個業(yè)務(wù)部門的核心,而不是作為一個你打電話尋求支持的部門來運作。"
馬斯特說,今天組織面臨的許多復(fù)雜問題都在業(yè)務(wù)部門內(nèi),而這些問題的許多解決方案都隱藏在數(shù)據(jù)中。"數(shù)據(jù)科學(xué)家和專家,與這些業(yè)務(wù)部門密切合作,并使用大型數(shù)據(jù)集和人工智能,將是孵化下一代產(chǎn)品、服務(wù)和客戶體驗的關(guān)鍵。"
誤區(qū)11:分析只適合博士
分析團隊中有很多受過良好教育的人是很好的,但這并不是成功的要求。
"公司傾向于認(rèn)為,如果沒有博士加入,他們將無法進(jìn)行一流的分析,"Saiz說。"現(xiàn)代分析需要融合各種技能——那些對新興技術(shù)和開源軟件很精通的人。建立具有不同技能的'豆莢'包括大數(shù)據(jù)架構(gòu)師、數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、數(shù)據(jù)可視化專家等等,這才是最重要的。"
誤區(qū)12:人工智能將摧毀就業(yè),破壞經(jīng)濟
歷史上,新技術(shù)的引入擾亂了許多工作和行業(yè),人們擔(dān)心人工智能將消除對人執(zhí)行某些任務(wù)的需求。
"人工智能解決方案在解決某些種類的問題方面比人要好得多,"舒爾茨說。"人工智能可以讀得更快,記得更多,計算復(fù)雜的數(shù)學(xué)關(guān)系比任何一個人都好。然而,人工智能沒有能力處理真正新穎的情況,而這正是人類擅長的地方。"
舒爾茨說,可以肯定的是,某些工作已經(jīng)因人工智能的發(fā)展而失去或減少,其他工作也將隨之而來。"他說:"但是,我們?nèi)祟惱斫夂吞幚硗耆豢深A(yù)見的情況的能力不會被任何目前理解的人工智能技術(shù)所取代。"在可預(yù)見的未來,對人工智能最有效的方法將是用人工智能系統(tǒng)增強人類的能力,執(zhí)行一些算法優(yōu)于人的'重活'。雖然許多工作將因人工智能而改變,但人將繼續(xù)是這個商業(yè)生態(tài)系統(tǒng)的關(guān)鍵部分。"