數(shù)據(jù)主義,未來一切都將數(shù)據(jù)化
1、大數(shù)據(jù)不是獨奏,而是不斷連接、無處不在的數(shù)據(jù)
作者在阿里就經歷了4個不同階段:數(shù)據(jù)驅動決策、數(shù)據(jù)驅動流程、數(shù)據(jù)驅動產品、數(shù)據(jù)驅動業(yè)務。在此過程中,你會發(fā)現(xiàn),數(shù)據(jù)驅動的目標越模糊、數(shù)據(jù)越零散、人的互動環(huán)節(jié)越多,智能項目開展起來就越吃力。
商業(yè)基礎正因眾多終端帶來的全域大數(shù)據(jù)而發(fā)生著改變。它帶來的變革不限于數(shù)據(jù)本身,還有思考社會和商業(yè)模式將如何被改變的全新角度。這么多零散的數(shù)據(jù)和維度疊加在一起,下一難題就變成了如何保證有效地存儲、更新、辨識和連接這些數(shù)據(jù),并靈活地使用它們。當數(shù)據(jù)從傳統(tǒng)PC端轉移到移動終端時,我們往往會遇到兩大誤區(qū)。第一個誤區(qū)是把智能手機當作一個新增的媒體渠道,相當于另一個屏幕,這是完全不夠的。手機作為功能設備產生的行為數(shù)據(jù),不僅有時間維度,還有空間維度和社交維度,這么多維度疊加在一起,分析的層面和方式也遠遠多于傳統(tǒng)網(wǎng)頁。第二個誤區(qū)是用同樣的方式考評PC端和移動終端。在PC端,我們更關注流量轉換的指標,而移動終端更在乎的是參與度。
與大數(shù)據(jù)的4V(量大、多樣、速度、價值)相比,移動大數(shù)據(jù)的核心重在實時(real time)、適時或最佳時機(right time)以及全時(all the time)。任何一個完整的高效服務都離不開這3T。
2、數(shù)據(jù)相關性比數(shù)據(jù)本身更重要
在信息爆炸時代,擁有大量信息可能是災難而不一定是好事,也不等于你有能力用好它。從業(yè)務過程中收集信息、分類信息、整合信息,必須要成為日常思維的一部分,這是成為數(shù)據(jù)驅動型公司的必要條件。
用上了“無中生有”的伎倆,并量化了早上的會議,目標是了解集團CEO關注什么。我快速將其他人演講的內容記錄下來,同時記錄了在其他人演講期間CEO的幾個動作信號:點頭、寫筆記和發(fā)問。大家可能已經明白,我是在量化領導對每一個主題演講的專注度。當然,如果領導從頭到尾都在玩手機的話,說明他對內容根本不感興趣。領導的一舉一動,無疑都間接地反映了他對什么內容比較關注或者有想法,什么內容是被他當垃圾扔掉的。
一切皆可量化,表面上看似不存在的數(shù)據(jù),其實也是有跡可循的。量化是對被量化的事物的一種映射,就像照X光片。關鍵是,我們要明白量化后的數(shù)據(jù)是為了解決什么問題,以及在量化的過程中如何降低噪聲,增加穩(wěn)定性。當我們學會量化以后,就是一個個從無到有的過程,很多重要的東西就這么“無中生有”了。這也是在新時代的特質下,企業(yè)想要實現(xiàn)“彎道超車”的一個難得的快捷方式。記住,要學會無中生有的量化,要有足夠的觀察、足夠的理解及數(shù)據(jù)收集。
我們就應該做到以下幾點:澄清什么是X。例如,你想量化“開心”,但究竟什么是“開心”?“開心”跟“快樂”是否一樣?你需要不斷用問題去澄清X!如何量化X?如果我們認為開心的表現(xiàn)是笑,那我們可以量化“微笑”嗎?面部情感識別的技術,微軟已經有較成熟的軟件了。量化之后能夠增加我們對X的了解或者減少不確定性嗎?我們能否找到量化后的“開心”指數(shù),并在應用中確認其價值?否則只能回到第一步,重新澄清什么是X。
3、數(shù)據(jù)流動在于利益關系
阿里時,作者是怎么處理部門間數(shù)據(jù)互通這件事情的呢?很簡單,首先是找出大家有意愿共用的部分,我稱其為企業(yè)內的公共數(shù)據(jù),然后安排資源把這一部分先建設起來。選擇公共數(shù)據(jù)也有一定的技巧,簡單歸類就是:各部門已經在高頻率但低效率的單線流通的數(shù)據(jù),被野蠻重復復制到各部門的相同數(shù)據(jù),大家都有意愿首先標準化的數(shù)據(jù)。當這些帶有公共性質的核心數(shù)據(jù)建立起來之后,大家就能更容易地感受到數(shù)據(jù)高質量流通的意義及好處。要保證這些數(shù)據(jù)的質量和新鮮度也相對變得容易了。
數(shù)據(jù)應用的理解歷程:第一個階段用數(shù)據(jù),第二個階段養(yǎng)數(shù)據(jù),第三個階段從看數(shù)據(jù)到用數(shù)據(jù)。
如果讓我總結這其中的精髓,我的秘訣是:數(shù)據(jù)分析也要講究用戶體驗。數(shù)據(jù)產品設計的切入點必須要問“目標問題是什么”“什么樣的數(shù)據(jù)才能解決這個問題”。只有得到用戶的信任,我們才能夠做出更多的好產品。產品需要不斷迭代,而非一勞永逸。這就是我們做產品的理念。
二、數(shù)字經濟引擎,智能商業(yè)的核心
1、不懂商業(yè)就別談數(shù)據(jù)
數(shù)據(jù)產業(yè)的另一關鍵是開源的小區(qū)、公司之間的合作與競爭關系并存。從數(shù)據(jù)的收集到使用,我們要學會與生態(tài)中的各種角色競合,因為沒有人能單槍匹馬地完成整張數(shù)據(jù)大圖。懂得這個道理的公司才會是未來的數(shù)據(jù)之王。數(shù)據(jù)使用權必然會是未來企業(yè)之間最大的競爭空間,當然也可能是最大的合作空間。
任何安全原則要想得到業(yè)務方面的支持,就必須契合企業(yè)的商業(yè)目標、風險承受能力和部署能力。而今天,大部分企業(yè)的管理層對數(shù)據(jù)安全還沒有達成共識,要做到這些相當困難。
阿里在數(shù)據(jù)化實踐過程中有三大原則:相信數(shù)據(jù)是未來所有業(yè)務的核心競爭力。不在線的數(shù)據(jù),不是大數(shù)據(jù)。數(shù)據(jù)的有效使用與高度流通要有互惠互利機制。如果我對你說,2010年時,阿里的數(shù)據(jù)化運營也是摸著石頭過河,最初的數(shù)據(jù)分析產品還不到50個用戶,業(yè)務方對數(shù)據(jù)化管理一點也不感冒,大家可不要感到奇怪。
數(shù)字經濟引擎包括4種形態(tài),分別是數(shù)據(jù)驅動決策、數(shù)據(jù)驅動流程、數(shù)據(jù)驅動產品以及數(shù)據(jù)驅動數(shù)據(jù)。
所以,我對有意布局數(shù)字經濟的企業(yè)有8個建議:關注業(yè)務決策的過程,從問題中尋找數(shù)據(jù)化的機會。企業(yè)數(shù)據(jù)能力的泛化,要建立在數(shù)據(jù)產品的靈活性上。建立規(guī)范,確保數(shù)據(jù)供應的質量及穩(wěn)定性。促進企業(yè)內部數(shù)據(jù)共創(chuàng)與共享機制的建立。建設外部數(shù)據(jù)積累及有使用權的數(shù)據(jù)戰(zhàn)略儲備。培養(yǎng)海量數(shù)據(jù)的深度分析能力。阻礙大數(shù)據(jù)發(fā)展的是倫理和法規(guī)。把“門窗”關好,數(shù)據(jù)越多,責任越大。
從被動走向主動、從靜態(tài)檢討轉向動態(tài)學習,數(shù)據(jù)閉環(huán)系統(tǒng)的理論和架構沒有太多改變;改變的只是科技在閉環(huán)系統(tǒng)中對斷點的修補、第三方數(shù)據(jù)對視野的開拓、人對自己在閉環(huán)系統(tǒng)中所扮演角色的定位及價值的認知,以及反應速度不斷提高的閉環(huán)系統(tǒng)本身。
2、智能時代,數(shù)據(jù)才是根本
我們并不缺少數(shù)據(jù),我們缺少的是對數(shù)據(jù)戰(zhàn)略的想象,以及看見調制解調器之后動手擷取的能力。
首先,我們必須有足夠高遠的眼界,“知道有”這些數(shù)據(jù)的存在;其次,我們要有足夠的知識與經驗,“知道用”這些數(shù)據(jù)去解決當下面臨的問題;最后,關鍵是有足夠的技術與知識,“懂得用”這些數(shù)據(jù),利用它們解決相關問題。
要從戰(zhàn)備上對大數(shù)據(jù)進行應用,企業(yè)現(xiàn)階段務必要培養(yǎng)幾個基礎能力。
第一,更廣泛地連接萬物。
第二,從被動接收到主動收集。
第三,更深入地分析,更準確地行動。
第四,更高速、更全面地學習。
互聯(lián)網(wǎng)領域,數(shù)據(jù)的規(guī)模、活躍度,以及收集、運用數(shù)據(jù)的能力,已經成為企業(yè)的核心競爭力之一。在深入洞悉市場、快速精準地找出應對策略時,數(shù)據(jù)已經成為企業(yè)實現(xiàn)更大商業(yè)價值的最強驅動力。當然,數(shù)據(jù)作為一種企業(yè)資產,需要與其他資產,如人力資源、硬件等相互組合才能發(fā)揮出最大的價值。
人工智能因大數(shù)據(jù)而重生,但制約人工智能在各領域實現(xiàn)更廣泛利用的,并不是算法不夠先進,而是缺乏高質量的數(shù)據(jù)。若想開發(fā)最先進的機器學習技術,能否獲得高質量的訓練數(shù)據(jù)極為關鍵,而如何啟動是大部分企業(yè)的一個難題。
每家公司的數(shù)據(jù)獲取策略不盡相同,但回想這么多年我在阿里也算面對了不少類似的困難,希望拋磚引玉與大家分享幾點。從零開始創(chuàng)建好的專有數(shù)據(jù)集,幾乎永遠意味著,預先投入大量人力收集數(shù)據(jù)。但更痛苦的是,業(yè)務變化的同時,數(shù)據(jù)結構也需要時時更新,正如前輩所說:“數(shù)據(jù)集成的同時已經在斷裂。”即使是表面上擁有很多數(shù)據(jù),但在運用機器學習時,仍會發(fā)現(xiàn)數(shù)據(jù)量的不足。你需要的數(shù)據(jù)量與你試圖解決的問題緊密相關。數(shù)據(jù)的收集、處理、運用,短期來說肯定是越貼近業(yè)務越有效率,然而從長遠看并不利于數(shù)據(jù)的標準化及重復使用,導致開發(fā)周期變得漫長。我的經驗是,起點可以從最小化應用做閉環(huán),基于眾多應用做長線規(guī)劃。確保早期創(chuàng)造的應用有足夠的吸引力,讓業(yè)務方及使用者甘愿交出他們的數(shù)據(jù)。大數(shù)據(jù)落地除了關乎技術問題,亦系于業(yè)務方及個人的意愿是否足夠。只有互利互惠,才有長久合作。在大范圍使用大數(shù)據(jù)之前,必須嚴肅地面對數(shù)據(jù)的標準和質量問題,否則后果堪憂。數(shù)據(jù)驅動型企業(yè)須明白,數(shù)據(jù)質量是全部員工的責任,并不僅僅是技術問題。大數(shù)據(jù)安全是一個命門,數(shù)據(jù)越多,責任越大,而且有時候會超出你的想象。原以為很安全的數(shù)據(jù)拼合其他數(shù)據(jù)之后,可能成為機密級別。
3、數(shù)據(jù),未來企業(yè)的核心資產
數(shù)據(jù)的存在是為了能夠有效地解決問題,而解決問題的核心與關鍵還是在于預測??蛻舻男袨閿?shù)據(jù)不一定能產生交易,但可以讓我們更了解他,讓我們知道他為什么會買或者為什么不會買。通過行為數(shù)據(jù)去發(fā)現(xiàn)客戶如何做決策是個重要課題,即使是負面數(shù)據(jù)也可能有正面作用。
中小企業(yè)要有清晰的具體目標:希望數(shù)據(jù)幫自己做什么、數(shù)據(jù)能解決什么問題。必須謹記,我們面對的是消費者,數(shù)據(jù)的收集、整合、決策、反饋都必須從消費者出發(fā),以人為中心。這樣才不至于太分散,盲目地“為了數(shù)據(jù)而數(shù)據(jù)”。另外,企業(yè)不應把客戶看成一個整體,因為解決了客戶的一般性需求,不等于了解了客戶的特殊需求。在大數(shù)據(jù)的驅動下,批量生產的個性化或許并非遙不可及。
在清洗數(shù)據(jù)時,定義一個數(shù)據(jù)口徑的地方,往往便是成敗的分水嶺。若對數(shù)據(jù)口徑和商業(yè)之間的理解不夠,便會影響到我們最初的認知,事倍功半。