回首過去十年,我們見證了大數(shù)據從概念誕生到行業(yè)落地,逐漸發(fā)展到基于數(shù)據中臺驅動決策的數(shù)據智能時代。作為后互聯(lián)網時代的產物,數(shù)據智能必將是未來很長一段發(fā)展階段的核心所在。
每日互動(個推)作為數(shù)據智能行業(yè)的代表企業(yè)之一,于今年迎來了第一個十年。在這十年間,個推以消息推送起家,借助技術力量拓寬以數(shù)據智能為核心的業(yè)務范疇,現(xiàn)已成長為一家在A股上市的數(shù)據智能企業(yè)。
但"數(shù)據智能"這個詞,對于大眾來說仍然相對比較陌生。數(shù)據行業(yè)從業(yè)者如何定義"數(shù)據智能"?過去的十年間,個推經歷了怎么樣的發(fā)展歷程?
在個推十周年之際,SegmentFault思否帶著以上這些問題,對個推CTO葉新江進行了一次專訪。
一、何謂"數(shù)據智能"?
隨著移動互聯(lián)網時代的到來,互聯(lián)網內容傳播和展現(xiàn)形式發(fā)生了巨大的變化,也讓數(shù)據的量級和形態(tài)發(fā)生了改變,數(shù)據服務也隨之發(fā)生了轉變。傳統(tǒng)的數(shù)據服務基本只針對于數(shù)據本身,而數(shù)據智能作為一種由數(shù)據、算力和算法等驅動的技術手段,具備著賦能企業(yè)進行管理和決策的能力。
1、數(shù)據智能是今年非常熱門的一個話題,能否談談對于「數(shù)據智能」和「數(shù)據中臺」的定義與理解?
目前數(shù)據經濟在國家層面是一個非常重要的發(fā)展方向,但同時也延伸出了一個亟待解決的問題--如何把各個行業(yè)的數(shù)據作為生產要素,通過數(shù)據治理發(fā)揮出更進一步的作用。
針對看不見摸不著的數(shù)據,需要有一個東西能進行有感管理,數(shù)據中臺就是一種用來進行數(shù)據治理的產品或者平臺,而數(shù)據智能則屬于一個更為廣義的范疇,它是以數(shù)據作為生產資料,通過結合大規(guī)模數(shù)據處理、數(shù)據挖掘、機器學習、人機交互、可視化、云計算等多種技術,從大量的數(shù)據中提煉、發(fā)掘、獲取知識,為人們在制定決策時提供有效的支持,減少或者消除不確定性的解決方案。
這兩個詞看起來很接近,但其實是不同維度的。以我們公司來講,數(shù)據中臺更多的是一個產品,體現(xiàn)了我們公司的數(shù)據能力;而數(shù)據智能則包含更多技術,融合了更多的行業(yè)知識,中臺是其中一個很重要的工具。打一個形象的比喻,數(shù)據中臺或者平臺是一個電腦的操作系統(tǒng),而數(shù)據智能則是結合業(yè)務,使用這個電腦,利用多種技術進行APP開發(fā),并且不斷進行優(yōu)化的過程。
2、您認為數(shù)據中臺的「行業(yè)壁壘」和「技術壁壘」分別是什么?個推作為一個成功上市的專業(yè)數(shù)據智能服務公司,自身在這個領域內具備的最大優(yōu)勢是什么?
目前市面上有很多數(shù)據中臺類的產品,據我們觀察,其中大部分的重點仍主要聚焦于數(shù)據治理的能力,但這可能只是數(shù)據中臺的"第一步"。
對于數(shù)據中臺產品來講,技術壁壘可能并不是很高。中臺會應用到的技術,雖然有些功能可以通過直接使用開源產品來實現(xiàn),但也有不少標準或者要求,比如安全性、實時性、可視化能力等,需要專業(yè)的技術來定制實現(xiàn)。
當然在數(shù)據中臺層面,采用的技術架構不同、產品設計的理念不同也是可以有差異的,譬如是否容易使用、容易理解、對資源要求是否經濟等。
如果希望通過數(shù)據中臺中來解決業(yè)務問題,實現(xiàn)降本增效或者發(fā)現(xiàn)新的業(yè)務模式,這就不是數(shù)據治理能解決的問題,需要有對行業(yè)的深度理解,也就是所謂的行業(yè)壁壘。
個推和其他大數(shù)據公司的差別,就體現(xiàn)在如何挖掘數(shù)據價值的層面。
個推的第一款產品是消息推送服務,這是一項跟數(shù)據緊密相關的業(yè)務。為了支撐這項業(yè)務的進行,實現(xiàn)消息推送在海量數(shù)據量下的快速響應,個推一直在嘗試為企業(yè)內部打造一個業(yè)務+數(shù)據平臺的協(xié)同閉環(huán)。這也為之后公司推出數(shù)據服務產品打下了很好的基礎。
在數(shù)據服務層面,個推既是服務的提供者也是使用者,這是我們在這個領域內最大的優(yōu)勢。
3、數(shù)據服務領域是否有一套標準化的判定體系?如何評定服務能力與技術水平的高低?
數(shù)據服務領域暫時還沒有一套國際或者國家權威機構提出的行業(yè)標準。究其原因,是因為數(shù)據服務在不同的行業(yè)間有著很大的差別,與一般的技術體系相比,具備更強的服務屬性。
對于客戶來說,挑選數(shù)據服務的時候會有幾個考量的維度:
平臺是否可以快速部署;
部署所耗費的資源是否合理;
能否借助數(shù)據服務快速實現(xiàn)業(yè)務提升;譬如是否能快速開發(fā)出業(yè)務的新需求,是否能很好地完成內部各個角色之間的協(xié)同。
這三項標準會是客戶選擇服務時的決策依據。但在選擇完之后,服務商應該如何完成、如何實現(xiàn)客戶提出的需求,因為沒有清晰的界定與評判方式,需要客戶在選型時進行綜合性的考慮,并在后續(xù)實際的業(yè)務場景中去感受平臺的服務能力。
這種情況其實也和市場需求有關。目前國內企業(yè)提出的需求都較為"定制化",再加上不同行業(yè)間的差異,導致國內的數(shù)據服務公司大部分是結合行業(yè)提供垂直的數(shù)據服務能力。
二、個推發(fā)展的每一步,踩的都是行業(yè)需求
我國的數(shù)字經濟發(fā)展才剛剛開始,數(shù)據智能服務的能力也在不斷迭代、發(fā)展。人工智能、區(qū)塊鏈、知識圖譜、可視化等新興技術,都可以作為底層的技術支撐為數(shù)據智能服務賦能,從而讓我們的數(shù)據服務具備更強大的能力,產生更多價值。
1、個推的發(fā)展經歷了多個階段,技術也在不斷迭代和演進。能否簡要分享一下不同階段的業(yè)務邏輯重點以及技術研發(fā)重點?
個推是我們的消息推送產品,做得比較早并且比較成熟了。但其實我們公司發(fā)展到現(xiàn)在已經十年了,業(yè)務范疇也早就不止是消息推送了。
公司發(fā)展的第一個階段是2010年到2013年。當時我們的核心團隊主要是在打磨消息推送的能力,也就是一套大規(guī)模的通信系統(tǒng)+互聯(lián)網搜索系統(tǒng),這是一個比較垂直但對于技術要求很高的領域。
2014年至2018年,公司進入了數(shù)據價值的"掘金"與"實踐"階段。在不斷精進推送能力的同時,我們發(fā)現(xiàn)系統(tǒng)產生了非常多的數(shù)據,如何讓這些數(shù)據發(fā)揮價值成為了我們需要思考和解決的問題。也是從這個階段開始,個推開始致力于大數(shù)據系統(tǒng)的研發(fā)。
個推的消息推送產品每天會產生幾十個T的數(shù)據,如何存儲、清洗、建模,如何在業(yè)務場景中產生商業(yè)化的價值,這是這一階段我們的研發(fā)重點。經過幾年的業(yè)務培養(yǎng)與場景實踐,我們將在數(shù)據服務領域沉淀下來的能力和know how(知識、經驗、流程),變成一種可以服務于更多行業(yè)的產品,可以說公司正式進入到了數(shù)據智能的階段。
2019年3月,每日互動成功在A股創(chuàng)業(yè)板上市,也引起了數(shù)據智能領域的一次新風潮。
在今年的疫情過程中,個推數(shù)據智能的能力得到了相當程度的驗證。疫情期間,我們與李蘭娟院士取得聯(lián)系,與李蘭娟院士團隊合作成立聯(lián)合戰(zhàn)隊。通過大數(shù)據技術,聯(lián)合戰(zhàn)隊對疫情發(fā)展態(tài)勢進行了研判,幫助疫情防控部門找到工作重點區(qū)域、重點人群和重點場景。在全國逐步有序恢復生產的時候,個推也充分發(fā)揮大數(shù)據能力并參與其中,為多個省份的疫情聯(lián)防聯(lián)控與民生保障、復工復產的有序統(tǒng)籌提供了決策參考依據。
當然,個推的數(shù)據智能服務仍然是在不斷迭代發(fā)展的。隨著人工智能、區(qū)塊鏈、知識圖譜、可視化等等新興技術的發(fā)展,這項基于數(shù)據的服務也將產生更多的價值。
2、個推致力于打造"每日治數(shù)平臺",目標方向是什么樣的?與一般的中臺產品有什么區(qū)別?
「每日治數(shù)平臺」其實也是數(shù)據中臺的概念,但我們提供的數(shù)據服務主要是應用于數(shù)據治理領域,所以命名為治數(shù)平臺更為準確。
這個平臺還有一個提煉后的名字--DMP。D代表了數(shù)據(DATA),M代表了機器(MACHINE),而P則代表了人(PEOPLE)和專業(yè)(PRO)。這幾個關鍵詞也代表了我們平臺的定位,即數(shù)據作為底層資料,快速專業(yè)地服務于具體業(yè)務當中。
我國的數(shù)字經濟發(fā)展其實才剛剛開始,據了解,不少企業(yè)并不知道該如何進行數(shù)字化、智能化的轉型,業(yè)內也缺乏專業(yè)的數(shù)據人才。
因此,我們的目標方向和傳統(tǒng)的數(shù)據中臺不同。我們希望真正將個推knowhow的能力沉淀下來,形成客戶可以復用的服務或平臺產品。之所以想要打造這樣的一個平臺,背后其實也是基于用戶的實際需求。
3、個推的第一個客戶是哪家企業(yè)?
個推消息推送業(yè)務的第一個客戶是新浪微博。當時微博非常火,有著上億的用戶量,消息推送對他們來說是不可或缺的一項功能。
2011年,我們主動聯(lián)系了微博相關業(yè)務的負責人,表示可以提供專業(yè)的消息推送服務,用更低的成本來實現(xiàn)更好的效果,這也是我們能夠打動他們的原因。
之所以第一個客戶就敢挑戰(zhàn)"行業(yè)頂配"的難度,一方面是技術團隊自身具備扎實的技術基礎和行業(yè)基礎,另一方面就是前面提到的,我們在支持自身業(yè)務的過程當中沉淀下來的數(shù)據和技術能力。
有這樣一個需求明確的大客戶,讓我們的技術服務能力得以更加高效地迭代,大大加快了技術進步的速度。
接受挑戰(zhàn)并做到"極致",正是我們公司的工程師文化,對此我們感覺很自豪。
4、目前面向的客戶群體有哪些,涉及哪些領域?
隨著數(shù)據能力的增強,以及對于行業(yè)理解的不斷加深,我們目前的服務客戶已經擴展到四大領域--互聯(lián)網、公共服務、風控服務和品牌營銷服務。
以金融領域為例,很多金融機構內部有自己的App,涉及推送、統(tǒng)計、分析之類非常繁復的數(shù)據和信息處理場景。我們幫他們打造了一個集成的消息平臺中心,解決了消息處理的分散問題,改善了工作流程。在深度溝通之后,我們發(fā)現(xiàn)數(shù)據智能服務在金融行業(yè)中是一個非常重度的業(yè)務場景,為此我們也在考慮開發(fā)專門針對金融行業(yè)的治數(shù)平臺。
5、對于數(shù)據公司來說,數(shù)據安全是紅線。個推如何保障數(shù)據安全性?
個推團隊自建立之初,便非常注重對于數(shù)據安全的保障。正如問題所說,數(shù)據安全對數(shù)據公司來說是紅線,個推始終認為保護用戶數(shù)據隱私是企業(yè)必須要堅守和捍衛(wèi)的行業(yè)準則、道德底線,并要時刻保持對數(shù)據安全的敬畏之心。
個推在嚴格落實合規(guī)和監(jiān)管要求的同時,倡導行業(yè)自律,積極聯(lián)合行業(yè)伙伴的力量,共同推動行業(yè)的健康發(fā)展。今年8月,由個推牽頭起草的《信息安全技術移動互聯(lián)網應用程序(App)SDK安全指南》國家標準項目,獲得全國信息安全標準化技術委員會正式立項,這將有助于SDK行業(yè)在開發(fā)、運營、信息處理、安全管理等環(huán)節(jié)向更規(guī)范的方向邁進。
在今年的國家護網行動當中,個推在三四百家參選企業(yè)中不借助外部安全公司的力量,僅憑公司自身的安全能力,便取得了第11名的成績,還是很自豪的。
三、大數(shù)據的未來,是不提大數(shù)據但是數(shù)據又無處不在的時代,"你意識不到我的存在就是我最大的存在"
隨著數(shù)據產業(yè)的規(guī)模越來越大,生態(tài)分工在未來將會越來越細,數(shù)據服務也將越來越細。而隨著人工智能、云計算、物聯(lián)網等技術的發(fā)展,大數(shù)據會不會和互聯(lián)網一樣,不再成為人們單獨討論的概念,而是成為像水電一樣的基礎設施,服務于各行各業(yè)中?
1、隨著社會的發(fā)展,未來的數(shù)據會呈現(xiàn)多形態(tài)共存的狀態(tài)。您認為未來幾年大數(shù)據領域會出現(xiàn)什么樣的一些變化?哪些因素將推動這些變化?你們的生態(tài)布局是怎么樣的?
隨著5G的成熟,數(shù)據領域的發(fā)展將從基礎的量變迎來一次質變,成為像水電一樣的社會基礎設施。
近幾年大家其實很少再單獨討論互聯(lián)網的概念,其中的一個因素,我認為是互聯(lián)網已經不再是新鮮事物,現(xiàn)階段技術的發(fā)展基于互聯(lián)網但又高于互聯(lián)網,大數(shù)據之后的發(fā)展肯定也會這樣,數(shù)據智能的未來,雖然基于大數(shù)據,但是不會再單獨討論大數(shù)據的概念。
從技術層面來看,大數(shù)據行業(yè)的發(fā)展對海量數(shù)據的存儲、處理、挖掘需求肯定會越來越高,未來可能也會誕生出幾個巨頭,將行業(yè)進行更加明確的細分。這是一個大家已經能夠觀察到的趨勢。
隨著數(shù)據產業(yè)的規(guī)模越來越大,生態(tài)分工在未來將會越來越明確,數(shù)據類的服務也將越來越精細化。我們打造的個推每日治數(shù)平臺,就是希望能夠參與到生態(tài)的建設當中,甚至圍繞平臺打造出一種新的生態(tài)。
2、業(yè)內最近有個觀點:"云原生體系架構是云服務時代的數(shù)據管理方法論",從技術角度來看,您如何評判云與數(shù)據智能間的關系?
不同的人評價同一件事肯定會有不同的出發(fā)點,這個觀點看起來應該是云服務廠商提出的(笑)。很巧,我前一陣也跟吉利公司的人在討論這個問題,他們最近剛從一家云廠商中遷移出來。
對企業(yè)來說,上不上云、選擇公有云還是私有云、選擇哪家云廠商需要考慮幾個維度:成本吃不吃得消、是否自主可控、當不滿足業(yè)務需求或者服務需求時是否方便切換等。
以個推為例,我們目前不會將數(shù)據放到第三方的云上,但從資源的調度、成本的控制等方面來看,云體系已經是一個公認的標準答案,所以我們也會使用云計算的相關技術,比如容器云、虛擬化等。
3、物聯(lián)網、AI、機器學習等新技術的出現(xiàn),對行業(yè)來說是機會還是挑戰(zhàn)?個推應對技術的發(fā)展是否有做哪些前瞻性的探索?
新技術的出現(xiàn),對行業(yè)來講既是機會也是挑戰(zhàn)。每次新技術的出現(xiàn),都能為人類解放生產力或者提高生產力提供了可能性。
但一些技術因為過于"新",暫時還沒有找到發(fā)揮能力的場景,沒辦法發(fā)揮出實際的社會價值,讓企業(yè)的投入與產出不成正比。
個推還成立了數(shù)據智能研究院,目前研究的方向是探索如何將技術更好地服務于具體的業(yè)務當中。比如我們對物聯(lián)網技術方向的探索,是想將自身的推送技術能力延伸到電視機、汽車等場景當中;對機器學習和區(qū)塊鏈的探索則是為了進行一些業(yè)務模式的研究。
技術是面向未來的,但用戶的需求是現(xiàn)在的。對于我們來說,目前的重點還是如何借助技術快速迭代服務能力,為用戶以及行業(yè)賦能。
回顧大數(shù)據行業(yè)和個推的發(fā)展時間線,不難發(fā)現(xiàn)個推成立的這十年,恰巧也是大數(shù)據從一種輔助工具向引領發(fā)展方向的核心引擎轉變的十年。
隨著大數(shù)據行業(yè)的發(fā)展,國家正在大力發(fā)展數(shù)字經濟,企業(yè)正在迎來一波借助數(shù)據智能實現(xiàn)數(shù)字化、智能化的轉型新浪潮。在這股浪潮中,開始"治數(shù)"的每日互動將會扮演一個什么樣的角色?我們拭目以待。