今年以來,根據(jù)中國信息通信研究院《中國大數(shù)據(jù)發(fā)展調(diào)查報告2018》數(shù)據(jù)顯示,2017年我國大數(shù)據(jù)市場規(guī)模為236億元(該統(tǒng)計口徑是大數(shù)據(jù)核心產(chǎn)業(yè),包括大數(shù)據(jù)軟件、硬件和服務(wù)的直接產(chǎn)值,不包括附加值)。而同年,我國小龍蝦產(chǎn)業(yè)連年快速增長,市場規(guī)模超千億元。為何,作為信息時代核心資源、未來戰(zhàn)略高地的大數(shù)據(jù)產(chǎn)業(yè),在經(jīng)歷幾年的資本流入和產(chǎn)業(yè)發(fā)展之后,市場規(guī)模到頭來還遠比不上如此接地氣的小龍蝦產(chǎn)業(yè)?
Hype曲線透析大數(shù)據(jù)發(fā)展路線
為了客觀看待這個問題,我們需要認識、了解新興技術(shù)發(fā)展的Hype曲線。這是由Garnter公司公布的技術(shù)成熟度曲線,描述的是新技術(shù)、新概念在媒體上曝光度隨時間的變化。圖1是2016年Gartner公布的Hype曲線。任何新技術(shù)的出現(xiàn),都會經(jīng)歷五大周期:一是炒作期;二是隨著資本媒體的關(guān)注,達到一個期望峰值;三是新技術(shù)會遇到各種各樣的現(xiàn)實問題,往往現(xiàn)實不如期望般美好,因此會有一個泡沫破滅的下滑期;四是產(chǎn)業(yè)開始腳踏實地解決一個個實際問題,慢慢推動新技術(shù)的應(yīng)用和發(fā)展,從而進入穩(wěn)步爬升期;五是隨著關(guān)鍵短板的解決,技術(shù)會進入實質(zhì)性的規(guī)模商用期,真正實現(xiàn)其價值。
圖1 Gartner Hype曲線
如圖1藍色方框是大數(shù)據(jù),經(jīng)過前兩年的炒作,大數(shù)據(jù)產(chǎn)業(yè)開始發(fā)現(xiàn)并面臨一個個現(xiàn)實問題,只有解決了這些問題,才能真正推動大數(shù)據(jù)產(chǎn)業(yè)進步。值得注意的是,這個Hype曲線是Gartner2016年公布的,2017年Hype曲線并沒有大數(shù)據(jù)產(chǎn)業(yè),因為Gartner覺得大數(shù)據(jù)并非是新興技術(shù)。因此現(xiàn)在2018年,大數(shù)據(jù)產(chǎn)業(yè)的實際位置應(yīng)該相比上圖再稍微下移一些。
需突破3個發(fā)展瓶頸
問題來了,既然大數(shù)據(jù)產(chǎn)業(yè),現(xiàn)在面臨不那么美好的泡沫破滅期,那么未來我們究竟要解決哪些瓶頸和桎梏,才能推動其真正步入穩(wěn)步爬升期,體現(xiàn)出應(yīng)有的價值?筆者認為主要有以下3個方面的問題亟待解決。
第一要解決“不會”的問題。
大數(shù)據(jù)如果要作為產(chǎn)品和服務(wù)變現(xiàn),那么首先需要建立起數(shù)據(jù)資產(chǎn)的概念,把企業(yè)積累的數(shù)據(jù)當(dāng)做資產(chǎn)去經(jīng)營。“不會”用數(shù)據(jù)分為3個層次。第一個層次是壓根沒有建立起數(shù)據(jù)資產(chǎn)概念的問題。目前我國三大產(chǎn)業(yè)90多個行業(yè)中,除了少數(shù)行業(yè)如金融、電信、互聯(lián)網(wǎng)等行業(yè)的大數(shù)據(jù)探索起步較早之外,絕大部分行業(yè)對大數(shù)據(jù)技術(shù)認識不足,到底什么是大數(shù)據(jù)?該采集哪些數(shù)據(jù)?采集之后怎么用,能帶來什么效益?絕大部分行業(yè)在這一層次的認識較為匱乏。第二個層次是有了大數(shù)據(jù)的意識,但是存在數(shù)據(jù)整合的問題。由于一個企業(yè)內(nèi)部分為很多事業(yè)部,每個事業(yè)部又有多條生產(chǎn)線,除了生產(chǎn)數(shù)據(jù),還有管理系統(tǒng)數(shù)據(jù)、營銷數(shù)據(jù)、維修數(shù)據(jù)、客戶數(shù)據(jù)等。多種內(nèi)部的數(shù)據(jù)互相割裂,難以融合使用。第三個層次是數(shù)據(jù)實現(xiàn)了初步整合,但是沒有統(tǒng)一的數(shù)據(jù)標準,數(shù)據(jù)質(zhì)量難以管控的問題。同樣的數(shù)據(jù),在不同線條、不同事業(yè)部、不同部門間有不同的表征方式,對于主數(shù)據(jù)、元數(shù)據(jù)的管理極不規(guī)范,導(dǎo)致雖然能初步形成數(shù)據(jù)礦產(chǎn),但是卻是鐵礦、銅礦,價值不高。
一言蔽之,“不會”是數(shù)據(jù)源企業(yè)內(nèi)部的問題,要解決這個問題,亟待建立數(shù)據(jù)資產(chǎn)的概念,用科學(xué)的數(shù)據(jù)資產(chǎn)、科學(xué)的管理方法,把數(shù)據(jù)源形成可用的狀態(tài)。
第二要解決“不敢”的問題。
解決了數(shù)據(jù)源的原材料問題,接下來是數(shù)據(jù)流通的問題。根據(jù)《中國大數(shù)據(jù)發(fā)展調(diào)查報告2018》,企業(yè)運用大數(shù)據(jù)最多的領(lǐng)域,仍然是營銷分析、客戶分析和內(nèi)部運營管理三大塊(如圖2)。這3塊仍然是偏向內(nèi)部應(yīng)用。而企業(yè)使用的大數(shù)據(jù)的來源,主要是來自自身生產(chǎn)數(shù)據(jù)、用戶數(shù)據(jù)、內(nèi)部經(jīng)營管理數(shù)據(jù),使用的外部數(shù)據(jù)占比較小,整個大數(shù)據(jù)仍然處于“男耕女織”的相對封閉時代,其最根本的阻礙是數(shù)據(jù)的安全合規(guī)流通(如圖3)。雖然我國已出臺了大數(shù)據(jù)相關(guān)法律法規(guī),但仍然存在很多空白地帶,即灰色地帶。在這些灰色地帶,很多企業(yè)開始了嘗試,但是這些嘗試到底是合法還是非法,目前沒有定論。
圖3企業(yè)使用數(shù)據(jù)來源
數(shù)據(jù)流通我國存在兩極分化的現(xiàn)象。一方面,數(shù)據(jù)流通的“汽化狀態(tài)”,即數(shù)據(jù)如空氣般快速流通。但這樣勢必會忽視掉一些數(shù)據(jù)安全問題、數(shù)據(jù)泄漏問題、數(shù)據(jù)權(quán)屬問題。例如前段時間山東的“30億條”,就是有不法公司非法獲取運營商數(shù)據(jù)開展營銷、加粉等牟利。另一方面,是數(shù)據(jù)流通的“固化”狀態(tài),即數(shù)據(jù)根本不流通。我們也同樣看到,一些手握優(yōu)質(zhì)數(shù)據(jù)資源大型企業(yè),為了規(guī)避風(fēng)險,一刀切、不流通,這樣也同樣不適應(yīng)行業(yè)的發(fā)展。
為了解決這些問題,不能一味訴求于法律,因為法律不可能涉及到諸多場景細節(jié);不能一味訴求于政府,因為行政資源是稀缺的,不可能兼顧方方面面。最靠譜的方法就是行業(yè)推動來解決,通過先選取某些場景進行試點,再推廣開來,大家通過標準形成共識,一步一步解決這個世紀難題。
第三要解決“不清”的問題。
前兩個問題中,第一個是數(shù)據(jù)源自身的問題,第二個是流通中的問題,那么第三個問題便是與數(shù)據(jù)使用方相關(guān)的問題。目前,存在著很多“不清”:權(quán)屬不清、估值不清、存證不清等。大數(shù)據(jù)與普通商品和服務(wù)不一樣,A方賣給B方后,A方的使命就結(jié)束了,而大數(shù)據(jù)不是,大數(shù)據(jù)在經(jīng)過層層流轉(zhuǎn)之后,還保留著最初的印記,而A方與B方還有諸多“不清”需要解決。
首先是估值不清。當(dāng)前在我國大數(shù)據(jù)產(chǎn)業(yè),整體的商業(yè)模式大致可以分為3種,賣資源的、賣工具平臺的、賣解決方案的(此處暫不討論提供基礎(chǔ)設(shè)施的)。對于后兩種,有明確的商業(yè)模式和市場已有的參考??墒菍τ谫u數(shù)據(jù)資源的,類似于一種無形資產(chǎn),尚沒有統(tǒng)一、達成共識的價值評估方法。這樣就會形成不同的定價方式,高低價不均衡。
其次是權(quán)屬不清。用戶的個人數(shù)據(jù),經(jīng)過服務(wù)廠商采集、處理之后,權(quán)屬到底屬于誰?A方的數(shù)據(jù)流轉(zhuǎn)到B方后,數(shù)據(jù)是屬于A還是屬于B?A方的數(shù)據(jù)通過B方加工之后,A方是否還對數(shù)據(jù)擁有主權(quán)?這些都是亟待解決的問題。今年8月份,杭州互聯(lián)網(wǎng)法院宣判了我國首例大數(shù)據(jù)產(chǎn)品不正當(dāng)競爭案,在這個案件中,由淘寶在收集巨量原始數(shù)據(jù)基礎(chǔ)上,以特定的算法深度分析過濾、提煉整合并經(jīng)匿名化脫敏處理后形成的數(shù)據(jù)產(chǎn)品,其權(quán)屬是被肯定的,也給后續(xù)大數(shù)據(jù)相關(guān)糾紛提供了法律依據(jù)。
最后是存證不清。在大數(shù)據(jù)交易中,尤其是數(shù)據(jù)的多級交易中,數(shù)據(jù)授權(quán)、數(shù)據(jù)交易記錄等極為重要,這些能對數(shù)據(jù)濫用、數(shù)據(jù)泄露產(chǎn)生約束,從而規(guī)范整個行業(yè)的行為。目前行業(yè)中已經(jīng)出現(xiàn)了一些授權(quán)篡改、造假、偽造的情況,這會導(dǎo)致用戶信息的泄露。針對這個問題,行業(yè)已經(jīng)出現(xiàn)用區(qū)塊鏈的方式,進行大數(shù)據(jù)的存證記錄,后續(xù)有待進一步落地深化。
盡管如此,但我們相信,在大數(shù)據(jù)這幾年“緊日子”的前途仍是光明的。當(dāng)產(chǎn)業(yè)齊心協(xié)力,共同推動上述難點一步步解決,大數(shù)據(jù)應(yīng)有的價值便會充分釋放,熠熠生輝。