人工智能只是一種技術(shù)手段,數(shù)據(jù)資產(chǎn)最終決定人工智能的行業(yè)應(yīng)用發(fā)展,以及企業(yè)新的市場。
隨著互聯(lián)網(wǎng)、開源、云計算等技術(shù)的發(fā)展,企業(yè)在技術(shù)上會越來越接近。
不久的將來,超級摩爾定律下芯片計算力會有更大突破,人工智能作為一種技術(shù)能力將越來越普及,長期來看,技術(shù)能力上的差異會越來越小。
在行業(yè)應(yīng)用上,真正能建構(gòu)牢固“護(hù)城河”的核心要素一定落在數(shù)據(jù)上。
那么,數(shù)據(jù)又從哪些維度展開競爭呢?
第一,數(shù)據(jù)的品質(zhì)。
比如數(shù)據(jù)的準(zhǔn)確性、完整性、可追溯性、持續(xù)性、真實性和共享性。這些品質(zhì)決定著人工智能模型的質(zhì)量,也決定最終的落地成果。
第二,數(shù)據(jù)競爭存在先發(fā)優(yōu)勢。
那些占據(jù)著特定的應(yīng)用場景,并且更早、更多地獲取數(shù)據(jù)的領(lǐng)域,人工智能的優(yōu)勢會更明顯。
第三,數(shù)據(jù)的安全和隱私保護(hù),決定了人工智能應(yīng)用最終可以走多遠(yuǎn)。
一、提升數(shù)據(jù)品質(zhì)
針對特定領(lǐng)域的數(shù)據(jù)集越龐大、越真實、越準(zhǔn)確、越可追溯、維度越豐富、越協(xié)同共享,越能得出最佳算法并帶來競爭優(yōu)勢。
比如,在奈飛的網(wǎng)站上,圍繞用戶的維度,有性別、年齡、瀏覽過的電影、喜歡的明星、過往閱覽記錄等;圍繞某個電影的維度,有年代、導(dǎo)演、演員、風(fēng)格、題材、用戶評價等。
繞兩個主體的數(shù)據(jù)維度越豐富,越能在兩者間建立精準(zhǔn)匹配的關(guān)系,讓企業(yè)以更好的體驗擴(kuò)大用戶群,不斷強(qiáng)化自己的優(yōu)勢。
我們看到,App的用戶規(guī)模越大,往往越能更精準(zhǔn)地滿足個性化體驗。
比如,現(xiàn)在我們使用的一些音樂App已經(jīng)能夠精洞悉每個用戶喜歡的音樂風(fēng)格,并準(zhǔn)確推送喜歡的音樂。
對如何提升數(shù)據(jù)品質(zhì),企業(yè)可以在兩方面同時努力:
內(nèi)部,要有系統(tǒng)的規(guī)劃,實時采集和整理數(shù)據(jù),建立長期數(shù)據(jù)積累;
在外部,要有意識地構(gòu)建生態(tài)體系或者尋找合作伙伴,盡可能多地獲得相關(guān)數(shù)據(jù),且搭建統(tǒng)一架構(gòu),幫助數(shù)據(jù)互通。
二、數(shù)據(jù)的先發(fā)優(yōu)勢
數(shù)據(jù)競爭一定存在先發(fā)優(yōu)勢。企業(yè)越是占據(jù)特定的場景,更早、更多地獲取數(shù)據(jù),人工智能的優(yōu)勢就越明顯。
現(xiàn)在,數(shù)據(jù)尚未全面商品化,企業(yè)與企業(yè)之間的數(shù)據(jù)交換尚未暢通。
由于市場的復(fù)雜和競爭、數(shù)據(jù)安全和監(jiān)管等原因,企業(yè)或機(jī)構(gòu)不敢輕易開放數(shù)據(jù),企業(yè)或機(jī)構(gòu)需要通過自己的產(chǎn)品和生態(tài)體系來獲得更多數(shù)據(jù)。
從這個角度看,平臺型科技公司基于自己強(qiáng)大的數(shù)據(jù)基因,占有完全優(yōu)勢。
長期來看,數(shù)據(jù)是可以創(chuàng)造收益的資產(chǎn),是公司的核心競爭力,越早入局規(guī)劃,越能占據(jù)主動。未來數(shù)據(jù)全面商品化之后,價值會非常明顯。
三、數(shù)據(jù)安全和隱私保護(hù)
對數(shù)據(jù)安全和個人隱私的保護(hù)程度,決定了人工智能可以走多遠(yuǎn)。
數(shù)據(jù)安全有兩層含義:
一是保證用戶數(shù)據(jù)不損壞、不丟失,這種情況發(fā)生的概率不大,數(shù)據(jù)存儲在云端也安全得多;
二是保證數(shù)據(jù)不泄露或者濫用,這是主要的關(guān)注點。
無論在電子商務(wù)、航空旅行、金融借貸還是醫(yī)療行業(yè),全球已發(fā)生多起數(shù)據(jù)泄露的件,引發(fā)公眾的憤慨。
2017年,單是美國征信企業(yè)艾可菲(Equifax)一家公司的信息泄露就涉及多達(dá)1.43億人的姓名、住址、出生日期、社會保障號和駕照等敏感信息。
人們不可能縱容自己的數(shù)據(jù)隱私被侵犯。任由信息泄露和濫用,公司會陷入輿論的漩渦,商業(yè)發(fā)展的困境最終會阻礙人工智能的發(fā)展。
四、找到“強(qiáng)相關(guān)數(shù)據(jù)”
首先,無論大數(shù)據(jù)或小數(shù)據(jù),有價值的就是好數(shù)據(jù);其次,“大數(shù)據(jù)”這個詞,更多是一種思維方式和一個時代標(biāo)志。
實際的場景中使用的數(shù)據(jù)往往是有限的,真正有用的是“小數(shù)據(jù)”。
兵法上講,“傷其十指不如斷其一指”,大數(shù)據(jù)是一樣的道理,要用力在關(guān)鍵的“一指”上,不必追求“十指”面面俱到。
用戶源源不斷地產(chǎn)生數(shù)據(jù),目前對于企業(yè)來說,數(shù)據(jù)的收集和存儲能力并不構(gòu)成障礙。
癥結(jié)在于,90%的數(shù)據(jù)沒有被真正利用起來,成了“廢數(shù)據(jù)”。
主觀上,這與機(jī)構(gòu)的數(shù)據(jù)思維文化有關(guān),并不是所有公司都能像奈飛、亞馬遜那樣推崇用數(shù)據(jù)說話。
客觀上,則與數(shù)據(jù)的相關(guān)度有關(guān)。
比如一名用戶10年前的互聯(lián)網(wǎng)數(shù)據(jù),對于分析當(dāng)下或預(yù)測未來并沒有太多的作用,時間序列上的弱相關(guān)度,大大減弱了數(shù)據(jù)的效力。
相關(guān)數(shù)據(jù),特別要強(qiáng)調(diào)與特定場景的相關(guān)度。現(xiàn)在,人工智能的應(yīng)用針對的是某個具體任務(wù)或具體目標(biāo),需要的數(shù)據(jù)類型不盡相同。
比如,傳媒、金融、醫(yī)療等各行業(yè)需要的細(xì)分?jǐn)?shù)據(jù)不同,具體到同一行業(yè)的子領(lǐng)域也不同。比如,在醫(yī)療領(lǐng)域,心血管疾病和癌癥診斷所要的細(xì)分?jǐn)?shù)據(jù)就不一樣。
大部分人工智能的應(yīng)用場景,都是針對一個具體的任務(wù)。
比如,個人信貸鑒別申請者的信用風(fēng)險,餐飲外賣確定最優(yōu)的派送路線,資訊信息流做精準(zhǔn)的個性化推薦……具體的場景中,起作用的主要是相關(guān)度高的數(shù)據(jù)。
五、重視小數(shù)據(jù)
相對大數(shù)據(jù)來說,能直接用起來的相關(guān)數(shù)據(jù),往往是一種特定的小數(shù)據(jù)。
這里的小數(shù)據(jù),指的是使用場景單一、對應(yīng)算法簡單、及時性較高、數(shù)量規(guī)模較少的數(shù)據(jù)。
可以說,大數(shù)據(jù)是宏觀、全面的分析,小數(shù)據(jù)則是針對特定任務(wù)的具體分析?,F(xiàn)階段真正好用的其實是小數(shù)據(jù)。
同樣以奈飛為例。
1997年,它以DVD在線出租起家,還沒有那么強(qiáng)的數(shù)據(jù)能力,幸運(yùn)的是,它早年就上線了用戶打分功能。
2007年,奈飛推出流媒體業(yè)務(wù)“Watch Now”(立即觀看)的時候已經(jīng)積累了20億條用戶打分?jǐn)?shù)據(jù)。
通過這些數(shù)據(jù),就能夠非常容易了解用戶對內(nèi)容的偏好。這個打分?jǐn)?shù)據(jù)就是小數(shù)據(jù),維度很單一,卻非常契合奈飛的業(yè)務(wù)場景,對內(nèi)容決策非常有用。
當(dāng)然,在大數(shù)據(jù)時代,小數(shù)據(jù)的內(nèi)涵也會發(fā)生延展。比如,圍繞個體的全方位數(shù)據(jù)更加重要。
這里的“個體”不只是自然人的個體,也包括社會組織,如商店、企業(yè)、社會團(tuán)體等。
掌握全方位的個體數(shù)據(jù),一個直接的好處就是可以精準(zhǔn)推送個性化服務(wù)。
數(shù)據(jù)競爭是未來競爭的核心,而在人工智能商業(yè)落地的過程中,掌握數(shù)據(jù)的核心要義,才能在未來的競爭中,構(gòu)建自己的護(hù)城河。