11月6日,由京東金融與紅杉資本聯(lián)合主辦的首屆“JDD-2017京東金融全球數(shù)據(jù)探索者大會(huì)”正式在北京拉開大幕。
國(guó)際人工智能聯(lián)合會(huì)理事會(huì)主席楊強(qiáng)談到,金融業(yè)閉環(huán)路徑短、交易頻度高、復(fù)合迭代快,是最適合AI應(yīng)用的場(chǎng)景。
國(guó)際人工智能聯(lián)合會(huì)理事會(huì)主席、香港科技大學(xué)計(jì)算機(jī)科學(xué)及工程學(xué)系主任楊強(qiáng)教授
以下為演講實(shí)錄:
剛才我們聽到了幾位從不同方面給我們解讀了人工智能、金融、數(shù)大局方面的前景。今天,我的主題是從另外一個(gè)方面來(lái)看這個(gè)問(wèn)題。
首先我是一個(gè)做學(xué)術(shù)的,同時(shí)我對(duì)商業(yè)也有著濃厚的興趣,所以我想探討一下從學(xué)術(shù)的角度來(lái)看商業(yè)的問(wèn)題,我們會(huì)得到哪些新的發(fā)現(xiàn)。
首先來(lái)看一下ALPHAGO的成功,首先ALPHAGO能夠引起很大的振動(dòng),我們從中能學(xué)到什么,對(duì)我們的商業(yè)方向有哪些指導(dǎo)呢?
首先我們看一下AlphaGo本身是幾個(gè)算法的結(jié)合,深度學(xué)習(xí),還有一個(gè)算法叫做強(qiáng)化學(xué)習(xí),就是中間這個(gè)圖所表達(dá)的,算法和環(huán)境有一個(gè)有機(jī)的連接,那么環(huán)境不斷給算法提供反饋,深度學(xué)習(xí)就像右邊這個(gè)圖所表達(dá)的,它既能告訴你你當(dāng)前的狀態(tài),又能為你未來(lái)的行為提供一個(gè)指導(dǎo)。
這樣一個(gè)算法是不是可以應(yīng)用在我們實(shí)際當(dāng)中去呢?我們看一下,從當(dāng)中我們可以獲得不同的解讀,這個(gè)是我的一個(gè)想法。
首先,是這個(gè)閉環(huán)的路徑要短。商業(yè)路徑也好、算法路徑也好,它的中間最好不要有過(guò)多的環(huán)節(jié),比方說(shuō)從用戶到得到反饋,到反饋到AI的算法得到補(bǔ)充,最后再返回到應(yīng)用,這個(gè)閉環(huán)要足夠短。
第二,這個(gè)反饋一定要足夠高頻、高通量的反饋,不斷得到反饋,系統(tǒng)得到刺激,這樣它的智能才能夠成長(zhǎng)。
第三個(gè),也是大家過(guò)去比較忽略的,它的反饋效果一定要起到一個(gè)復(fù)合的作用,我們?cè)诮?jīng)濟(jì)上經(jīng)常講復(fù)合收益,在人工智能上的成功這一點(diǎn)也是非常重要的,像這個(gè)圖所表達(dá)的,也就是說(shuō)這一輪的反饋對(duì)系統(tǒng)的增益要持續(xù)進(jìn)行,就會(huì)有一個(gè)指數(shù)型的收益上升。
我們?cè)倏纯粗苓厡?shí)際遇到的問(wèn)題,是不是有很多類似的場(chǎng)景滿足這樣的需求呢。我們回顧一下人工智能的里程碑。
九七年,我們有深藍(lán)。然后一一年的時(shí)候我們有IBM watson,最近我們又有了AlphaGo,無(wú)人車,包括最近有了德州撲克,這些都是我們引以為豪的人工智能。
在這些里程碑的成功背后是不是路徑閉環(huán)足夠短,反饋?zhàn)銐蝾l繁。另外,復(fù)合作用是非常明顯,系統(tǒng)在不斷改進(jìn)自己,智能在提升。
再看一下周邊的工作,所以我就有一個(gè)想法。人工智能在現(xiàn)階段的應(yīng)用并不是在所有領(lǐng)域都會(huì)取得成功,我們一定要非常仔細(xì)挑選在哪些領(lǐng)域人工智能比較容易得到成功,在哪些領(lǐng)域還要等一等。
所以,下面就要來(lái)看一下技術(shù)和商業(yè)這兩方面到底哪些是我們現(xiàn)在可以得到效益的風(fēng)口。
首先來(lái)看一下技術(shù)風(fēng)口。人類的知識(shí)獲得70%以上都是通過(guò)視覺(jué)的,也一點(diǎn)都不奇怪,深度學(xué)習(xí)的發(fā)展肯定對(duì)人工智能的應(yīng)用、對(duì)人工智能的技術(shù)一定是持續(xù)發(fā)展的。比方左邊列的這些技術(shù)方向,包括用更好的深度學(xué)習(xí)、可解釋的深度學(xué)習(xí),包括理解物體之間的關(guān)系,包括通過(guò)一個(gè)視頻可以理解里面的一些人類能理解的摘要,把它給取出來(lái),為人類和計(jì)算機(jī)的模型進(jìn)行溝通。
自然語(yǔ)言緊隨其后,包括文本的閱讀、理解、產(chǎn)生、問(wèn)答、分析等等,現(xiàn)在深度學(xué)習(xí)都帶來(lái)了非常大的提高。但是,這個(gè)提高還是要隨著算法的提升有待更加地提高,在使用當(dāng)中能夠產(chǎn)生更大的效益。
另外一個(gè),智能推薦。在電商、在往上購(gòu)物等等都有這個(gè)推薦。但是推薦的一個(gè)重大的問(wèn)題就是我們很容易陷入一個(gè)所謂的深坑,就是在機(jī)器學(xué)習(xí)技術(shù)上所說(shuō)的過(guò)擬合。當(dāng)我們點(diǎn)擊了一個(gè)在手機(jī)上的新聞,我們會(huì)得到好多這樣的新聞,系統(tǒng)不會(huì)顧及到我們對(duì)其他的興趣。
怎么樣解決這些問(wèn)題呢?這個(gè)就是技術(shù)上的革新所期待的,我們?cè)谶@方面也在不斷做新的研究。
還有一個(gè)就是我個(gè)人的研究,遷移學(xué)習(xí)。比方說(shuō)人類很自然就會(huì)使用遷移學(xué)習(xí),我們?cè)谝粋€(gè)領(lǐng)域很專業(yè),怎么把這個(gè)知識(shí)遷移到另外一個(gè)領(lǐng)域,能不能讓計(jì)算機(jī)也有這個(gè)能力。有很多的專家認(rèn)為這就是人工智能機(jī)器學(xué)習(xí)下一個(gè)的熱點(diǎn)。
遷移學(xué)習(xí)也會(huì)帶來(lái)很多技術(shù)革新。比方,我們可以在一些小數(shù)據(jù)上面應(yīng)用大數(shù)據(jù)得到的結(jié)果,在一個(gè)領(lǐng)域得到一個(gè)非常好的模型,可以把它遷移到周邊一些小數(shù)據(jù)的模型,這個(gè)也是人類學(xué)習(xí)的一個(gè)有效的模式。
另外一個(gè),遷移學(xué)習(xí)可以使得模型的可靠性得到加強(qiáng),一個(gè)模型產(chǎn)生了,我們可以讓它在不同的場(chǎng)合都適用,這個(gè)模型就更加可靠。
再有,越來(lái)越多的個(gè)性化的需求,在場(chǎng)景當(dāng)中經(jīng)常聽到這樣的名詞,千人千面,這樣一個(gè)場(chǎng)景可以用遷移學(xué)習(xí)實(shí)現(xiàn)。比如右邊這個(gè)圖表現(xiàn),如果在云端得到一個(gè)通用的模型,可以把它適配到各個(gè)終端,使它在不同的終端就有不同模型的體現(xiàn),這樣就實(shí)現(xiàn)一個(gè)個(gè)性化。
它帶來(lái)的另外一個(gè)好處就是遷移學(xué)習(xí)可以解決隱私問(wèn)題,每一個(gè)終端用戶都不必把他的個(gè)性化的數(shù)據(jù)上傳到云端,就可以得到它的結(jié)果。
所以,我們很期待這樣一個(gè)技術(shù)的革新。
這里是遷移學(xué)習(xí)的一個(gè)實(shí)例,右邊這個(gè)圖表示遷移學(xué)習(xí)不一定是一步到位,從一個(gè)模型遷移到一個(gè)場(chǎng)景,我們可以通過(guò)一系列的場(chǎng)景把一個(gè)模型遷移到不同的更廣泛的范圍,比方說(shuō)一個(gè)手段就是中間這個(gè)圖所示的用深度學(xué)習(xí)來(lái)做遷移學(xué)習(xí),這也是我最近一個(gè)研究方向。
最右邊這個(gè)圖就表現(xiàn)了一個(gè)實(shí)際的應(yīng)用。最近斯坦福大學(xué)和聯(lián)合國(guó)共同做了一個(gè)應(yīng)用,利用衛(wèi)星圖片分析非洲大陸不同地區(qū)的貧困程度。利用這種所謂傳遞式的遷移學(xué)習(xí),就大量節(jié)省了人力。過(guò)去是要派一些觀察員到本地去做各種積累、各種調(diào)查,現(xiàn)在不用了,現(xiàn)在就用衛(wèi)星圖片把白天和晚上的地球圖象加以比對(duì),最后訓(xùn)練出一個(gè)模型,大大節(jié)省了人力。
這里我們看到這些技術(shù)可能的革新,這些技術(shù)革新和商業(yè)應(yīng)用方向有哪些是最契合的。這里我要特別提金融方向。我們之前提過(guò),一個(gè)是閉環(huán)的路徑要短,一個(gè)是溝通要高頻,最后要有復(fù)合效應(yīng)產(chǎn)生,很快讓模型能夠變得壯大。那么金融就是這樣一個(gè)領(lǐng)域。
我不用多說(shuō)大家也明白,在金融里面有各種各樣的場(chǎng)景,比方和用戶溝通的場(chǎng)景,金融的安全、活體識(shí)別、識(shí)別用戶本人,用人臉識(shí)別、用聲音識(shí)別、用行為識(shí)別。在后端,可以對(duì)用戶整個(gè)風(fēng)險(xiǎn)進(jìn)行分析,是不是應(yīng)該借貸。做一筆投資,在這筆投資之前要進(jìn)行風(fēng)險(xiǎn)分析,現(xiàn)在基于大數(shù)據(jù)和人工智能可以自動(dòng)產(chǎn)生這樣的分析,像個(gè)人和企業(yè)的征信。
另外運(yùn)營(yíng)方面、投顧方面,我們都可以借助于人工智能大量加強(qiáng)提高效益。經(jīng)濟(jì)本身就是一個(gè)提高效益的不斷的過(guò)程?,F(xiàn)在人工智能又為經(jīng)濟(jì)效益的提升提供了一個(gè)強(qiáng)大的動(dòng)力。
比方剛剛講的風(fēng)險(xiǎn)管理這里面又分監(jiān)控、識(shí)別、評(píng)估和干預(yù),每一個(gè)方面都可以有大量的人工智能的參與。
這里一個(gè)很有趣的例子是從京東金融本身的實(shí)踐得來(lái)的,就是人工智能可以幫助養(yǎng)雞,是一個(gè)非常有趣的應(yīng)用。比如過(guò)去一個(gè)養(yǎng)殖戶用12塊錢養(yǎng)一只雞,需要提前貸款,貸一筆很大的款放在那兒,這個(gè)時(shí)候就產(chǎn)生了很大利息支出,這個(gè)對(duì)養(yǎng)雞戶是一筆很大的費(fèi)用。但是雞的成長(zhǎng),小雞的時(shí)候不需要吃那么多的飼料,只有長(zhǎng)大的時(shí)候才吃。不同的雞對(duì)不同飼料的需求也不一樣。當(dāng)我們能夠掌握這個(gè)過(guò)程的時(shí)候,我們就可以把把放貸變得因地制宜,在一開始養(yǎng)雞戶不需要借這么多錢,過(guò)去逐次增加。所以如果我們能夠做到按日計(jì)息就可以做到這一點(diǎn),就能夠大大提升效率。
到現(xiàn)在京東金融可以做到6分錢就養(yǎng)一只雞,用人工智能的算法來(lái)做分析。
同時(shí)我剛剛提到推薦系統(tǒng),大規(guī)模的機(jī)器學(xué)習(xí)系統(tǒng),當(dāng)前共有的一個(gè)問(wèn)題是過(guò)擬合。就像剛才說(shuō)的,在手機(jī)的一些新聞的APP上,當(dāng)我們點(diǎn)了一類的新聞以后,后面20個(gè)都是那一類的新聞,這是為什么呢?這是因?yàn)樵诩夹g(shù)上,它沒(méi)有照顧到兩個(gè)需求,一個(gè)是準(zhǔn)確性的需求,一個(gè)是多樣性的需求。
現(xiàn)在我們?cè)谘芯可?,我們?cè)谘芯恳粋€(gè)強(qiáng)化學(xué)習(xí)的模型,能夠把兩個(gè)需求全部照顧到,就是右邊這個(gè)名詞叫遷移的匪徒模型。用這個(gè)模型既照顧到準(zhǔn)確率,又召開到多樣性,就把過(guò)擬合的問(wèn)題徹底解決。
最后,我要說(shuō)一下JDD背后是一個(gè)大賽,同時(shí)在中美兩邊進(jìn)行。說(shuō)起JDD,我要特別提KDD,即數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn),在學(xué)術(shù)界大家都聽說(shuō)過(guò)KDD,這樣的大會(huì)已經(jīng)有過(guò)20年的歷史,而且每一年都有一個(gè)大賽,就是由工業(yè)出題,也變成了我們發(fā)現(xiàn)一些優(yōu)秀團(tuán)隊(duì)的一個(gè)方式。
今年的JDD也是采用了這樣一個(gè)在金融方面的非常大的機(jī)會(huì),今年的機(jī)會(huì)來(lái)自四個(gè)方面,都是緊貼著金融應(yīng)用的。一個(gè)是登陸的行為識(shí)別,要發(fā)現(xiàn)有沒(méi)有可能是欺詐的行為,這里面需要深度學(xué)習(xí),需要了解一些金融的知識(shí),所以需要兩方面的知識(shí),這也是JDD大賽的一個(gè)特點(diǎn),我們不僅要技術(shù)上的革新,同時(shí)也需要這些參賽隊(duì)伍能夠?qū)懗鲆粋€(gè)商業(yè)計(jì)劃,能夠把商業(yè)場(chǎng)景想清楚。
第二,金融界非常關(guān)鍵的一個(gè)需求,就是信貸需求的預(yù)測(cè),還有店鋪銷量的預(yù)測(cè)。
最后一個(gè)非常有趣的識(shí)別叫做豬臉識(shí)別,而不是人臉識(shí)別。豬臉識(shí)別是需要做什么呢?首先我們可以獲取到大量數(shù)據(jù),而不用擔(dān)心隱私問(wèn)題,我們想豬可能不太關(guān)心隱私。同時(shí)又是一個(gè)活體識(shí)別的問(wèn)題。同時(shí)確確實(shí)實(shí)背后有一個(gè)商業(yè)場(chǎng)景的問(wèn)題,我們可以設(shè)想一下,假如有學(xué)生參加這個(gè)比賽,一個(gè)場(chǎng)景就是它可以幫助養(yǎng)豬戶鑒別不同的豬只在養(yǎng)殖過(guò)程中的各種活動(dòng),這個(gè)豬是不是活躍,它是不是散養(yǎng)的,它還是一只非常不愛動(dòng)的豬,對(duì)健康就可以作決策,對(duì)保險(xiǎn)就可以作預(yù)測(cè)。另外消費(fèi)者可能也會(huì)有挑選,有人可能喜歡不同的豬肉,可能對(duì)整個(gè)的歷史還有豬的鑒別就有個(gè)別個(gè)性化的需求。所以既有深度學(xué)習(xí)的應(yīng)用,又有商業(yè)的應(yīng)用,所以這是非常有趣的一個(gè)題目。
我們就很期待這樣一個(gè)學(xué)術(shù)界和金融界的結(jié)合,就是從JDD大賽開始。