12月14日的谷歌開(kāi)發(fā)者大會(huì)上,身著紅衣的李飛飛不僅激蕩起了臺(tái)下的掌聲,還成為了各路媒體報(bào)道中討論的焦點(diǎn)。這不得不讓人感嘆,我們又回到了崇拜科學(xué)家的時(shí)代。
或許是因?yàn)槿斯ぶ悄鼙旧砭褪且粋€(gè)學(xué)術(shù)話語(yǔ)權(quán)極強(qiáng)的領(lǐng)域,現(xiàn)在的AI企業(yè)不管體量大小,往往都有教授、專家坐鎮(zhèn),發(fā)布論文的數(shù)量和學(xué)術(shù)競(jìng)賽排名,似乎也成了考量企業(yè)技術(shù)含金量的標(biāo)準(zhǔn)。
可問(wèn)題的關(guān)鍵是,我們不僅優(yōu)秀的科研成果,更需要能把技術(shù)從論文中帶到我們身邊的傳火者。今天就來(lái)談?wù)?,怎樣才能稱得上人工智能領(lǐng)域的傳火者。
論文產(chǎn)品化:象牙塔內(nèi)外的海水與火焰
很多人的概念里都存有一個(gè)誤區(qū),論文發(fā)的多、專利申請(qǐng)的多、競(jìng)賽排名足夠高就意味著技術(shù)有著更高的實(shí)用性和商業(yè)前景。學(xué)術(shù)上的持續(xù)探索當(dāng)然是人工智能能不斷進(jìn)步的基礎(chǔ),但從論文到產(chǎn)品、再到優(yōu)秀的產(chǎn)品,這期間的里程往往比我們想象中要遙遠(yuǎn)得多。
不管是論文還是賽事,往往都會(huì)給出一個(gè)理想的恒定實(shí)驗(yàn)環(huán)境來(lái)追求某一項(xiàng)技術(shù)的極致可能。比如給出統(tǒng)一的硬件標(biāo)準(zhǔn)或數(shù)據(jù)庫(kù),而得出的結(jié)果也是在某一標(biāo)準(zhǔn)下的最佳結(jié)果。
這就導(dǎo)致一種尷尬的結(jié)果:有時(shí)論文會(huì)走向一種非常刁鉆的方向,很難實(shí)際應(yīng)用在生活中。像是耗費(fèi)大量計(jì)算資源去追求極小的模型壓縮,或是犧牲計(jì)算速度去在極小范圍內(nèi)提升模型準(zhǔn)確率。但這些研究成果往往只能在仿真環(huán)境中起作用,要想應(yīng)用到現(xiàn)實(shí)中來(lái),往往會(huì)遇到這樣那樣的問(wèn)題。
現(xiàn)在很多技術(shù)模型都是開(kāi)源共享的,將公開(kāi)的模型進(jìn)行參數(shù)調(diào)試,從一個(gè)領(lǐng)域移植到另一領(lǐng)域并不難,可想要實(shí)現(xiàn)產(chǎn)品化,就要為模型尋找到合適場(chǎng)景,嵌入到適用的軟件或硬件中。在這一過(guò)程中,如何面對(duì)技術(shù)開(kāi)源,難以建立壁壘的問(wèn)題就是一個(gè)難點(diǎn)。
即使把技術(shù)成功產(chǎn)品化,也要考量產(chǎn)品的實(shí)際應(yīng)用性。人工智能技術(shù)的加入是不是真的能提升用戶體驗(yàn),體驗(yàn)的提升和所耗費(fèi)的成本之間是否又能找到平衡點(diǎn)……很多時(shí)候,人工智能產(chǎn)品還未經(jīng)市場(chǎng)檢驗(yàn),就已經(jīng)折戟在論文產(chǎn)品化的過(guò)程中了。
論文和排名僅僅是人工智能產(chǎn)業(yè)的一部分,我們不能否認(rèn)它的價(jià)值,但也要保持清醒的頭腦。有些企業(yè)靠這些可以拿到大筆融資,但這絕不是企業(yè)成功的標(biāo)志。過(guò)往,論文和會(huì)議競(jìng)賽中的技術(shù)存在于科研環(huán)境中,代表的是人工智能無(wú)限的可能性。幸好,如今科學(xué)家們紛紛走出了象牙塔,把技術(shù)從仿真世界帶到物理世界,向我們展示人工智能的應(yīng)用性。
把目光投向物理世界,
學(xué)術(shù)力量落足在哪?
在今天的人工智能熱潮中,既然有人靠水論文拿融資,自然也會(huì)有人可以成為技術(shù)的傳火者,把學(xué)術(shù)能力化為產(chǎn)品能力甚至商業(yè)能力,成為人工智能時(shí)代的“傳火者”。
拋開(kāi)谷歌的光環(huán),從加州理工畢業(yè)的李飛飛自身也有著極高的學(xué)術(shù)起點(diǎn),在斯坦福實(shí)驗(yàn)室中的身體力行培養(yǎng)出了不少牛人,也憑著TED上強(qiáng)大的演講能力吸引了不少人關(guān)注計(jì)算機(jī)視覺(jué)領(lǐng)域。
李飛飛對(duì)人工智能領(lǐng)域最大的貢獻(xiàn)無(wú)疑是創(chuàng)立了世界上最大的圖片識(shí)別數(shù)據(jù)庫(kù)ImageNet。此前機(jī)器學(xué)習(xí)一直飽受過(guò)擬合和泛化的困擾,學(xué)界一直試圖在模型上尋找解決方式,直到李飛飛開(kāi)始主導(dǎo)ImageNet的研究,從數(shù)據(jù)集入手試圖改變游戲規(guī)則。
ImageNet的影響力越來(lái)越大,甚至從中誕生了卷積神經(jīng)網(wǎng)絡(luò)這樣實(shí)用性極高的技術(shù),計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)也越來(lái)越多的應(yīng)用在物理世界中:社交網(wǎng)絡(luò)的圖像標(biāo)注、自動(dòng)駕駛的物體監(jiān)測(cè)……包括李飛飛自己在谷歌街景上添加的種種功能,如通過(guò)分析汽車(chē)分析街區(qū)政治傾向等,在CV和產(chǎn)業(yè)結(jié)合中締造了更多想象空間。
大量的落地應(yīng)用也再不斷的向CV技術(shù)提供反饋,物理世界的技術(shù)應(yīng)用也催化了仿真世界中技術(shù)的發(fā)展。
NLP和CV兩個(gè)領(lǐng)域,都聚集了大量華人科學(xué)家。在學(xué)界和產(chǎn)業(yè)界都有布局的,王海峰算是其中一個(gè)典型。
王海峰在學(xué)界的成就很高,是迄今為止國(guó)際計(jì)算語(yǔ)言學(xué)會(huì)(The Association for Computational Linguistics)唯一出任過(guò)主席的華人,也是首位來(lái)自大陸的會(huì)士。還曾獲國(guó)家科技進(jìn)步獎(jiǎng)及創(chuàng)新?tīng)?zhēng)先獎(jiǎng)等等。
2010年王海峰入職百度,百度也給了他很大的發(fā)揮空間。他先后為百度開(kāi)拓并發(fā)展了自然語(yǔ)言處理、知識(shí)圖譜、深度學(xué)習(xí)、語(yǔ)音技術(shù)、圖像技術(shù)等多個(gè)技術(shù)方向,并在2013年上半年作為執(zhí)行負(fù)責(zé)人協(xié)助創(chuàng)建了百度深度學(xué)習(xí)研究院(IDL),這些開(kāi)拓性工作奠定了百度人工智能的基礎(chǔ)。在擔(dān)任百度搜索業(yè)務(wù)群組任副總經(jīng)理期間,王海峰總負(fù)責(zé)百度搜索引擎、信息流、手機(jī)百度等百度最核心的業(yè)務(wù),并打造了小度機(jī)器人、度秘等新的明星產(chǎn)品。從這些動(dòng)作就能看出,王海峰不僅科研能力突出,還很善于產(chǎn)品創(chuàng)新及工程實(shí)施。
我們今天看到的百度搜索、百度翻譯等產(chǎn)品的變化,以及度秘等新產(chǎn)品的誕生,在用戶體驗(yàn)的感受差異中,實(shí)際是神經(jīng)網(wǎng)絡(luò)、語(yǔ)音識(shí)別和知識(shí)圖譜等等技術(shù)的理性呈現(xiàn)。其實(shí)這些就是學(xué)術(shù)和產(chǎn)業(yè)之間產(chǎn)生的化學(xué)反應(yīng)。搜索引擎源源不斷產(chǎn)生出的數(shù)據(jù),加上王海峰團(tuán)隊(duì)在學(xué)界的先行經(jīng)驗(yàn),最終構(gòu)成了百度在人工智能方面的技術(shù)優(yōu)勢(shì)。
相比BAT其他的人工智能大牛,王海峰相對(duì)低調(diào),大概這也是“工程派”的特征之一。但他和他的團(tuán)隊(duì)的確為百度后續(xù)諸多產(chǎn)品的智能化奠定了基礎(chǔ),屬于百度AI中的隱形部隊(duì)。正因?yàn)榘俣華I技術(shù)平臺(tái)體系發(fā)展脈絡(luò)始終清晰有序,才有了從底層打造平臺(tái)、開(kāi)放生態(tài)的能力,接入更多產(chǎn)品化和工程化端口。在人工智能的長(zhǎng)線戰(zhàn)爭(zhēng)中,工程化和產(chǎn)品化能力可以為百度贏得更多優(yōu)勢(shì)。
優(yōu)秀的科學(xué)家、豐富的數(shù)據(jù)源和業(yè)務(wù)落地場(chǎng)景三個(gè)元素單獨(dú)存在時(shí)都很難構(gòu)成顯著的優(yōu)勢(shì),但三者結(jié)合后,帶來(lái)的能量就不容小覷了。
提到強(qiáng)化學(xué)習(xí),大多數(shù)人會(huì)認(rèn)為這是一項(xiàng)距離現(xiàn)實(shí)非常遙遠(yuǎn)的技術(shù),不過(guò)一直有人在嘗試著把這一技術(shù)帶到現(xiàn)實(shí),Pieter Abbeel就是其中之一。
在博士時(shí)期,Pieter Abbeel就與導(dǎo)師一同提出了師徒學(xué)習(xí)這一強(qiáng)化學(xué)習(xí)中的重要概念。在伯克利任教期間,還因讓機(jī)器人通過(guò)強(qiáng)化學(xué)習(xí)學(xué)會(huì)疊毛巾獲得了MIT頒發(fā)的TR35獎(jiǎng)項(xiàng)。后來(lái)入職馬斯克的OpenAI,推出了著名的機(jī)器人訓(xùn)練場(chǎng)Gym。Gym雖然也還是一個(gè)仿真環(huán)境,但本質(zhì)來(lái)說(shuō)已經(jīng)是在為強(qiáng)化學(xué)習(xí)應(yīng)用在實(shí)際場(chǎng)景中做出準(zhǔn)備。尤其當(dāng)場(chǎng)地、費(fèi)用、用時(shí)這些問(wèn)題成為強(qiáng)化學(xué)習(xí)落地訓(xùn)練的阻礙時(shí),仿真環(huán)境的出現(xiàn)讓很多團(tuán)隊(duì)可以在低成本的前提下快速訓(xùn)練智能體。
Pieter Abbeel自己已經(jīng)把強(qiáng)化學(xué)習(xí)機(jī)器人帶入了商業(yè)領(lǐng)域,直到今天,硅谷機(jī)器人制造商Willow Garage的很多產(chǎn)品中還有Pieter Abbeel利用強(qiáng)化學(xué)習(xí)訓(xùn)練的成果。如今Pieter Abbeel已經(jīng)離開(kāi)OpenAI,創(chuàng)立自己的團(tuán)隊(duì),專注于利用強(qiáng)化學(xué)習(xí)讓現(xiàn)有硬件設(shè)備自主學(xué)習(xí)完成任務(wù)。
自動(dòng)化的普及度不斷增高的過(guò)程,本質(zhì)上也是機(jī)器人訓(xùn)練成本不斷降低的過(guò)程,強(qiáng)化學(xué)習(xí)的應(yīng)用的落足之處也在其中。
革命來(lái)臨前夜,天秤兩端的學(xué)與業(yè)
以上三位科學(xué)家僅僅是人工智能領(lǐng)域眾多傳火者的一個(gè)縮影,卻也能讓我們管中窺豹,領(lǐng)悟到一點(diǎn)人工智能產(chǎn)業(yè)發(fā)展的勢(shì)頭。
有一些生物學(xué)界的人士曾經(jīng)對(duì)這次人工智能浪潮做出過(guò)忠告,說(shuō)今天的人工智能特別像十幾年前的生物學(xué),論文滿天飛、大學(xué)猛開(kāi)專業(yè)、專家教授紛紛“下海”創(chuàng)業(yè)。最后生物學(xué)卻因?yàn)楫a(chǎn)業(yè)化能力不足,反倒湮滅了學(xué)術(shù)界的星星火光。而人工智能被稱為下一次工業(yè)革命,自然要把“學(xué)”和“業(yè)”放在天秤的兩端。
“學(xué)”的能力,既包括了論文數(shù)量、競(jìng)賽排名,也需要考量技術(shù)的創(chuàng)新型和實(shí)用性。
像現(xiàn)如今大火的DeepMind,他們發(fā)表的很多關(guān)于深度學(xué)習(xí)的論文中并沒(méi)有利用太多超前的方法論,而是引源上個(gè)世紀(jì)的認(rèn)知科學(xué)方法,用來(lái)解決今天的現(xiàn)實(shí)問(wèn)題。
至于“業(yè)”的方面,往往要看技術(shù)的根扎在哪里。學(xué)術(shù)能力當(dāng)然可貴,但僅僅依靠學(xué)術(shù)很難支撐起人工智能未來(lái)的宏圖。以上三個(gè)案例中,科學(xué)家們雖然都出身象牙塔和實(shí)驗(yàn)室,但也都是典型的工程派,把技術(shù)的根基深深的扎在了大企業(yè)和應(yīng)用產(chǎn)業(yè)中。廣泛的業(yè)務(wù)和廣泛的應(yīng)用場(chǎng)景意味著源源不斷的現(xiàn)實(shí)數(shù)據(jù),以此吸取的養(yǎng)分,才能讓科學(xué)家們?cè)诜抡媸澜缪邪l(fā)出的模型無(wú)限適用于物理世界,讓技術(shù)切實(shí)影響到人們的生活。把工業(yè)革命的火種帶到現(xiàn)實(shí)中來(lái)。
不過(guò)我相信人工智能產(chǎn)業(yè)很難重蹈生物產(chǎn)業(yè)的覆轍,一個(gè)顯著的苗頭就是,人們正在對(duì)天秤嚴(yán)重失衡的企業(yè)失去信心。比如此前的智能音箱風(fēng)潮,市場(chǎng)上已經(jīng)看不到前兩年對(duì)智能手環(huán)一類產(chǎn)品的熱情,反而換來(lái)了不少對(duì)智障音箱的嘲諷。又比如一直強(qiáng)調(diào)自己學(xué)術(shù)背景的科大訊飛,最近也因?yàn)槁涞貓?chǎng)景匱乏而飽受爭(zhēng)議。
歷經(jīng)了從“.com”時(shí)代的幾次泡沫,我們已經(jīng)越來(lái)越清楚自己想要的是什么,對(duì)于空中神殿的勾勒的確迷人,可想要真正改變現(xiàn)狀,還需一次火種的傳遞。