人工智能的缺憾

人工智能背后的人工》一文。這些人每個(gè)月拿著4000左右的工資,在電腦前機(jī)械的點(diǎn)著鼠標(biāo)做圖片標(biāo)注,得到的數(shù)據(jù)最終用于無人駕駛項(xiàng)目。還有很多下到村里收集人臉識(shí)別數(shù)據(jù)的,報(bào)酬是洗衣粉或者豆油。即使是科學(xué)研究逐漸資本化的今天,也很難想象一門學(xué)科可以像這樣直接催生新的勞動(dòng)關(guān)系。

人工智能的嶄新范式

人工智能的研究范式和數(shù)理科學(xué)截然不同。這種范式數(shù)據(jù)導(dǎo)向,非常工程化,方法論發(fā)達(dá)而認(rèn)識(shí)論不足。首先我們談數(shù)據(jù)導(dǎo)向。李飛飛老師的ImageNet項(xiàng)目是一個(gè)非常典型的例子。海量圖片的收集,整理和標(biāo)注,有巨大的工作量。在這些高質(zhì)量數(shù)據(jù)基礎(chǔ)上進(jìn)行了世界范圍的圖像識(shí)別競賽,參賽隊(duì)通過構(gòu)建規(guī)模更大的深度學(xué)習(xí)網(wǎng)絡(luò),表現(xiàn)迅速超過了傳統(tǒng)算法,這也成為深度學(xué)習(xí)標(biāo)志性的成就。其基本的工作流程是積累大規(guī)模數(shù)據(jù),得到更深的網(wǎng)絡(luò)模型,實(shí)現(xiàn)更好的表現(xiàn)。雖然現(xiàn)在我們有了更多不同種類的深度網(wǎng)絡(luò)應(yīng)對(duì)不同任務(wù),但這一基本框架并沒有本質(zhì)的改變。在該框架中,數(shù)據(jù)收集幾乎占據(jù)了最為重要的位置,若數(shù)據(jù)質(zhì)量不過關(guān),很容易造成所說的garbage in-garbage out。而數(shù)據(jù)集大小是影響深度學(xué)習(xí)效能的重要因素,一般認(rèn)為,當(dāng)數(shù)據(jù)集較小時(shí),深度學(xué)習(xí)不一定優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)方法。而隨著數(shù)據(jù)集規(guī)模的增大,傳統(tǒng)機(jī)器學(xué)習(xí)算法的表現(xiàn)很容易飽和,深度學(xué)習(xí)的表現(xiàn)卻可以隨著網(wǎng)絡(luò)規(guī)模的增大而更加優(yōu)異。

在傳統(tǒng)數(shù)理科學(xué)領(lǐng)域,我們并沒有如此依賴數(shù)據(jù)來進(jìn)行模型構(gòu)建??赡苡捎谌四X思維能力的限制,人們更習(xí)慣于從簡單假設(shè)出發(fā),利用邏輯演繹或者公式推導(dǎo)來構(gòu)建一套模型系統(tǒng),用以解釋實(shí)際數(shù)據(jù)。數(shù)理科學(xué)存在利用大量數(shù)據(jù)的情形:比如開普勒從第谷得觀測數(shù)據(jù)中也找到了特定的結(jié)構(gòu),不過這種結(jié)構(gòu)不是用神經(jīng)網(wǎng)絡(luò)的方式來描述的,而是采取了數(shù)學(xué)上更為簡潔的形式。而該規(guī)律只有納入牛頓力學(xué)的框架的時(shí)候才成為一個(gè)自然的結(jié)果。現(xiàn)在觀測手段更加進(jìn)步,據(jù)說LHC每秒可以產(chǎn)生100萬億字節(jié)的對(duì)撞數(shù)據(jù)。但這些數(shù)據(jù)不是為了導(dǎo)出模型,而主要是為了驗(yàn)證只有幾十個(gè)參數(shù)的人為構(gòu)建的標(biāo)準(zhǔn)模型,其包含的信息量也沒有超過這個(gè)模型。在很多時(shí)候,理論的提出或者發(fā)展,可以用到很少的數(shù)據(jù),甚至幾乎不用數(shù)據(jù)。伽利略構(gòu)建其運(yùn)動(dòng)學(xué)的時(shí)候,應(yīng)該只依據(jù)很少的觀測。而泰勒斯提出原子理論的時(shí)候我相信是沒有什么觀測數(shù)據(jù)的。理論的魅力在于可以從人的經(jīng)驗(yàn),思維或者直覺中生產(chǎn),具有內(nèi)在的簡潔性卻能解釋大量的現(xiàn)實(shí)觀測。

對(duì)數(shù)據(jù)的內(nèi)在追求,導(dǎo)致人工智能研究中有很多重勞力的部分。和產(chǎn)業(yè)的結(jié)合,資本的進(jìn)入進(jìn)一步放大了這一效應(yīng)。國內(nèi)人工智能創(chuàng)業(yè)公司不斷涌現(xiàn),數(shù)據(jù)標(biāo)注儼然已經(jīng)成為一種新的職業(yè)。已經(jīng)有不少相關(guān)的報(bào)道,比如可以參考甲子光年的《那些人工智能背后的人工》一文。這些人每個(gè)月拿著4000左右的工資,在電腦前機(jī)械的點(diǎn)著鼠標(biāo)做圖片標(biāo)注,得到的數(shù)據(jù)最終用于無人駕駛項(xiàng)目。還有很多下到村里收集人臉識(shí)別數(shù)據(jù)的,報(bào)酬是洗衣粉或者豆油。即使是科學(xué)研究逐漸資本化的今天,也很難想象一門學(xué)科可以像這樣直接催生新的勞動(dòng)關(guān)系。這也部分由于我們要談的第二個(gè)問題,也就是人工智能研究非常工程化。

如果上過吳恩達(dá)老師的深度學(xué)習(xí)課程,就會(huì)發(fā)現(xiàn),深度學(xué)習(xí)在工程上非常先進(jìn),具有一套非常清晰的工作模式。對(duì)于一個(gè)深度網(wǎng)絡(luò)模型,那些參數(shù)具有最大的影響,如何通過表現(xiàn)判斷調(diào)節(jié)參數(shù)的方向,人們有著豐富的經(jīng)驗(yàn)。最終決定表現(xiàn)的還是數(shù)據(jù)質(zhì)量,規(guī)模,以及特征(feature)選取。這就導(dǎo)致了人工智能領(lǐng)域的工作,非常容易scale-up,也就是規(guī)?;_@也是硅谷最喜歡的發(fā)展模式--通過資本催化迅速實(shí)現(xiàn)技術(shù)飛越和革新。類似的模式造就了我們熟悉的facebook,amazon,現(xiàn)在的互聯(lián)網(wǎng)移動(dòng)互聯(lián)網(wǎng)世界。

在數(shù)理科學(xué)領(lǐng)域,我們不能簡單通過積累用戶或者數(shù)據(jù)獲得革新。一般情況下,理論的發(fā)育程度對(duì)應(yīng)了工程范疇的發(fā)展程度。新的工程實(shí)踐可能要求理論的創(chuàng)新,而理論的進(jìn)步又可以拓展人們進(jìn)行工程化創(chuàng)造的能力。沒有愛因斯坦的質(zhì)能方程,我想人們?cè)囋俣嗄?,有再多?shù)據(jù)也不會(huì)造出原子彈。所以人工智能可以算是一朵奇葩,感謝計(jì)算能力的巨大發(fā)展,它工程的發(fā)展程度已經(jīng)可以跟理論脫節(jié)。這種缺乏理論或者認(rèn)識(shí)論會(huì)帶來比較嚴(yán)重的后果,我們后面會(huì)有所述及。

人工智能沒有催生理念的進(jìn)步

對(duì)人工智能最大的批評(píng)在于它的可詮釋性,人們難以理解越發(fā)龐大的深度網(wǎng)絡(luò)是如何發(fā)揮它的作用,每個(gè)節(jié)點(diǎn)有著怎樣的功能。拿圖像識(shí)別任務(wù)來說,比較早期的深度網(wǎng)絡(luò)AlexNet有35K個(gè)參數(shù)。到了2014年,VGG16網(wǎng)絡(luò)有138M個(gè)參數(shù)。在強(qiáng)大的表現(xiàn)背后,是一個(gè)人們從未接觸過的,難以理解的龐大造物(考慮到標(biāo)準(zhǔn)模型只有19個(gè)自由參數(shù))。關(guān)于如何解讀網(wǎng)絡(luò),現(xiàn)在逐漸有一些工作。但似乎還沒有令人信服的結(jié)果。在數(shù)學(xué)上可能也沒有成熟的工具來針對(duì)這類問題。神經(jīng)網(wǎng)絡(luò)算法的提出,最開始是受到了生物學(xué)研究,尤其是神經(jīng)研究的啟發(fā)。不過即使針對(duì)比較簡單的模式生物,比如只有302個(gè)神經(jīng)元的線蟲,我們也剛剛能理解一些最簡單行為,比如趨熱或者趨冷在神經(jīng)系統(tǒng)里細(xì)胞層面是如何編碼的。詮釋神經(jīng)網(wǎng)絡(luò)的工作,一方面受制于網(wǎng)絡(luò)規(guī)模的飛速增大,參數(shù)的急劇膨脹,以及應(yīng)用場景的逐漸復(fù)雜。另一方面,這本身可能就是不可解的問題,類似于我們本身都不知道大腦是如何運(yùn)作,產(chǎn)生復(fù)雜思維。

沒有理論的學(xué)科會(huì)造成很多問題,可以參看我之前的博文《沒有理論的學(xué)科會(huì)怎么樣》。針對(duì)人工智能這一領(lǐng)域,第一個(gè)負(fù)面結(jié)果是會(huì)造成邊際效益遞減。也就是隨著數(shù)據(jù)規(guī)模的增大,網(wǎng)絡(luò)復(fù)雜度的增大,獲得的進(jìn)步越來越少。我們談到深度學(xué)習(xí)一個(gè)重要的特征是表現(xiàn)隨著數(shù)據(jù)體量增大而提高,這也是為什么大數(shù)據(jù)時(shí)代最適合深度學(xué)習(xí)。有時(shí)候我們覺得參數(shù)的膨脹標(biāo)志著一種進(jìn)步。但從物理學(xué)的角度看,這其實(shí)是退步--因?yàn)檫@標(biāo)志著參數(shù)解釋力的下降。這正是現(xiàn)實(shí)發(fā)生的情況,但即使我們?cè)谟?jì)算能力以及數(shù)據(jù)規(guī)模(感謝資本)上大躍進(jìn),表現(xiàn)的提高卻越來越慢。還是拿圖像識(shí)別為例,AlexNet的錯(cuò)誤率是16.4%,而參數(shù)增加了4000倍的VGG網(wǎng)絡(luò)錯(cuò)誤率是7.3%,基本錯(cuò)誤減半。換過來說,是35K個(gè)參數(shù)可以識(shí)別83.6%的圖片,多出幾千倍的參數(shù)只多識(shí)別了9.1%的圖片,效能加起來只有接近九分之一。這也是為什么每當(dāng)人工智能進(jìn)入一個(gè)新的領(lǐng)域時(shí),往往可以產(chǎn)生激動(dòng)人心的初步結(jié)果(因?yàn)閿?shù)據(jù)要求低),但對(duì)表現(xiàn)的改善卻是趨于更慢的。這對(duì)于一些要求苛刻的領(lǐng)域這其實(shí)是致命的,比如對(duì)于自動(dòng)駕駛,我們必須把失誤控制在非常低的水平(每次失誤可能都會(huì)造成致命的事故),而現(xiàn)實(shí)情況又非常復(fù)雜多變,有些情況不僅靠訓(xùn)練,也要靠應(yīng)變和經(jīng)驗(yàn)上的判斷。

沒有理論的另一個(gè)負(fù)面結(jié)果是研究過程近似于盲人摸象。雖然我們也有越來越多的網(wǎng)絡(luò)模型,但這些模型的構(gòu)建似乎更受到靈感的作用,而不是通過理論的啟發(fā)。這種try and error類型的研究,試對(duì)了就好,試不對(duì)就重來,運(yùn)氣的成分會(huì)比較大。從理念上看,深度學(xué)習(xí)領(lǐng)域似乎還沒有根本上的創(chuàng)新,其最大的進(jìn)步似乎還是計(jì)算力上的進(jìn)步,工作的模式仍然接近于對(duì)生物神經(jīng)系統(tǒng)的模仿。而這種模仿其實(shí)并不能算是效率很高的模仿,我相信人腦完成復(fù)雜任務(wù)計(jì)算的效率平均講還是高于神經(jīng)網(wǎng)絡(luò)的。至少從計(jì)算時(shí)間和所需能量來講是遠(yuǎn)優(yōu)于計(jì)算機(jī)的。人腦的功率據(jù)說是20W左右,而現(xiàn)在好點(diǎn)的英偉達(dá)顯卡比如GeForce GTX 1080Ti的功耗已經(jīng)到了200W大關(guān)了。好在現(xiàn)在計(jì)算力不是瓶頸,再低的效率乘上龐大的計(jì)算力都能得到可觀的結(jié)果。

人工智能從應(yīng)用方式和應(yīng)用場景上,都是對(duì)人的一些基本能力的模仿。吳恩達(dá)老師有過一個(gè)說法,說如果一個(gè)問題,人可以憑借直覺在幾秒內(nèi)判斷出來,那么就有可能用人工智能來解決?,F(xiàn)在出現(xiàn)比較多的也的確是這類問題,比如對(duì)于圖像識(shí)別,到底是貓是狗,人一般幾秒鐘就能看出來。或者在自動(dòng)駕駛方面,在一個(gè)路口是要?jiǎng)x車還是左轉(zhuǎn),正常的司機(jī)幾秒鐘也能判斷出來。所以說人工智能是對(duì)人的能力的再現(xiàn),這使得它在一些場景下可以代替人工,提高生產(chǎn)效率。但它難以完成更高級(jí)的一些思維活動(dòng),比如創(chuàng)造性思維。雖然有些“靈感一現(xiàn)”發(fā)生的時(shí)間也很短,但目前的計(jì)算框架并不具備相應(yīng)的發(fā)散性,聯(lián)想性和隨機(jī)性。所以深度學(xué)習(xí)研究不僅自身缺乏理論,而且也很難為其他學(xué)科領(lǐng)域帶來新的理論。根本的區(qū)別在于數(shù)理科學(xué)的研究具有不同的工作模式,一般包括假設(shè)提出,理論發(fā)展和實(shí)驗(yàn)驗(yàn)證,三者之間相互促進(jìn)。其中假設(shè)的提出是最為關(guān)鍵的一步,也是研究設(shè)計(jì)的基礎(chǔ)。人工智能在這第一步就敗下陣來。人怎么能夠提出假設(shè),這是一個(gè)復(fù)雜的問題。但其基本原因,脫不開人是有自我意識(shí)的,對(duì)世界的認(rèn)識(shí)是自由的,人的思維也是自由的。人工智能有沒有思維,有沒有意識(shí)是另外的話題,但目前來看它的訓(xùn)練數(shù)據(jù)都是高度單一的,它的結(jié)構(gòu)或者結(jié)構(gòu)的規(guī)則也是比較單一的,難以形成更復(fù)雜的思維結(jié)構(gòu)。

人工智能與社會(huì)發(fā)展

所以綜上人工智能最佳的應(yīng)用場景是對(duì)人類勞動(dòng)的部分替代。人工智能的革命,可能是生產(chǎn)效率的革命,類似于工業(yè)革命把人的雙手解放出來。但現(xiàn)在還很難講它在產(chǎn)業(yè)上會(huì)不會(huì)產(chǎn)生類似工業(yè)革命的影響,主要的區(qū)別可能有幾點(diǎn),第一,現(xiàn)在社會(huì)一般性產(chǎn)品的生產(chǎn)基本已經(jīng)飽和,需要更多的是創(chuàng)新性產(chǎn)品,消費(fèi)主要為了提高生活品質(zhì),也就是所說的“滿足美好生活需要”。在生產(chǎn)創(chuàng)新性產(chǎn)品和服務(wù)方面,還沒有看到人工智能的優(yōu)勢。第二,全球經(jīng)濟(jì)發(fā)展不平均(以及國內(nèi)發(fā)展不平衡)造成的大量的低成本勞動(dòng)力,在一些場景下替代這部分勞動(dòng)力效益不高。舉一個(gè)極端的例子,一些創(chuàng)業(yè)公司搞線上的人工智能產(chǎn)品或者demo,背后其實(shí)可以在人力成本比較低的地方雇真人來做,這也是實(shí)際發(fā)生過的事情。如果人力成本很低,電子化的人不一定能競爭過肉身的人。如果有一天人力成本都很高了,我們可能就進(jìn)入共產(chǎn)主義社會(huì)了。我懷疑人工智能最危險(xiǎn)的地方在于它對(duì)社會(huì)治理和網(wǎng)絡(luò)治理的影響,而且這種影響很可能是負(fù)面的。這里就不展開多說了。

另外像我提到的,人工智能對(duì)生產(chǎn)力的解放是有限的,它還難以替代創(chuàng)造性勞動(dòng),尤其是科研活動(dòng)。我們支持人工智能是合理的,all-in人工智能是危險(xiǎn)的?;A(chǔ)研究還應(yīng)該受到重視,目前看這是唯一可能導(dǎo)向新技術(shù)革命的路徑。不重視基礎(chǔ)研究,永遠(yuǎn)會(huì)被人落在后面。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論