深度學(xué)習(xí)一直處于人工智能技術(shù)發(fā)展的最前沿,許多人認(rèn)為,深度學(xué)習(xí)是實(shí)現(xiàn)技術(shù)奇點(diǎn)的救市銀彈。諸如谷歌 Alpha Go 這樣的項(xiàng)目似乎已經(jīng)預(yù)示著美麗新世界的到來,特斯拉甚至高調(diào)地宣布,完全自動(dòng)駕駛的汽車指日可待。
人工智能領(lǐng)域的頂級(jí)盛會(huì) NIPS(神經(jīng)信息處理系統(tǒng)大會(huì),Conference and Workshop on Neural Information Processing Systems)門票已經(jīng)售罄,無數(shù)企業(yè)巨頭的新聞稿中,“人工智能”字眼頻現(xiàn),鋼鐵俠 Elon Musk 仍然看好無人駕駛的前景,甚至在中國浦東開始動(dòng)工興建一個(gè)自動(dòng)化的汽車工廠,少數(shù)精英預(yù)測(cè):人工智能在人類歷史上的重要程度甚至在電力之上。
但,真是這樣嗎?
深度學(xué)習(xí)塵埃落定
機(jī)器學(xué)習(xí)的權(quán)威領(lǐng)袖吳恩達(dá)(Andrew Ng)此前從谷歌跳槽到了百度,擔(dān)任首席科學(xué)家一職,斯坦福大學(xué)人工智能實(shí)驗(yàn)室主管李飛飛加盟谷歌,成為華人女性在科學(xué)界的杰出代表。
我們正處于巨大變革的前夜,這種人事更迭只是行業(yè)火爆的外部表現(xiàn)。但仔細(xì)觀察,就可以發(fā)現(xiàn),不知從何時(shí)起,吳恩達(dá)在社交媒體上好像不如以前那么活躍了,這表明,要么他在積蓄能量,要么他已經(jīng)蟄伏。但新聞界對(duì)他的關(guān)注度無疑在下降。
在公開發(fā)聲的一些推文上,他也言辭審慎,頗具含蓄之美。比如,此前特征鮮明的“革命”字眼悄悄換成了“變革”或者“進(jìn)化”,也不再大張旗鼓地宣揚(yáng)深度學(xué)習(xí)就是終極算法。
由一眾硅谷大亨聯(lián)合創(chuàng)辦的人工智能非營利組織 OpenAI 在很長(zhǎng)一段時(shí)期內(nèi)表現(xiàn)的相當(dāng)沉寂,他們的最近一次發(fā)聲居然是在中國的國民游戲 Dota2 中敗給了人類選手。
即便強(qiáng)勢(shì)如谷歌,也暗中對(duì)人工智能的未來抱有深切懷疑,類似 Deepmind 這樣的明星項(xiàng)目,其發(fā)展進(jìn)程顯然也不如預(yù)想的那樣好。
至于研究人員,他們的訴求可和企業(yè)不同。他們一直在與政府官員保持密切接觸,以確??蒲袚芸畈皇苡绊?。不少此前赫赫有名的人工智能專家從資金充裕的大公司紛紛轉(zhuǎn)投政府機(jī)構(gòu)的懷抱。
當(dāng)然,這些只是早期跡象,但已經(jīng)足夠構(gòu)成趨勢(shì)預(yù)判。用中國人的超然智慧來總結(jié),叫做“春江水暖鴨先知”。
深度學(xué)習(xí)難擴(kuò)展
深度學(xué)習(xí)系統(tǒng)可以飛速擴(kuò)展。2012年問世的 AlexNet,當(dāng)時(shí)參數(shù)非常有限。而現(xiàn)在,至少有6000萬個(gè)參數(shù),涉及到650000個(gè)神經(jīng)元、五個(gè)卷積層,數(shù)據(jù)模型堪稱臃腫,問題是:這些東西有用嗎?
圖為 | AlexNet到Alpha Go Zero的數(shù)據(jù)增長(zhǎng)模型
我們看到,VGG 和 Resnets 等深度學(xué)習(xí)模型在計(jì)算資源上已經(jīng)趨于飽和。谷歌初始架構(gòu)的變體 Xception,則比其他競(jìng)爭(zhēng)對(duì)手略勝一籌。
機(jī)器翻譯使用大型的人工神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)單詞序列,在單個(gè)集成模型中對(duì)整個(gè)句子進(jìn)行建模,Deepmind 和 OpenAI 則廣泛應(yīng)用于游戲領(lǐng)域。Alpha Zero 需要大量計(jì)算,但在現(xiàn)實(shí)世界的應(yīng)用程序非常少。
顯而易見,我們現(xiàn)在可以在幾分鐘訓(xùn)練 AlexNet,但是否能夠獲得更好的效果則是另一回事。
我們不無遺憾的獲知,以上數(shù)據(jù)樣本僅在模擬游戲環(huán)境中能夠派上用場(chǎng)。
無人駕駛前景堪憂
深度學(xué)習(xí)在無人駕駛領(lǐng)域功敗垂成。
自動(dòng)駕駛汽車要能實(shí)現(xiàn)真實(shí)路況行駛,需要多樣化的數(shù)據(jù)來訓(xùn)練算法。蘭德公司(RAND Corporation)指出,SAE Level 4 及以上的全自動(dòng)駕駛汽車必須積累數(shù)億英里,有時(shí)甚至是數(shù)百億英里的測(cè)試?yán)锍?,其?shù)據(jù)才具有統(tǒng)計(jì)學(xué)意義,從而證明其自動(dòng)駕駛技術(shù)在減少傷亡方面的可靠性。而最早進(jìn)行自動(dòng)駕駛技術(shù)研發(fā)、在該領(lǐng)域擁有最先進(jìn)的技術(shù)、部署測(cè)試車輛最多的 Waymo(Google),自2009年到2017年底,也只測(cè)試了400萬英里。
加州車輛管理局(DMV)數(shù)據(jù)顯示,Nvidia 汽車在沒有脫離接觸的情況下,行駛距離不到十英里。
我們?cè)谏窠?jīng)網(wǎng)絡(luò)方面似乎已經(jīng)取得了一些進(jìn)展。但截至今天,大部分無人駕駛車輛仍然不能準(zhǔn)確地識(shí)別環(huán)形交叉路口等復(fù)雜交通狀況。
2016年以來,特斯拉的自動(dòng)駕駛系統(tǒng)已經(jīng)釀成了幾起影響極壞的事故,其中一些造成了致命傷害。Uber 的無人駕駛項(xiàng)目也在亞利桑那州殺死了一名無辜的行人。我們可以在互聯(lián)網(wǎng)上找到鋪天蓋地的報(bào)道。
分析報(bào)告指出,大部分無人駕駛系統(tǒng)在事故發(fā)生前6秒才能識(shí)別雷達(dá)報(bào)告的行人,此時(shí)的車輛行駛速度為每小時(shí)43英里。當(dāng)車輛與行人路徑相符時(shí),自動(dòng)駕駛系統(tǒng)會(huì)先將行人判別為車輛,然后是自行車,并根據(jù)不同路線預(yù)測(cè)可能的移動(dòng)軌跡。在事故發(fā)生前1.3秒,自動(dòng)駕駛系統(tǒng)才能發(fā)出停車指令,考慮到制動(dòng)距離,這一系統(tǒng)反應(yīng)時(shí)間足以致命。
我們每天都做出很多決策。人們通常說:“我看到一個(gè)騎自行車的人,因此我轉(zhuǎn)向左邊,避開了他”。這是一種下意識(shí)反應(yīng)。
人類對(duì)三維空間、速度、時(shí)間等參數(shù)的判斷能力是生存的原始技能之一。大量的心理學(xué)文獻(xiàn)指出,人類看到的物體被神經(jīng)系統(tǒng)感知,并在短時(shí)間內(nèi)做出快速反應(yīng),但很久以后,人們才能意識(shí)到發(fā)生了什么。這是人類在10億年的歷史長(zhǎng)河中的進(jìn)化結(jié)果。無人駕駛試圖通過數(shù)據(jù)訓(xùn)練將這一反應(yīng)過程擬人化,讓機(jī)器去執(zhí)行,代價(jià)高昂,但收效甚微。
至少就目前來看,深度學(xué)習(xí)的發(fā)展并不像它宣傳的那樣強(qiáng)大。與此同時(shí),還出現(xiàn)了一種奇怪的現(xiàn)象。那就是“偽AI”的興起。
科技公司正在利用人類
做機(jī)器人的工作
大量企業(yè)將對(duì)低效、重復(fù)人工勞作的依賴作為經(jīng)營基石。建立由人工智能驅(qū)動(dòng)的標(biāo)準(zhǔn)服務(wù)很難,一些初創(chuàng)公司認(rèn)識(shí)到,他們可以投機(jī)取巧,畢竟,讓人類像機(jī)器人一樣行動(dòng),比讓機(jī)器像人類一樣行動(dòng)容易得多。
使用人來完成某些工作可以讓你跳過大量的技術(shù)和業(yè)務(wù)開發(fā)環(huán)節(jié),并且成本低廉。”偽AI“就是這么出現(xiàn)的。
總部位于圣何塞的 EdisonSoftware,人工智能工程師通過瀏覽用戶的個(gè)人郵箱來識(shí)別他們的身份,進(jìn)行編碼,以便改進(jìn)“自動(dòng)回復(fù)”功能。該公司的隱私政策里完全沒有提及工作人員會(huì)查看客戶郵箱。
2008年,一家致力于將語音郵件轉(zhuǎn)換為短信的科技公司 Spinvox 被指控在海外呼叫中心使用大量成本低廉的人工,以替代自動(dòng)應(yīng)答系統(tǒng)。
2016年,彭博社的報(bào)道指出,一些人每天花12小時(shí),假裝成為日歷安排服務(wù)的聊天機(jī)器人。這項(xiàng)工作簡(jiǎn)單重復(fù),令人生厭,以至于工作人員表示,他們十分期待能夠被機(jī)器人所取代。
2017年,業(yè)務(wù)費(fèi)用管理應(yīng)用程序 Expensify 承認(rèn),它一直使用人工處理此前大肆宣揚(yáng)的“商業(yè)票據(jù)智能掃描技術(shù)”。實(shí)際運(yùn)作時(shí),票據(jù)掃描件被發(fā)布到亞馬遜的眾包平臺(tái)上,然后由低薪工人閱讀、轉(zhuǎn)錄。Expensify SmartScan 的用戶顯然不知道這些內(nèi)幕。
即便是在人工智能領(lǐng)域投入巨資的 Facebook,也依賴人類作為 Messenger 的虛擬助手。
一家名為 Scale 的公司提供人力工作者,為自動(dòng)駕駛汽車和其他人工智能系統(tǒng)提供數(shù)據(jù)培訓(xùn)。他們通過定位系統(tǒng)查看傳感器畫面,在畫面中標(biāo)記汽車和行人。通過人工校準(zhǔn),AI 才能學(xué)習(xí)識(shí)別這些物體。
通常,一些企業(yè)會(huì)偽造人工智能發(fā)展假象,并告訴投資者和用戶,他們已經(jīng)開發(fā)了可擴(kuò)展的AI技術(shù),其實(shí)他們嚴(yán)重依賴人類智能。
心理健康聊天機(jī)器人 Woebot 創(chuàng)始人 Alison Darcy 指出,很多時(shí)候,人工智能的幕后其實(shí)是人,而不是某種算法。
研究表明,當(dāng)人們認(rèn)為他們的交談對(duì)象是一臺(tái)機(jī)器,而不是一個(gè)人時(shí),他們傾向于透露更多信息,因?yàn)楦鷻C(jī)器對(duì)話能夠讓他們卸下防備。
一個(gè)名為 Ellie、初創(chuàng)于南加州大學(xué)的虛擬治療師項(xiàng)目印證了這個(gè)論斷。他們發(fā)現(xiàn),患有戰(zhàn)后創(chuàng)傷應(yīng)激障礙的退伍軍人在面對(duì)人工智能對(duì)話系統(tǒng)時(shí)更加自在,更加能夠吐露心聲。這無疑是人工智能或 AI 偽造人類的道德窘境。
愿景宏大 落地艱難
就技術(shù)發(fā)展而言,人工智能以機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘?yàn)閮纱蠛诵?,在技術(shù)范疇上有所交叉。機(jī)器學(xué)習(xí)包含對(duì)抗學(xué)習(xí)等諸多類型,其中備受矚目的就是深度學(xué)習(xí)。按照拓?fù)浣Y(jié)構(gòu)分類,深度學(xué)習(xí)可分為卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和全連接神經(jīng)網(wǎng)絡(luò),通過算法框架實(shí)現(xiàn)學(xué)習(xí)過程。
基于機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘,目前人工智能領(lǐng)域已經(jīng)形成了最常見的三大技術(shù)應(yīng)用,即:計(jì)算機(jī)視覺、智能語音和自然語言處理。此外,人工智能技術(shù)的實(shí)現(xiàn),還依托于芯片、傳感器等硬件的支持以及云存儲(chǔ)和計(jì)算服務(wù)。
人工智能的技術(shù)愿景非常宏大,但落地艱難。軟件開發(fā)迭代進(jìn)度緩慢,數(shù)據(jù)采集成本高昂,還存在無法回避的倫理問題,以上種種因素造成,人工智能技術(shù)發(fā)展進(jìn)程阻礙重重。
這個(gè)冬天會(huì)有多冷,目前我們都不知道。預(yù)測(cè)人工智能的冬天就像預(yù)測(cè)股市崩盤一樣,我們不可能確切地說出它何時(shí)發(fā)生,但幾乎可以肯定,一定會(huì)發(fā)生。