有沒有可能,其實某些人工智能的實例并不像我們想象的那么智能?
一組計算機研究生報告稱,在對幾十種被譽為人工研究里程碑的信息檢索算法進行了更深入的研究之后,他們發(fā)現(xiàn)這些算法實際上遠沒有它們宣稱的那樣具有革命性。事實上,在這些算法中使用的人工智能通常只是對之前建立的例程進行了微小的調(diào)整而已。
麻省理工學院的研究生研究員Davis Blalock說,在他的團隊檢驗了81種開發(fā)神經(jīng)網(wǎng)絡的方法(這些方法被普遍認為優(yōu)于早期的研究成果)之后,他們并不能確定這些方法是否真的取得了任何進步。
Blalock說,“已經(jīng)有50份文件了,很明顯,甚至連最先進的技術是什么都不清楚。”
過去的十年中,人工智能進步的大部分功勞都在于硬件的改善,比如圖形處理器、計算機處理單元、相機等硬件的進步,這些硬件進步使得復雜搜索項目、面部識別、攝影、語言翻譯、語音識別等項目可以以指數(shù)形式增長,并使可視化虛擬現(xiàn)實游戲取得了突破。
當然,算法的改進對此也有幫助,但麻省理工學院的研究小組表示,至少人工智能算法的某些進步是虛假的。
例如,他們發(fā)現(xiàn),只要對此前建立的人工智能算法做一些小的調(diào)整,舊的程序本質(zhì)上就可以像被高度吹捧的“新改進”程序一樣工作。在一些情況下,新的人工智能模型實際上還不如舊的方法。
《科學》雜志上的一篇文章對該研究進行了評估,文章引用了一項元分析,直到2019年,該元分析對搜索引擎使用的信息檢索算法進行了長達10年的分析,分析發(fā)現(xiàn)“高分實際上是在2009年設定的。”另一項對流媒體服務使用的神經(jīng)網(wǎng)絡推薦系統(tǒng)的研究發(fā)現(xiàn),在使用的7個程序中,有6個沒有改進多年前設計的簡單算法。
Blalock指出,由于比較算法的技術存在不一致性,使得一種方法優(yōu)于另一種方法的說法的準確性還有待商榷。
事實上,麻省理工學院(MIT)的一位計算機科學家表示,過去10年人工智能某些領域明顯缺乏重大進展,很大程度上要歸咎于無法恰當?shù)乇容^和評估那些相互競爭的方法。Blalock的博士導師約翰·古塔格(John Guttag)說,“這是老生常談了對吧?如果你無法衡量某件事,就很難讓它變得更好。”
卡內(nèi)基梅隆大學(Carnegie Mellon University)的計算機科學家濟科科爾特(Zico Kolter)推測,將自己的名字與一種新算法聯(lián)系起來,比僅僅修補和調(diào)整舊的方法有更大的動機和社會回報。
他研究了圖像識別模型,這些模型被編程用來抵御黑客的對抗性攻擊,這種攻擊會使用經(jīng)過巧妙修改的代碼來繞過系統(tǒng)安全。對此一種被稱為投影梯度下降(PGD, projected gradient descent)的早期方法會通過訓練人工智能系統(tǒng)來區(qū)分代碼的真實和虛假示例來抵御這種攻擊,人們曾經(jīng)認為這是一種可靠的方法,但這種方法被更新更好的協(xié)議繞過了。然而,科爾特的研究小組發(fā)現(xiàn),對舊的PGD方法進行簡單的調(diào)整后,它的有效性與新方法相比可謂旗鼓相當。
科爾特說:“很明顯,PGD實際上就是正確的算法,這是顯而易見的,人們只是希望找到更繁瑣的解決方案。”