IBM公司人工智能系統(tǒng)Watson的創(chuàng)造者大衛(wèi)·費魯奇正在以童話故事的方式向人們推介一款新產(chǎn)品。
故事中,主人公費爾南多和佐伊各買了一些綠植。費爾南多將他的綠植放在窗臺上,然而佐伊選擇將她的關(guān)在小黑屋里養(yǎng)。幾天后,費爾南多的植物綠意盎然,而佐伊的逐漸枯黃。她隨即將植物移到窗臺上,不久恢復(fù)生機(jī)。
這時一個問題出現(xiàn)在屏幕上:“是費爾南多把他的植物放在窗臺上這個動作使其茁壯成長嗎?實際上,是窗臺上有充足的光照,光照保證了植物生長。”
這個問題揭示了部分費魯奇的AI系統(tǒng)學(xué)習(xí)工作的原理??赡軐τ诟魑粊碚f,把植物放到有光照的窗臺理所應(yīng)當(dāng),但是AI系統(tǒng)理解起來并非易如反掌。
費魯奇和他的公司Elemental Cognition致力彌補(bǔ)AI系統(tǒng)的認(rèn)知空白,他們嘗試教會機(jī)器自己獲取并運用知識,逐步像人們一樣交流、思考、探索周遭。人類早已習(xí)慣了常識的存在,但機(jī)器還不具備。
紐約大學(xué)教授歐內(nèi)斯特·戴維斯在這個領(lǐng)域研究十余年了。他認(rèn)為常識對于推進(jìn)從語言理解到機(jī)器人技術(shù)的一切都至關(guān)重要。“這對我們要使用AI進(jìn)行的大多數(shù)操作而言都很重要!”
戴維斯說,機(jī)器需要掌握一些基本概念,比如時間、因果、社交互動等,從而才能展示出真正的智慧。然而,這個問題恰恰是當(dāng)前面臨的最大障礙。
結(jié)合機(jī)器學(xué)習(xí)和大數(shù)據(jù),新一輪的AI進(jìn)步為我們提供了能夠?qū)陬^命令做出響應(yīng)的小工具,以及能夠識別路障的自動駕駛汽車。令人欣喜的同時,也要意識到他們的缺陷——均不具備常識。
Alexa和Siri都能夠復(fù)讀Wikipedia上面羅列的一堆植物,但它倆都不能告訴你把綠植養(yǎng)在不見光的地方后果會怎樣。同理,躲避路障的程序往往也不清楚為什么躲開人群比躲開路標(biāo)更重要。
讓我們再來看看費魯奇的計算機(jī)。費魯奇在屏幕上單擊“是”按鈕,以回答計算機(jī)關(guān)于費爾南多的綠植問題。在服務(wù)器上,名為CLARA的AI程序?qū)⒃撔畔⑻砑拥饺嗽斓某WR庫中。
這就像一個永不停息的好奇孩子一樣,CLARA向費魯奇接二連三地詢問了有關(guān)植物故事的問題,試圖“理解”事物為何以這種方式展現(xiàn)出來。
“我們能否讓機(jī)器真正理解他們閱讀的內(nèi)容?” 他說:“這是一件非常困難的事情,而這最終就是元素認(rèn)知的意義。”
就這一問題,費魯奇已鉆研多年。十年前,當(dāng)他領(lǐng)導(dǎo)IBM Watson開發(fā)時,用計算機(jī)回答美國老牌智力問答節(jié)目Jeopardy!的問題幾乎是不可能的。
然而在2011年,Watson接連擊敗了數(shù)位真人冠軍。Watson解析大量文本,以找到瑣碎的線索回答Jeopardy!的問題。
對于AI而言,這是一個極高的成就,但是顯然還是缺少真正的理解:在一檔電視節(jié)目中,機(jī)器人得到“美國城市”的提示,卻錯答“什么是多倫多?”由此可見發(fā)展依舊道阻且長。
費魯奇說,Watson的局限性以及該項目的大肆宣傳,給他滿滿壓力以及動力去制造更了解世界的機(jī)器。Watson已經(jīng)成了IBM的一個品牌,代表一系列困難繁雜的技術(shù),而不是普通機(jī)器。
這場Jeopardy!比賽一年后,費魯奇只身離開,創(chuàng)辦了Elemental Cognition。它由Bridgewater Associates和其他三方共同資助。Bridgewater Assosictes是由雷·達(dá)利奧創(chuàng)立的對沖基金,管理約1,600億美元的資金。
Elemental Cognition坐落于Bridgewater辦公區(qū),在郁郁蔥蔥的林地中,俯瞰康涅狄格州韋斯特伯特的湖泊。
Watson一舉成名,AI也逐步轉(zhuǎn)型。深度學(xué)習(xí),是一種教計算機(jī)進(jìn)行面部識別、語音傳輸,輸入大量數(shù)據(jù)來執(zhí)行各種操作的方法。深度學(xué)習(xí)愈發(fā)強(qiáng)大,并逐步應(yīng)用于多個領(lǐng)域。
過去幾年間,深度學(xué)習(xí)在言語交流領(lǐng)域取得長足進(jìn)步。向特定種類的人工神經(jīng)網(wǎng)絡(luò)輸入大量文本,能夠生成合理回答,或是高連貫性的文本模型。
Google、Microsoft 、OpenAI和百度的團(tuán)隊已開發(fā)了更大更復(fù)雜的模型將語言處理得更好。
然而,常識的缺乏限制了這些模型進(jìn)一步發(fā)展。
比如,費魯奇的團(tuán)隊為高級語言模型傳輸費爾南多和佐伊的故事,并要求將“佐伊將她的綠植移到有陽光的窗邊,不久后……”這一句子補(bǔ)充完整。
由于抓不住植物只有在陽光下才能茁壯生長的重點,機(jī)器的回應(yīng)顯然是基于數(shù)據(jù)匹配、詞語的機(jī)械堆積:“她發(fā)現(xiàn)了一些東西,不愉快”、“窗臺上可以看到肥料”、“另一盆植物從臥室里消失了”。
CLARA的目標(biāo)是通過明確的邏輯規(guī)則,將深度學(xué)習(xí)技術(shù)與傳統(tǒng)知識輸入的方式相結(jié)合。比如植物有葉子且需要光照。它使用統(tǒng)計方法來識別句子中的名詞和動詞等概念。除此之外還要探測一些“核心知識”,例如發(fā)生了什么事,又會導(dǎo)致其他什么事。
從Mechanical Turkers眾包特殊領(lǐng)域知識,然后內(nèi)置到CLARA中。比如光促進(jìn)植物生長,而窗戶能透光。通過輸入正確數(shù)據(jù)至深度學(xué)習(xí)模型,或許會有助于機(jī)器正確回答有關(guān)植物學(xué)的問題,但這個想法也有可能不成立。
根據(jù)以往的經(jīng)驗,手動構(gòu)建知識輸入系統(tǒng)將非常耗時。因此,CLARA將其給出的事實與深度學(xué)習(xí)語言模型相結(jié)合,以產(chǎn)生其自身的常識。以綠植故事為例,這可能會使CLARA得出結(jié)論,認(rèn)為靠近窗戶有助于植物生長。
CLARA還通過與用戶互動來收集常識。如果遇到問題,它會提問哪個陳述是正確的。
“盡管肩負(fù)挑戰(zhàn),但我認(rèn)為前途無量。”麻省理工學(xué)院的教授羅杰·利維說道。他致力于AI、語言和認(rèn)知科學(xué)的交匯。“語言絕不僅僅是一系列數(shù)據(jù)的堆砌組合,它與含義、邏輯、常識緊密相連。”
很難評定費魯奇在賦予AI常識方面做了多大貢獻(xiàn),因為Elemental Cognition相當(dāng)神秘。該公司最近發(fā)表了一篇論文,認(rèn)為多數(shù)機(jī)器在理解方面的所做的努力欠佳,應(yīng)由那些對文本含義提出更深層次問題的機(jī)器代替。但Elemental尚未就此發(fā)布更多細(xì)節(jié)。
推廣如此復(fù)雜的系統(tǒng)是個棘手問題。費魯奇似乎正尋找一家財大氣粗、坐擁海量用戶的的公司提供支持。如果更多人可以參與到幫助引擎建立常識中,AI智能化將加快。
費魯奇還有一個想法,認(rèn)為系統(tǒng)可以和學(xué)生進(jìn)行有效互動:以一段文字而言,系統(tǒng)既可以檢查學(xué)生是否理解文章內(nèi)容,也可以反過來幫助自己建立知識庫。
費魯奇說:“歡迎有意向的機(jī)構(gòu)對Elemental投資,我們樂意進(jìn)一步溝通。我們暫時不缺資金,但是我很想達(dá)成合伙關(guān)系或進(jìn)行并購。”
CLARA并不是唯一致力解決常識問題的AI。
華盛頓大學(xué)艾倫人工智能研究所研究員崔藝珍教授最近開發(fā)了另一種方法,將深度學(xué)習(xí)與符號邏輯相結(jié)合,稱為COMET。在交談或回答問題時,與純深度學(xué)習(xí)語言模型相比,該程序的混淆頻率更低,但仍會出錯。
崔藝珍說,她希望了解CLARA的內(nèi)部運行。“大概率看,CLARA的存在有其道理。我覺得用CLARA舉幾個小例子并不難,但很難相信有人真的可以將它適用于各種常識。”
紐約大學(xué)的戴維斯不確定常識AI是否已準(zhǔn)備好迎接其輝煌時代。他懷疑,機(jī)器要像人類一樣輕松地學(xué)習(xí)知識,可能需要一個根本性的突破。
他舉例表示,尚不清楚機(jī)器如何掌握人類本就不確定的含義。“我們似乎忽略了一些最重要的東西,目前尚未發(fā)現(xiàn)。”