近日谷歌AI 助手幫助用戶打電話點餐事件刷爆朋友圈,谷歌助手生成了一段就像真人一樣的打電話語音,接線員絲毫沒有發(fā)現(xiàn)這竟然出自人工智能助手之口,而且在其打電話的過程中谷歌助手還糾正了接線員的理解錯誤,人們不禁感嘆人工智能竟如此聰明。
“今天,無論是語音識別、文本翻譯、或是計算機視覺等技術(shù)所支撐的人工智能,都沒有真正理解自己所接受信息的含義。它們只是在匹配預(yù)設(shè)的模型。”5月8日,在接受記者專訪時,微軟全球資深副總裁、微軟亞太研發(fā)集團主席兼微軟亞洲研究院院長洪小文直言,“它只是一個黑盒,無法歸納和理解,只知道根據(jù)輸入導(dǎo)出結(jié)果。”
與之相對應(yīng)的是,人類能夠理解。不僅是理解自己已知的概念,甚至面對未知的事物,也可以根據(jù)自己過去的經(jīng)驗去嘗試?yán)斫?,去歸納總結(jié),舉一反三,這便是所謂“白盒”。
值得注意的是,白盒智慧,但存在偏差,黑盒機械,但更加公正,這其中各有優(yōu)劣。因此,洪小文認(rèn)為,AI可以幫助人類去做一些專業(yè)性的任務(wù),面對需要分析決策的環(huán)節(jié),則需要人類的智力,“AI+HI(人工智能+人類智能)非常重要。”
不過,盡管AI本身仍處于黑盒階段,但搭載AI終端的智能邊緣計算正在撲面而至,這一點,從今年微軟Build開發(fā)者大會上頻頻提及智能邊緣計算,并與大疆無人機、高通合作開發(fā)相關(guān)開發(fā)工具包便可見一斑。在洪小文看來,智能邊緣計算必將發(fā)生,也特別值得期待。
黑盒與白盒
記者:今年Build大會上現(xiàn)場展示了智能語音技術(shù)。當(dāng)前國外智能語音技術(shù)已經(jīng)找到了智能音箱作為一個較為普及的落地場景,國內(nèi)則仍在苦苦探索。這背后是中文語音技術(shù)本身的問題嗎?
洪小文:即便擁有方言,中文的語音識別也并不難于英文,只要收集到足夠多的數(shù)據(jù),就不是問題。國外智能音箱(尤其是搭載亞馬遜Alexa的Echo)之所以普及,還是與亞馬遜電商業(yè)務(wù)本身有關(guān),外國用戶習(xí)慣在亞馬遜上購物后,就愿意嘗試使用更方便的智能音箱來購物。另外外國用戶家里空間大又喜歡聽音樂,本身就有音箱的需求,所以這種形態(tài)的終端更容易普及。
至于國內(nèi)用戶,平時更喜歡與自己的智能手機交互,在手機上體驗購物、聽音樂等功能,對于這些用戶而言已經(jīng)足夠便捷和直觀,并已經(jīng)養(yǎng)成了這樣的習(xí)慣,這些因素導(dǎo)致智能音箱在國內(nèi)沒有普及。
記者:就語音技術(shù)而言,你提到識別不是問題,那目前的問題在哪里?
洪小文:當(dāng)前人工智能對語音的反饋包括三個階段:識別、理解和提供服務(wù),問題的難點是在理解上。由于要理解的內(nèi)容本身擁有無窮組合,因此便沒有精確模型,無法只用建構(gòu)模式去進行,這還不論更復(fù)雜的言外有意的情況。今天的AI只是一個黑盒,但理解本身是白盒,也就是人類擁有的能力:不僅理解所接受的信息本身,甚至還可以對本身不了解的信息進行猜測,部分理解其含義。這對于今天的AI而言非常難解,需要更新的技術(shù)才行。
記者:存在黑盒與白盒的應(yīng)用界限嗎?或是黑盒必將需要轉(zhuǎn)變?yōu)榘缀校?/p>
洪小文:對于一些推理過程而言,一定需要白盒,沒有白盒的系統(tǒng)很難進行推理。即便黑盒可進行推理,也只存在于某個輸出剛好是下一個輸入的情況下,這是黑盒的局限性。
但黑盒也有其好處,從某個角度而言,它不會存在偏差,是什么就是什么,非常公平。白盒推理存在既定立場,例如人類心理狀態(tài)中多少會有一些偏見,比如關(guān)于墮胎、性別傾向等各種容易引起爭議的問題,便是源于每個人的既定立場。在這個立場下推理出的東西必然會有所偏頗。黑盒就不會,因此類似于法官這樣的角色就需要黑盒的思維,怎樣輸入就怎樣輸出。
因此,當(dāng)前的合理狀態(tài)應(yīng)該是AI+HI(人工智能+人類智能)。AI可以致力于流程性分析,但深度分析、理解和創(chuàng)造仍需要依靠人類。
可解釋AI
記者:人工智能盡管還處于黑盒階段,但已不可解釋和理解,即將無法確切了解其內(nèi)部運作方式,進而導(dǎo)致人類對人工智能產(chǎn)生不信任感。事實上,最近歐盟也在力圖推動AI算法透明化。你如何理解這種不可解釋AI?
洪小文:先來說一說可解釋AI??山忉孉I擁有兩層意義,第一層意義是指,輸入信息后得出結(jié)果,能夠知道得出這個結(jié)果的原因,從這個角度而言,我認(rèn)為它可以解釋,只是解釋的過程非常復(fù)雜。比如AlphaGo使用增強學(xué)習(xí)后,在棋盤上最終落子,你無法講明其背后的決策規(guī)則,但你了解它在使用增強學(xué)習(xí)得出這一步,而這一步的目的是贏棋。知道結(jié)果,只是不知道結(jié)果背后的規(guī)則究竟如何,它一定有規(guī)則,只不過這個規(guī)則繁瑣到無法窮舉,這就是可解釋AI。
通常所說的不可解釋AI,在我看來其實是第二層意義的可解釋AI,即一般人無法理解的結(jié)果,例如將黑人辨認(rèn)為猩猩等。在我看來,這依然是可解釋AI:之所以出現(xiàn)這樣的結(jié)果,是因為訓(xùn)練數(shù)據(jù)里擁有偏差,因此還是可解釋。
此外,設(shè)計AI系統(tǒng)的人是否能預(yù)期到輸入信息、得出結(jié)果后的后果。如果能夠預(yù)期到這個后果,一定會準(zhǔn)備一套理論去加以解釋,即便遇到危機事件,也能擁有一套自己的邏輯。
記者:所以從技術(shù)角度而言,通常意義的AI不可解釋性是數(shù)據(jù)偏差導(dǎo)致的,這種情況下AI技術(shù)人員可以有怎樣的作為?
洪小文:數(shù)據(jù)偏差所導(dǎo)致的結(jié)果很嚴(yán)重。以實際生活為例,比如風(fēng)控系統(tǒng)判定某人無法貸款,原因是此人來自一個平均收入較低的區(qū)域,根據(jù)這個基礎(chǔ)規(guī)則設(shè)定下的AI就會進而導(dǎo)致偏見甚至歧視。對于技術(shù)人員而言,能否預(yù)先知曉有這樣的不合理漏洞,甚至最好能夠?qū)⒙┒炊伦。褪瞧渎氊?zé)所在。
智能邊緣已來
記者:無論人工智能當(dāng)前實力如何,但畢竟已經(jīng)有了許多應(yīng)用甚至是在終端的應(yīng)用。相較于往年而言,今年微軟Build大會上智能邊緣計算高頻出現(xiàn),您如何看待邊緣計算未來適用的行業(yè)和場景?
洪小文:AI應(yīng)用剛發(fā)生時,絕大部分都發(fā)生在云端。但如今,以視覺應(yīng)用為例,視頻畫面采集設(shè)備正在從4K進化到8K,相應(yīng)地像素幀數(shù)也在大幅提升,導(dǎo)致數(shù)據(jù)量呈現(xiàn)爆發(fā)式增長。即便未來5G技術(shù)發(fā)展,但也存在巨大的數(shù)據(jù)量需要傳輸。因此我大膽預(yù)測,許多視覺相關(guān)的服務(wù)、智能工廠等場景會產(chǎn)生大量終端計算,即邊緣計算。
記者:邊緣計算場景的特點是怎樣的?
洪小文:大部分的數(shù)據(jù)訓(xùn)練會發(fā)生在云端,因為云端在數(shù)據(jù)收集和訓(xùn)練上存在優(yōu)勢。但諸如智能工廠、智能安防等場景需要有即時反饋,需要當(dāng)機立斷,因此大部分終端至少需要執(zhí)行和辨認(rèn)的能力。
除了傳輸速度之外,還有傳輸能耗的問題,大量數(shù)據(jù)傳輸必然會存在大量能耗。事實上,智能工廠中即便終端要與云端互動,也是短途傳輸再聚總傳送至云端。既然有一個聚總過程,就可以在這個過程中本地賦予一些處理和智能的功能。從能耗的角度而言,這種方式也最為節(jié)能。所以終端計算必然會發(fā)生。
(原標(biāo)題:人工智能真的如看起來的那么“聰明”嗎?)