“深度學習的鑰匙丟在了黑暗角落。”張鈸院士不止一次提出這個論點。
深度學習方法易受欺騙、易受攻擊已經是研究者們達成的共識,追其根本原因,張鈸歸結為:大家只是在燈亮的方向對模型修修補補,沒有向人類深入學習。
更為具體的是:沒有在數據驅動的基礎上引進知識,沒有改變深度學習網絡的模型與結構。
圖片來自AI TIME第十期
對人工智能發(fā)展的三個階段進行剖析:1.計算智能;2.感知智能;3.認知智能。顯然,2019年是在第二階段渡過的,在2019年,我們進一步研究語音識別,計算機人臉的識別,以及想方設法讓計算機加強語言文字處理能力。但是,對于第三階段,讓人工智能真正的進行理解,進行思考,進行推理還尚未觸及到門檻。
“當前的人工智能很多的研究,并不在于理解,是一個非常表象的匹配。”清華大學黃民烈在AI Time第十期學術論壇中提到,“當前的感知智能實際上是涉及機器的視覺、聽覺和觸覺感知的能力,主要是對深數據的處理,能做一些分類、檢測,然后基于這些再做初步的決策,特點是數據驅動,是一種典型的弱人工智能的范疇。”
這也就是說深度學習技術的確是推動了感知智能技術的快速發(fā)展,但是僅僅依靠深度學習技術是遠遠不夠的,深度學習是純粹基于數據的方法,屬于歸納的范疇,并不具有可解釋性。從感知智能走向認知智能,僅僅依靠深度學習是遠遠不夠的,還需要有更多突破。
所以,從感知智能走向認知智能必須把相關研究放在認知層面,即將研究方向聚焦于人的語言、認知和邏輯相關方面,打造具有歸納的能力,有推理的能力,有知識運用的能力的強人工智能。
認知智能的獲取,AI研究的瓶頸
感知智能和認知智能是人類的兩個不同的性質,無法對這兩個行為進行孰高孰低的評價。張鈸院士認為人類的智能實際上是三個內容,分別是感知智能、理性行為、人類的一些行為動作,這三個內容加起來才是認知智能。
在感知方面,最大的問題是無法從感性的認識提高到理性,也就是說目前深度學習幾乎達不到從感性上升到理性。
然而推理在攻克人工智能項目難題時非常重要,例如交互視覺的相關研究中,如果場景中有鏡子,呈現(xiàn)的場景是虛像,當前的深度學習算法無法有效處理,這時候便需要推理。在醫(yī)學影像中,如果如果兩根血管離的非常近,深度學習很容易把兩個并在一起,準確區(qū)分則需要進行推理。
讓機器獲得推理能力,就要讓機器做一個“人類”,模仿人腦思考的方式,建立新的神經網絡結構,賦予其足夠的表達力。
正如阿里巴巴的楊紅霞在AI Time第10期中談到:“小朋友觀看一次狗的圖片,就能認識到狗這個物種,但是機器需要訓練成千上萬張圖片才不會犯錯誤;對于一只狗眼睛,人可能下意識的感知到這是一只狗的眼睛,機器可能會因為信息不充分判斷失敗”。
所以,用少量的信息得到最好的效果,也是機器獲得認識智能的一個表現(xiàn)。
將數據和知識結合獲得認知是學界達成共識的一個方法,但是知識獲很困難,將數據和知識結合更加困難。
讓AI獲得知識的知識庫在業(yè)界稱為“知識圖譜”,它不僅要關注知識點還要關注知識點間的關聯(lián)。這些關聯(lián)將賦予AI聯(lián)想力。提到水,它要反映到密度、透明等多個性質聯(lián)系起來,更高級的是計算出用多大力道去取水。
知識圖譜的建立非常困難,人類海量的知識如何翻譯成機器的語言,并與之建立聯(lián)系,很成問題。尤其是之前這項工作一直是人工完成的,例如谷歌詞庫、百度百科、維基百科等都可以轉換為知識圖譜,但工作量大、內容異常龐雜。
幸好,有一些思路為我們提供了參考,例如圖神經網絡在對圖節(jié)點之間依賴關系進行建模的強大功能,使得與圖分析相關的研究領域取得了突破;從人腦中借助的注意力機制、記憶、遺忘也很好的改變了現(xiàn)有的神經網絡結構,設計動態(tài)神經網絡,根據外界的輸入,改變自身的結構和參數。
正如達摩院2020十大科技趨勢預測中的那樣,人工智能會從感知智能向認知智能演進。人工智能已經在“聽、說、看”等感知智能領域已經達到或超越了人類水準,但在需要外部知識、邏輯推理或者領域遷移的認知智能領域還處于初級階段。認知智能將從認知心理學、腦科學及人類社會歷史中汲取靈感,并結合跨領域知識圖譜、因果推理、持續(xù)學習等技術,建立穩(wěn)定獲取和表達知識的有效機制,讓知識能夠被機器理解和運用,實現(xiàn)從感知智能到認知智能的關鍵突破。
獲取和表達知識重要的是有高效的學習系統(tǒng),那么現(xiàn)在的學習系統(tǒng),應該怎么樣去積累,去獲得知識呢?
模擬人類大腦,構建機器學習系統(tǒng)
觀察人類的進化角度、發(fā)展的角度,從而讓機器學習這種角度是一個非常好的路徑,但是具體實施確是非常個困難。關于學習系統(tǒng),張鈸院士在AI Time學術論壇中提到:“對于人腦來說,其實從神經元的表述來講,差別并不大,一個非常重要的原因,人類的大腦連接的很少,提供了非常靈活的學習機會,人類最大的優(yōu)勢就在于腦容量越大,但是都是不確定的,全是靠出生10多年不斷的產生連接,所以這屬于非常靈活的結構。
這也就是說,學習知識的能力,并不是取決于神經網絡已有的固定連接。
人工智能的最終解決要依靠我們對大腦的工作有深入的了解,對大腦理解越多,對如何構建學習系統(tǒng)就會更加清晰。正如張鈸院士提到的那樣,目前我們對大腦的了解,在細胞這個量級上面,所有的重大問題都清楚,人腦細胞的重大問題基本上都解決了,但是這些知識對人工智能幾乎沒有什么用處,因為已解決的問題太細節(jié)了,太底層了,無法直接運用。真正對人工智能有用就是網絡,解決人腦的回路問題才是重點,然而現(xiàn)在在腦回路方面的研究非常粗淺。
現(xiàn)在的嘗試主要基于類腦計算,依靠神經科學家和數學家。而早期的類腦計算(也可以狹義的稱為神經計算),將神經元和突觸模型作為基礎,把這些模型用在許多現(xiàn)實中的識別任務,從而發(fā)揮模擬人腦功能,例如字體識別,人臉識別等等。
腦建模則是在認知腦的基礎上進行的,目前的類腦計算算法還有很大的研究價值,目前發(fā)現(xiàn)的生物學機制只有少部分使用了計算神經學的方式進行模擬,被用在類腦計算中的機制則更加有限。另外,計算機仿真工具和數學的理論分析仍然不夠完善,類腦計算沒有形成統(tǒng)一的理論框架,面對大數據時代還沒辦法取代深度學習等成熟算法和工具的地位。