人工智能發(fā)展勢頭大好,每一步發(fā)展都備受全世界的關(guān)注,被譽(yù)為下一股技術(shù)浪潮的人工智能,正迎來快速發(fā)展的契機(jī)。中國人工智能學(xué)會副理事長,清華大學(xué)計算機(jī)系教授,博士生導(dǎo)師馬少平帶我們走進(jìn)人工智能快速發(fā)展的這段歷史。
中國人工智能學(xué)會副理事長,清華大學(xué)計算機(jī)系教授,博士生導(dǎo)師馬少平
人工智能發(fā)展的四個階段
人工智能發(fā)展到現(xiàn)在已經(jīng)有60年時間,在這60年當(dāng)中取得了一些成績,在今天人工智能大火的時候,我們有必要簡單回顧一下人工智能的進(jìn)程。人工智能誕生人工智能起源于1956年達(dá)特茅思的討論會上,在1950年圖靈在論文中探討了機(jī)器智能的問題,并提出了圖靈測試,為什么1956年提出了人工智能的概念,實際上是跟計算機(jī)的出現(xiàn)有關(guān),1946年出現(xiàn)計算機(jī),到了1956年有了很大的發(fā)展,人們覺得在這樣一個強(qiáng)有力的工具下,我們以前的智能機(jī)械這個夢想終于可以實現(xiàn)了,從此就誕生了人工智能這樣一個新的方向。
在這60年當(dāng)中,我們大體上可以把人工智能劃分為這樣四個階段,我們下面回憶一下,首先在初期階段,人民是比較樂觀,當(dāng)時研究的一些問題都是通用問題,其實在1956那次會上演示過一個計算機(jī)下棋的問題,人們很希望做出一個真正有智能的產(chǎn)品出來,但是由于人們對困難的估計不足陷入了困境,人們就來反思,為什么我們做的不成功,在這個反思過程中認(rèn)識了知識的重要性,這樣進(jìn)入了人工智能發(fā)展的知識處理階段。
在這個階段工作性質(zhì)就是專家系統(tǒng),一個專家之所以能夠很好解決本領(lǐng)域的問題,是因為他有這方面的知識,如果把專家的知識總結(jié)出來,讓計算機(jī)去使用,根據(jù)這個知識進(jìn)行推理,一個計算機(jī)也就可以像專家一樣去工作了,所以這就是當(dāng)時所謂專家系統(tǒng),知識工程,主要是要人為的總結(jié)認(rèn)識,讓計算機(jī)使用這些知識處理問題。
很快發(fā)現(xiàn)一個問題,知識獲取的瓶頸,發(fā)現(xiàn)知識獲取并不是那么容易,在這樣一種情況下,人們開始研究機(jī)器學(xué)習(xí),希望讓計算機(jī)通過自己學(xué)習(xí)來獲取這個知識,來解決這種問題。這個主要就是一種以統(tǒng)計學(xué)習(xí)方法為主的一些技術(shù),當(dāng)時這個階段的主要特征就是要人為定義這個特征,讓計算機(jī)去提取這些特征,通過淺層的特征影射,來實現(xiàn)這樣智能的目的。
但是這個特征,一方面要反映物質(zhì)的本職,另一方面也要能計算機(jī)處理,這個特征的提取也并不是那么容易,比如說在語音識別,我現(xiàn)在說話大家都能聽的懂,但是到底是哪些特征你決定了我在說什么,其實很難表達(dá)什么。
在這個時代,如何定義特征成為了這方面關(guān)鍵的問題,也陷入了一些困境。從2006年提出了深度學(xué)習(xí)這個概念之后,可以說我們進(jìn)入了數(shù)據(jù)時代,直接從原始數(shù)據(jù)中利用深度學(xué)習(xí)技術(shù),讓這個系統(tǒng)計算機(jī)自動的提取特征,而且要提取不同層次的特征,有低層次的,也有比較高層次的,實現(xiàn)從特征深層分類,讓計算機(jī)自動的提取特征,并且獲得知識,最終解決問題,這個就是我們現(xiàn)在所處的以深度學(xué)習(xí)為基礎(chǔ)的數(shù)據(jù)處理的時代。
由計算機(jī)處理知識到處理特征,到直接處理數(shù)據(jù),可以認(rèn)為人工智能是一步步發(fā)展,領(lǐng)域?qū)<覅⑴c的越來越少,在知識處理時代需要領(lǐng)域?qū)<抑苯訁⑴c,到現(xiàn)在數(shù)據(jù)時代,我們只需要根據(jù)數(shù)據(jù)不需要那么多的領(lǐng)域?qū)<覅⑴c,可以體現(xiàn)了人工智能的進(jìn)展。
深度學(xué)習(xí)存在問題
現(xiàn)在應(yīng)用很多,也取得了一些成功的案例,現(xiàn)在幾乎是深度學(xué)習(xí)的天下,但是深度學(xué)習(xí)是不是就是人工智能的全部呢?我認(rèn)為也不是,我們看這些成功的例子都有一個特點,不能叫做單一數(shù)據(jù),我們把它叫做單一數(shù)據(jù),什么意思?我做語音識別的時候要很多的語音數(shù)據(jù),但每一段語音對應(yīng)的是什么內(nèi)容,這是一一對應(yīng)的,我要做一個漢字識別,到底是那個字也是一一對應(yīng),這里面沒有別的內(nèi)容。但是很多情況下有一下復(fù)雜數(shù)據(jù),比如說在社交媒體當(dāng)中,什么數(shù)據(jù)都有,就不是單一數(shù)據(jù),我本人做有關(guān)搜索引擎有關(guān)的,里面的點擊數(shù)量也有大量的東西在里面,所以也不是單一的,變成復(fù)雜的數(shù)據(jù),深度學(xué)習(xí)不一定好用,還是要人的參與。
我舉一個我自己的做的一個例子,叫做垃圾網(wǎng)頁識別,通過做假的手段欺騙搜索引擎,這個會嚴(yán)重影響用戶的體驗,這就是一個例子,一搜這個迅速在下面一個,這個可能看不清楚,他是一個治療青光眼的網(wǎng)頁,為什么搜這個會出現(xiàn)這個,就是做網(wǎng)頁的人采取了欺騙的手段騙了搜索引擎,這樣會對用戶體驗非常不好。
以往對這個問題,各個搜索引擎都非常重視,但是這里面比較難辦,就像計算機(jī)病毒一樣,垃圾網(wǎng)頁作弊手段層出不窮,很難找一個有效的手段,過去都是一事一議,像防計算機(jī)病毒一樣,出一個殺一個。我們在做這件事情的時候就想,能不能找一個通用的辦法,我們就從垃圾網(wǎng)頁做的目的來著手,任何一個垃圾網(wǎng)頁基本上都是通過欺騙搜索引擎欺騙用戶,我們就想一個正常的用戶對一個正常的網(wǎng)頁跟一個垃圾網(wǎng)頁行為是不一樣的,所以我就想能不能基于群體用戶的行為對這個網(wǎng)頁,到底是正常網(wǎng)頁還是垃圾網(wǎng)頁進(jìn)行識別,在這里面我們主要是要人為總結(jié)一些特征,比方說我搜清華大學(xué)的時候,如果你點擊是清華大學(xué)正常網(wǎng)頁,我會在上面看,會停留時間比較長,如果是一個作弊網(wǎng)頁,跟清華沒有關(guān)系就馬上關(guān)掉,這是一個用戶行為特征,如果是一個正常的清華大學(xué)網(wǎng)頁,我可能還會進(jìn)一步看計算機(jī)系的主頁,而一個垃圾網(wǎng)頁可能就不太會采取這樣的行為。
一個垃圾網(wǎng)頁主要是通過欺騙搜索引擎來欺騙用戶點擊,很少有用戶直接用他的URL去訪問,有多大比例,搜索引擎引導(dǎo)過來這也是一個特征,我們尋找?guī)资畟€類似的特征,就采取傳統(tǒng)的統(tǒng)計學(xué)習(xí)的辦法就可以把這個問題經(jīng)過建模以后解決,并且得到非常好的效果,最右下角0.915就是一個指標(biāo),我通過這個例子說明,我們很多情況下,可能傳統(tǒng)的方法上也許會更有效,尤其是復(fù)雜性的問題,還是要把人的智慧參加進(jìn)來。
深度學(xué)習(xí)本身其實現(xiàn)在也存在著一些問題,比方說大數(shù)據(jù)跟小樣本,深度學(xué)習(xí)一定要用大數(shù)據(jù),小樣本很難做到,但是現(xiàn)實當(dāng)中有些問題沒有那么大的樣本。另外一個問題是黑箱對可解釋,基本上深度學(xué)習(xí)是一個黑箱的東西,把得出的東西我們很難解釋,比如說一個應(yīng)用,比如說做一個醫(yī)療診斷,我給你判斷出什么病,你得給我點理由深度學(xué)習(xí)很難做到這一點。另外深度學(xué)習(xí)是一次性學(xué)習(xí),學(xué)完以后就用,增加一個類別就很難,想增加一個類別必須重頭推翻,重新訓(xùn)練。
還有所謂的固執(zhí)己見,很難說讓他改,是不是能夠做到知錯能改,要想改就得找出大量樣本重新訓(xùn)練。還有一個問題,深度學(xué)習(xí)還一個猜測,做不到理解,跟我們?nèi)诉€是不一樣,有一些人研究對抗樣本找深度學(xué)習(xí)存在的漏洞,比如說對于一個能識別物體的,有人構(gòu)造了這樣一些圖,給他識別錯了,這樣都完全識別錯的,這就有理解的問題。
還有人做過這樣的實驗,左邊兩邊都是熊貓,我們?nèi)丝炊际切茇?,不會認(rèn)錯,但是把中間故意弄一些噪聲之后,這邊識別成熊貓,那邊就識別成別的,這都是因為猜測存在著一些漏洞,猜測造成的因素。
人工智能發(fā)展尚處在初級階段
經(jīng)過60年發(fā)展,到現(xiàn)在人工智能有了很大的進(jìn)步,綜合應(yīng)用已有的方法確實可以解決一些復(fù)雜的問題,比如說像計算機(jī)圍棋,在2015年之前基本上認(rèn)為不可解決的問題,現(xiàn)在已經(jīng)達(dá)到了一個非常高的水平。但是這是一個,第二個我就是說,人工智能也不是說單一方法能夠解決的,除了現(xiàn)在大熱的深度學(xué)習(xí)之外,其實還有很多邏輯,跟常識有關(guān)的方法,可能很多情況下需要不同的方法來解決,單一的方法可能是不行的,即便是說阿爾法狗,也是搜索加深度學(xué)習(xí)兩種方法的結(jié)合,而搜索認(rèn)為是傳統(tǒng)的一種搜索技術(shù),深度學(xué)習(xí)認(rèn)為是一個比較新的技術(shù),但是必須得把兩個結(jié)合在一起用,才能夠解決這樣圍棋的問題。
現(xiàn)在人工智能雖然已經(jīng)發(fā)展的60年,但是可能還不夠,我認(rèn)為人工智能還處于萊特兄弟飛機(jī)的階段,萊特兄弟時代飛機(jī)很簡單,但是已經(jīng)可以航行了,就跟人工智能可以解決一些實際問題一樣,但是要從一個萊特兄弟的飛機(jī)發(fā)展到現(xiàn)在的噴氣式飛機(jī),中間有個理論上的東西叫空氣動力學(xué),在空氣動力學(xué)的指導(dǎo)下才有噴氣式飛機(jī)。
我們?nèi)斯ぶ悄芤胱叩絿姎馐斤w機(jī)這一步,我們可能還需要一個動力學(xué),還學(xué)習(xí)空氣動力,當(dāng)然人工智能的空氣動力學(xué)在哪里,還正在尋找當(dāng)中,還需要大家的努力才能做到這一點。