人工智能發(fā)展勢(shì)頭大好,每一步發(fā)展都備受全世界的關(guān)注,被譽(yù)為下一股技術(shù)浪潮的人工智能,正迎來快速發(fā)展的契機(jī)。中國(guó)人工智能學(xué)會(huì)副理事長(zhǎng),清華大學(xué)計(jì)算機(jī)系教授,博士生導(dǎo)師馬少平帶我們走進(jìn)人工智能快速發(fā)展的這段歷史。
中國(guó)人工智能學(xué)會(huì)副理事長(zhǎng),清華大學(xué)計(jì)算機(jī)系教授,博士生導(dǎo)師馬少平
人工智能發(fā)展的四個(gè)階段
人工智能發(fā)展到現(xiàn)在已經(jīng)有60年時(shí)間,在這60年當(dāng)中取得了一些成績(jī),在今天人工智能大火的時(shí)候,我們有必要簡(jiǎn)單回顧一下人工智能的進(jìn)程。人工智能誕生人工智能起源于1956年達(dá)特茅思的討論會(huì)上,在1950年圖靈在論文中探討了機(jī)器智能的問題,并提出了圖靈測(cè)試,為什么1956年提出了人工智能的概念,實(shí)際上是跟計(jì)算機(jī)的出現(xiàn)有關(guān),1946年出現(xiàn)計(jì)算機(jī),到了1956年有了很大的發(fā)展,人們覺得在這樣一個(gè)強(qiáng)有力的工具下,我們以前的智能機(jī)械這個(gè)夢(mèng)想終于可以實(shí)現(xiàn)了,從此就誕生了人工智能這樣一個(gè)新的方向。
在這60年當(dāng)中,我們大體上可以把人工智能劃分為這樣四個(gè)階段,我們下面回憶一下,首先在初期階段,人民是比較樂觀,當(dāng)時(shí)研究的一些問題都是通用問題,其實(shí)在1956那次會(huì)上演示過一個(gè)計(jì)算機(jī)下棋的問題,人們很希望做出一個(gè)真正有智能的產(chǎn)品出來,但是由于人們對(duì)困難的估計(jì)不足陷入了困境,人們就來反思,為什么我們做的不成功,在這個(gè)反思過程中認(rèn)識(shí)了知識(shí)的重要性,這樣進(jìn)入了人工智能發(fā)展的知識(shí)處理階段。
在這個(gè)階段工作性質(zhì)就是專家系統(tǒng),一個(gè)專家之所以能夠很好解決本領(lǐng)域的問題,是因?yàn)樗羞@方面的知識(shí),如果把專家的知識(shí)總結(jié)出來,讓計(jì)算機(jī)去使用,根據(jù)這個(gè)知識(shí)進(jìn)行推理,一個(gè)計(jì)算機(jī)也就可以像專家一樣去工作了,所以這就是當(dāng)時(shí)所謂專家系統(tǒng),知識(shí)工程,主要是要人為的總結(jié)認(rèn)識(shí),讓計(jì)算機(jī)使用這些知識(shí)處理問題。
很快發(fā)現(xiàn)一個(gè)問題,知識(shí)獲取的瓶頸,發(fā)現(xiàn)知識(shí)獲取并不是那么容易,在這樣一種情況下,人們開始研究機(jī)器學(xué)習(xí),希望讓計(jì)算機(jī)通過自己學(xué)習(xí)來獲取這個(gè)知識(shí),來解決這種問題。這個(gè)主要就是一種以統(tǒng)計(jì)學(xué)習(xí)方法為主的一些技術(shù),當(dāng)時(shí)這個(gè)階段的主要特征就是要人為定義這個(gè)特征,讓計(jì)算機(jī)去提取這些特征,通過淺層的特征影射,來實(shí)現(xiàn)這樣智能的目的。
但是這個(gè)特征,一方面要反映物質(zhì)的本職,另一方面也要能計(jì)算機(jī)處理,這個(gè)特征的提取也并不是那么容易,比如說在語音識(shí)別,我現(xiàn)在說話大家都能聽的懂,但是到底是哪些特征你決定了我在說什么,其實(shí)很難表達(dá)什么。
在這個(gè)時(shí)代,如何定義特征成為了這方面關(guān)鍵的問題,也陷入了一些困境。從2006年提出了深度學(xué)習(xí)這個(gè)概念之后,可以說我們進(jìn)入了數(shù)據(jù)時(shí)代,直接從原始數(shù)據(jù)中利用深度學(xué)習(xí)技術(shù),讓這個(gè)系統(tǒng)計(jì)算機(jī)自動(dòng)的提取特征,而且要提取不同層次的特征,有低層次的,也有比較高層次的,實(shí)現(xiàn)從特征深層分類,讓計(jì)算機(jī)自動(dòng)的提取特征,并且獲得知識(shí),最終解決問題,這個(gè)就是我們現(xiàn)在所處的以深度學(xué)習(xí)為基礎(chǔ)的數(shù)據(jù)處理的時(shí)代。
由計(jì)算機(jī)處理知識(shí)到處理特征,到直接處理數(shù)據(jù),可以認(rèn)為人工智能是一步步發(fā)展,領(lǐng)域?qū)<覅⑴c的越來越少,在知識(shí)處理時(shí)代需要領(lǐng)域?qū)<抑苯訁⑴c,到現(xiàn)在數(shù)據(jù)時(shí)代,我們只需要根據(jù)數(shù)據(jù)不需要那么多的領(lǐng)域?qū)<覅⑴c,可以體現(xiàn)了人工智能的進(jìn)展。
深度學(xué)習(xí)存在問題
現(xiàn)在應(yīng)用很多,也取得了一些成功的案例,現(xiàn)在幾乎是深度學(xué)習(xí)的天下,但是深度學(xué)習(xí)是不是就是人工智能的全部呢?我認(rèn)為也不是,我們看這些成功的例子都有一個(gè)特點(diǎn),不能叫做單一數(shù)據(jù),我們把它叫做單一數(shù)據(jù),什么意思?我做語音識(shí)別的時(shí)候要很多的語音數(shù)據(jù),但每一段語音對(duì)應(yīng)的是什么內(nèi)容,這是一一對(duì)應(yīng)的,我要做一個(gè)漢字識(shí)別,到底是那個(gè)字也是一一對(duì)應(yīng),這里面沒有別的內(nèi)容。但是很多情況下有一下復(fù)雜數(shù)據(jù),比如說在社交媒體當(dāng)中,什么數(shù)據(jù)都有,就不是單一數(shù)據(jù),我本人做有關(guān)搜索引擎有關(guān)的,里面的點(diǎn)擊數(shù)量也有大量的東西在里面,所以也不是單一的,變成復(fù)雜的數(shù)據(jù),深度學(xué)習(xí)不一定好用,還是要人的參與。
我舉一個(gè)我自己的做的一個(gè)例子,叫做垃圾網(wǎng)頁識(shí)別,通過做假的手段欺騙搜索引擎,這個(gè)會(huì)嚴(yán)重影響用戶的體驗(yàn),這就是一個(gè)例子,一搜這個(gè)迅速在下面一個(gè),這個(gè)可能看不清楚,他是一個(gè)治療青光眼的網(wǎng)頁,為什么搜這個(gè)會(huì)出現(xiàn)這個(gè),就是做網(wǎng)頁的人采取了欺騙的手段騙了搜索引擎,這樣會(huì)對(duì)用戶體驗(yàn)非常不好。
以往對(duì)這個(gè)問題,各個(gè)搜索引擎都非常重視,但是這里面比較難辦,就像計(jì)算機(jī)病毒一樣,垃圾網(wǎng)頁作弊手段層出不窮,很難找一個(gè)有效的手段,過去都是一事一議,像防計(jì)算機(jī)病毒一樣,出一個(gè)殺一個(gè)。我們?cè)谧鲞@件事情的時(shí)候就想,能不能找一個(gè)通用的辦法,我們就從垃圾網(wǎng)頁做的目的來著手,任何一個(gè)垃圾網(wǎng)頁基本上都是通過欺騙搜索引擎欺騙用戶,我們就想一個(gè)正常的用戶對(duì)一個(gè)正常的網(wǎng)頁跟一個(gè)垃圾網(wǎng)頁行為是不一樣的,所以我就想能不能基于群體用戶的行為對(duì)這個(gè)網(wǎng)頁,到底是正常網(wǎng)頁還是垃圾網(wǎng)頁進(jìn)行識(shí)別,在這里面我們主要是要人為總結(jié)一些特征,比方說我搜清華大學(xué)的時(shí)候,如果你點(diǎn)擊是清華大學(xué)正常網(wǎng)頁,我會(huì)在上面看,會(huì)停留時(shí)間比較長(zhǎng),如果是一個(gè)作弊網(wǎng)頁,跟清華沒有關(guān)系就馬上關(guān)掉,這是一個(gè)用戶行為特征,如果是一個(gè)正常的清華大學(xué)網(wǎng)頁,我可能還會(huì)進(jìn)一步看計(jì)算機(jī)系的主頁,而一個(gè)垃圾網(wǎng)頁可能就不太會(huì)采取這樣的行為。
一個(gè)垃圾網(wǎng)頁主要是通過欺騙搜索引擎來欺騙用戶點(diǎn)擊,很少有用戶直接用他的URL去訪問,有多大比例,搜索引擎引導(dǎo)過來這也是一個(gè)特征,我們尋找?guī)资畟€(gè)類似的特征,就采取傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)的辦法就可以把這個(gè)問題經(jīng)過建模以后解決,并且得到非常好的效果,最右下角0.915就是一個(gè)指標(biāo),我通過這個(gè)例子說明,我們很多情況下,可能傳統(tǒng)的方法上也許會(huì)更有效,尤其是復(fù)雜性的問題,還是要把人的智慧參加進(jìn)來。
深度學(xué)習(xí)本身其實(shí)現(xiàn)在也存在著一些問題,比方說大數(shù)據(jù)跟小樣本,深度學(xué)習(xí)一定要用大數(shù)據(jù),小樣本很難做到,但是現(xiàn)實(shí)當(dāng)中有些問題沒有那么大的樣本。另外一個(gè)問題是黑箱對(duì)可解釋,基本上深度學(xué)習(xí)是一個(gè)黑箱的東西,把得出的東西我們很難解釋,比如說一個(gè)應(yīng)用,比如說做一個(gè)醫(yī)療診斷,我給你判斷出什么病,你得給我點(diǎn)理由深度學(xué)習(xí)很難做到這一點(diǎn)。另外深度學(xué)習(xí)是一次性學(xué)習(xí),學(xué)完以后就用,增加一個(gè)類別就很難,想增加一個(gè)類別必須重頭推翻,重新訓(xùn)練。
還有所謂的固執(zhí)己見,很難說讓他改,是不是能夠做到知錯(cuò)能改,要想改就得找出大量樣本重新訓(xùn)練。還有一個(gè)問題,深度學(xué)習(xí)還一個(gè)猜測(cè),做不到理解,跟我們?nèi)诉€是不一樣,有一些人研究對(duì)抗樣本找深度學(xué)習(xí)存在的漏洞,比如說對(duì)于一個(gè)能識(shí)別物體的,有人構(gòu)造了這樣一些圖,給他識(shí)別錯(cuò)了,這樣都完全識(shí)別錯(cuò)的,這就有理解的問題。
還有人做過這樣的實(shí)驗(yàn),左邊兩邊都是熊貓,我們?nèi)丝炊际切茇?,不?huì)認(rèn)錯(cuò),但是把中間故意弄一些噪聲之后,這邊識(shí)別成熊貓,那邊就識(shí)別成別的,這都是因?yàn)椴聹y(cè)存在著一些漏洞,猜測(cè)造成的因素。
人工智能發(fā)展尚處在初級(jí)階段
經(jīng)過60年發(fā)展,到現(xiàn)在人工智能有了很大的進(jìn)步,綜合應(yīng)用已有的方法確實(shí)可以解決一些復(fù)雜的問題,比如說像計(jì)算機(jī)圍棋,在2015年之前基本上認(rèn)為不可解決的問題,現(xiàn)在已經(jīng)達(dá)到了一個(gè)非常高的水平。但是這是一個(gè),第二個(gè)我就是說,人工智能也不是說單一方法能夠解決的,除了現(xiàn)在大熱的深度學(xué)習(xí)之外,其實(shí)還有很多邏輯,跟常識(shí)有關(guān)的方法,可能很多情況下需要不同的方法來解決,單一的方法可能是不行的,即便是說阿爾法狗,也是搜索加深度學(xué)習(xí)兩種方法的結(jié)合,而搜索認(rèn)為是傳統(tǒng)的一種搜索技術(shù),深度學(xué)習(xí)認(rèn)為是一個(gè)比較新的技術(shù),但是必須得把兩個(gè)結(jié)合在一起用,才能夠解決這樣圍棋的問題。
現(xiàn)在人工智能雖然已經(jīng)發(fā)展的60年,但是可能還不夠,我認(rèn)為人工智能還處于萊特兄弟飛機(jī)的階段,萊特兄弟時(shí)代飛機(jī)很簡(jiǎn)單,但是已經(jīng)可以航行了,就跟人工智能可以解決一些實(shí)際問題一樣,但是要從一個(gè)萊特兄弟的飛機(jī)發(fā)展到現(xiàn)在的噴氣式飛機(jī),中間有個(gè)理論上的東西叫空氣動(dòng)力學(xué),在空氣動(dòng)力學(xué)的指導(dǎo)下才有噴氣式飛機(jī)。
我們?nèi)斯ぶ悄芤胱叩絿姎馐斤w機(jī)這一步,我們可能還需要一個(gè)動(dòng)力學(xué),還學(xué)習(xí)空氣動(dòng)力,當(dāng)然人工智能的空氣動(dòng)力學(xué)在哪里,還正在尋找當(dāng)中,還需要大家的努力才能做到這一點(diǎn)。