當(dāng)前,人工智能的計(jì)算力、識(shí)別力快速發(fā)展,但想象力、創(chuàng)造力仍處瓶頸。為破解這一局限,科學(xué)家設(shè)計(jì)出一套類似“貓鼠游戲”的技術(shù),讓人工智能在自動(dòng)學(xué)習(xí)中變得更“聰明”。
這種技術(shù)被稱為“對(duì)抗性神經(jīng)網(wǎng)絡(luò)”技術(shù),美國《麻省理工學(xué)院技術(shù)評(píng)論》日前將其評(píng)為2018年“全球十大突破性技術(shù)”之一。
人工智能的識(shí)別能力有賴于海量樣本學(xué)習(xí),比如給它“看”數(shù)以百萬計(jì)的鳥類圖片,它才能“學(xué)會(huì)”辨認(rèn)鳥類,而生成逼真的鳥類圖像則更難。其局限性在于,有些事物缺乏海量樣本,而且這種學(xué)習(xí)還依賴人類的“灌輸”,缺少自主性。這限制了人工智能的發(fā)展,特別是向想象力、創(chuàng)造力這種更高層次的進(jìn)階。
美國人伊恩·古德費(fèi)洛2014年在加拿大蒙特利爾大學(xué)讀博士時(shí)想出一套設(shè)計(jì)方案:用兩個(gè)神經(jīng)網(wǎng)絡(luò),進(jìn)行數(shù)字版的“貓鼠游戲”——一個(gè)負(fù)責(zé)“造假”,一個(gè)負(fù)責(zé)“驗(yàn)真”,從而在對(duì)抗中不斷提高。
負(fù)責(zé)“造假”的神經(jīng)網(wǎng)絡(luò)稱為“生成網(wǎng)絡(luò)”,它依據(jù)所“見過”的圖片來生成新圖片,這需要它總結(jié)規(guī)律、發(fā)揮想象力和創(chuàng)造力;負(fù)責(zé)“驗(yàn)真”的神經(jīng)網(wǎng)絡(luò)稱為“判別網(wǎng)絡(luò)”,它需要憑訓(xùn)練累積的“經(jīng)驗(yàn)”,來判斷某張圖片是真實(shí)事物,還是生成網(wǎng)絡(luò)“自創(chuàng)”的“假貨”。
生成網(wǎng)絡(luò)并非一開始就足夠“聰明”,比如它可能“認(rèn)為”鳥類會(huì)有3條腿,這樣的“假貨”當(dāng)然很容易被發(fā)現(xiàn)。但隨著機(jī)器學(xué)習(xí)的不斷深入和反復(fù)對(duì)抗練習(xí),生成網(wǎng)絡(luò)對(duì)事物的理解越發(fā)深刻,最終生成足以“以假亂真”的作品。
這樣的神經(jīng)網(wǎng)絡(luò)具有廣泛應(yīng)用價(jià)值。比如在自動(dòng)駕駛領(lǐng)域,人工智能如果創(chuàng)造出海量接近真實(shí)的合成圖片,包含各種情形下的行人、障礙物等路況,自動(dòng)駕駛系統(tǒng)使用這些圖片展開自我訓(xùn)練,將有助于大幅提高應(yīng)用性。
香港中文大學(xué)教授李鴻升認(rèn)為,除了在機(jī)器翻譯、人臉識(shí)別、信息檢索等諸多方向的具體應(yīng)用,對(duì)抗性神經(jīng)網(wǎng)絡(luò)的價(jià)值和意義還在于其蘊(yùn)含的對(duì)抗性思想,這有助于改進(jìn)現(xiàn)有人工智能算法。
從技術(shù)上看,對(duì)抗性神經(jīng)網(wǎng)絡(luò)已經(jīng)接近成熟。來自美國芯片企業(yè)英偉達(dá)的研究人員用明星照片訓(xùn)練出一套系統(tǒng),進(jìn)而生成了數(shù)百張根本不存在、但看起來很真實(shí)的人臉照片。還有研究團(tuán)隊(duì)讓系統(tǒng)生成出看起來十分逼真的梵高油畫。
展現(xiàn)巨大潛力的同時(shí),這項(xiàng)技術(shù)發(fā)展帶來的負(fù)面影響也不容忽視。比如不法分子可能利用此類系統(tǒng)制造出圖片甚至視頻來混淆視聽,給監(jiān)管、安全帶來新挑戰(zhàn)。古德費(fèi)洛就表示,他當(dāng)前的研究重心就在于避免這類技術(shù)的濫用問題,希望它“不至誤入歧途”。
中國科學(xué)院自動(dòng)化研究所副所長(zhǎng)劉成林介紹說,中國的研究機(jī)構(gòu)目前致力于研究對(duì)抗性神經(jīng)網(wǎng)絡(luò)理論的進(jìn)一步改良及優(yōu)化。對(duì)抗性神經(jīng)網(wǎng)絡(luò)的理論基礎(chǔ)、算法和應(yīng)用,都還有很大的發(fā)展空間。
中國企業(yè)界則更傾向于把技術(shù)應(yīng)用在服務(wù)中,并在一些領(lǐng)域達(dá)到了業(yè)界領(lǐng)先。比如,百度利用這項(xiàng)技術(shù)構(gòu)建語音識(shí)別框架,阿里云城市大腦則借此技術(shù)生成訓(xùn)練數(shù)據(jù)集以優(yōu)化車牌精準(zhǔn)識(shí)別功能。