某些對(duì)抗性事件很可能是人為設(shè)計(jì)而來。我們必須知曉其中的手法與工件是什么,這樣才能真正理解深度神經(jīng)網(wǎng)絡(luò)的可靠性。
深度神經(jīng)網(wǎng)絡(luò)是一種使用數(shù)學(xué)模型處理圖像以及其他數(shù)據(jù)的多層系統(tǒng),而且目前已經(jīng)發(fā)展為人工智能的重要基石。
深度神經(jīng)網(wǎng)絡(luò)得出的結(jié)果看似復(fù)雜,但同樣有可能受到誤導(dǎo)。而這樣的誤導(dǎo)輕則致使其將一種動(dòng)物錯(cuò)誤識(shí)別為另一種動(dòng)物,重則在自動(dòng)駕駛汽車上將停車標(biāo)志誤解為正常前進(jìn)。
休斯敦大學(xué)的一位哲學(xué)家在發(fā)表于《自然機(jī)器智能》上的一篇論文中提到,關(guān)于這些假想問題背后的普遍假設(shè),在于誤導(dǎo)性信息可能給這類網(wǎng)絡(luò)的可靠性造成嚴(yán)重影響。
隨著機(jī)器學(xué)習(xí)以及其他形式的人工智能越來越深入滲透至社會(huì),其用途也開始涵蓋從ATM機(jī)到網(wǎng)絡(luò)安全系統(tǒng)的廣泛領(lǐng)域。哲學(xué)系副教授Cameron Buckner表示,正是這種普及,讓了解明顯錯(cuò)誤的來源變得無比重要。研究人員們將這類信息稱為“對(duì)抗性示例”,指當(dāng)深度神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)過程中遇到訓(xùn)練輸入之外的其他信息時(shí),則很有可能總結(jié)出錯(cuò)誤的結(jié)論、最終引發(fā)圖像或數(shù)據(jù)誤判。之所以被表述為“對(duì)抗性”,是因?yàn)檫@樣的問題往往只能由另一機(jī)器學(xué)習(xí)網(wǎng)絡(luò)所產(chǎn)生或發(fā)現(xiàn)。作為機(jī)器學(xué)習(xí)領(lǐng)域中的一種前沿技術(shù),對(duì)抗雙方將不斷升級(jí)自身能力,以更復(fù)雜的方法嘗試實(shí)現(xiàn)干擾與反干擾。
Buckner提到,“但這種對(duì)抗有時(shí)候可能源自人為誤導(dǎo),因此要想更好地了解神經(jīng)網(wǎng)絡(luò)的可靠性,我們必須對(duì)誤導(dǎo)問題做出深入研究。”
換言之,這種誤導(dǎo)結(jié)果很可能源自網(wǎng)絡(luò)需要處理的內(nèi)容、與所涉及的實(shí)際模式之間的某種相互作用所引發(fā)。這與傳統(tǒng)意義上的誤導(dǎo),似乎還不完全是同一種概念。
Buckner寫道,“理解對(duì)抗性整合的含義,可能需要探索第三種可能性:其中至少有一部分模式屬于人為創(chuàng)造。因此,目前的難題在于,直接丟棄這些模式可能有損模型學(xué)習(xí),但直接使用則具有潛在風(fēng)險(xiǎn)。”
引發(fā)機(jī)器學(xué)習(xí)系統(tǒng)錯(cuò)誤的對(duì)抗性事件除了無心而發(fā),更可能是有意為之。Buckner認(rèn)為這才是更嚴(yán)重的風(fēng)險(xiǎn),“意味著惡意攻擊者可能會(huì)欺騙某些本應(yīng)可靠的系統(tǒng),例如安全類應(yīng)用程序。”
例如,基于人臉識(shí)別技術(shù)的安全系統(tǒng)很可能遭遇黑客入侵,導(dǎo)致違規(guī)行為的出現(xiàn);或者在交通標(biāo)志上張貼某些圖形,導(dǎo)致自動(dòng)駕駛汽車產(chǎn)生意外誤解。
先前的研究發(fā)現(xiàn),與人們的預(yù)期相反,使用場(chǎng)景中天然存在著一些對(duì)抗性示例,即機(jī)器學(xué)習(xí)系統(tǒng)有可能因?yàn)橐馔饨换?而非因數(shù)據(jù)錯(cuò)誤)而產(chǎn)生誤解。這類情況相當(dāng)罕見,必須通過其他人工智能技術(shù)才可能發(fā)現(xiàn)。
但這些問題又真實(shí)存在,要求研究人員重新考慮該如何辨別自然異常與人為誤導(dǎo)。
事實(shí)上,我們對(duì)這類人為誤導(dǎo)的理解并不清晰。但這有點(diǎn)像是相機(jī)鏡頭上時(shí)不時(shí)出現(xiàn)的光暈,類似于依靠光暈來判斷畫面中太陽的位置,研究人員似乎也可以借助這樣的蛛絲馬跡推斷機(jī)器學(xué)習(xí)中的惡意誤導(dǎo)方法。
更重要的是,這種新的思考方式也將影響人們?cè)谏疃壬窠?jīng)網(wǎng)絡(luò)中使用工件的方式,包括不應(yīng)簡單將誤解結(jié)論視為深度學(xué)習(xí)無效。
他總結(jié)道,“某些對(duì)抗性事件很可能是人為設(shè)計(jì)而來。我們必須知曉其中的手法與工件是什么,這樣才能真正理解深度神經(jīng)網(wǎng)絡(luò)的可靠性。”