微軟的研究人員正在給AI程序提供焦慮的粗略模擬,當(dāng)計(jì)算機(jī)學(xué)習(xí)駕駛虛擬世界時(shí),它會(huì)使用這些“恐懼”信號(hào)作為指導(dǎo):如果一個(gè)人會(huì)感到害怕,計(jì)算機(jī)也可能會(huì)冥想“我做錯(cuò)了”,從而提升駕駛的安全性。
近年來(lái),由于人工智能的迅猛發(fā)展,使得自動(dòng)駕駛汽車(chē)在城市道路上奔馳的場(chǎng)景不再是一個(gè)遙不可及的概念。
但是,盡管人工智能目前取得了長(zhǎng)足的進(jìn)步,但有一件事是人類(lèi)應(yīng)該清楚的認(rèn)識(shí),那就是人工智能天生不具備人類(lèi)所擁有的恐懼感。
由恐懼驅(qū)動(dòng)的生理反應(yīng)幫助人類(lèi)做出關(guān)鍵決定,保持警覺(jué),尤其是在開(kāi)車(chē)這樣的情況下。
在一項(xiàng)新的研究中,微軟的研究人員提高自動(dòng)駕駛汽車(chē)的決策技能借鑒了這一理念,努力研發(fā)學(xué)習(xí)更快,出錯(cuò)更少的“具有直覺(jué)的機(jī)器”。
該團(tuán)隊(duì)在2019年學(xué)習(xí)表征國(guó)際會(huì)議(ICLR)上發(fā)表的一篇論文中詳細(xì)闡述了他們的發(fā)現(xiàn)。
為了教會(huì)人工智能“感知”恐懼,研究人員在駕駛模擬器中使用脈沖傳感器來(lái)跟蹤人們的覺(jué)醒。
然后,這些信號(hào)被輸入到算法中,以了解是什么情況導(dǎo)致一個(gè)人的脈搏達(dá)到峰值。
作者Daniel McDuff和Ashish Kapoor在論文的摘要中解釋道:“隨著人們學(xué)會(huì)駕馭世界,自主神經(jīng)系統(tǒng)(例如,“戰(zhàn)斗或逃跑”)反應(yīng)提供了關(guān)于行動(dòng)選擇的潛在后果的內(nèi)在反饋(例如,當(dāng)靠近懸崖邊緣或在彎道周?chē)焖傩旭倳r(shí)變得緊張。)”
生理變化與這些生物制劑有關(guān),它們可以保護(hù)一個(gè)人免受危險(xiǎn)。”
研究人員表示,教授算法當(dāng)一個(gè)人在特定情況下可能感到更焦慮時(shí)的感受,可以作為幫助機(jī)器規(guī)避風(fēng)險(xiǎn)的指南。
研究小組解釋說(shuō):“我們的假設(shè)是,在強(qiáng)化學(xué)習(xí)環(huán)境中,這樣的獎(jiǎng)勵(lì)函數(shù)可以規(guī)避與稀疏和傾斜獎(jiǎng)勵(lì)相關(guān)的挑戰(zhàn),并有助于提高樣本效率。”
研究人員讓自主軟件通過(guò)一個(gè)到處都是墻壁和坡道的模擬迷宮,觀察它們?cè)诳謶种斜憩F(xiàn)如何。
而且,與只基于臨壁訓(xùn)練的人工智能相比,學(xué)會(huì)恐懼的系統(tǒng)崩潰的可能性要小得多。
研究人員寫(xiě)道:“與交感神經(jīng)系統(tǒng)反應(yīng)相關(guān)的信號(hào)訓(xùn)練獎(jiǎng)勵(lì)機(jī)制的一個(gè)主要好處是,獎(jiǎng)勵(lì)是非稀疏的——負(fù)面獎(jiǎng)勵(lì)在車(chē)禍發(fā)生前就開(kāi)始出現(xiàn)了。”
“這將提高培訓(xùn)的效率,如果設(shè)計(jì)得當(dāng),還能制定出與目標(biāo)一致的政策。”
但是還有一些值得警醒的地方。
研究人員指出:“雖然情緒對(duì)決策很重要,但在某些情況下,它們也會(huì)對(duì)決策產(chǎn)生不利影響。”
“之后的研究將考慮如何平衡內(nèi)在獎(jiǎng)勵(lì)和外在獎(jiǎng)勵(lì),包括對(duì)包含多種內(nèi)在驅(qū)動(dòng)力(如饑餓、恐懼和痛苦)的表現(xiàn)形式的擴(kuò)展。”