人類會(huì)在行動(dòng)之前預(yù)判他們的行動(dòng)軌跡。例如,如果一個(gè)人要踢球,他們可能想知道球在哪里,他們會(huì)根據(jù)需要移動(dòng)到球的新位置。機(jī)器人(特別是那些沒有配備高級(jí)人工智能的機(jī)器人)通常無法做到這一點(diǎn),因?yàn)樗鼈兺ǔ1痪幊虂韴?zhí)行簡(jiǎn)單的任務(wù)。
加州大學(xué)伯克利分校的一個(gè)研究小組已經(jīng)確定,讓機(jī)器人可以有這種感知能力。為了證明這一點(diǎn),他們開發(fā)了一種新的機(jī)器人學(xué)習(xí)技術(shù),使機(jī)器人能夠提前思考,以“弄清楚如何操作他們從未遇到過的物體”。
這個(gè)團(tuán)隊(duì)已經(jīng)把這種技術(shù)稱為“視覺預(yù)見”——但它不能給機(jī)器人預(yù)測(cè)未來的能力。
伯克利分校的研究人員將這項(xiàng)技術(shù)應(yīng)用到名為“Vestri”的機(jī)器人上,使其能夠預(yù)測(cè)未來幾秒鐘內(nèi)的攝像頭將會(huì)看到什么。通過新的遠(yuǎn)見,Vestri展示了在桌子上移動(dòng)小物件的能力,而不需要觸碰或撞倒附近的障礙物。然而,最令人印象深刻的是,這項(xiàng)技術(shù)使得機(jī)器人能夠在沒有人的輸入、監(jiān)督或之前的物理知識(shí)的情況下完成小任務(wù)。
“以同樣的方式,我們可以想象我們的行動(dòng)將移動(dòng)物體在我們的環(huán)境中,這種方法可以使一個(gè)機(jī)器人可視化不同的行為將如何影響周圍的世界,”解釋謝爾蓋·萊文伯克利分校助理教授的電氣工程和計(jì)算機(jī)科學(xué)系的——背后的實(shí)驗(yàn)室技術(shù)的發(fā)展。“這可以在復(fù)雜的現(xiàn)實(shí)環(huán)境中實(shí)現(xiàn)高度靈活的智能規(guī)劃。”
視覺預(yù)測(cè)是基于“卷積反復(fù)的視頻預(yù)測(cè)”,即動(dòng)態(tài)神經(jīng)平流(DNA)。根據(jù)該團(tuán)隊(duì)的研究,基于DNA的模型能夠預(yù)測(cè)圖像中的像素如何根據(jù)機(jī)器人的行為從一個(gè)幀移動(dòng)到另一個(gè)幀。作為L(zhǎng)evine實(shí)驗(yàn)室的一名博士生,同時(shí)也是原始DNA模型的發(fā)明者的切爾西·芬恩(Chelsea Finn)解釋說,像Vestri這樣的機(jī)器人現(xiàn)在可以“完全依靠自己學(xué)習(xí)一系列的視覺對(duì)象操作技能”。
弗雷德里克·埃伯特(Frederik Ebert)是Levine實(shí)驗(yàn)室的一名研究生,他參與了這個(gè)項(xiàng)目,將他們的工作與機(jī)器人的工作進(jìn)行了比較,以使人類學(xué)會(huì)與環(huán)境中的物體進(jìn)行互動(dòng):
Ebert說:“人類在一生中通過與各種各樣的物體互動(dòng),而沒有任何老師來學(xué)習(xí)對(duì)象操縱技能。”“我們已經(jīng)證明,建立一個(gè)機(jī)器人系統(tǒng),也可以利用大量的自主收集的數(shù)據(jù)來學(xué)習(xí)廣泛適用的操作技巧,特別是對(duì)象推動(dòng)技能。”
也許有一天你甚至不需要自己疊衣服——你的機(jī)器人助手可以幫你洗衣服。