圖片來源@視覺中國
在科幻影視或游戲中,為了體現(xiàn)未來感往往會(huì)有一個(gè)很常見的設(shè)置,那就是在家庭或辦公室場(chǎng)景中安排一個(gè)能做“雜活”的機(jī)器人,幫助人類端茶倒水、澆花掃地,似乎是在用這樣的方式描繪出一個(gè)人類與機(jī)器人共同生存的世界。
實(shí)際在現(xiàn)實(shí)生活中,我們也算是生活在一個(gè)人與機(jī)器人共存的世界里,工廠里高度自動(dòng)化、智能化的流水線,或是酒店展館里能夠起到接待引導(dǎo)作用的機(jī)器人,廣義上都可以算作各式各樣的機(jī)器人。只不過現(xiàn)如今的機(jī)器人還沒有深入到日常生活場(chǎng)景,仍然是扎根于某一專業(yè)領(lǐng)域各司其職,而不是在家庭或辦公室中為人類提供廣泛的幫助。因此總是顯得和幻想世界有著不小的差距。
這其中的原因并不復(fù)雜。主要是因?yàn)椋绞侨粘I顖?chǎng)景、越是簡(jiǎn)單而廣泛的日常協(xié)助,相反對(duì)機(jī)器人的通用性智能能力要求越高。簡(jiǎn)單來說,要讓機(jī)器人通過機(jī)器視覺能力以超越人類的速度分揀商品并不困難,可要把機(jī)器人放到家居環(huán)境里讓他既能澆花又能傳送物品,恐怕就沒那么容易。
我們都知道通用人工智能從技術(shù)層面來說研發(fā)起來非常困難,可換個(gè)角度想,如果僅僅在家庭或日常辦公環(huán)境需要一個(gè)助理型的機(jī)器人,真的用得上“通用型AI”這種高度的技術(shù)嗎?
在機(jī)器人擁有大腦之前,人類可以替他們思考
答案顯然是否定的。
對(duì)于機(jī)器人來說,一定要將周圍的環(huán)境數(shù)字化、結(jié)構(gòu)化,才能清晰的制定行進(jìn)路線和行為模式。最常見的掃地機(jī)器人就是這樣,第一次使用時(shí)掃地機(jī)器人通常會(huì)在整個(gè)房間游走一遍,通過SLAM技術(shù)來對(duì)整個(gè)房間的地圖進(jìn)行定位和路線規(guī)劃,在未來的使用過程中,就可以按照這種既定的路線進(jìn)行清掃。
日常應(yīng)用場(chǎng)景對(duì)于機(jī)器人來說過于復(fù)雜和多變,而且超越在“掃地”這一單一的需求后,機(jī)器人就要對(duì)周圍環(huán)境進(jìn)行立體式的理解和構(gòu)建,比掃地機(jī)器人規(guī)劃清掃路線要復(fù)雜的多。例如家中的花草可能今天擺在東北角明天擺在西北角,想要讓機(jī)器人每次都重新理解環(huán)境,恐怕會(huì)大大折損實(shí)用性并且增加硬件成本——不僅需要激光雷達(dá)和3D結(jié)構(gòu)光攝像頭,光是耗電量就是一個(gè)很難解決的問題。
但家用機(jī)器人不一定非要像《底特律:變?nèi)恕防餀C(jī)器人一樣,能夠完全獨(dú)立于人類,自覺發(fā)現(xiàn)日常生活場(chǎng)景中的種種需求然后自主完成工作。在人類的指導(dǎo)和協(xié)助下完成部分工作,應(yīng)當(dāng)是家用機(jī)器人發(fā)展的第一步。
換句話說,我們是否可以為家用機(jī)器人規(guī)劃行動(dòng)和行進(jìn)路線,就像一些掃地機(jī)器人可以通過App來手動(dòng)操控清掃路線一樣?
像控制AR貼圖一樣,控制你的掃地機(jī)器人
來自普渡大學(xué)的研究團(tuán)隊(duì)就推出了一個(gè)針對(duì)家用機(jī)器人的實(shí)驗(yàn)性解決方案。
普渡大學(xué)研究出了一款名為VRa的嵌入式應(yīng)用程序,這一程序利用AR技術(shù),將機(jī)器人“錄入”手機(jī)AR系統(tǒng),再用AR與現(xiàn)實(shí)場(chǎng)景的交互,讓用戶可以通過手機(jī)App端來為機(jī)器人規(guī)劃行動(dòng)路徑。例如用戶想讓機(jī)器人走出一條環(huán)形路線,只需要在手機(jī)上利用AR功能畫出一條行進(jìn)路線即可。同時(shí)還可以讓機(jī)器人進(jìn)行一些簡(jiǎn)單的動(dòng)作,例如拾取等等。
而用戶規(guī)劃路線和機(jī)器人的連接方式,是通過在掃地機(jī)器人、廉價(jià)機(jī)器人手臂等等設(shè)備中安插拓展塢,直接將手機(jī)架設(shè)在拓展塢上。這時(shí)手機(jī)的前置攝像頭可以承擔(dān)視覺功能,成為機(jī)器人的“眼睛”,而手機(jī)芯片則可以承擔(dān)計(jì)算功能,成為機(jī)器人的大腦。
同時(shí)通過在不同設(shè)備上加設(shè)二維碼,還可以通過“掃碼”方式在不同設(shè)備間交換信息進(jìn)行協(xié)作。在實(shí)驗(yàn)過程中,研究人員在兩個(gè)箱子中貼上了不同的二維碼,通過二維碼獲取信息后,手機(jī)可以控制機(jī)器手臂做出拾取和放下兩個(gè)不同的工作。
通過VRa,實(shí)驗(yàn)人員已經(jīng)能夠操控機(jī)器人在家庭場(chǎng)景中進(jìn)行拾取物品、澆花等等簡(jiǎn)單的家務(wù)。目前普渡大學(xué)還在工廠場(chǎng)景中進(jìn)行試驗(yàn),希望將VRa這種簡(jiǎn)單的人機(jī)交互方式帶入更多場(chǎng)景發(fā)揮作用。
人與機(jī)器的協(xié)作未來
當(dāng)然,VRa目前還是一個(gè)實(shí)驗(yàn)性的模型,并不代表能夠進(jìn)入現(xiàn)實(shí)場(chǎng)景應(yīng)用。但VRa解決了兩個(gè)家用機(jī)器人身上的重要問題,一個(gè)是沒有編程能力的普通用戶無法便利的控制機(jī)器人;另一個(gè)是通過手機(jī)+廉價(jià)機(jī)器人的方式克服了硬件成本問題。
從VRa的模式中,我們可以找到一些未來人類與家用機(jī)器人協(xié)作的靈感。
第一, 手機(jī)的終端能力是否可以進(jìn)行轉(zhuǎn)移和釋放?
目前手機(jī)終端的軟件和硬件能力都在不斷提高以便適應(yīng)智能需求,從3D結(jié)構(gòu)光攝像頭到AI芯片,都處于不斷下放的狀態(tài)。相比之下,讓掃地機(jī)器人、機(jī)械手臂從自身供應(yīng)鏈能力來說,想應(yīng)用上同樣的軟硬件,恐怕就需要承擔(dān)更高成本,進(jìn)而將這些成本轉(zhuǎn)移到市場(chǎng)端。但如果家用機(jī)器人能夠應(yīng)用上手機(jī)端的能力,一方面可以幫助廠商發(fā)揮技術(shù)價(jià)值,另一方面也能降低自身成本。
第二, 圖形化編程是否需要在家用機(jī)器人和家庭IoT系統(tǒng)中進(jìn)行普及?
家庭場(chǎng)景的復(fù)雜和高靈活性,并不一定代表需要機(jī)器人完全依靠自己的能力去理解環(huán)境。通過AR和二維碼、電子標(biāo)簽等等方式來建立機(jī)器人與現(xiàn)實(shí)環(huán)境的物理關(guān)系,在通過圖形化的交互方式展現(xiàn)給用戶,讓人人都可以為機(jī)器人規(guī)劃路線、操縱行動(dòng)。以這種方式促進(jìn)人機(jī)協(xié)作,通過人類智慧幫助機(jī)器人發(fā)揮作用。
第三, 家用機(jī)器人是否會(huì)走向廉價(jià)化?
VRa的一個(gè)重要特征,是“重腦”而“輕四肢”。通過拓展塢連接在設(shè)備上的手機(jī)才是重點(diǎn),承擔(dān)著交互、定位和視覺的重要作用。而作為四肢的掃地機(jī)器人、機(jī)械手臂等等反而承擔(dān)了更少的功能,價(jià)格也偏于廉價(jià)。未來家用機(jī)器人是否會(huì)偏向于出售軟件系統(tǒng)和控制中樞,而硬件本身則像樂高積木一樣,可以被隨意組裝和替換?
說到底,VRa的出現(xiàn)展示出了一種很常見的AI思潮——暫緩追求更高能、全能的AI技術(shù),轉(zhuǎn)向打磨操作系統(tǒng)和交互界面,讓更多人可以方便的將AI看做一種工具,去操縱和使用他們。
既然人的智慧已經(jīng)如此強(qiáng)大,我們又為什么要繞路去仿造人類的智慧呢?當(dāng)在追求智慧高度上走不通時(shí),轉(zhuǎn)向去追求智慧的普遍適用性,或許是個(gè)不錯(cuò)的選擇。