人工智能Ai的未來?Ai大模型加持下的人形機(jī)器人走進(jìn)現(xiàn)實(shí)!

隨著機(jī)器人技術(shù)的不斷演進(jìn),在經(jīng)歷過程序控制機(jī)器人、自適應(yīng)機(jī)器人、智能機(jī)器人三代明顯的進(jìn)化過程后,機(jī)器人發(fā)展的整體方向和路徑也呈現(xiàn)出了明確的態(tài)勢,從“自動(dòng)化”向“智能化”的演進(jìn)成為必然的要求。

本文來自微信公眾號(hào)“元宇宙生態(tài)環(huán)”。

隨著機(jī)器人技術(shù)的不斷演進(jìn),在經(jīng)歷過程序控制機(jī)器人、自適應(yīng)機(jī)器人、智能機(jī)器人三代明顯的進(jìn)化過程后,機(jī)器人發(fā)展的整體方向和路徑也呈現(xiàn)出了明確的態(tài)勢,從“自動(dòng)化”向“智能化”的演進(jìn)成為必然的要求。

眾所周知,作為人工智能多項(xiàng)技術(shù)和智慧的“集合體”,機(jī)器人幾乎可以代表了當(dāng)下人工智能技術(shù)的“最高成就”。近來,隨著ChatGPT等大語音模型等人工智能應(yīng)用的持續(xù)火熱,AI大模型受到了行業(yè)內(nèi)外空前的關(guān)注度,那么AI大模型+人形機(jī)器人會(huì)帶來怎樣的效果呢。

行業(yè)相關(guān)專家認(rèn)為,人形機(jī)器人作為人工智能的物理載體,相當(dāng)于為AI大模型打造的物理的身體,從這個(gè)角度來看,人形機(jī)器人起到了打破虛擬與現(xiàn)實(shí)之間邊界的效果;此外,人形機(jī)器人還將持續(xù)拓展AI大模型的“實(shí)操”度,提升人工智能的“智能系數(shù)”。

人形機(jī)器人與人工智能日漸共生、相互促進(jìn)

相較于工業(yè)機(jī)器人,人形機(jī)器人硬件要求更為復(fù)雜和多元,例如特斯拉采用的電驅(qū)方案具備商業(yè)化的應(yīng)用基礎(chǔ),預(yù)計(jì)全身共40個(gè)執(zhí)行器;而機(jī)械手采用微型電機(jī)+腱繩驅(qū)動(dòng)傳動(dòng)結(jié)構(gòu),單手6個(gè)電機(jī),11個(gè)自由度,空心杯電機(jī)結(jié)構(gòu)緊湊、能量密度高、能耗低,和人形機(jī)器人機(jī)械手需求契合度高。

正是AI大模型與人形機(jī)器人的互相依賴和相互促進(jìn),讓整個(gè)人工智能技術(shù)邁出了通向通用人工智能的一大步——這也正是將機(jī)器人做成人形的終極考慮:為了使機(jī)器人的執(zhí)行能力更加通用。據(jù)了解,AI大模型將從語音、視覺、決策、控制等多方面實(shí)現(xiàn)同人形機(jī)器人的結(jié)合,形成感知、決策、控制閉環(huán),使機(jī)器人具備常識(shí)。

在語音層面,語言大模型為機(jī)器人的自主語音交互提供了解決方案,包括上下文理解、多語種識(shí)別、多輪對(duì)話、情緒識(shí)別、模糊語義識(shí)別等通用語言任務(wù)上,ChatGPT顯著由于深度學(xué)習(xí),表現(xiàn)出了不亞于人類的理解力和語言生成能力。

在視覺層面,通用視覺大模型的All in One的多任務(wù)訓(xùn)練方案能使得機(jī)器人更好地適應(yīng)人類生活場景:大模型的強(qiáng)擬合能力使人形機(jī)器人在進(jìn)行目標(biāo)識(shí)別、避障、三維重建、語義分割等任務(wù)時(shí),具備更高的精確度;通用視覺大模型通過大量數(shù)據(jù)學(xué)到更多的通用知識(shí),并遷移到下游任務(wù)中,基于海量數(shù)據(jù)獲得的預(yù)訓(xùn)練模型具有較好的知識(shí)完備性,提升場景泛化效果。

而在決策層面,基于多模態(tài)的預(yù)訓(xùn)練大模型將增強(qiáng)機(jī)器人可完成任務(wù)的多樣性與通用性,讓其不局限于文本和圖像等單個(gè)部分,而是多應(yīng)用相容,拓展單一智能為融合智能,使機(jī)器人能結(jié)合其感知到的多模態(tài)數(shù)據(jù)實(shí)現(xiàn)自動(dòng)化決策。

AI大模型強(qiáng)勢發(fā)力之下人形機(jī)器人未來倍具想象空間

近日,英偉達(dá)創(chuàng)始人黃仁勛在2023年ITF世界大會(huì)上發(fā)表演講并提出,人工智能和加速計(jì)算正在共同改變技術(shù)行業(yè)。下一波人工智能浪潮將是一種被稱為具身AI的新型人工智能,即能夠理解、推理并與物理世界互動(dòng)的智能系統(tǒng),將“具身智能”的概念瞬間提升到了風(fēng)口浪尖。

所謂“具身智能”,則指在機(jī)器智能領(lǐng)域中,通過將智能算法與物理實(shí)體的感知、行動(dòng)和環(huán)境交互相結(jié)合,使機(jī)器能夠以更自然、更智能的方式與環(huán)境進(jìn)行交互和解決問題的能力。因此,也有不少行業(yè)內(nèi)外人士認(rèn)為,具身智能正是AI的終極形態(tài)。

在真實(shí)的物理環(huán)境下執(zhí)行任務(wù)、解決問題——人形機(jī)器人自誕生起,其實(shí)就正是具身智能的一種物理承載。換而言之,人形機(jī)器人的逐步完善也為具身智能的落地提供了方向,是具身智能的重要應(yīng)用場景,也將為具身智能的迭代優(yōu)化提供方向和空間。

從AI到人形機(jī)器人,再到具身智能,究竟帶動(dòng)了多大的市場和科研熱度呢?從專利數(shù)層面或可窺知一二。天眼查數(shù)據(jù)顯示,機(jī)器人專利保持穩(wěn)定增長,2022年申請(qǐng)專利2.3萬余項(xiàng);從類型上來看,發(fā)明專利與實(shí)用新型占比較高,兩者之和占總數(shù)的9成。

360截圖16251112669372.png

與此同時(shí),在AI大模型層面,單從“敲門磚”層面的自然語言處理領(lǐng)域來看,天眼查數(shù)據(jù)顯示,從近年來專利申請(qǐng)的數(shù)量來看,還是保持了較為穩(wěn)定快速的增長,自2018以來,其申請(qǐng)量的復(fù)合增長率達(dá)到61.2%;從類型上來看,發(fā)明專利占據(jù)絕對(duì)的領(lǐng)先地位,占比近98%。

360截圖16251112669372.png

逐年增長的研發(fā)熱情,為人形機(jī)器人和具身智能帶來了相當(dāng)充足的發(fā)展想象空間。

行業(yè)人士認(rèn)為,具身智能最大的特質(zhì)就是能夠以主人公的視角去自主感知物理世界,用擬人化的思維路徑去學(xué)習(xí),從而做出人類期待的行為反饋,而不是被動(dòng)的等待數(shù)據(jù)投喂;人形機(jī)器人提供了各種基于人類行為的學(xué)習(xí)和反饋系統(tǒng),為實(shí)現(xiàn)更復(fù)雜行為語義提供了迭代的基礎(chǔ)和試驗(yàn)場,因此,人形機(jī)器人或?qū)⒙氏瘸休d具身智能的能力。

誠然,在整個(gè)過程中,最重要的是AI的大腦,而AI的軀體從屬于智慧大腦,按照這樣的邏輯去打通人機(jī)之間的交互方式,讓AI能夠主動(dòng)感知物理世界,擬人化的思維路徑才能做到人類期待的行為反饋。而在當(dāng)下,機(jī)器人還遠(yuǎn)沒有人類期待的那般智能,但隨著人工智能技術(shù)的進(jìn)一步發(fā)展更迭,在AI大模型的持續(xù)加持之下,具身智能或?qū)⒁愿斓乃俣韧度胧袌觥⒆哌M(jìn)人們的生活。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論