AI+機(jī)器人,是噱頭?

當(dāng)機(jī)器人實(shí)現(xiàn)任務(wù)級(jí)交互,完成通用性進(jìn)化。那么就意味著在任何場(chǎng)景下,用戶僅需向機(jī)器人明確抽象的任務(wù)目標(biāo),它便能理解自然語(yǔ)言并自主拆解任務(wù)內(nèi)容,輸出具體決策與操作指令。并根據(jù)反饋信息,對(duì)指令進(jìn)行修正。

本文來自微信公眾號(hào)“高工移動(dòng)機(jī)器人”,作者/不及。

“為通用人形機(jī)器人構(gòu)建基礎(chǔ)模型是當(dāng)今人工智能最令人興奮的問題之一。”黃仁勛在GTC2024的開幕演講中表示。

而科大訊飛董事長(zhǎng)劉慶峰也在兩會(huì)上預(yù)言,“2024年將是大模型走向落地應(yīng)用的關(guān)鍵之年。”

“AI+機(jī)器人”的概念在這個(gè)春天被引爆。但除了科技大佬和投資人的狂歡以外,也有機(jī)器人從業(yè)者感到無(wú)法理解:小腦都沒做好,就開始炒作“大腦”了?

有人直言:“AI+機(jī)器人純粹是炒概念。”“這個(gè)概念太超前了,落地不現(xiàn)實(shí)。”

意見對(duì)立的根本矛盾在于,“AI+機(jī)器人”現(xiàn)在能不能跑通?進(jìn)入工業(yè)還有多久?

未來太美,現(xiàn)在太遠(yuǎn)

如果去看“AI+機(jī)器人”描繪的未來,無(wú)疑是美好的。

當(dāng)機(jī)器人實(shí)現(xiàn)任務(wù)級(jí)交互,完成通用性進(jìn)化。那么就意味著在任何場(chǎng)景下,用戶僅需向機(jī)器人明確抽象的任務(wù)目標(biāo),它便能理解自然語(yǔ)言并自主拆解任務(wù)內(nèi)容,輸出具體決策與操作指令。并根據(jù)反饋信息,對(duì)指令進(jìn)行修正。

“大腦”進(jìn)化之后,機(jī)器人的使用者將從掌握編程語(yǔ)言的專業(yè)算法工程師變?yōu)橐话愕钠胀ㄓ脩?,大大降低使用門檻。這也往往是一個(gè)產(chǎn)品或一個(gè)產(chǎn)業(yè)走向大規(guī)??焖俦l(fā)的起點(diǎn)。

這種設(shè)想已看到了現(xiàn)實(shí)的曙光,不少大模型形成了泛化能力。泛化能力指的是,大模型在訓(xùn)練數(shù)據(jù)中提煉共性,這樣在面對(duì)從未見過的數(shù)據(jù)時(shí)也能具備很好的預(yù)測(cè)能力,做到只窺見物體的一部分,而能想象到全貌。

百度集團(tuán)副總裁侯震宇認(rèn)為,和上一輪AI落地不同,2023年的大模型參數(shù)動(dòng)輒上千億,這樣規(guī)模的大模型才能在各個(gè)場(chǎng)景下具備通用能力,基于這種大模型精調(diào)出來才具備更好的產(chǎn)業(yè)應(yīng)用效果。

在主客觀因素影響下,全球基礎(chǔ)大模型均主要面向To B行業(yè)市場(chǎng)。例如制造、零售、金融等行業(yè),而機(jī)器人更是被認(rèn)為是大模型的最佳載體之一,目前有大量企業(yè)及相關(guān)機(jī)構(gòu)在瞄準(zhǔn)“AI+機(jī)器人”賽道。

例如,擁有協(xié)作機(jī)器人和AMR產(chǎn)品線的Teradyne Robotics在GTC大會(huì)上宣布與英偉達(dá)合作,為協(xié)作和移動(dòng)機(jī)器人添加新的AI功能;Figure AI的人形機(jī)器人搭載ChatGPT大模型,已能遵循指示并協(xié)助完成清理和移交物體等任務(wù);近期瞄準(zhǔn)機(jī)器人行業(yè)的多模態(tài)大模型公司若愚科技完成超5000萬(wàn)元天使輪融資……

更早之前,李飛飛教授聯(lián)合斯坦福大學(xué)、加州理工、清華大學(xué)和英偉達(dá)幾位學(xué)者打造的機(jī)器人VIMA,是一個(gè)帶有機(jī)械臂的LLM,能接受多模態(tài)提示詞、單個(gè)文本、圖像、視頻等信息結(jié)合,一度引發(fā)行業(yè)熱議。

然而,在產(chǎn)業(yè)鏈深耕的部分從業(yè)者們對(duì)此持疑,“商業(yè)的本質(zhì)是產(chǎn)生價(jià)值,而不是有高級(jí)的東西就買。”更多人認(rèn)為,“AI+機(jī)器人”前景是美好的,但工業(yè)講究務(wù)實(shí),并不會(huì)只為好的概念而買單。

有人舉例,“一分投入一分收獲,智能駕駛投入了多少時(shí)間和人力物力,到現(xiàn)在都不是個(gè)合格的駕駛員,又怎么能指望AI能培養(yǎng)出來一個(gè)合格的工人?”

透過大模型未來繁榮的濾鏡,機(jī)器人產(chǎn)業(yè)鏈更關(guān)注大模型何時(shí)能落地、現(xiàn)階段又能產(chǎn)生何種價(jià)值。

“AI是很熱,但是技術(shù)和錢是不一樣的,錢在哪投都是錢,但是你做產(chǎn)品和技術(shù)在不同的領(lǐng)域都有可能不一樣,不能被市場(chǎng)熱點(diǎn)帶著跑。”

“如果5-8年內(nèi),AI疊加到機(jī)器人身上,能解決一些特定的工藝問題,那還是有巨大市場(chǎng)的。”

然而,機(jī)器人要想像人類一樣,具有廣泛的知識(shí)、協(xié)調(diào)的肢體行為能力,短期來看是不現(xiàn)實(shí)的。

泛化的AI,還無(wú)法成為合格工人

已具備泛化能力的大模型,為何還無(wú)法成為一個(gè)合格工人?

如果說通用大模型是培養(yǎng)一個(gè)對(duì)社會(huì)生活有基礎(chǔ)認(rèn)知和處理能力的人,那么行業(yè)大模型的目標(biāo)就是訓(xùn)練一個(gè)成熟掌握技能的工人。

行業(yè)大模型基于基礎(chǔ)大模型能力做一些行業(yè)微調(diào),針對(duì)性定制,不需要從零開始標(biāo)注數(shù)據(jù)。

但難就難在“行業(yè)微調(diào)”,機(jī)器人面對(duì)千行百業(yè),下游應(yīng)用豐富,但終端行業(yè)數(shù)據(jù)具有封閉性,大模型要獲得工藝數(shù)據(jù)的培訓(xùn)十分困難。

例如,工業(yè)場(chǎng)景復(fù)雜不標(biāo)準(zhǔn),人的經(jīng)驗(yàn)難以理論化,工藝更難靠理論推演。同一個(gè)場(chǎng)景下,不同的SKU、不同材質(zhì)和形狀的部件,都會(huì)有不同的處理方法。對(duì)人來說舉一反三輕而易舉,對(duì)AI而言卻是能力的鴻溝。

因此,大部分人認(rèn)為,“AI+機(jī)器人”不是不能加入工業(yè)場(chǎng)景,不過只能做一些簡(jiǎn)單的場(chǎng)景。

“如果只能解決低工藝場(chǎng)景,現(xiàn)在的技術(shù)都能做到,加不加AI有什么區(qū)別呢?”

“例如就擰螺絲而言,要給四個(gè)角擰螺絲,如果是機(jī)器人可能四個(gè)角就全擰死了,而在實(shí)際操作中,需要有先后次序,不能一下全部擰死。”如果沒有對(duì)工藝庫(kù)有深刻的理解,根本不知道這些細(xì)節(jié)。甚至焊接一類復(fù)雜的場(chǎng)景,都還沒有形成可復(fù)制推廣的工藝程序。

如果寄希望于行業(yè)開放工藝數(shù)據(jù),又會(huì)陷入另一個(gè)僵局。工廠最值錢的是工藝和供應(yīng)鏈,最難的是工藝庫(kù)。而建工藝庫(kù),來自大量現(xiàn)場(chǎng)實(shí)踐。作為工廠的核心機(jī)密之一,工藝庫(kù)向來不假借于外人之手。

要撬開終端的數(shù)據(jù)庫(kù)并不容易。但基于數(shù)據(jù)庫(kù)的重要性,越來越多的機(jī)器人廠商與終端合作,典型是作為具身智能代表的人形機(jī)器人。

例如Figure AI與寶馬的合作、Digit落地試點(diǎn)亞馬遜倉(cāng)庫(kù)、Apollo進(jìn)軍奔馳車間等。

但這種模式的跑通顯然不是一蹴而就的,有行業(yè)人士直指,AI+機(jī)器人能不能成功,要看特斯拉今年能不能在工廠內(nèi)跑通。

另一種可能的路徑是做行業(yè)大模型的人,本身就深諳機(jī)器人產(chǎn)業(yè),對(duì)一些應(yīng)用場(chǎng)景深入了解。正如許多汽車廠商躬身入局,開發(fā)人形機(jī)器人投入到汽車產(chǎn)線上。

但放眼整個(gè)機(jī)器人行業(yè)而言,都缺乏這類復(fù)合型人才,“以前行業(yè)不需要智能,現(xiàn)在需要智能的時(shí)候,這個(gè)產(chǎn)業(yè)鏈上的人都不是搞智能出身的。”

除了工藝庫(kù)建設(shè)的難度外,硬件精度是實(shí)現(xiàn)機(jī)器人智慧操作的短板。

目前,機(jī)器人行業(yè)現(xiàn)狀是,硬件不夠軟件湊。傳感器精度的不足,常常需要依靠算法來彌補(bǔ)。但當(dāng)算法已經(jīng)成長(zhǎng)為真正的“大腦“,此時(shí)的手腳失衡只會(huì)讓機(jī)器人顯得更笨拙。

有行業(yè)人士表示,如果要達(dá)成理想化的“AI+機(jī)器人”,當(dāng)前的傳感器強(qiáng)度就不支持。例如“大腦”已經(jīng)完成了識(shí)別、規(guī)劃,但受限于傳感器精度,機(jī)器人可能按照規(guī)劃路徑都走不準(zhǔn)。

“只靠理論推演,而不親身實(shí)踐,是走不通的。起碼現(xiàn)在沒有一個(gè)行業(yè)按照這種模式走得通,就說明AI不是萬(wàn)能的。”

理論永遠(yuǎn)無(wú)法推演實(shí)際,一套完美的邏輯化成現(xiàn)實(shí),往往需要經(jīng)過艱難的跋涉。

機(jī)器人不僅是走在科技前沿的新質(zhì)生產(chǎn)力,更多是幾十年的打鐵功夫積累,看的就是一釘一鑿之間的幽微之處。

而這釘鑿之間的細(xì)微差距,已足以讓AI深研良久。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論