本文來(lái)自微信公眾號(hào)“數(shù)字經(jīng)濟(jì)雜志”,作者/杜蘭。
技術(shù)創(chuàng)新是一條彎曲的直線,要經(jīng)過(guò)技術(shù)萌芽期、期望膨脹期、泡沫破裂的低谷期、穩(wěn)步爬升的復(fù)蘇期和成熟期。元宇宙作為一種融合多個(gè)技術(shù)的科技愿景,也難免經(jīng)歷這種種階段。全景式的、虛實(shí)共生的元宇宙,在短期內(nèi)難以實(shí)現(xiàn),甚至XR產(chǎn)業(yè)的規(guī)模突破仍有待時(shí)日。但長(zhǎng)期來(lái)看,我們應(yīng)該對(duì)元宇宙抱有美好的預(yù)期,因?yàn)樵钪婢哂幸蕴撝鷮?shí),推動(dòng)現(xiàn)實(shí)生產(chǎn)力發(fā)展的巨大潛力。
在過(guò)去的兩年里,元宇宙一直都是科技圈里的熱門(mén)概念。從最初的什么是元宇宙,描繪未來(lái)場(chǎng)景,勾勒發(fā)展階段,到探索元宇宙在具體行業(yè)和場(chǎng)景的落地路徑,人們對(duì)元宇宙的認(rèn)識(shí)逐漸回歸理性和現(xiàn)實(shí)。一方面,元宇宙應(yīng)作為數(shù)字經(jīng)濟(jì)的一部分來(lái)助力實(shí)體經(jīng)濟(jì)發(fā)展,這已成為國(guó)內(nèi)產(chǎn)業(yè)界的共識(shí);另一方面,作為元宇宙入口的VR/AR/XR終端設(shè)備發(fā)展卻始終較為緩慢,近期多個(gè)科技巨頭在發(fā)展受挫后陸續(xù)收縮了相關(guān)的布局,不禁讓人感慨元宇宙諸多掣肘,道阻且長(zhǎng)。
2023年1月以來(lái),ChatGPT引發(fā)全球人工智能的新一輪技術(shù)熱潮,這使元宇宙看起來(lái)更顯落寞。在這種背景下,我們應(yīng)如何看待元宇宙的現(xiàn)狀和前景?人工智能的發(fā)展又將怎樣推動(dòng)元宇宙的發(fā)展?ChatGPT對(duì)元宇宙又有何意義?我想就此分享一些觀點(diǎn)。
元宇宙的困境:沉浸感與開(kāi)放度難以兼得
元宇宙到底發(fā)展到哪一步了?我們首先通過(guò)好萊塢電影《頭號(hào)玩家》,來(lái)看看理想中的元宇宙是什么樣。這部電影中的元宇宙叫做“綠洲”,它已經(jīng)具備了元宇宙的6個(gè)基本要素:虛擬形象和身份、沉浸式體驗(yàn)、社交系統(tǒng)、經(jīng)濟(jì)系統(tǒng)、開(kāi)放自由的創(chuàng)作以及規(guī)則共識(shí)。每個(gè)要素不但從技術(shù)到應(yīng)用都高度發(fā)達(dá),而且都是虛實(shí)共生的。
我們距離“綠洲”這種理想中的元宇宙有多遠(yuǎn)?在當(dāng)下,主要用戶為青少年的Roblox游戲社區(qū)基本具備了元宇宙各個(gè)要素,尤其是在社交系統(tǒng)、經(jīng)濟(jì)系統(tǒng)、自由開(kāi)放的創(chuàng)作環(huán)境等方面表現(xiàn)很好,但沉浸式體驗(yàn)感很弱,卡通風(fēng)的人物和場(chǎng)景建模,真實(shí)感遠(yuǎn)遠(yuǎn)不及3A游戲大作,也不完全是VR場(chǎng)景。
與之恰恰相反的是,國(guó)內(nèi)外主流的XR設(shè)備一直致力于沉浸感、真實(shí)感的提升,也取得了顯著的進(jìn)步,但卻始終沒(méi)有形成像Roblox這樣的用戶規(guī)模和活躍生態(tài)(Roblox2022年Q4日活用戶為5880萬(wàn))。
人工智能是提升元宇宙生產(chǎn)效率的關(guān)鍵
在資源有限的情況下,必須提高生產(chǎn)效率和降低成本,而人工智能技術(shù)的發(fā)展或?qū)⑹瞧凭值年P(guān)鍵。人工智能是能夠貫穿元宇宙各場(chǎng)景的基礎(chǔ)性工具,將助力元宇宙變得高效敏捷、成本低廉、性能強(qiáng)大。
第一,人工智能是保障元宇宙人機(jī)交互沉浸式體驗(yàn)的支撐性技術(shù)。元宇宙的高度沉浸體驗(yàn),有賴于終端設(shè)備上的視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等感官體驗(yàn)的高度逼真,以及語(yǔ)音、光學(xué)定位、手勢(shì)追蹤、動(dòng)作捕捉等人機(jī)交互要非常敏捷智能,這些功能的提升都有賴于AI技術(shù)的支撐。
作為中國(guó)人工智能領(lǐng)域的頭部企業(yè),科大訊飛在“智能人機(jī)交互”領(lǐng)域取得了很多突破。過(guò)去一年里,我們的語(yǔ)音合成體驗(yàn)實(shí)現(xiàn)大幅提升,在“訊飛有聲”App上,你不但能選擇多種風(fēng)格的合成聲音,還能花幾分鐘時(shí)間讓AI“復(fù)刻”自己的聲音。語(yǔ)音識(shí)別方面,在最復(fù)雜的高噪音、多人說(shuō)話的場(chǎng)景下,我們從過(guò)去的單模態(tài)識(shí)別準(zhǔn)確率39%做到了多模態(tài)的88%,已基本可以大規(guī)模使用。
在此基礎(chǔ)上,我們?cè)诜e極推進(jìn)從“單模態(tài)感知”到“多模態(tài)感知”的系統(tǒng)創(chuàng)新,在復(fù)雜場(chǎng)景的感知、復(fù)雜信息的理解等方面都取得了重大突破?;诙嗄B(tài)語(yǔ)音識(shí)別、視線檢測(cè)等多模態(tài)融合技術(shù),科大訊飛推出了“多模態(tài)免喚醒交互系統(tǒng)”,交互響應(yīng)成功率超93%以上、誤喚醒率0.01%,目前已在車(chē)載場(chǎng)景實(shí)現(xiàn)定點(diǎn)生產(chǎn)。此外,實(shí)時(shí)手勢(shì)識(shí)別技術(shù)實(shí)現(xiàn)了“凌空手寫(xiě)”,視線追蹤技術(shù)實(shí)現(xiàn)了“眼神打字”,多模感知算法為用戶帶來(lái)了更多元、更直接、更沉浸的交互體驗(yàn)。
這些技術(shù)進(jìn)步也為未來(lái)元宇宙中的沉浸式人機(jī)交互打下了基礎(chǔ)。只有大幅提升人機(jī)交互的沉浸感、便捷性,才能加速元宇宙XR硬件終端普及,推動(dòng)市場(chǎng)應(yīng)用與技術(shù)發(fā)展產(chǎn)生正向循環(huán),推動(dòng)制造和研發(fā)成本不斷降低。
第二,人工智能是元宇宙世界創(chuàng)建和內(nèi)容生產(chǎn)的助推器。元宇宙中,用戶直接接觸到的對(duì)象主要有虛擬人、虛擬物品和場(chǎng)景、文娛內(nèi)容等。借助人工智能AIGC技術(shù),以人機(jī)耦合的方式來(lái)生產(chǎn)這些對(duì)象,將大大提高生產(chǎn)效率和降低成本。
虛擬人是元宇宙落地的先鋒領(lǐng)域,在真正應(yīng)用于元宇宙之前,虛擬人就已廣泛應(yīng)用于媒體、電商、娛樂(lè)、運(yùn)營(yíng)商、旅游、教育、政務(wù)、企業(yè)等很多領(lǐng)域,助力降本增效。還可以打造情感陪伴型虛擬人,為每個(gè)家庭服務(wù)。過(guò)去一年,科大訊飛在虛擬人的多模感知、多維表達(dá)、情感貫穿、自主定義等方面取得突破,不但虛擬人的真實(shí)度大幅提升,制作效率也顯著提高,可以快速構(gòu)建3D虛擬人,一句話?cǎi)R上學(xué)會(huì)你的聲線,可以定制特定的手勢(shì)、姿態(tài),整個(gè)過(guò)程只需低代碼甚至無(wú)代碼。
元宇宙中物品、場(chǎng)景的構(gòu)建也需要人工智能技術(shù)。例如英偉達(dá)通過(guò)人工智能技術(shù)用2D圖片快速生成3D模型,而不再需要通過(guò)漫長(zhǎng)的建模、渲染。Meta開(kāi)發(fā)的BuilderBot工具,直接說(shuō)“要一棵樹(shù)”,或者“在這兒放一張桌子”,就能用語(yǔ)音指令的方式快速搭建場(chǎng)景。
科大訊飛使用人工智能的語(yǔ)義理解技術(shù),實(shí)現(xiàn)了建筑三維圖紙的自動(dòng)設(shè)計(jì),可以幫助設(shè)計(jì)師把一個(gè)20萬(wàn)平方米建筑的設(shè)計(jì)周期從60天縮短到15天。在元宇宙中,同樣可以應(yīng)用這項(xiàng)技術(shù)提升數(shù)字建筑的搭建效率。
在文娛內(nèi)容創(chuàng)作方面,用AI寫(xiě)作、繪畫(huà)、作曲、視頻等技術(shù)將大大低元宇宙中人們的創(chuàng)作門(mén)檻,提高創(chuàng)作效率,極大地豐富元宇宙中的個(gè)性化內(nèi)容。例如AI繪畫(huà)領(lǐng)域,DALL·E、DiscoDiffusion、Midjourney等工具支持文本到圖片的創(chuàng)作,既能生成不同藝術(shù)風(fēng)格的繪畫(huà)作品,也能生成以假亂真的攝影作品,把圖像藝術(shù)的創(chuàng)作門(mén)檻降到了最低。
第三,人工智能也是元宇宙以虛助實(shí),服務(wù)于民生和產(chǎn)業(yè)發(fā)展的橋梁。從現(xiàn)實(shí)世界到虛擬世界,我們的媒介是數(shù)字人,而從虛擬世界到現(xiàn)實(shí)世界,我們的媒介是機(jī)器人??拼笥嶏w的“超腦2030計(jì)劃”,旨在打造懂知識(shí)、善學(xué)習(xí)、能進(jìn)化的機(jī)器人,讓機(jī)器人走進(jìn)每個(gè)家庭。當(dāng)然這個(gè)目標(biāo)不是一步完成的,現(xiàn)階段我們會(huì)發(fā)展專業(yè)虛擬人,再到具備多模態(tài)情感理解能力的陪伴虛擬人,同時(shí)發(fā)展仿生機(jī)器人、外骨骼機(jī)器人等硬件技術(shù),最后我們要打造出軟硬件一體,貫穿虛擬世界和現(xiàn)實(shí)世界的陪伴機(jī)器人。在農(nóng)業(yè)、工業(yè)等實(shí)體經(jīng)濟(jì)領(lǐng)域,人工智能也將幫助我們更好地實(shí)現(xiàn)虛實(shí)融合。例如在農(nóng)業(yè)領(lǐng)域,農(nóng)業(yè)生產(chǎn)者可以在虛擬空間里借助智能設(shè)備對(duì)農(nóng)作物和畜禽的生長(zhǎng)狀態(tài)進(jìn)行實(shí)時(shí)觀測(cè),制定最佳的農(nóng)作物管理措施,并利用智能設(shè)備落實(shí)這些措施。工業(yè)元宇宙,可以在研發(fā)設(shè)計(jì)環(huán)節(jié),用虛實(shí)共生的可視化方式進(jìn)行模擬驗(yàn)證,優(yōu)化產(chǎn)品全生命周期的制造過(guò)程,解決產(chǎn)品試制周期長(zhǎng)、制造工藝不穩(wěn)定等問(wèn)題。也可以更高效地管控整個(gè)生產(chǎn)過(guò)程,及時(shí)發(fā)現(xiàn)和診斷故障。
ChatGPT對(duì)元宇宙有重要意義
首先要明確的是,ChatGPT是人工智能的一項(xiàng)技術(shù)和產(chǎn)品,而元宇宙與其說(shuō)是一項(xiàng)技術(shù),不如說(shuō)是一個(gè)極為宏大和復(fù)雜的場(chǎng)景,兩者之間并不是直接的此消彼長(zhǎng)的關(guān)系。但從技術(shù)角度看,ChatGPT對(duì)元宇宙的發(fā)展又是個(gè)好消息。最近我們訊飛研究院的執(zhí)行院長(zhǎng)劉聰在接受新華網(wǎng)專訪時(shí)談到了ChatGPT。這項(xiàng)技術(shù)本質(zhì)上是一個(gè)由浮點(diǎn)數(shù)參數(shù)表示的深度神經(jīng)網(wǎng)絡(luò)大模型,是深度學(xué)習(xí)提出后又一個(gè)里程碑式的技術(shù)革命,已經(jīng)實(shí)現(xiàn)了初步的“智慧涌現(xiàn)”。我們認(rèn)為,在ChatGPT的基礎(chǔ)上,以自然語(yǔ)言處理為代表的人工智能算法有可能重構(gòu)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的產(chǎn)品形態(tài),促進(jìn)教育業(yè)、醫(yī)療業(yè)、汽車(chē)業(yè)、金融業(yè)、消費(fèi)業(yè)、媒體業(yè)、服務(wù)業(yè)和制造業(yè)等眾多產(chǎn)業(yè)的升級(jí),最終帶來(lái)對(duì)應(yīng)商業(yè)模式的變革。
如果把元宇宙看作三維空間的互聯(lián)網(wǎng),那么ChatGPT在當(dāng)前互聯(lián)網(wǎng)世界的應(yīng)用也將能夠進(jìn)一步拓展到元宇宙中,加速元宇宙的到來(lái)。結(jié)合科大訊飛多年來(lái)在深度學(xué)習(xí)算法、大模型技術(shù)、行業(yè)大數(shù)據(jù)、知識(shí)圖譜、多模態(tài)感知、系統(tǒng)工程技術(shù)方面優(yōu)勢(shì)積累,通過(guò)最近兩個(gè)多月的系統(tǒng)分析和快速驗(yàn)證,我們非常有信心實(shí)現(xiàn)ChatGPT類(lèi)似的技術(shù)階躍進(jìn)步,并在中文認(rèn)知智能領(lǐng)域達(dá)到國(guó)際領(lǐng)先水平。
元宇宙發(fā)展要學(xué)會(huì)沿途下蛋,為真實(shí)世界服務(wù)。我們常說(shuō)技術(shù)創(chuàng)新是一條彎曲的直線,總是要經(jīng)過(guò)技術(shù)萌芽期、期望膨脹期、泡沫破裂的低谷期、穩(wěn)步爬升的復(fù)蘇期和成熟期。元宇宙作為一種融合多個(gè)技術(shù)的科技愿景,也難免經(jīng)歷這種種階段。全景式的、虛實(shí)共生的元宇宙,在短期內(nèi)難以實(shí)現(xiàn),甚至XR產(chǎn)業(yè)的規(guī)模突破仍有待時(shí)日。但長(zhǎng)期來(lái)看,我們應(yīng)該對(duì)元宇宙抱有美好的預(yù)期,因?yàn)樵钪婢哂幸蕴撝鷮?shí),推動(dòng)現(xiàn)實(shí)生產(chǎn)力發(fā)展的巨大潛力。
當(dāng)泡沫退去,真正想要投身元宇宙的創(chuàng)業(yè)者要堅(jiān)持源于熱愛(ài)的初心,要看到星辰大海,才能在創(chuàng)新道路上長(zhǎng)期堅(jiān)守。也要學(xué)會(huì)沿途下蛋,為階段性的技術(shù)成果找到應(yīng)用場(chǎng)景和市場(chǎng),最好是選擇社會(huì)剛需領(lǐng)域或有大量潛在的活躍用戶領(lǐng)域,這樣既能為后續(xù)發(fā)展造血,也能通過(guò)應(yīng)用牽引推動(dòng)技術(shù)不斷突破。
科技產(chǎn)生于真實(shí)世界的需求,并且要為真實(shí)世界服務(wù)。只有讓數(shù)字技術(shù)融合實(shí)體經(jīng)濟(jì)發(fā)展,引領(lǐng)讓現(xiàn)實(shí)世界更美好的開(kāi)拓型元宇宙,摒棄讓人深度沉迷的奶嘴形元宇宙,才能給中國(guó)和人類(lèi)社會(huì)帶來(lái)真正意義上的進(jìn)步。
(文︱杜蘭科大訊飛高級(jí)副總裁)