AIGC+實(shí)時(shí)互動(dòng),能不能為你造一個(gè)“虛擬老婆”?

從2015年前后,短視頻、直播興起,才令人們對(duì)于實(shí)時(shí)音視頻有了更加具象的認(rèn)知。隨后,疫情爆發(fā)之下“全民宅家”所催生的視頻會(huì)議、在線教育、電商直播也使得實(shí)時(shí)音視頻需求迅速爆發(fā)。

本文來(lái)自“物聯(lián)網(wǎng)智庫(kù)”,作者/李寶珠。

AIGC的風(fēng)已經(jīng)刮到了實(shí)時(shí)互動(dòng)(RTE)領(lǐng)域,并且已經(jīng)有企業(yè)乘風(fēng)起勢(shì)。

提到RTE,亦或是實(shí)時(shí)音視頻(RTC),可能很多人感覺(jué)到陌生,但其實(shí),在視頻會(huì)議、線上直播、網(wǎng)上課堂等場(chǎng)景中,正是RTC與RTE支撐起了低時(shí)延、高清晰、深度沉浸的互動(dòng)體驗(yàn)。

從2015年前后,短視頻、直播興起,才令人們對(duì)于實(shí)時(shí)音視頻有了更加具象的認(rèn)知。隨后,疫情爆發(fā)之下“全民宅家”所催生的視頻會(huì)議、在線教育、電商直播也使得實(shí)時(shí)音視頻需求迅速爆發(fā)。

據(jù)36氪研究院發(fā)布的數(shù)據(jù)顯示,實(shí)時(shí)音視頻在國(guó)內(nèi)360、華為、小米三大安卓應(yīng)用市場(chǎng)的近10,000個(gè)App中的滲透率,2015年還不到1%,2021年已突破30%。業(yè)界認(rèn)為,在未來(lái)幾年,實(shí)時(shí)音視頻技術(shù)在關(guān)鍵行業(yè)的滲透率可能將超過(guò)50%。

對(duì)于很多消費(fèi)者而言,RTC、RTE作為默默耕耘在應(yīng)用背后的重要技術(shù),或許并沒(méi)有得到頗高的關(guān)注,但在產(chǎn)業(yè)端,這個(gè)能夠迸發(fā)出創(chuàng)新應(yīng)用的領(lǐng)域卻是在持續(xù)成長(zhǎng)中逐漸與越來(lái)越多的場(chǎng)景結(jié)合。

這也令筆者想起了此前與聲網(wǎng)相關(guān)負(fù)責(zé)人的一次訪談——“即便你過(guò)去沒(méi)有聽(tīng)說(shuō)過(guò)聲網(wǎng),但你一定用過(guò)聲網(wǎng)的服務(wù)”。的確,作為最早一批入局實(shí)時(shí)音視頻領(lǐng)域的企業(yè),聲網(wǎng)雖然在C端并不似生態(tài)繁榮的大廠那般名頭響亮,但其全球注冊(cè)應(yīng)用在2022年9月就已超過(guò)51.1萬(wàn),在行業(yè)內(nèi)的影響力可見(jiàn)一斑。

就在今天上午,RTE 2023第九屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)在北京召開(kāi),這個(gè)由聲網(wǎng)從2015年搭建而成的交流平臺(tái),也逐漸成為了RTC的行業(yè)聚會(huì),而在今天上午的主論壇上,AIGC無(wú)疑成為了主旋律。

AIGC+RTE,玩出什么新花樣

從去年年底開(kāi)始,ChatGPT異軍突起,甚至被黃仁勛稱為人工智能的“iPhone時(shí)刻”。時(shí)至今日,這場(chǎng)圍繞大模型、AIGC的狂歡還在持續(xù),并且有更多相關(guān)的技術(shù)、行業(yè)參與其中,RTE其實(shí)并不是最早加入的,但應(yīng)該算得上是極富創(chuàng)造力的。

首先來(lái)了解一下什么是RTE。

據(jù)悉,2020年,聲網(wǎng)在上市招股書(shū)中首次公開(kāi)提出“RTE(Real-Time Engagement)”概念,此后這一概念逐漸被全行業(yè)認(rèn)可和使用。此前,更多被業(yè)內(nèi)所熟知的RTC更多是強(qiáng)調(diào)對(duì)語(yǔ)義信息進(jìn)行高質(zhì)量和高效率的傳遞,而RTE則是更聚焦用戶所需要的共享時(shí)空,即場(chǎng)景。

換言之,RTC是從信息傳遞的角度出發(fā),而實(shí)時(shí)音視頻也僅僅提供語(yǔ)音溝通,能夠滿足單一的場(chǎng)景和通話標(biāo)準(zhǔn)。而隨著實(shí)時(shí)互動(dòng)的創(chuàng)新場(chǎng)景涌現(xiàn),加之人們對(duì)于通話質(zhì)量的要求提升,低時(shí)延、高清晰的實(shí)時(shí)互動(dòng)需求恰恰是RTE的專長(zhǎng)。

而火爆的AIGC自然是不需要過(guò)多介紹了,從聊天機(jī)器人到AI助理,再到到虛擬女友,再到復(fù)刻親人形象,其已經(jīng)多次展示了驚人的創(chuàng)造力。

那么,RTE又能夠與AI擦出哪些火花呢?

聲網(wǎng)創(chuàng)始人兼CEO趙斌在RTE大會(huì)上展示了聲網(wǎng)鳳鳴AI引擎優(yōu)化線上課程噪聲的案例,以及利用AI算法提升實(shí)時(shí)視頻清晰度的案例,進(jìn)一步介紹了AI對(duì)于RTE行業(yè)的顛覆式改造。此外,面向社交和泛娛樂(lè)場(chǎng)景的實(shí)時(shí)互動(dòng),AIGC相較傳統(tǒng)的AI對(duì)話機(jī)器人,還能夠提供更加接近于真人的情感價(jià)值和情緒價(jià)值。

趙斌還表示,AIGC對(duì)于RTE行業(yè)的另一個(gè)影響便是可以大幅提高應(yīng)用開(kāi)發(fā)效率。從編程、自動(dòng)化測(cè)試再到文檔生產(chǎn)以及低代碼平臺(tái)進(jìn)化,都將得到一定的促進(jìn)。雖然很多影響和變化還都處于早期階段,但未來(lái)值得釋放的空間仍非常值得期待,還有很多想象仍未被實(shí)現(xiàn)。

例如,AIGC能否徹底顛覆低代碼形成的方式,以對(duì)話的形式指令機(jī)器來(lái)生成代碼,甚至不光是生成代碼,而是生成完整的應(yīng)用,從而實(shí)現(xiàn)新一代的無(wú)代碼能力。

至于聲網(wǎng),作為RTE賽道的開(kāi)創(chuàng)者,其也率先推出了AIGC RTE能力模塊,可以和任何大模型平臺(tái)對(duì)接,將現(xiàn)有的文字交流的互動(dòng)方式和溝通方式轉(zhuǎn)化成更加自然的語(yǔ)音對(duì)話,同時(shí)也保障了接近人與人對(duì)話的低時(shí)延體驗(yàn)。

據(jù)介紹,目前聲網(wǎng)RTE x AIGC一站式解決方案,可以將AI對(duì)話端到端響應(yīng)延時(shí)控制在1.9秒以內(nèi),并且支持API快速調(diào)用,提供開(kāi)箱即用的場(chǎng)景化demo,最快3個(gè)小時(shí)即可實(shí)現(xiàn)方案驗(yàn)證。

趙斌也表示,除了社交、直播、泛娛樂(lè)場(chǎng)景等,企業(yè)用戶近年來(lái)開(kāi)始積極擁抱實(shí)時(shí)互動(dòng)所帶來(lái)的一系列變化,開(kāi)始基于RTE進(jìn)行效率優(yōu)化。企業(yè)也意識(shí)到如今的實(shí)時(shí)互動(dòng)能力已經(jīng)遠(yuǎn)遠(yuǎn)超出了企業(yè)內(nèi)部視頻會(huì)議的需求,而實(shí)時(shí)互動(dòng)平臺(tái)也不僅僅是視頻會(huì)議平臺(tái),其所提供的無(wú)所不答的實(shí)時(shí)網(wǎng)絡(luò)以及無(wú)所不及的音視頻能力,正在成為企業(yè)數(shù)字化轉(zhuǎn)型的一個(gè)重要支撐。

對(duì)于幾萬(wàn)、甚至幾十萬(wàn)人的大企業(yè)而言,往往需要構(gòu)建全域一張網(wǎng)、全業(yè)務(wù)一張網(wǎng)、全設(shè)備一網(wǎng)通、全業(yè)務(wù)多形態(tài)連接的基礎(chǔ)能力。聲網(wǎng)也可以配合企業(yè)構(gòu)建音視頻實(shí)時(shí)互動(dòng)平臺(tái),用統(tǒng)一中臺(tái)的方式,改造企業(yè)內(nèi)部過(guò)去做一個(gè)應(yīng)用就要重新建一套系統(tǒng)、重新部署網(wǎng)絡(luò)的低效、重復(fù)建設(shè)模式,從而極大地提高企業(yè)在業(yè)務(wù)上的靈活度和效率。

1.png

值得注意的是,在演講的最后,趙斌也帶了one more thing——聲網(wǎng)在RTE行業(yè)里面首次實(shí)現(xiàn)了廣播級(jí)的4K超高清實(shí)時(shí)互動(dòng)體驗(yàn)。

5G能與實(shí)時(shí)音視頻擦出什么火花?

雖然RTE 2023大會(huì)的主論壇主要聚焦在了AIGC與RTE的結(jié)合,但其實(shí)圍繞實(shí)時(shí)互動(dòng)的通信技術(shù)升級(jí)也是不容忽視的重要底座。過(guò)去,業(yè)內(nèi)一直在期待5G能夠幫助RTE領(lǐng)域?qū)崿F(xiàn)4G所未能達(dá)到的體驗(yàn)。

一方面,5G的超大帶寬、超低時(shí)延等特征,可大幅降低音視頻信息的延遲和緩沖時(shí)間,提高端到端毫秒級(jí)傳輸時(shí)延的滿足率,為RTC的數(shù)據(jù)傳輸?shù)於藞?jiān)實(shí)的基礎(chǔ)。另一方面,5G的商用之于不斷涌現(xiàn)的實(shí)時(shí)音視頻場(chǎng)景而言也是恰逢其時(shí)。

例如,在智慧醫(yī)療領(lǐng)域,無(wú)論是5G遠(yuǎn)程會(huì)診,還是遠(yuǎn)程手術(shù)示教、遠(yuǎn)程教學(xué)等場(chǎng)景,都需要低時(shí)延、高清晰的實(shí)時(shí)音視頻系統(tǒng)。

此外,以聲網(wǎng)的超低延時(shí)平行駕駛和平行控制方案為例,該方案面向以無(wú)人車、機(jī)器人為代表的智能設(shè)備遠(yuǎn)程運(yùn)維、人工接管和遠(yuǎn)程控制場(chǎng)景。針對(duì)于同城遠(yuǎn)程控制,聲網(wǎng)解決方案通過(guò)標(biāo)記優(yōu)先級(jí)優(yōu)化路由調(diào)度策略和同節(jié)點(diǎn)轉(zhuǎn)化方式,保障該場(chǎng)景下的延時(shí)傳輸質(zhì)量。

同時(shí)還結(jié)合了多運(yùn)營(yíng)商物聯(lián)網(wǎng)卡場(chǎng)景下,通過(guò)Multipath多路徑融合的技術(shù),保證網(wǎng)絡(luò)質(zhì)量的可用性和弱網(wǎng)對(duì)抗能力。據(jù)悉,實(shí)測(cè)數(shù)據(jù)顯示,從無(wú)人駕駛車輛攝像頭畫(huà)面采集,到遠(yuǎn)程控制臺(tái)顯示,聲網(wǎng)能做實(shí)時(shí)音視頻端到端時(shí)延最低百毫秒內(nèi),5G公網(wǎng)平均160ms;可靠信令可以做到端到端25ms之內(nèi),5G公網(wǎng)平均50ms,可以保障低速自動(dòng)駕駛車輛在30公里時(shí)速下,擁有相對(duì)可靠、安全和高效沉浸式的體驗(yàn),來(lái)完成所有的遠(yuǎn)程作業(yè)。

未來(lái),隨著AIGC的進(jìn)一步融合,加之5G提供更加穩(wěn)定、高可靠的通道,RTE勢(shì)必將帶來(lái)更多創(chuàng)新應(yīng)用,讓我們拭目以待。

參考資料:

1.《全球音視頻社交市場(chǎng)規(guī)模達(dá)1813億美元,60%以上用聲網(wǎng)》,36氪產(chǎn)業(yè)創(chuàng)新

2.《加速邁入“真實(shí)時(shí)”物聯(lián)網(wǎng)RTC成智能設(shè)備“硬指標(biāo)”》,砍柴網(wǎng)

3.《聲網(wǎng)CEO趙斌:生成式AI技術(shù)將顛覆式改造社交和泛娛樂(lè)行業(yè)|鈦媒體焦點(diǎn)》,鈦媒體APP

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論