1992年,科幻作家尼爾·斯蒂芬森在《雪崩》里提及了兩個概念,“Metaverse(元宇宙)”與“Avatar(化身)”。
今天,市場為這兩個概念,都“瘋”了一般。
元宇宙,自不必說。
“Avatar(化身)”也同樣迸發(fā)出驚人的爆發(fā)力。
從愛醬到A Soul、從阿凡達到柳夜熙、從數(shù)字孿生黃仁勛到小扎,從艾靈到華智冰、夏語冰,虛擬人正在以前所未有的速度走紅、出圈,迎來井噴式爆發(fā)。
近期,虛擬人產(chǎn)業(yè)界又爆出驚天大消息——繼上次真假難辨,被認為是虛擬人技術天花板的每經(jīng)AI主播N小黑走紅剛一周,小冰公司又聯(lián)合北影世紀(北京)教育咨詢集團旗下的數(shù)字人類公司,打造了表現(xiàn)力更勝一籌的數(shù)字孿生CEO李威克。
“我原以為‘N小黑’已經(jīng)天下無敵了,沒想到此人比他還要‘勇猛’。”一場虛擬人之間真實自然度的天花板對決再度拉開。
而當這些虛擬人在不斷追求技術的極致表現(xiàn)時,或許一個商業(yè)爆發(fā)的虛擬人時代就離我們不遠了?!
看似差不多的虛擬人,也有“三教九流”?
數(shù)字孿生CEO李威克是首個登場于影視和數(shù)字營銷賽道的數(shù)字孿生虛擬人,其真實自然度甚至要比N小黑要更勝一籌。
數(shù)字孿生CEO李威克
此前,N小黑上線直播了70多天,竟無一人發(fā)覺站在臺前的是一個虛擬主播。
甚至,還有人發(fā)問“節(jié)目24小時都在做,半夜也直播,你們得給主播多少加班費?”
數(shù)字孿生主播N小黑
而直到N小黑在節(jié)目中“自爆身份”之后,大家才恍然大悟,直呼“沒想到,如今的虛擬人已經(jīng)真實到真假難辨的程度”。
誰曾想,長江后浪推前浪啊!
如今,數(shù)字孿生CEO李威克在面容、表情、肢體動作等表現(xiàn)上甚至比N小黑都更真實自然,近乎本尊出鏡,不斷挑戰(zhàn)著N小黑的地位。
不過,話又說回來,究竟什么是數(shù)字孿生虛擬人?如此強大!
值得一提的是,當前柳夜熙大火,身為影視和營銷跨界老炮的李威克,為何會選擇數(shù)字孿生虛擬人來作呈現(xiàn),而不是CG?
正所謂,外行看熱鬧,內(nèi)行看門道。
這里面的“道道”可多著呢。
盡管市面上的虛擬人角色很多,但是其背后的技術支持實則都不盡相同。
當前大火的Ayayi、柳夜熙等實際都是動作捕捉結合中之人實拍,用CG換臉加特效呈現(xiàn)出來的形象,而撒貝寧的虛擬主持搭檔“小小撒”、新華社數(shù)字記者小諍等,則是通過CG形象建模,聲音建模,再加上Audio2Face等機器學習方法驅動的虛擬人。
而AI與CG融合度越高,則虛擬人的真實度、自然度以及自主性也就越高,小冰公司聯(lián)合每日經(jīng)濟新聞打造的N小黑、N小白,以及數(shù)字孿生CEO李威克在深度神經(jīng)網(wǎng)絡渲染技術(XNR)等支持下,呈現(xiàn)出來的效果優(yōu)勢也就更加明顯。
由此,數(shù)字孿生CEO李威克登場的背后,實則又是一次技術的進階。
N小黑走紅、李威克登場的背后,數(shù)字孿生虛擬人為何密集登場?
如今,從N小黑、N小白走紅到李威克登場,短短的時間間隔之內(nèi),數(shù)字孿生虛擬人的登場愈發(fā)頻繁,一個AI being時代加速而來。
在這一切的背后,核心技術的突破究竟解決了虛擬人產(chǎn)業(yè)的哪些問題,使得產(chǎn)業(yè)的齒輪能如此加速運轉?
回到虛擬人產(chǎn)業(yè)的痛點上,我們一一拆解。
首先,我們需要明確的是,創(chuàng)造虛擬人其實并不難,十幾年前就有,比如2007年誕生的虛擬偶像“初音未來”,難就難在如何讓虛擬人看起來足夠的真實自然。
客觀來看,對比最新的數(shù)字孿生CEO李威克與早前的虛擬人角色,幾乎可以說是兩個不同的物種。
之所以能拉開這么明顯的差距,是因為小冰公司采用的深度神經(jīng)網(wǎng)絡渲染技術(XNR)與CG融合后,能基于深度學習的三維場景表達和對應的神經(jīng)渲染管線,在特定場景中發(fā)揮作用,讓數(shù)字孿生虛擬人的面容、表情、肢體動作更加真實自然。
同時,這項技術還可以充分利用深度學習,從大量數(shù)據(jù)中提取數(shù)據(jù)先驗,實現(xiàn)更快速的渲染,降低虛擬人的制作成本。
要知道,做到同等真實自然度的柳夜熙,一個月更新一條,其1-2分鐘內(nèi)容成本就已經(jīng)逾百萬,從成本上來看很難持續(xù)。而過往的電影CG制作也大多存在這樣的問題,成本高且周期長。
如今,在技術的迭代下,這一限制也逐漸被消解。
其次,虛擬人的自主性也非常重要。此前的虛擬人大多缺乏自主性,可落地的場景也少,往往需要提前“彩排”或“人工牽引”,才能完成一系列產(chǎn)業(yè)化的操作流程。
就虛擬主播而言,能否實現(xiàn)不用人工干預的、端到端的生成實時流媒體,是一個重要的應用考量。
小冰公司的N小黑、N小白與其他虛擬主播的不同就在于其自主性。
在N小黑、N小白“工作”期間,從金融資訊的文本生成,到通過預訓練的虛擬主播實現(xiàn)音畫同步播報,再結合同步場景動態(tài)繪制,最終生成完整的直播推流,這些全部都是由AI完成,完全不需要人工介入。
在全球范圍內(nèi),這是自動化AI采編播全流程的首次實現(xiàn),也是虛擬主播自主性的一次重大突破。
由此,當數(shù)字孿生虛擬人越來越接近于人的“自主性”,更自主也就更有用,能發(fā)揮出人的勞動價值,產(chǎn)業(yè)驅動或許將迎來更多的數(shù)字孿生虛擬人的出現(xiàn),也是可以預見的。
最后,虛擬人的制作周期問題,也很重要。
為什么以前的數(shù)字孿生虛擬人沒辦法密集登場?先來看一個例子。
“黃仁勛”背后的英偉達團隊,為了實現(xiàn)“黃仁勛”短短15秒的的亮相演示,由數(shù)十位工程師花費了幾個月的時間進行AI與CG的融合創(chuàng)造,其中的訓練周期、后期優(yōu)化達到了數(shù)月之久。
這就是為什么有的數(shù)字孿生虛擬人只能“曇花一現(xiàn)”,因為真的太久了。
如今,這個問題終于得到了解決。通過小冰框架小樣本學習技術,N小黑、N小白兩個虛擬主播只需要一周的訓練周期即可完成。
對比來看,這一問題的破解大幅降低了虛擬人的制作門檻,周期長、成本高的問題逐一解決,故而小冰公司CEO李笛表示:“一個永不疲倦、安全可靠、穩(wěn)定輸出的AI Being時代已經(jīng)到來。”
數(shù)字孿生虛擬人的商業(yè)潛力
數(shù)字孿生虛擬人加速而來,而數(shù)字孿生虛擬人的市場能否如期而至?其背后的問題是,虛擬人能帶來多大的商業(yè)價值?
昨天在保時捷中國的微信朋友圈信息流廣告中,虛擬人Ayayi出鏡,引發(fā)新一輪朋友圈的熱評。
這一次是Ayayi,下一次又將是誰?虛擬人的營銷話題度持續(xù)高漲。
同時,以數(shù)字孿生CEO李威克登場為代表,影視工業(yè)和營銷行業(yè)都同時盯上了數(shù)字孿生虛擬人,并選擇了AI與CG融合的道路。
那么,在數(shù)字孿生虛擬人的背后,實則正在孕育出一個龐大的市場。
其中,李威克也是小冰公司基于深度神經(jīng)網(wǎng)絡渲染融合CG呈現(xiàn)出來的最新成果。由此可見,技術正在帶給這個市場無限的商業(yè)可能性。
從數(shù)字孿生虛擬人層面來看,區(qū)別于現(xiàn)實的本尊,數(shù)字孿生虛擬人具備比本尊更多的可能性,比如語言能力。
在現(xiàn)實生活中,一個人所能掌握的語言是有限的,但數(shù)字孿生虛擬人不同,得益于AI的自然語言處理能力,能輕松學習不同語言,實現(xiàn)多語種的輸出。
這個功能目前已在實測,未來或許我們無法掌握多門語言,但是我們的數(shù)字孿生虛擬人卻能輕輕松松的掌握70國語言都并非難事,只要歷經(jīng)簡單的數(shù)據(jù)采集、訓練、渲染和驅動。
從產(chǎn)業(yè)應用層面來看,數(shù)字孿生虛擬人在技術的支持下,具備了更多可遷移應用的可能性。在每日經(jīng)濟新聞里,小冰公司將虛擬人打造成為了365*24小時主播。而面向其他場景或行業(yè),底層的技術經(jīng)過遷移結合其他行業(yè)的知識體系,便能繼續(xù)創(chuàng)造等同于行業(yè)專家的數(shù)據(jù)孿生虛擬人。
現(xiàn)在,小冰公司正依托全球承載交互量最大的完備人工智能框架之一“小冰框架”在自然語言處理、計算機語音、計算機視覺及人工智能內(nèi)容生成等技術方面持續(xù)迭代,從而夯實技術基礎,打通數(shù)字孿生虛擬人應用于各行各業(yè)的服務路徑。
可以預見,未來的數(shù)字孿生虛擬人不僅更真實自然,接近本尊,還將更強大且專業(yè),超越本尊。
那么,當一個數(shù)字孿生虛擬人具備這些成熟的條件和能力,其商業(yè)潛力或許也將是難以估量的。
而如今,不管是李威克的登場,還是N小黑的走紅,兩者競爭虛擬人真實自然度天花板的背后,就已經(jīng)預示著虛擬人日趨成熟,正在迎來商業(yè)爆發(fā)的前奏。