當(dāng)別人從你的社交網(wǎng)絡(luò)上抓取一張照片,他能做些什么?
給你 P 出各種表情?加上有趣搞笑的濾鏡?如果你以為只是這樣那就大錯(cuò)特錯(cuò),因?yàn)橥ㄟ^ AI 技術(shù)做出一段惟妙惟肖的假視頻,然后讓朋友誤以為真的是你,這件事如今已經(jīng)不再只是科幻。
你沒聽錯(cuò),這不是電影,而是 AI 技術(shù)又一次新嘗試。來自俄羅斯三星實(shí)驗(yàn)室的研究員新開發(fā)的一項(xiàng) AI 技術(shù),只需要某人的一張照片,就能帶來一段活靈活現(xiàn)的視頻內(nèi)容。這種技術(shù)甚至能讓蒙娜麗莎開口說話,就像下面視頻中這樣:
通常,要做出以假亂真的 deepfake 視頻需要大量數(shù)據(jù)支持。比如早前我們?cè)?jīng)介紹過利用深度學(xué)習(xí)技術(shù),有人為色情演員加上了好萊塢明星的臉,蓋爾·加朵、艾瑪·沃森被「移花接木」到了色情視頻當(dāng)中。
這樣的換臉技術(shù)本身是通過機(jī)器學(xué)習(xí)來對(duì)大量素材訓(xùn)練,通過生成式對(duì)抗網(wǎng)絡(luò)(GAN)將目標(biāo)對(duì)象替換成自己需要的對(duì)象圖像,甚至如果數(shù)據(jù)資料夠多,它還能將圖像、聲音等完全偽造。但如今,新的 deepfake 技術(shù)不再需要大量數(shù)據(jù),甚至一張普通照片就能偽造一段視頻。
研究人員先是從 YouTube 上搜集的 7000 多張名人照片進(jìn)行進(jìn)行面部特征提取,包括臉型、眼睛、嘴型等特征點(diǎn),通過這些特征點(diǎn)進(jìn)行的訓(xùn)練去比對(duì)拍攝的照片,并讓這些拍攝的照片動(dòng)態(tài)頭部模型,通過一系列卷積運(yùn)算讓比對(duì)效果不斷提升,最終在進(jìn)行前期大量學(xué)習(xí)訓(xùn)練之后,新的神經(jīng)網(wǎng)絡(luò)只需要少量數(shù)據(jù)和就能生成新的人臉信息甚至是視頻。
聽起來有些復(fù)雜,但實(shí)際效果卻是肉眼可見的明顯,不僅僅是《蒙娜麗莎的微笑》中角色可以開口出現(xiàn)表情動(dòng)作,就連阿爾伯特·愛因斯坦、薩爾瓦多·達(dá)利等也都可以從靜態(tài)肖像活靈活現(xiàn)出現(xiàn)在你的眼前。
當(dāng)然,和大多數(shù) deepfake 生成的視頻相似的問題是,三星的研究人員做出的這些視頻現(xiàn)在看來并不完美,你依然能看到有縫隙、動(dòng)作古怪甚至有點(diǎn)像家地,但伴隨數(shù)據(jù)訓(xùn)練越來越多,這樣的問題將會(huì)被改善。
研究人員表示,這項(xiàng)研究可以運(yùn)用在娛樂領(lǐng)域,比如像《哈利·波特》電影中那樣讓靜態(tài)肖像畫活動(dòng)起來。但這毫無疑問也為人們帶來了一些擔(dān)心,既然一張照片就能偽造成一段視頻,那么未來這樣的技術(shù)是否會(huì)對(duì)我們產(chǎn)生危險(xiǎn)?
關(guān)于這一點(diǎn),達(dá)特茅斯學(xué)院媒體取證專家 Hany Farid 就談到:「deepfake 這樣的技術(shù)在如今的趨勢(shì)下,需要的相關(guān)數(shù)據(jù)越來越少,將會(huì)導(dǎo)致未來創(chuàng)造內(nèi)容真假難辨?!惯@一點(diǎn)也是讓人所擔(dān)心的,也許犯罪分子會(huì)通過這樣的技術(shù)來進(jìn)行犯罪。
不過三星的研究人員目前希望這樣的技術(shù)能夠?qū)崿F(xiàn)更大突破,并且有機(jī)會(huì)被應(yīng)用于電子游戲、電影、電視等領(lǐng)域,對(duì)于特效行業(yè)來說,這樣的技術(shù)會(huì)降低不少成本。而隨著反作弊技術(shù)的進(jìn)步,對(duì)于這些偽造視頻的判斷將會(huì)更加精準(zhǔn),現(xiàn)階段觀察并討論它的適用范圍是我們更該做的事情。