搜狗最新人工智能 邀你來(lái)體驗(yàn)

重慶日?qǐng)?bào)
楊藝
做搜索引擎、輸入法的搜狗,還做起了人工智能。8月20日,重慶日?qǐng)?bào)記者從搜狗獲悉,搜狗將在智博會(huì)展出其最新人工智能技術(shù)和產(chǎn)品,包括機(jī)器同傳、語(yǔ)音合成、人臉遷移、明醫(yī)智能分診、唇語(yǔ)識(shí)別、虛擬主播、旅行翻譯寶...

做搜索引擎、輸入法的搜狗,還做起了人工智能。8月20日,重慶日?qǐng)?bào)記者從搜狗獲悉,搜狗將在智博會(huì)展出其最新人工智能技術(shù)和產(chǎn)品,包括機(jī)器同傳、語(yǔ)音合成、人臉遷移、明醫(yī)智能分診、唇語(yǔ)識(shí)別、虛擬主播、旅行翻譯寶、錄音翻譯筆等。

機(jī)器同傳

音色也能同步翻譯

在演講現(xiàn)場(chǎng),屏幕上除了顯示由機(jī)器語(yǔ)音識(shí)別的中文內(nèi)容外,還有其同步翻譯的英文內(nèi)容,實(shí)現(xiàn)演講內(nèi)容的雙語(yǔ)滾動(dòng)字幕——隨著搜狗機(jī)器同傳的推出,這樣的場(chǎng)景已成為現(xiàn)實(shí)。

據(jù)悉,搜狗同傳應(yīng)用了搜狗自研的語(yǔ)音識(shí)別技術(shù)與機(jī)器翻譯技術(shù),能夠?qū)?huì)議演講者的語(yǔ)音實(shí)時(shí)轉(zhuǎn)錄成文字,并且同步完成翻譯,準(zhǔn)確率已接近人類(lèi)同傳翻譯結(jié)果。

除了中英實(shí)時(shí)同步翻譯外,搜狗機(jī)器同傳還可以根據(jù)說(shuō)話人的聲音進(jìn)行數(shù)據(jù)訓(xùn)練,然后將其音色附加到翻譯內(nèi)容中,并輸出與說(shuō)話人原語(yǔ)音音色相同的譯文語(yǔ)音,達(dá)到真正“音意同步”的同傳效果。

語(yǔ)音合成

機(jī)器也能當(dāng)“朗讀者”

觀眾說(shuō)一段話,再選擇一首喜歡的歌曲,機(jī)器便能分析該觀眾的語(yǔ)音數(shù)據(jù),與歌曲結(jié)合,實(shí)現(xiàn)以說(shuō)話者音色演唱這首歌曲。

“語(yǔ)音合成又稱(chēng)文語(yǔ)轉(zhuǎn)換技術(shù),能將任意文字轉(zhuǎn)化為清晰自然、富有表現(xiàn)力的語(yǔ)音朗讀出來(lái),相當(dāng)于給機(jī)器裝上了人工嘴巴。”搜狗相關(guān)負(fù)責(zé)人介紹,該技術(shù)涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),是信息處理領(lǐng)域的一項(xiàng)前沿技術(shù),受到了國(guó)內(nèi)外各大科技公司的爭(zhēng)相研究,被廣泛應(yīng)用在智能客服、新聞播報(bào)、語(yǔ)音導(dǎo)航等眾多場(chǎng)景之中。

人臉遷移

人人都可有張“明星臉”

想要成為喜歡的明星的模樣,只要選中明星的照片,面對(duì)大屏幕,屏幕就可以將該明星的臉與體驗(yàn)者的臉進(jìn)行融合,面部還能實(shí)現(xiàn)各種動(dòng)態(tài)變化——智博會(huì)上,觀眾們還能在現(xiàn)場(chǎng)體驗(yàn)搜狗的人臉遷移技術(shù),有張“明星臉”。

據(jù)悉,搜狗AI人臉遷移技術(shù),結(jié)合了人臉識(shí)別、三維人臉擬合、表情控制等多項(xiàng)前沿技術(shù),只需單張人物圖像,就能瞬間完成換臉體驗(yàn),還可實(shí)現(xiàn)面部實(shí)時(shí)動(dòng)態(tài)變化效果。

目前,該項(xiàng)技術(shù)已運(yùn)用在直播、視頻互動(dòng)、影視制作以及教育等場(chǎng)景中,未來(lái)則將更多地運(yùn)用到智能生活中。

虛擬主播

音容面貌都可被“復(fù)制”

人工智能模仿你的聲音和說(shuō)話方式,“復(fù)制”你的容貌和面部表情,并生成一個(gè)“你”,然后再以“你”的形態(tài)對(duì)文本進(jìn)行播報(bào),而這個(gè)“你”是以音視頻的方式出現(xiàn)。

智博會(huì)上,只需上傳一張自己的照片、說(shuō)幾句話,搜狗虛擬主播還能讓觀眾看到一個(gè)“復(fù)制”的自己。

據(jù)介紹,搜狗虛擬主播結(jié)合了人臉識(shí)別、人臉建模、語(yǔ)音合成以及深度學(xué)習(xí)等多項(xiàng)前沿技術(shù),能將任意文本轉(zhuǎn)化為相應(yīng)的唇語(yǔ),為用戶提供多模態(tài)的交互體驗(yàn)。

作為具備視頻內(nèi)容生產(chǎn)能力的一項(xiàng)技術(shù),虛擬主播技術(shù)可以應(yīng)用于媒體、教育、醫(yī)療、客服等多個(gè)行業(yè),節(jié)約大量的人力成本,還可以應(yīng)用于各種具備交互能力的智能軟硬件。

未來(lái),該技術(shù)還將和語(yǔ)音交互進(jìn)行結(jié)合,生成虛擬個(gè)人助理的形象,以提升人機(jī)交互體驗(yàn)等。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論