本文來自微信公眾號“元力社”,編輯丨珍妮。
目前為止,元宇宙項(xiàng)目一直處于動蕩且不穩(wěn)定的態(tài)勢。而小語種技術(shù)的發(fā)展是一個(gè)例外。谷歌、NVIDIA和Meta本身在內(nèi)的公司正在致力于使用人工智能進(jìn)行語音到語音(S2S)翻譯來縮小小語種技術(shù)差距。
元宇宙是一個(gè)共享虛擬/數(shù)字世界,人們可以通過VR/AR頭顯進(jìn)行訪問參觀、與虛擬環(huán)境進(jìn)行互動以及結(jié)識其他人。這個(gè)空間完全是虛擬的,就像互聯(lián)網(wǎng)一樣,它沒有邊界。所以,如果說不同語言的人見面,他們將無法相互交談。
到目前為止,大型科技巨頭一直專注于開發(fā)翻譯更多語言的技術(shù),不僅開發(fā)了算法,而且試圖將這些原則簡單地應(yīng)用于所有其他語言。這對于大語言使用者來說是一個(gè)很好的體驗(yàn),但是當(dāng)用戶開始將小語言添加到組合中時(shí),翻譯準(zhǔn)確性會急劇下降。這導(dǎo)致小語種使用者在技術(shù)產(chǎn)品的可用性方面存在差異。例如,Siri不會說拉脫維亞語。語言技術(shù)發(fā)展需要更長的時(shí)間才能適用于小語種使用者。
但這種情況將會在元宇宙發(fā)生改變。由于采用元宇宙空間的關(guān)鍵要求之一是消除語言障礙,因此相關(guān)方(即最有可能建立元宇宙和/或從中受益的各方)便產(chǎn)生了動力來解決這個(gè)問題。
出于這個(gè)原因,谷歌、Meta和NVIDIA都宣布計(jì)劃開發(fā)支持S2S翻譯中的小語種技術(shù)。此前,谷歌宣布推出用于文檔翻譯的翻譯中心,以及人工智能驅(qū)動的通用語音模型。Meta還宣布了一款通用語音翻譯器(UST),它可以處理書面和非書面語。NVIDIA迅速發(fā)布了自己的設(shè)備語音AI生態(tài)系統(tǒng),以加速自動語音識別模型的發(fā)展。
幾十年來,小語種一直被科技巨頭所忽視。為了滿足這些社區(qū)的需求,Tilde在十年的大部分時(shí)間里一直致力于開發(fā)基于人工智能的語音和翻譯技術(shù)。不僅如此,他們還在WMT競賽(有點(diǎn)像機(jī)器翻譯奧運(yùn)會)中擊敗了所有其他機(jī)器翻譯供應(yīng)商,在“小語言”類別中展示了更高水平的精度。
Tilde表示,谷歌和其他公司首先專注于大語言,然后嘗試將這些算法應(yīng)用于小語言之上。這不能有效地工作。相反,我們所做的是從復(fù)雜的語言開始,這需要一種不同的方法來訓(xùn)練AI。在英語中,只有500k-700k可能的單詞形式。而在拉脫維亞語中,用戶有超過2200萬種可能的單詞形式。使用這些方法,我們可以成功地將人工智能應(yīng)用于其他語言,如愛沙尼亞語和芬蘭語。Tilde的AI已經(jīng)被集成到微軟的產(chǎn)品中,也成為芬蘭總理辦公室的官方翻譯工具。
在考慮元宇宙時(shí),假設(shè)他們的服務(wù)條款可以訪問這些數(shù)據(jù),每個(gè)口語都會成為由提供翻譯引擎的人處理的數(shù)據(jù)。那么我們是否想把每一個(gè)在元宇宙中的口語都交到那些在數(shù)據(jù)管理方面聲譽(yù)不佳的公司手中?
總而言之,元宇宙不可避免的發(fā)展似乎正在推動人們對小語言技術(shù)的興趣。雖然我們不知道在VR中未來的生活會怎樣,但我們確實(shí)知道我們之間的交流肯定會變得更容易一些。