2018年的博鰲年會,成為AI人工智能翻譯展示自己的絕佳舞臺,科大訊飛、騰訊等人工智能翻譯引擎巨頭紛紛亮相,一時間鋒芒畢露,受到了各界廣泛的關(guān)注??珊髞戆l(fā)生了一個小插曲,一場被業(yè)界稱為“同聲傳譯車禍”的低級錯誤又引爆了業(yè)界,引起唏噓一片。
一時間,“AI能不能代替人類翻譯”再次被推上風(fēng)口浪尖。對此,記者采訪了翻譯界老將、傳神語聯(lián)董事長何恩培先生。
何恩培表示,翻譯界正發(fā)生變革,萬億翻譯市場正在覺醒,科技巨頭積極推進AI與翻譯相融合,這一現(xiàn)象是變革成長過程中不可避免的。何恩培同時提醒,由于人工智能目前尚未成熟,跟人類智慧產(chǎn)物——語言的結(jié)合只是一個過程,而且永遠并不能完全替代人類翻譯,不要過度炒作過度消費。積極擁抱AI,更應(yīng)該客觀的對待。
何恩培認為,翻譯是人類真正的智慧的高地,語言文字因人的存在而存在,語言文字是人類智慧的表達,從長遠看來,AI應(yīng)該能夠超越人類的智力,但人的智慧卻是難以逾越的。
記者帶著疑問來到傳神語聯(lián)北京公司,同何恩培先生做了一次暢談。下面請大家隨這位翻譯老將一起揭開AI與翻譯的世紀糾葛之謎。
記者:如何看待騰訊AI同傳翻譯在博鰲論壇上出現(xiàn)的小事故?
何恩培:百度、騰訊、科大訊飛等正在做的機器翻譯方面的努力,值得行業(yè)尊重和正確對待,這是值得肯定的努力,是業(yè)內(nèi)敢于尋求新知和未知的偉大嘗試。他們的嘗試更多的是一種對人們面向未來開拓新思維的教育:翻譯距離人很近了,不再遙不可及。跨境游、國際商務(wù)等涉及大眾息息相關(guān)的翻譯需求近在眼前。他們作為機器翻譯探索者,“吃螃蟹”是對萬億翻譯市場的啟動。但也不能片面地、極端化地看待機器翻譯,機器不可能“反客為主”,技術(shù)進步為未來產(chǎn)業(yè)發(fā)展提供了一條全新的思維走向和融合的新路子,翻譯行業(yè)要進步既不能否認新生事物也不能唱衰或者忽略人類譯者這個根本。
記者:近年來,AI取代翻譯的聲音不絕于耳。譯者老師們似乎被時代裹挾著前進,您是如何看待這種聲音的?
何恩培:恐慌是因為反差導(dǎo)致。過去人類譯者對機器翻譯的偏見和不屑,而這一代基于深度學(xué)習(xí)的機器翻譯能力明顯提升,提升程度超過人們的認知,使得人類譯者恐慌,而被裹挾前進。同時,在期望與落差間,譯者價值被遮蓋形成“裹挾怪圈”。但現(xiàn)階段這種明顯的過度炒作是不正常的,這種“噱頭”是對人類文明的不自信的表現(xiàn),對人類文化、文明進步并沒有好處。過度依賴人工智能,是極具破壞性的文明自毀行為。
翻譯是人類智慧的高地。人腦的“全息信息”是來自眼耳鼻口舌身意的全部信息的綜合,是基于共同文化經(jīng)歷體驗和共識而形成的。語言文字只是人腦“全息信息”的一維表達,它依賴人腦“全息信息”映射才能真正被理解。兩種文字的映射理解是以兩種文字背后的“全息信息”為背景的。所以,依靠一維語言文字的大量數(shù)據(jù)訓(xùn)練出來的機器翻譯機器人,基本只能機械的“映射”難以全面實現(xiàn)“全息轉(zhuǎn)換”,自然無法將原文真正意義轉(zhuǎn)換到另外一種語言。因此語言文字和翻譯都將因人的存在而存在,是人類智慧的表達。從長遠看來,人工智能能夠超越人類的智力,但人的智慧卻是難以逾越的。
粗略計算,人從小學(xué)到大學(xué)大約能接受10萬句話的學(xué)習(xí)量,而10萬句在翻譯行業(yè)已經(jīng)屬于中高級譯者了。但人工智能千萬句甚至上億句對的訓(xùn)練可能只能達到初級翻譯水平。目前看來依賴人類翻譯形成的大量優(yōu)質(zhì)語料數(shù)據(jù)進行訓(xùn)練是機器翻譯的主要途徑,這也將限制了機器翻譯的進化速度。
圍棋之所以可以被AI迅速超越,是因為圍棋本身是有固定的規(guī)則,有確定的輸贏結(jié)果,所以AI可以自我對局不分晝夜的訓(xùn)練。但語言不同,具有種族性、不可論證性和不可推導(dǎo)性,幾乎不能象ALPHA那樣在自我生成棋局、自我對局訓(xùn)練中提升。我看到有些報道在探索翻譯的“自我對局訓(xùn)練”,個人觀點認為,那最多是產(chǎn)生一種“機器方言”,如同一個封閉部落自我使用的方言,不可能達到符合現(xiàn)代社會人類需要的翻譯水平。
截止今天的人工智能還是咖啡中的勺子,浸泡在咖啡里攪拌了咖啡,但其實并不知道咖啡是什么味道,只有人才知道。機器翻譯更多是基于算法、算力利用語料數(shù)據(jù)訓(xùn)練的結(jié)果,難以達到人類的智慧。
講到這里,何恩培還舉了一個傳神公司培訓(xùn)的實例。傳神公司給做網(wǎng)文翻譯的譯者做提升培訓(xùn),開班時有一個學(xué)生的翻譯水平是團隊最差的,但經(jīng)過一周的啟發(fā)、培訓(xùn)和演練,成為團隊第三名??梢韵胂笠恢軙r間內(nèi)有限的素材培訓(xùn),對AI來說,可能還不夠“塞牙縫”,更談不上質(zhì)量進步。但因為人的一周培訓(xùn)是“全息訓(xùn)練”,而AI只是“一維訓(xùn)練”,這是至今人類獨一無二的能力。
記者:您剛才提到語言的功能是分層的在你看來分哪幾個層次?
何恩培:語言可以分四個層次:1.信號層; 2.簡單信息層;3.語言感知、感受、交流;4.文化、專業(yè)。前兩層是初級翻譯屬于智力范疇,以AI翻譯為主基本上沒問題。當(dāng)下,計算、數(shù)據(jù)統(tǒng)計等能力已經(jīng)可以實現(xiàn)弱人工智能。而后兩層是高端翻譯屬于智慧范疇,今天的人工智能并不能頓悟,人的智慧很多時候是頓悟的,所以主力還是人類譯者。
記者:從社會發(fā)展和人性角度講,人不可能創(chuàng)造自我替代品。機器替代譯者是需要很長時間,這個過程非常漫長,不可能完全替代人類。“語言是人類智慧的高地,智慧需要頓悟”,是否意味著語言具有的某種特性是AI無法打破的?這個天然阻礙是什么?
何恩培:總的來說,經(jīng)過幾千年的發(fā)展,語言具有兩大特性,這兩大特性說明語言是智慧的產(chǎn)物、是AI不可超越的。
首先,在語言學(xué)上,語言具有種族性,語言是在不同文化背景下誕生的,是不同民族對待事情的方法。例子:沙發(fā)為什么這樣翻譯呢?為什么不翻譯成帶皮的椅子?因為中華民族的字典里就沒有對應(yīng)的詞,沙發(fā)是歐洲人對待站、臥、起、坐這些事情的處理方法,具有明顯的種族獨特性。語言的種族性是由文化背景支撐的,而文化是一種全息的東西,每一個文字可能都意味和承載著不同的場景畫面,單一的機器純靠文字不能準確表達多方面的內(nèi)在意義。譯者往往必須多方面考慮再做翻譯(演講人的情緒、表情、語氣、PPT、演講事件涉及場景、觀眾的文化背景等等),這是在全息性的前提下,瞬間合成一個場景,再用一種語言表達出來。機器翻譯輸入的只是干巴巴的單一信息,輸出的結(jié)果自然不會很準確。
其次,語言是一群人的共識,簡單講就是某事物大家都這樣描述,因此也就這樣表達了。比如“我去兩天”并不是真的兩天,可能是一個約數(shù),這是人的共識,但機器只能翻譯成兩天。共識隨著時間變化而偶然發(fā)生,機器短時間內(nèi)不可能更精準表達出來。因為具有共識性所以語言具有不可論證性,比如“我差點沒摔死”,邏輯上講是死了,而實際上沒有死。因為這是一種習(xí)慣性表達,不可論證。
記者:我去年有幸聽過您做的一次演講,我還清楚地記得您提到‘過去1600年左右,人類的翻譯能力提升2倍到3倍,而過去20年人類社會信息量增長1000倍’。在信息量激增的狀況下,譯者在翻譯行業(yè)應(yīng)該被放在什么位置?AI和譯者的關(guān)系能否和睦?
何恩培:的確如此,事實上人類力量所能翻譯的,是人類文明中微不足道的一個量,還有大量東西需要翻譯,而人類譯者不可能有精力翻譯出來,所以我們應(yīng)該慶幸隨著需求的爆發(fā)人工智能出現(xiàn)了。
我們應(yīng)該思考一下為什么譯者的收入不能水漲船高?為什么人們看不懂不馬上交給譯者或者翻譯公司翻譯?為什么譯者會覺得翻譯枯燥?其實是因為一種語言不翻譯成母語,用戶看不懂,但需要翻譯的信息中50-70%屬于簡單信息,甚至是對用戶意義不大的信息。也就是說,簡單信息對于譯者翻譯來講如同搬磚,沒有價值感。對于客戶來講翻譯是為了了解和理解,核心部分沒有那么多,但不翻譯又看不懂,所以用戶會感到投入產(chǎn)出不合算。所以機器翻譯的進步,不但可以幫助用戶節(jié)約成本,而且可以讓譯者做有價值的翻譯而感受樂趣。
所以,譯者應(yīng)該從“搬磚”的定位到“用起重機搬磚”的定位。這就是傳神提出的“人機共譯”。人類譯者可以將機器譯者作為自己的團隊成員之一,自己做這個team的leader,做體現(xiàn)人類智慧的、機器成員做不了的翻譯,以及用人工智能翻譯過程管理。也就是說人工智能在翻譯領(lǐng)域的價值絕不僅僅是翻譯這一個動作,完全可以作用于翻譯整個流程。
舉一個例子,中國解放以來引進的圖書大概17萬種,而全世界暢銷的英文圖書大概324萬種,大約95%的圖書沒有進入中國。不是中國讀者不需要,而是很多外文書看不懂看不到。由此可見,信息量海量是可見的事實,這直接導(dǎo)致翻譯需求更加多樣化和復(fù)雜,翻譯效率和質(zhì)量需要同步提升。因此,行業(yè)更應(yīng)合理運用AI,快速完成低端翻譯任務(wù),解放翻譯生產(chǎn)力;把更多的譯者放在高級翻譯領(lǐng)域中,創(chuàng)造更大價值。
人工智能是相互協(xié)作關(guān)系而不是對立關(guān)系,機器翻譯替代簡單勞動,智慧勞動人來做,這也是由譯者的特殊性決定的。
記者:譯者是一群特殊的群體,大到國家外交層面,小到個人旅游,都有譯者在背后做多語服務(wù)支持,這群“隱身人”的生存狀況如何?
何恩培:在我看來,譯者是一個偉大的人群,他們是人類文明傳播的“使者”,但他們并沒有得到應(yīng)有的回報。一個就是前面所說的“搬磚”的糾結(jié),另一個就是翻譯的勞動按照字數(shù)計算的不科學(xué)性,比如譯者為了將一句話翻譯準確,查閱資料可能花可能一小時,但客戶只按翻譯字數(shù)算錢,這個顯然不公平;最重要的是,譯者的這種勞動價值難以被全球遇到同樣情形的譯者復(fù)用,所以價值又得不到體現(xiàn)。而全球可能無數(shù)人還在重復(fù)這樣的工作,資源浪費巨大。
所以我認為翻譯行業(yè)應(yīng)該為人工智能和其他技術(shù)進步的到來感到慶幸,我認為譯者的生存狀況將在這個時代得到改變,傳神正在做這件事。希望所有的譯者都能夠享受技術(shù)進步帶來的價值,做一個快樂的“傳神者”。特別強調(diào)一下,“傳神者”里的傳神不是狹指傳神公司,而是指譯者梵音的境界,這個詞有兩個意思:其一是希望譯者只做那些能夠體現(xiàn)傳神的翻譯,而不是大量時間去搬磚。其二是希望譯者都是人類文明的傳神者。
記者:在“AI威脅”和“質(zhì)疑AI”的片面化言論大肆其道的狀態(tài)下,您認為未來的譯者、行業(yè)應(yīng)該選擇?
何恩培:“AI威脅”論雖然喚醒人類重視人工智能翻譯,但也給翻譯行業(yè)造成困擾,使得學(xué)翻譯的人為自己前途擔(dān)憂,這必將導(dǎo)致翻譯人才缺失,而翻譯其實不可能被人工智能完全替代,這就會為人類文明傳播速度和效果帶來不利影響。
希望譯者應(yīng)該明白一個道理,機器翻譯出來了,不是人沒事干了,而是“搬磚”的事情不用人干了,那些需要人翻譯的還在那里,只是如果人類譯者只想去干搬磚的簡單底端活兒賺錢,那就是要和機器搶工作,那就是找死。
未來的譯者要有價值,就要做到兩點,第一不僅需要懂翻譯,還要懂得利用工具和機器翻譯完成,所以譯者要適應(yīng)新技術(shù)時代,擁抱變化提升自己,從單純操作語言文字,到利用新技術(shù)來操作語言文字。第二不僅要會語言本身,更有價值的是深刻理解語言承載的文化,深度掌握語言涉及的行業(yè)領(lǐng)域,要讓自己成為有專業(yè)的譯者、跨文化的譯者、能夠基于場景的譯者;
記者:剛才談到 “語聯(lián)網(wǎng)”,可否請您通俗地介紹一下語聯(lián)網(wǎng)?
何恩培:語聯(lián)網(wǎng)聚集全球產(chǎn)能,這個產(chǎn)能不僅包括人的產(chǎn)能還包括機器的產(chǎn)能。通過語聯(lián)網(wǎng)大腦實現(xiàn)質(zhì)量控制,輸出合格的產(chǎn)能,然后輸出給各個應(yīng)用場景,未來人類跨語種溝通和信息不再是找翻譯,而是在設(shè)備上或者應(yīng)用軟件上設(shè)置自己的母語即可。
目前語聯(lián)網(wǎng)已經(jīng)接入很多合作伙伴和場景化應(yīng)用,嵌入老百姓多樣化翻譯場景,語翼、TransnBox翻譯機、小尾巴APP、云譯客等等。傳神公司的愿景是讓人類溝通沒有語言障礙,讓人們?nèi)缤娨粯臃奖愕厥褂谜Z言服務(wù),用母語溝通世界。語聯(lián)網(wǎng)已經(jīng)深度擁抱AI,加快人機共譯落地,“把神氣傳向全人類”。