人工智能語(yǔ)言輸出的發(fā)展困境

中國(guó)社會(huì)科學(xué)網(wǎng)
佚名
美國(guó)漢森機(jī)器人公司生產(chǎn)的機(jī)器人索菲亞(Sophia)在2017年10月成為歷史上首個(gè)獲得公民身份的機(jī)器人后迅速走紅,頻繁出現(xiàn)在各國(guó)的電視節(jié)目、社交媒體、時(shí)尚雜志、音樂(lè)視頻以及線(xiàn)下講座論壇等活動(dòng)中,其豐富的面部表情...

美國(guó)漢森機(jī)器人公司生產(chǎn)的機(jī)器人索菲亞(Sophia)在2017年10月成為歷史上首個(gè)獲得公民身份的機(jī)器人后迅速走紅,頻繁出現(xiàn)在各國(guó)的電視節(jié)目、社交媒體、時(shí)尚雜志、音樂(lè)視頻以及線(xiàn)下講座論壇等活動(dòng)中,其豐富的面部表情以及對(duì)問(wèn)題流暢的回答引來(lái)人們的驚嘆甚至是恐慌。但近來(lái)以Facebook人工智能實(shí)驗(yàn)室主任、深度學(xué)習(xí)專(zhuān)家楊立昆(Yann LeCun)為代表,評(píng)論其為“徹頭徹尾的騙局”的反對(duì)聲音又將其推向社會(huì)輿論的風(fēng)口浪尖。這些質(zhì)疑并非空穴來(lái)風(fēng),索菲亞在語(yǔ)言輸出上的表現(xiàn)很大程度上基于設(shè)計(jì)團(tuán)隊(duì)對(duì)問(wèn)答的前期編寫(xiě),而遠(yuǎn)未達(dá)到語(yǔ)言的自主表達(dá)和“自我意識(shí)”建立的水平。

人工智能在語(yǔ)言輸出方面的發(fā)展受到廣泛關(guān)注,因?yàn)檎Z(yǔ)言是人類(lèi)重要的交際工具和思維工具,承擔(dān)著重要的社會(huì)作用,甚至在某種程度上可以說(shuō)是人和其他動(dòng)物相區(qū)別的重要標(biāo)志。換言之,如果人工智能在完成“圖靈測(cè)試”的基礎(chǔ)上能輸出與人類(lèi)自然語(yǔ)言相近的語(yǔ)言,說(shuō)明它在一定程度上已達(dá)到“類(lèi)人”或“新興人類(lèi)”的標(biāo)準(zhǔn),此時(shí)它與人類(lèi)的關(guān)系與區(qū)別也將被重新審視。就目前的科學(xué)技術(shù)水平來(lái)看,人工智能語(yǔ)言輸出與自然語(yǔ)言究竟有哪些難以逾越的顯著差異,人工智能語(yǔ)言輸出在發(fā)展中遇到了怎樣的困境,這是值得探討和回答的問(wèn)題。目前,人工智能語(yǔ)言輸出同自然語(yǔ)言存在如下差異。

差異一:產(chǎn)生。關(guān)于人類(lèi)自然語(yǔ)言的生成和習(xí)得,語(yǔ)言學(xué)界目前的主流觀(guān)點(diǎn)以喬姆斯基(Noam Chomsky)的“天賦說(shuō)”為代表,他認(rèn)為在人的大腦中有一個(gè)特殊的語(yǔ)言習(xí)得機(jī)制(LAD)且掌握了一種普遍語(yǔ)法(UG),這種獨(dú)有的生理現(xiàn)象經(jīng)由遺傳得到。兒童在已有語(yǔ)言習(xí)得機(jī)制這一生理基礎(chǔ)上接受外界給予的環(huán)境刺激和信息輸入,通過(guò)“咿呀期”“獨(dú)詞句”“雙詞句”“電報(bào)體”到“接近成人”等一系列階段,逐步實(shí)現(xiàn)結(jié)構(gòu)表達(dá)和詞匯輸出上的飛躍,同時(shí)依靠語(yǔ)言系統(tǒng)運(yùn)轉(zhuǎn)的核心——橫向上構(gòu)成線(xiàn)性序列的語(yǔ)言成分之間的“組合關(guān)系”及縱向上同一個(gè)結(jié)構(gòu)位置上不同結(jié)構(gòu)單位間相互替換的“聚合關(guān)系”,對(duì)語(yǔ)言規(guī)則加以吸收和運(yùn)用,從而推動(dòng)語(yǔ)言習(xí)得由量變走向質(zhì)變。

由于這一語(yǔ)言習(xí)得機(jī)制尚未得到實(shí)證且無(wú)法進(jìn)行實(shí)驗(yàn)?zāi)M,因此從本質(zhì)上看人工智能只能從建構(gòu)語(yǔ)言系統(tǒng)的組合關(guān)系和聚合關(guān)系著手,存儲(chǔ)一系列語(yǔ)言規(guī)則和根據(jù)結(jié)構(gòu)位置分類(lèi)的語(yǔ)言單位,所用結(jié)構(gòu)單位材料極其有限。同時(shí),語(yǔ)言表達(dá)的效度和可接受性離不開(kāi)生理的語(yǔ)言習(xí)得機(jī)制和語(yǔ)義制約在內(nèi)的人類(lèi)語(yǔ)言感受,而人工智能仍處于“無(wú)心的機(jī)器”階段,對(duì)語(yǔ)言的感受甚至是最基本的生理與心理感受都難以獲取,只能通過(guò)程式和算法進(jìn)行簡(jiǎn)單的、規(guī)則明確的、具廣泛適用性的有限表達(dá)。

此外,人工智能向更高級(jí)別的推進(jìn)離不開(kāi)機(jī)器的“自主學(xué)習(xí)”。AlphaGo Zero通過(guò)三天的“自主學(xué)習(xí)”便戰(zhàn)勝了與人類(lèi)棋手對(duì)決中取得勝利的舊版本AlphaGo,這是根據(jù)固定的圍棋規(guī)則不斷進(jìn)行自我糾正的結(jié)果。相比之下,語(yǔ)法規(guī)則和話(huà)語(yǔ)規(guī)則并非勝負(fù)這樣簡(jiǎn)單,句子的可接受程度往往有一定的范圍,判斷時(shí)甚至不能僅憑某一說(shuō)話(huà)人的語(yǔ)感而需進(jìn)行一定規(guī)模的語(yǔ)言調(diào)查,且仍有較大比重的語(yǔ)言規(guī)則由于停留在主觀(guān)層面而不可論證,用普通的算法和程式難以進(jìn)行準(zhǔn)確而全面的描寫(xiě)與限定。因此,人工智能在語(yǔ)言輸出上要達(dá)到“自主學(xué)習(xí)”的程度絕非易事。人類(lèi)在語(yǔ)言習(xí)得的過(guò)程中同樣也離不開(kāi)修正環(huán)節(jié),這往往依靠外界環(huán)境糾正(如父母對(duì)兒童的糾正)和記憶、自省式糾正等,而這些同樣建立在語(yǔ)言習(xí)得機(jī)制上。

差異二:過(guò)程。語(yǔ)言交際以信息(message)為核心,以渠道(channel)為載體,在“編碼—發(fā)送—傳遞—接收—解碼”這一閉合式的信息交際輪中,要進(jìn)行新一輪編碼(encode)需先解碼(decode),即“識(shí)別”與“理解”。人工智能目前在語(yǔ)音識(shí)別上已取得了很大進(jìn)展,識(shí)別的準(zhǔn)確度和信息的全面性已有較大提高,但“無(wú)心的機(jī)器”很難做到真正意義上的理解。目前人工智能的解決方法是建構(gòu)詞匯和結(jié)構(gòu)在內(nèi)的多個(gè)語(yǔ)義群,在解碼中通過(guò)對(duì)關(guān)鍵詞、句子基本結(jié)構(gòu)的識(shí)別進(jìn)行語(yǔ)義的歸并,同時(shí)利用攝像頭進(jìn)行視覺(jué)跟蹤和轉(zhuǎn)移,掃描識(shí)別對(duì)方的面部表情來(lái)預(yù)測(cè)交際中的態(tài)度變化,并調(diào)動(dòng)機(jī)器面部肌肉和肢體動(dòng)作進(jìn)行模擬,達(dá)成語(yǔ)言輸出和行為外化的對(duì)應(yīng),索菲亞在這方面的表現(xiàn)尤為突出。但事實(shí)上這種“對(duì)應(yīng)”與真正意義上的“理解”存在著本質(zhì)差異。

相較于人工智能,人類(lèi)在自然語(yǔ)言的理解上有更多內(nèi)省的選擇,最為顯著的是認(rèn)知語(yǔ)言學(xué)中喬治·萊考夫(George Lackoff)和馬克·約翰遜(Mark Johnson)提出的概念隱喻理論(Conceptual Metaphor Theory,CMT),認(rèn)為通過(guò)與外界的感知和互動(dòng)所形成的認(rèn)知中的“意象圖式”是抽象概念的隱喻性表達(dá)。人們?cè)讷@取具體概念時(shí),通過(guò)對(duì)外界的感知和互動(dòng),形成物理實(shí)體的身體經(jīng)驗(yàn);而抽象概念的獲得也扎根于感知與互動(dòng),通過(guò)與外界接觸形成意象圖式,再由意象圖式作為隱喻性表達(dá)來(lái)表現(xiàn)和獲取抽象概念。

意象圖式作為理論中樞,主要來(lái)自于人們的體驗(yàn)、經(jīng)驗(yàn),它賦予人類(lèi)認(rèn)知世界的能力。但目前要將這一理論直接投入運(yùn)用還存在諸多困難。1.圖式的相對(duì)泛化與模糊,暫時(shí)缺乏數(shù)量與比例的度量;2.圖式的動(dòng)態(tài)描寫(xiě)相對(duì)較少,偏向于靜態(tài)觀(guān)察和描摹;3.圖式中往往著眼于內(nèi)部結(jié)構(gòu),不同結(jié)構(gòu)、層級(jí)的圖式之間的互動(dòng)關(guān)系關(guān)注較少;4.圖式受不同語(yǔ)言的限制,對(duì)具體語(yǔ)言的觀(guān)照并不充分;5.尚未建立一個(gè)跨語(yǔ)言、統(tǒng)一、完整的語(yǔ)言認(rèn)知模型。其中,簡(jiǎn)單的描摹形狀和表達(dá)相對(duì)位置(如“容器”“部分—整體”“中心—邊緣”等)的意象圖式,已經(jīng)在認(rèn)知心理學(xué)領(lǐng)域通過(guò)實(shí)驗(yàn)的方式進(jìn)行了相關(guān)性和顯著性證實(shí),但對(duì)標(biāo)識(shí)復(fù)雜關(guān)系的意象圖式還缺乏可靠的實(shí)證方法和論證模式。

從今后發(fā)展上看,可建立一個(gè)較為完整和統(tǒng)一的語(yǔ)言認(rèn)知模型系統(tǒng)作為更高級(jí)的范式,從而順利完成機(jī)器的前期讀取和前端輸入,即從自然語(yǔ)言輸出的末端入手模擬人腦的思維調(diào)動(dòng)過(guò)程,進(jìn)而刺激并開(kāi)發(fā)“機(jī)器思維”。

差異三:表現(xiàn)。從索菲亞與人的交互可看出人工智能已能實(shí)現(xiàn)基本詞匯的組合和句子的簡(jiǎn)單判斷,但語(yǔ)言輸出的過(guò)程中符合所屬語(yǔ)言的自然表達(dá)、語(yǔ)境、語(yǔ)用含意,則是判定是否達(dá)到人類(lèi)自然語(yǔ)言水平的三個(gè)主要衡量標(biāo)準(zhǔn)。

1.所屬語(yǔ)言的自然表達(dá)。以漢語(yǔ)為例,它是典型的語(yǔ)義導(dǎo)向和語(yǔ)用強(qiáng)勢(shì)語(yǔ)言,主要表現(xiàn)為同一種語(yǔ)法關(guān)系可隱含較大的語(yǔ)義容量和復(fù)雜的語(yǔ)義關(guān)系,在語(yǔ)境允許的情況下部分句法成分可省略,詞序也相當(dāng)靈活。人工智能在規(guī)定程式下輸出的語(yǔ)言往往是結(jié)構(gòu)完整的規(guī)范作答,缺乏表達(dá)的靈活性,也不符合特定語(yǔ)言的表達(dá)習(xí)慣。雖可在前期大量輸入語(yǔ)料庫(kù),但涵蓋面仍受限且不一定適用當(dāng)前語(yǔ)境。

2.語(yǔ)境。語(yǔ)境分為大語(yǔ)境和小語(yǔ)境,前者包括大衛(wèi)·貝羅(David Berlo)建構(gòu)的S—M—C—R交際模型中知識(shí)、社會(huì)制度和文化等,后者包括正在進(jìn)行的交際語(yǔ)境等。人工智能在語(yǔ)句選擇中往往依照結(jié)構(gòu)和語(yǔ)義規(guī)則,無(wú)法對(duì)具體語(yǔ)境進(jìn)行準(zhǔn)確判斷,難以做到“在什么情景說(shuō)什么話(huà)”。

3.語(yǔ)用含意。日常交際中,句子的字面意義與說(shuō)話(huà)人想要表達(dá)的實(shí)際意義往往并不等值,即“言下之意、弦外之音”,這種語(yǔ)用含意根植于語(yǔ)境和說(shuō)話(huà)人真實(shí)意圖中。人工智能可借助信息傳遞的外在渠道進(jìn)行感官的識(shí)別和判斷,但對(duì)于邏輯推理等還需要長(zhǎng)時(shí)間的研究升級(jí)。

通過(guò)分析現(xiàn)階段人工智能語(yǔ)言輸出與人類(lèi)自然語(yǔ)言在產(chǎn)生、過(guò)程、表現(xiàn)上的區(qū)別與差距,人工智能在語(yǔ)言輸出上的發(fā)展困境可作如下總結(jié)。

1.人工智能缺乏“語(yǔ)言習(xí)得機(jī)制”的生理基礎(chǔ),只能通過(guò)程式和算法實(shí)現(xiàn)一些簡(jiǎn)單的、規(guī)則明確的、有限的表達(dá)。

2.人工智能在語(yǔ)言輸出中缺乏有效的糾正性反饋機(jī)制,因此難以達(dá)到“自主學(xué)習(xí)”的程度,大大限制了輸入和輸出的容量。

3.諸多語(yǔ)義規(guī)則、句法規(guī)則以及新興的認(rèn)知范式缺乏實(shí)證性,難以直接、準(zhǔn)確、全面地投入應(yīng)用,這也要求語(yǔ)言學(xué)家對(duì)語(yǔ)言規(guī)則和規(guī)律進(jìn)行更為深入的研究和更為清晰的梳理。

4.人工智能目前仍然是“無(wú)心的機(jī)器”,不同因子之間的外在“對(duì)應(yīng)”并不能解決內(nèi)在意義“理解”上的難題,對(duì)于語(yǔ)境的把握和邏輯的判斷還需更為可靠的模型和范式。

索菲亞與交際對(duì)象的問(wèn)答大多為提前設(shè)定,這也是社會(huì)輿論中將其看作“應(yīng)答機(jī)器人”而非“交互機(jī)器人”的主要論據(jù)。但在這些發(fā)展困境的背后,也必須看到人工智能在語(yǔ)言輸出上為更好地模擬人類(lèi)自然語(yǔ)言所獲得的突破和成就,比如語(yǔ)音識(shí)別技術(shù)的升級(jí),多感官、多模態(tài)的識(shí)別,語(yǔ)言表達(dá)的完善等,這些均為人工智能在語(yǔ)言輸出中的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)?;谀壳暗目茖W(xué)技術(shù)水平,人工智能語(yǔ)言輸出與自然語(yǔ)言存在著諸多差異,包括不少根本性的差距,這就需要尋求更為高級(jí)的范式

THEEND

最新評(píng)論(評(píng)論僅代表用戶(hù)觀(guān)點(diǎn))

更多
暫無(wú)評(píng)論