據(jù)外媒報(bào)道,今年5月,谷歌推出了Duplex語音助手,引起了轟動(dòng)。這是一款酷似人類的語音助手,可以進(jìn)行餐廳預(yù)訂和沙龍預(yù)約。它似乎標(biāo)志著語音生成和自然語言理解的一個(gè)新的里程碑,揭開了人機(jī)交互的未來可能是什么樣子的帷幕。
盡管谷歌正在有限的公開發(fā)布中緩慢推出這一功能,但阿里巴巴自己的語音助手已經(jīng)領(lǐng)先了。12月2日,在2018年人工智能研究年度大會(huì)——神經(jīng)信息處理系統(tǒng)大會(huì)(Neural Information Processing Systems conference)上,阿里巴巴展示了其物流公司菜鳥的人工智能客服助手。
阿里巴巴機(jī)器智能與技術(shù)實(shí)驗(yàn)室(Machine Intelligence and Technology Lab)主任Jin Rong表示,這個(gè)助手每天已經(jīng)為數(shù)百萬客戶提供服務(wù)。
預(yù)先錄制的演示電話的內(nèi)容是智能助手詢問客戶他希望他的包裹在哪里交付。在來回的對(duì)話中,助手成功地識(shí)別出了幾個(gè)會(huì)話元素,這些元素展示了其自然語言能力的廣度。在30秒內(nèi),代理順利地處理了三種常見的、棘手的會(huì)話成分:中斷、非線性會(huì)話和隱性意圖。
中斷是不言自明的助手可以響應(yīng)客戶的中斷并繼續(xù)傳遞相關(guān)信息,而無需重新啟動(dòng)或跳過一個(gè)節(jié)拍。
當(dāng)客戶問“您是誰?”這就要求助手意識(shí)到客戶沒有回答前面的問題,而是開始了新的詢問。作為響應(yīng),助手在返回到最初的問題之前重新進(jìn)行自我介紹。
當(dāng)客戶回答“我早上不在家”時(shí),就會(huì)產(chǎn)生隱性意圖。他從來沒有明確地說出他真正的意思——送貨上門行不通——但助手能夠從字里行間讀出意思,并理智地采取后續(xù)行動(dòng)。這些元素在人類的對(duì)話中可能非常普遍,但機(jī)器往往難以處理它們。
從谷歌演示的類似通話樣本來看,阿里巴巴的語音助手能夠做到這一點(diǎn),說明它比谷歌的Duplex通話更復(fù)雜。然而,值得注意的是,阿里巴巴的演示電話是為舞臺(tái)演示設(shè)計(jì)的;實(shí)際情況可能有所不同。
目前,該助手僅用于協(xié)調(diào)包裹遞送,但Jin表示,它可以擴(kuò)展到處理其他主題。他不愿透露這位助手是如何訓(xùn)練的。但他暗示,除了使用其他資源外,公司還可以使用大量客戶錄音。
據(jù)介紹幻燈片顯示,在一個(gè)典型的日子里,該公司平均每天會(huì)接到5萬個(gè)客服電話——這個(gè)數(shù)字在雙十一(11月11日)會(huì)翻五倍,雙十一是該公司一年中收入最高的節(jié)日。
阿里巴巴還在為其業(yè)務(wù)的其他方面開發(fā)數(shù)字助手,包括可以在嘈雜的餐廳和商店里為你點(diǎn)餐的訂餐助手;一個(gè)類似人類的虛擬助手,可以回答有關(guān)阿里巴巴產(chǎn)品的問題;此外,阿里巴巴旗下轉(zhuǎn)售平臺(tái)咸魚(Xianyu)上20%的賣家已經(jīng)在使用一款價(jià)格低廉的聊天機(jī)器人。
這些助手的核心是語音識(shí)別和自然語言處理引擎AliMe,由該公司的機(jī)器智能和技術(shù)實(shí)驗(yàn)室開發(fā)。然后,它們被打包并適應(yīng)業(yè)務(wù)的不同部分。
阿里巴巴在這一領(lǐng)域的最大優(yōu)勢(shì)是,它有大量的數(shù)據(jù)來培訓(xùn)人工智能。這些助手學(xué)習(xí)和提高的速度更快,因?yàn)樗麄冊(cè)谔幚砀鞣N情況時(shí)得到了大量的練習(xí)??焖俨渴疬@些技術(shù)的巨大商業(yè)動(dòng)機(jī)也有幫助。
除了處理大量的客戶支持電話,阿里巴巴每天還遞送10億個(gè)包裹。將某些任務(wù)交給人工智能,有助于減輕人類的負(fù)擔(dān),保持業(yè)務(wù)平穩(wěn)運(yùn)行。