精品一极毛片一区二区,亚洲成人av综合久久久蜜桃臀

揭秘Siri，蘋果發(fā)布論文闡釋語音助手設(shè)計(jì)想法

2020-02-05 08:52

鎂客網(wǎng)

Lynn

AI首先必須確定輸入音頻中的語音內(nèi)容是否與觸發(fā)短語的語音內(nèi)容匹配（語音觸發(fā)檢測(cè)），然后必須確定說話者的語音是否與一個(gè)或多個(gè)注冊(cè)用戶的語音相匹配（說話者驗(yàn)證）。一般方法是將兩項(xiàng)任務(wù)分別來處理，蘋果則認(rèn)為可以用一個(gè)神經(jīng)網(wǎng)絡(luò)模型同時(shí)解決兩項(xiàng)任務(wù)，同時(shí)它表示，經(jīng)過驗(yàn)證，該方法各方面性能可以達(dá)到預(yù)期。

最近，蘋果發(fā)布了一系列論文來闡釋語音助手的重要工作機(jī)理，公開揭秘Siri，向業(yè)界貢獻(xiàn)了自己在設(shè)計(jì)上的不同想法。

在第一篇論文中，蘋果就語音助手中的多任務(wù)處理問題進(jìn)行了闡釋，它指出在Siri中，喚醒處理通常需要兩個(gè)步驟：AI首先必須確定輸入音頻中的語音內(nèi)容是否與觸發(fā)短語的語音內(nèi)容匹配（語音觸發(fā)檢測(cè)），然后必須確定說話者的語音是否與一個(gè)或多個(gè)注冊(cè)用戶的語音相匹配（說話者驗(yàn)證）。一般方法是將兩項(xiàng)任務(wù)分別來處理，蘋果則認(rèn)為可以用一個(gè)神經(jīng)網(wǎng)絡(luò)模型同時(shí)解決兩項(xiàng)任務(wù)，同時(shí)它表示，經(jīng)過驗(yàn)證，該方法各方面性能可以達(dá)到預(yù)期。

在該論文中，研究人員給出了模型示例。他們?cè)诎?6000小時(shí)帶注釋樣本的數(shù)據(jù)集中訓(xùn)練了基于兩種思路下設(shè)計(jì)的模型，其中5000小時(shí)的音頻帶有語音標(biāo)簽，其余均只有揚(yáng)聲器標(biāo)簽。相比于一般訓(xùn)練模型去獲取多個(gè)標(biāo)簽的思路，蘋果通過將不同任務(wù)的訓(xùn)練數(shù)據(jù)進(jìn)行級(jí)聯(lián)來訓(xùn)練多個(gè)相關(guān)任務(wù)的模型。結(jié)果發(fā)現(xiàn)，在性能表現(xiàn)相同的情況下，蘋果新提出的模型反而更適合應(yīng)用，它能夠在兩個(gè)任務(wù)之間共享計(jì)算，大大節(jié)省了設(shè)備上的內(nèi)存空間，同時(shí)計(jì)算時(shí)間或等待時(shí)間以及所消耗的電量/電池?cái)?shù)量都將降低。

在另一篇論文中，蘋果還介紹了多語言演講場(chǎng)景的演講者識(shí)別系統(tǒng)設(shè)計(jì)——知識(shí)圖譜輔助聽寫系統(tǒng)決策。以聲學(xué)子模型為例，它可以基于語音信號(hào)傳輸痕跡來進(jìn)行預(yù)測(cè)，并且其上下文感知的預(yù)測(cè)組件考慮了各種交互上下文信號(hào)，其中上下文信號(hào)包含有關(guān)發(fā)出命令的條件信息、已安裝的命令語言環(huán)境、當(dāng)前選擇的命令語言環(huán)境以及用戶在發(fā)出請(qǐng)求之前是否切換命令語言環(huán)境的信息。

結(jié)果顯示，這一設(shè)計(jì)的優(yōu)勢(shì)在于，它們可以在語音信號(hào)太短而無法通過聲學(xué)模型產(chǎn)生可靠預(yù)測(cè)的情況下提供幫助。

此外，蘋果還提出了一項(xiàng)補(bǔ)充研究，緩解錯(cuò)誤觸發(fā)問題，即忽略不適合語音助手（Siri）的語音?；趫D結(jié)構(gòu)設(shè)計(jì)AI模型的思路，研究人員提出了一種圖神經(jīng)網(wǎng)絡(luò)（GNN），其中每個(gè)節(jié)點(diǎn)都與標(biāo)簽相連。結(jié)果顯示，該模型減少了87％的錯(cuò)誤觸發(fā)。

THEEND

免責(zé)聲明：凡注明為其它來源的信息均轉(zhuǎn)自其它平臺(tái)，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對(duì)此類作品本站僅提供交流平臺(tái)，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益，請(qǐng)作者持權(quán)屬證明與本站聯(lián)系，我們將及時(shí)更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點(diǎn)資訊

全民抗疫：AIoT行業(yè)可以為社會(huì)做哪些事情？

揭秘Siri，蘋果發(fā)布論文闡釋語音助手設(shè)計(jì)想法

2024 信息化觀察網(wǎng)

長(zhǎng)按掃描二維碼閱讀原文

揭秘Siri，蘋果發(fā)布論文闡釋語音助手設(shè)計(jì)想法

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

人工智能技術(shù)發(fā)展趨勢(shì)，給創(chuàng)新帶來了很大的變革

亞馬遜擬評(píng)估砍掉Alexa業(yè)務(wù)，智能音箱吹的牛，永遠(yuǎn)無法實(shí)現(xiàn)了？

支付寶感受到了寒意

人工智能與基礎(chǔ)設(shè)施游戲規(guī)則改變者正在走向市場(chǎng)成熟

本月熱門

AI 原生時(shí)代，字節(jié)想要復(fù)刻第三次增長(zhǎng)奇跡

2024 年預(yù)防網(wǎng)絡(luò)攻擊的 12 項(xiàng)網(wǎng)絡(luò)安全最佳實(shí)踐措施

從5G到6G：開啟無線通信的未來

2024年上半年中國云終端市場(chǎng)跟蹤報(bào)告：出貨量達(dá)到166.3萬臺(tái)，同比增長(zhǎng)22.4%

DevSecOps建設(shè)標(biāo)桿丨民生證券攜手懸鏡安全，共建敏捷安全開發(fā)體系

ESIS 2024第三屆中國電子半導(dǎo)體數(shù)智峰會(huì)正式啟動(dòng)，邀您共創(chuàng)電子半導(dǎo)體行業(yè)美好未來!

精選文章

錢晟磊：賦能小微企業(yè)，推動(dòng)產(chǎn)業(yè)升級(jí)

華為云網(wǎng)安一體解決方案，助力城市智能體安全建設(shè)

2024半導(dǎo)體生態(tài)創(chuàng)新大會(huì)圓滿落幕，蘇州冠禮榮登上榜

智能表格+工作流+應(yīng)用搭建，一站式數(shù)字化平臺(tái)SeaTable助力企業(yè)低門檻實(shí)現(xiàn)工作數(shù)字化

國產(chǎn)化的金融數(shù)據(jù)建模隱私計(jì)算應(yīng)用實(shí)踐

榮耀應(yīng)用市場(chǎng)攜手?jǐn)?shù)智融合應(yīng)用伙伴共創(chuàng)綠色生態(tài)

熱點(diǎn)資訊

走進(jìn)智能工廠，見證卓越智造的力量

美妝界的數(shù)字化奇跡：漠小曼的電商轉(zhuǎn)型與國潮崛起

2024 數(shù)智化創(chuàng)新應(yīng)用技術(shù)大會(huì) | 一號(hào)邀請(qǐng)

SRM趨勢(shì)洞察：供應(yīng)商關(guān)系管理將走向何方？

喜訊!智邦國際榮獲“數(shù)智化轉(zhuǎn)型領(lǐng)導(dǎo)品牌”

全民抗疫：AIoT行業(yè)可以為社會(huì)做哪些事情？

數(shù)字化家庭：借助物聯(lián)網(wǎng)和人工智能使家用電器更智能

揭秘Siri，蘋果發(fā)布論文闡釋語音助手設(shè)計(jì)想法

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

欄目推薦

人工智能技術(shù)發(fā)展趨勢(shì)，給創(chuàng)新帶來了很大的變革

亞馬遜擬評(píng)估砍掉Alexa業(yè)務(wù)，智能音箱吹的牛，永遠(yuǎn)無法實(shí)現(xiàn)了？

支付寶感受到了寒意

人工智能與基礎(chǔ)設(shè)施游戲規(guī)則改變者正在走向市場(chǎng)成熟

本月熱門

精選文章

熱點(diǎn)資訊

全民抗疫：AIoT行業(yè)可以為社會(huì)做哪些事情？

數(shù)字化家庭：借助物聯(lián)網(wǎng)和人工智能使家用電器更智能

揭秘Siri，蘋果發(fā)布論文闡釋語音助手設(shè)計(jì)想法

人工智能技術(shù)發(fā)展趨勢(shì)，給創(chuàng)新帶來了很大的變革

亞馬遜擬評(píng)估砍掉Alexa業(yè)務(wù)，智能音箱吹的牛，永遠(yuǎn)無法實(shí)現(xiàn)了？

全民抗疫：AIoT行業(yè)可以為社會(huì)做哪些事情？