Siri開(kāi)始說(shuō)人話:聲紋識(shí)別終到來(lái) 今天的蘋(píng)果夠AI

網(wǎng)易智能
隨著深度學(xué)習(xí)技術(shù)的不斷成熟,基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音合成逐漸成為語(yǔ)音合成領(lǐng)域的主流方法,這次蘋(píng)果采用的就是Neural TTS(神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成)技術(shù)(如上圖),這樣的技術(shù)應(yīng)用在國(guó)內(nèi)已經(jīng)很多,AI合成語(yǔ)音已經(jīng)可以以假亂真。
  今天凌晨,一年一度的蘋(píng)果WWDC 19全球開(kāi)發(fā)者大會(huì)在美國(guó)圣何塞舉辦,蘋(píng)果更新了自家系統(tǒng)平臺(tái)macOS、iOS、watchOS、tvOS以及今年剛剛加入的iPad OS。
 
  在常規(guī)的軟件升級(jí)之外,智能菌將帶大家細(xì)數(shù)本屆WWDC蘋(píng)果在AI方面的升級(jí),我們也和大家聊聊蘋(píng)果關(guān)于隱私保護(hù)方面的思考。
 
  終于開(kāi)始“說(shuō)人話”的智能助手
 
  早在2007年,蘋(píng)果率先推出了這款搭載于iPhone4S的智能語(yǔ)音控制功能,用戶利用Siri可以通過(guò)手機(jī)讀短信、介紹餐廳、詢問(wèn)天氣、語(yǔ)音設(shè)置鬧鐘等。
 
 
  從2017年開(kāi)始,Siri逐漸迎來(lái)更豐富的更新,加入了實(shí)時(shí)翻譯功能,支持英語(yǔ)、法語(yǔ)、德語(yǔ)等語(yǔ)言,與此同時(shí),Siri的智能化還進(jìn)一步得到提升,還支持上下文的預(yù)測(cè)功能。
 
  但一直以來(lái),由于蘋(píng)果的封閉性,Siri的可用性還是飽受詬病,在AI技術(shù)方面更是被吐槽為“人工智障”,從今年的WWDC來(lái)看,蘋(píng)果希望擺脫智障的帽子,起碼讓Siri交流起來(lái)更像真人了。
 
 
  具體來(lái)講,隨著深度學(xué)習(xí)技術(shù)的不斷成熟,基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音合成逐漸成為語(yǔ)音合成領(lǐng)域的主流方法,這次蘋(píng)果采用的就是Neural TTS(神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成)技術(shù)(如上圖),這樣的技術(shù)應(yīng)用在國(guó)內(nèi)已經(jīng)很多,AI合成語(yǔ)音已經(jīng)可以以假亂真。
 
  別人吃剩下的聲紋識(shí)別來(lái)了
 
  HomePod是蘋(píng)果在2017年WWDC推出的智能音箱產(chǎn)品,該音響7英寸高,擁有7個(gè)高頻揚(yáng)聲器和一個(gè)很大的低頻揚(yáng)聲器,配備精準(zhǔn)的音效喇叭和風(fēng)向控制。
 
 
  這是蘋(píng)果的第一款智能音箱硬件,一經(jīng)推出便口碑兩重天,很多人贊揚(yáng)它的音質(zhì)和曼妙的腰線,擺放在哪里都不違和的設(shè)計(jì),但更多人的指責(zé)它封閉的應(yīng)用生態(tài)和隱私性。
 
  這里提到的隱私性就是指這款產(chǎn)品標(biāo)榜的Siri喚醒和發(fā)布指令,在此之前,任何在它旁邊的人都可以喚醒它,只要說(shuō)出“朗讀短信”,用戶的秘密就大告天下了。
 
  在今年的WWDC現(xiàn)場(chǎng),蘋(píng)果終于為HomePod加入了聲紋識(shí)別功能,它可以智能區(qū)別與它對(duì)話的是哪位,聲紋識(shí)別(Voiceprint Recognize)是一項(xiàng)提取說(shuō)話人聲音特征和說(shuō)話內(nèi)容信息,自動(dòng)核驗(yàn)說(shuō)話人身份的技術(shù),目前已經(jīng)廣泛應(yīng)用在了考勤系統(tǒng)、遠(yuǎn)程認(rèn)證、門(mén)禁系統(tǒng)等場(chǎng)景之中。
 
  在中國(guó)廠商發(fā)布的智能音箱產(chǎn)品中更是早有應(yīng)用,這回蘋(píng)果算是玩大家剩下的,就看它的實(shí)際體驗(yàn)?zāi)芊衲嬉u領(lǐng)跑了,拭目以待。
 
  保護(hù)隱私用戶的云端數(shù)據(jù)蘋(píng)果也不看
 
  美國(guó)消費(fèi)者保護(hù)組織Consumer Watchdog曾出具過(guò)一份報(bào)告,指責(zé)來(lái)自亞馬遜和谷歌的專利申請(qǐng)曝光了其智能音箱是如何“偷聽(tīng)”用戶的。該組織的研究稱,這些設(shè)備可能被用作收集大量信息和廣告推廣的監(jiān)聽(tīng)設(shè)備。
 
  事實(shí)上,這樣的用戶反饋確實(shí)不絕于耳,Alexa曾將夫妻之間私人談話的內(nèi)容偷偷記錄下來(lái),并發(fā)給了其中一名家庭成員的同事,他當(dāng)即打電話說(shuō)這對(duì)夫婦:“趕緊拔掉你的Alexa設(shè)備!”
 
  針對(duì)種種擔(dān)憂,歐盟更是推出了史上最嚴(yán)的隱私保護(hù)條例GDPR(General Data Protection Regulation),目的就在于遏制個(gè)人信息被濫用,保護(hù)個(gè)人隱私。
 
 
  雖然沒(méi)有證據(jù)表明蘋(píng)果設(shè)備存在這樣的隱患,但也足夠引起大家的擔(dān)憂。
 
  而蘋(píng)果的隱私保護(hù)做法在2019 WWDC有了進(jìn)一步的補(bǔ)充和升級(jí),在Watch OS方面,蘋(píng)果推出了運(yùn)動(dòng)推薦和數(shù)據(jù)分析的功能,在智能家居應(yīng)用中,蘋(píng)果更新了視頻分析和數(shù)據(jù)存儲(chǔ)功能。
 
 
  以上二者的共同點(diǎn)是,蘋(píng)果將處置數(shù)據(jù)的權(quán)利交給用戶,用戶可以選擇不上傳(保存在本地的加密芯片),也可以選擇上傳到云端,但蘋(píng)果稱用戶的數(shù)據(jù)他們也無(wú)能查看。
 
  值得一提都是,蘋(píng)果還在智能家居的數(shù)據(jù)保護(hù)中加入了路由器的防護(hù),以此來(lái)保障用戶不在任何的環(huán)節(jié)遭遇攻擊。
 
  在增強(qiáng)現(xiàn)實(shí)里暢游“我的世界”
 
  ARKit是蘋(píng)果在2017年WWDC推出的AR開(kāi)發(fā)平臺(tái),開(kāi)發(fā)人員可以使用這套工具iPhone和iPad創(chuàng)建增強(qiáng)現(xiàn)實(shí)應(yīng)用程序。
 
 
  在WWDC 2019蘋(píng)果帶來(lái)了AR應(yīng)用的更新和全新的RealityKit平臺(tái),如上圖,蘋(píng)果在現(xiàn)場(chǎng)展示了《我的世界》游戲的AR版本,這是一款堆方塊、不斷冒險(xiǎn)的游戲,融入增強(qiáng)現(xiàn)實(shí)之后趣味性十足,還可以多人互動(dòng)游戲。
 
 
  此外,蘋(píng)果還帶來(lái)了RealityKit開(kāi)發(fā)工具,新增了AR模型還可以融合人物,支持動(dòng)作捕捉,并且可以實(shí)現(xiàn)照片級(jí)渲染,環(huán)境和相機(jī)效果。
 
  美國(guó)專利局曾批準(zhǔn)了蘋(píng)果的一項(xiàng)申請(qǐng):頭盔將配置攝像頭,用于辨認(rèn)和注釋興趣點(diǎn)和其他對(duì)象。大家一度認(rèn)為蘋(píng)果會(huì)在WWDC推出AR硬件。
 
  庫(kù)克有言,蘋(píng)果認(rèn)為AR增強(qiáng)現(xiàn)實(shí)會(huì)是未來(lái)10年非常重要的技術(shù),我們會(huì)在這個(gè)領(lǐng)域投入更多。有分析認(rèn)為,隨著5G技術(shù)的應(yīng)用,AR將迎來(lái)成熟期,目前AR相關(guān)專利申請(qǐng)正在持續(xù)攀升。
 
  總結(jié)
 
  依然是一場(chǎng)很蘋(píng)果的開(kāi)發(fā)者大會(huì),在人工智能技術(shù)方面不冒進(jìn),堅(jiān)持用產(chǎn)品和體驗(yàn)說(shuō)話,他們強(qiáng)調(diào)自己是一家軟件公司,在細(xì)枝末節(jié)上的打磨確實(shí)值得稱贊。
 
  但不可否認(rèn),蘋(píng)果的封閉性依然制約著其AI功能大放異彩的機(jī)會(huì),Siri本可以做得更多,話不多說(shuō),期待開(kāi)放內(nèi)測(cè)。
THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論