本文來(lái)自微信公眾號(hào)“根新未來(lái)”。
日前,《自然》人工智能子刊《自然·機(jī)器智能》發(fā)表了清華大學(xué)集成電路學(xué)院教授任天令團(tuán)隊(duì)研發(fā)的一款可穿戴人工喉,可以識(shí)別佩戴者喉部發(fā)聲的信號(hào),并將其轉(zhuǎn)換為語(yǔ)音播放出來(lái),還原準(zhǔn)確率超90%。
據(jù)任天令教授團(tuán)隊(duì)介紹,人在語(yǔ)音交流過(guò)程中發(fā)出的聲音,來(lái)源于聲帶震動(dòng),以及喉部、唇部這些發(fā)聲器官的協(xié)同合作。區(qū)別于麥克風(fēng)通過(guò)空氣中的機(jī)械波采集聲音,人工喉是一個(gè)極其敏感的機(jī)械傳感器,它能夠感知喉部細(xì)微的震動(dòng),基本可以把它看作一個(gè)頻域感知范圍更廣的麥克風(fēng)。
基于石墨烯材料研發(fā)的智能可穿戴人工喉,對(duì)低頻的肌肉運(yùn)動(dòng)、中頻食管振動(dòng)和高頻聲波信息有較高的靈敏度,也具有抗噪聲的語(yǔ)音感知能力。同時(shí),人工喉還能通過(guò)熱聲效應(yīng)將信號(hào)轉(zhuǎn)換成聲音播放。這將有助于發(fā)聲失能群體恢復(fù)發(fā)聲,造福更多的聲音障礙者。
人工喉VS電子喉助音器
相比較于現(xiàn)在市面上的電子喉,需要人去適應(yīng)設(shè)備的理念,人工喉是讓機(jī)器去學(xué)習(xí)人類的語(yǔ)言。具體來(lái)說(shuō),使用者往往因?yàn)楹砬谐中g(shù)后把聲帶切除了,喪失了聲帶這個(gè)震動(dòng)的聲源。傳統(tǒng)的電子喉是一個(gè)提供單頻振動(dòng)的馬達(dá),配合上食管、唇部、舌頭的運(yùn)動(dòng),調(diào)制振動(dòng)發(fā)出聲音;而且,電子喉學(xué)習(xí)、使用成本很高的。在喉切除手術(shù)以后,需要手持電子喉抵住喉嚨去學(xué)習(xí),嘗試用它發(fā)聲。
人工喉的使用相比電子喉會(huì)更容易。使用者貼附以后只需要錄入自己的語(yǔ)音,設(shè)備的算法可以快速學(xué)會(huì)語(yǔ)音特征,不用去單獨(dú)另外再學(xué)一門(mén)語(yǔ)言。這類似于手機(jī)錄入指紋的過(guò)程,嘗試幾次以后就慢慢學(xué)會(huì)了。而且,伴隨著科技的進(jìn)一步發(fā)展,采用人工AI語(yǔ)音合成技術(shù)的人工喉將會(huì)對(duì)使用者本來(lái)的聲音進(jìn)行完全還原;佩戴也會(huì)更舒適,一枚硬幣大小的人工喉貼片,貼在頸部靠近喉嚨處就可以了。
人工喉的應(yīng)用前景
人工喉還有很大的優(yōu)化和拓展空間,例如提高聲音的質(zhì)量和音量,增加語(yǔ)音的多樣性和情感識(shí)別,以及結(jié)合其他生理信號(hào)和環(huán)境信息實(shí)現(xiàn)更自然和智能的語(yǔ)音交互。比如貼附的位置也不只限于喉嚨,未來(lái)也可能在面部產(chǎn)生類似于一種像電影《阿凡達(dá)》里面那些外星人面部紋身,看起來(lái)會(huì)很有科技感。
項(xiàng)目研究的初衷是想幫助解決發(fā)聲失能群體恢復(fù)發(fā)聲的問(wèn)題,但實(shí)際上這項(xiàng)成果對(duì)普通人來(lái)講也是可以適用的。比如說(shuō)在機(jī)場(chǎng)工作的地勤人員、火災(zāi)現(xiàn)場(chǎng)的消防員,在那種嘈雜環(huán)境下正常的語(yǔ)音交流肯定是不行的。但是通過(guò)我們的這種方式,將聲音轉(zhuǎn)化成對(duì)應(yīng)的語(yǔ)音信號(hào),傳到耳麥里進(jìn)行播放,可以有效解決這些問(wèn)題。
另外對(duì)更廣大的社會(huì)人群,在一些注意通話私密性的場(chǎng)合,還有金融支付領(lǐng)域都有廣泛的應(yīng)用前景。比如人工喉可以將采集到的喉部振動(dòng)信息用于語(yǔ)音支付,安全方面或會(huì)有比較顯著的提升。