咳兩聲就能鎖定新冠!MIT收集20萬(wàn)咳嗽樣本,用AI辨別無(wú)癥狀感染者,準(zhǔn)確率100%

大數(shù)據(jù)文摘
編譯
麻省理工的研究小組正在努力將該模型整合到一個(gè)用戶友好的應(yīng)用程序中,如果獲得FDA的批準(zhǔn)并被大規(guī)模采用,該程序?qū)⒂锌赡艹蔀橐环N免費(fèi)、便捷、無(wú)創(chuàng)的預(yù)篩查工具,以識(shí)別可能對(duì)Covid-19無(wú)癥狀的人。

大數(shù)據(jù)文摘作品

來(lái)源:mit.edu

編譯:miggy

10月25日,喀什地區(qū)疏附縣24日發(fā)現(xiàn)1例新冠肺炎無(wú)癥狀感染者后,新疆迅速對(duì)其密切接觸者、密切接觸者的接觸者進(jìn)行核酸檢測(cè),截至10月25日14時(shí),檢測(cè)出137人呈陽(yáng)性,經(jīng)專家診斷,均為無(wú)癥狀感染者。

后疫情時(shí)代,無(wú)癥狀感染者正成為疫情復(fù)發(fā)最大的威脅。沒(méi)有任何胸悶發(fā)熱癥狀,你和同伴可能很難區(qū)分是否感染了新冠。

但人工智能可以,只要你給TA聽(tīng)聽(tīng)你的咳嗽聲。

在最近發(fā)表在《IEEE醫(yī)學(xué)與生物學(xué)工程學(xué)雜志》上的一篇論文中,麻省理工學(xué)院的研究人員表示,他們已經(jīng)開(kāi)發(fā)出可以識(shí)別COVID-19感染者咳嗽聲的AI。

論文地址:

https://www.embs.org/ojemb/articles/covid-19-artificial-intelligence-diagnosis-using-only-cough-recordings/

據(jù)論文顯示,研究小組開(kāi)發(fā)了一種AI模型,該模型通過(guò)分析你的咳嗽錄音,可以將無(wú)癥狀感染者與健康的人區(qū)分開(kāi)來(lái)。所有人都可以通過(guò)網(wǎng)絡(luò)瀏覽器以及手機(jī)和筆記本電腦等設(shè)備自愿提交的錄音。

研究人員稱,該模型由他們一直以來(lái)進(jìn)行的“咳嗽檢測(cè)阿爾茲海默早期癥狀”演變而來(lái),疫情以來(lái),研究者通過(guò)“網(wǎng)絡(luò)眾籌”的方式,已經(jīng)在全球搜集了20多萬(wàn)的咳嗽樣本,建立了有史以來(lái)最大的“咳嗽數(shù)據(jù)庫(kù)”。

通過(guò)這些咳嗽樣本和錄入的相關(guān)感染、性別、情緒數(shù)據(jù),對(duì)該模型進(jìn)行了聲音訓(xùn)練。

目前,該模型識(shí)別出確診為Covid-19的人的咳嗽的準(zhǔn)確率為98.5%,其中,利用咳嗽聲識(shí)別無(wú)癥狀感染者的準(zhǔn)確度高達(dá)100%。

麻省理工的研究小組正在努力將該模型整合到一個(gè)用戶友好的應(yīng)用程序中,如果獲得FDA的批準(zhǔn)并被大規(guī)模采用,該程序?qū)⒂锌赡艹蔀橐环N免費(fèi)、便捷、無(wú)創(chuàng)的預(yù)篩查工具,以識(shí)別可能對(duì)Covid-19無(wú)癥狀的人。

用戶可以每天登錄,錄下咳嗽聲到他們的手機(jī)中,并立即獲得有關(guān)他們是否可能被感染的信息。

麻省理工學(xué)院自動(dòng)識(shí)別實(shí)驗(yàn)室的研究科學(xué)家布萊恩·蘇比拉納(Brian Subirana)與麻省理工學(xué)院自動(dòng)ID實(shí)驗(yàn)室的Jordi Laguarta和Ferran Hueto聯(lián)合完成了這項(xiàng)研究。

從阿茲海默癥檢測(cè)到新冠檢測(cè)

其實(shí)這項(xiàng)算法并非為新冠定制。

早在疫情爆發(fā)之前,這個(gè)研究小組已經(jīng)在咳嗽的手機(jī)錄音中訓(xùn)練算法,以準(zhǔn)確診斷肺炎和哮喘等疾病。麻省理工學(xué)院的團(tuán)隊(duì)正在以類似的方式開(kāi)發(fā)AI模型,以分析強(qiáng)迫咳嗽記錄,以查看它們是否可以檢測(cè)出阿爾茨海默氏癥的體征,這種疾病不僅與記憶力下降有關(guān),而且還與神經(jīng)肌肉退化(如聲帶減弱)有關(guān)。

他們首先訓(xùn)練了一種通用的機(jī)器學(xué)習(xí)算法或稱為ResNet50的神經(jīng)網(wǎng)絡(luò),以區(qū)分與不同聲帶強(qiáng)度相關(guān)的聲音。研究表明,聲音“ mmmm”的質(zhì)量可以表明一個(gè)人的聲帶有多弱。Subirana在包含了1000多個(gè)小時(shí)語(yǔ)音的有聲讀物數(shù)據(jù)集上訓(xùn)練了神經(jīng)網(wǎng)絡(luò),以從“ the”和“ then”等其他詞中挑選出“ them”一詞。

該小組訓(xùn)練了第二個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)區(qū)分言語(yǔ)中明顯的情緒狀態(tài),因?yàn)橐炎C明阿爾茨海默氏癥患者以及神經(jīng)系統(tǒng)較弱的人表現(xiàn)出某些情緒,例如沮喪或平淡無(wú)奇,比他們表達(dá)快樂(lè)還是冷靜的情緒更高。

研究人員通過(guò)在大型演員數(shù)據(jù)集上訓(xùn)練情緒情感分類器(例如中性,平靜,快樂(lè)和悲傷)來(lái)開(kāi)發(fā)情緒語(yǔ)音分類器模型。

然后,研究人員在咳嗽數(shù)據(jù)庫(kù)上訓(xùn)練了第三個(gè)神經(jīng)網(wǎng)絡(luò),以辨別肺和呼吸功能的變化。

最后,該團(tuán)隊(duì)將這三個(gè)模型結(jié)合在一起,并疊加了一種算法來(lái)檢測(cè)肌肉退化。該算法通過(guò)實(shí)質(zhì)上模擬音頻蒙版或噪聲層,并區(qū)分強(qiáng)咳嗽(通過(guò)噪聲可以聽(tīng)到的咳嗽)與較弱的咳嗽,來(lái)做到這一點(diǎn)。

通過(guò)新的AI框架,該團(tuán)隊(duì)提供了包括阿爾茨海默氏癥患者在內(nèi)的音頻記錄,發(fā)現(xiàn)與現(xiàn)有模型相比,它可以更好地識(shí)別阿爾茨海默氏癥的樣本。

結(jié)果表明,聲帶強(qiáng)度、情緒、肺和呼吸功能以及肌肉退化是診斷該疾病的有效生物標(biāo)志物。

當(dāng)冠狀病毒大流行開(kāi)始蔓延時(shí),Subirana想知道他們針對(duì)阿爾茨海默氏癥的AI框架是否也可以用于診斷Covid-19,因?yàn)樵絹?lái)越多的證據(jù)表明感染的患者會(huì)經(jīng)歷一些類似的神經(jīng)系統(tǒng)癥狀,例如暫時(shí)性神經(jīng)肌肉損傷。

“說(shuō)話和咳嗽的聲音都受到聲帶和周圍器官的影響。這意味著當(dāng)講話時(shí),部分講話就像是咳嗽,反之亦然。這也意味著我們很容易從流利的言語(yǔ)中衍生出一些東西,人工智能可以簡(jiǎn)單地從咳嗽中發(fā)現(xiàn)一些信息,包括人的性別、母語(yǔ)甚至情緒狀態(tài)。實(shí)際上,您的咳嗽中蘊(yùn)含著情感。” Subirana說(shuō)。

“所以我們認(rèn)為,為什么我們不嘗試探究這些阿茲海默癥的生物標(biāo)志物(以及看它們是否與Covid相關(guān))”。

20萬(wàn)+咳嗽樣本,已知最大的咳嗽研究數(shù)據(jù)集

在4月,研究小組著手收集盡可能多的咳嗽記錄,包括來(lái)自Covid-19患者的咳嗽記錄。

他們建立了一個(gè)網(wǎng)站,人們可以通過(guò)手機(jī)或其他支持網(wǎng)絡(luò)的設(shè)備記錄一系列咳嗽。參與者還填寫了他們正在經(jīng)歷的癥狀的調(diào)查表,無(wú)論他們是否患有Covid-19,是否通過(guò)官方測(cè)試,通過(guò)醫(yī)生對(duì)其癥狀的評(píng)估或是否經(jīng)過(guò)自我診斷而得到了診斷。他們還可以記錄自己的性別,地理位置和母語(yǔ)。

迄今為止,研究人員已經(jīng)收集了70,000多條錄音,每條錄音包含多個(gè)咳嗽聲,總計(jì)約200,000咳嗽音頻樣本,Subirana說(shuō)這是“已知最大的咳嗽研究數(shù)據(jù)集”。確認(rèn)患有Covid-19的人(包括無(wú)癥狀的人)提交了大約2500份錄音。

該團(tuán)隊(duì)使用了2,500個(gè)與Covid相關(guān)的記錄,以及他們從集合中隨機(jī)選擇的另外2500個(gè)記錄來(lái)平衡數(shù)據(jù)集。他們使用了4,000個(gè)樣本來(lái)訓(xùn)練AI模型。然后將其余的1,000個(gè)記錄輸入模型中,以查看它能否準(zhǔn)確區(qū)分出Covid患者和健康個(gè)體的咳嗽。

令人驚訝的是,正如研究人員在論文中所寫的那樣,他們的努力揭示了“阿爾茨海默氏癥和新冠咳嗽算法之間驚人的相似之處”。

他們發(fā)現(xiàn),在原本用于阿爾茨海默氏癥的AI框架內(nèi)無(wú)需進(jìn)行大量調(diào)整,他們就能找到針對(duì)Covid-19的四種生物標(biāo)志物的模式-聲帶強(qiáng)度、情緒、肺和呼吸功能以及肌肉退化。該模型從Covid-19確診的人中識(shí)別出98.5%的咳嗽,并準(zhǔn)確地檢測(cè)到了所有無(wú)癥狀的咳嗽。

Subirana說(shuō):“我們認(rèn)為這表明,即使您沒(méi)有癥狀,當(dāng)您擁有Covid時(shí),您產(chǎn)生聲音的方式也會(huì)改變。”

100%檢測(cè)到無(wú)癥狀感染者

Subirana強(qiáng)調(diào),這種AI模型的優(yōu)勢(shì)不在于檢測(cè)有癥狀的新冠患者,不管他們的癥狀是由于Covid-19還是其他癥狀(如流感或哮喘)引起的。該工具的優(yōu)勢(shì)在于它能夠分辨無(wú)癥狀新冠感染者的咳嗽和健康的咳嗽。

MIT的團(tuán)隊(duì)正在與一家公司合作,根據(jù)他們的AI模型開(kāi)發(fā)免費(fèi)的預(yù)檢應(yīng)用程序。他們還與世界各地的多家醫(yī)院合作,收集更大,更多樣化的咳嗽記錄集,這將有助于訓(xùn)練和增強(qiáng)模型的準(zhǔn)確性。

正如他們?cè)谡撐闹刑岢龅哪菢樱?ldquo;如果預(yù)篩查工具始終在后臺(tái)并且不斷改進(jìn),那么泛濫癥就可能成為過(guò)去。”

最終,他們?cè)O(shè)想可以將他們開(kāi)發(fā)的音頻AI模型集成到智能揚(yáng)聲器和其他聽(tīng)音設(shè)備中,以便人們可以方便地(也許每天)對(duì)他們的疾病風(fēng)險(xiǎn)進(jìn)行初步評(píng)估。

相關(guān)鏈接:

https://news.mit.edu/2020/covid-19-cough-cellphone-detection-1029

https://techcrunch.com/2020/10/30/cough-scrutinizing-ai-shows-major-promise-as-an-early-warning-system-for-covid-19/

https://www.engadget.com/ai-covid-19-cough-detection-from-recordings-213858299.html

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論