盡管美國各地在今年春天都努力地抑制新型冠狀病毒的傳播,但在過去幾周,美國各州都經(jīng)歷了多次疫情高峰。自疫情爆發(fā)以來,美國新冠肺炎確診病例已經(jīng)攀升至450多萬例。
包括加州在內(nèi)的許多州的政府官員已經(jīng)開始取消重新開放,以幫助遏制病毒的傳播。在未來,州和地方?jīng)Q策者將會再次決定何時以及如何重新開放他們的社區(qū)。一加州大學(xué)圣巴巴拉分校工程學(xué)院的兩位研究人員Xifeng Yan和Yu-Xiang Wang說,他們已經(jīng)開發(fā)出一種受人工智能啟發(fā)的新型預(yù)測模型,這種模型能夠提供及時的本地信息,官員和公眾都可以使用這些信息來進行決策。
Yan是Venkatesh Narayanamurti計算機科學(xué)系主任,他說:“我們接觸到許多的數(shù)據(jù),其中大部分?jǐn)?shù)據(jù)都是國家和州提供的。但家長們更感興趣的是他們孩子的學(xué)區(qū)發(fā)生了什么,以及他們的孩子在秋季上學(xué)是否安全,然而提供這些信息的網(wǎng)站卻很少。我們的目標(biāo)是利用更有用的當(dāng)?shù)財?shù)據(jù)為當(dāng)?shù)鼐用窈蜎Q策者提供預(yù)測和解釋。”
這項預(yù)測項目名為“利用神經(jīng)領(lǐng)域適應(yīng)模型在當(dāng)?shù)厣鐓^(qū)進行干預(yù)性新冠肺炎反應(yīng)預(yù)測”,獲得了美國國家科學(xué)基金會(NSF)近20萬美元的快速反應(yīng)研究(Rapid Response Research,簡稱Rapid)資助。
作為計算機科學(xué)助理教授、Eugene Aas主席,Wang表示:“理解混亂的數(shù)據(jù)正是我們作為人工智能和機器學(xué)習(xí)領(lǐng)域的計算機科學(xué)家每天都要處理的挑戰(zhàn)。我們有必要提供我們的專業(yè)知識來幫助社區(qū)做出明智的決定。”
Yan和Wang開發(fā)了一種創(chuàng)新的預(yù)測算法,該算法基于名為Transformer的深度學(xué)習(xí)模型。這個模型是由一種由注意力機制驅(qū)動的模型,這種機制通過了解過去要查看的時間段以及哪些是最重要和最相關(guān)的數(shù)據(jù),從而直觀地學(xué)習(xí)如何進行預(yù)測。
“如果我們試圖預(yù)測一個特定的地區(qū),比如圣巴巴拉縣,我們的算法會比較不同地區(qū)在一段時間內(nèi)的新冠肺炎病例增長曲線,以確定最相似的地區(qū)。然后對這些地區(qū)進行權(quán)衡,以預(yù)測目標(biāo)地區(qū)的案例。”
除了新冠肺炎數(shù)據(jù)之外,該算法還從美國人口普查中提取信息,以便在為當(dāng)?shù)厣鐓^(qū)校準(zhǔn)預(yù)測時考慮到本地的細(xì)節(jié)。
Wang說:“普查數(shù)據(jù)信息量很大,因為它含蓄地反映了每個社區(qū)的文化、生活方式、人口統(tǒng)計和商業(yè)類型。當(dāng)你把這些數(shù)據(jù)與各地區(qū)現(xiàn)有的新冠肺炎數(shù)據(jù)結(jié)合起來時,它有助于我們將從一個地區(qū)學(xué)到的知識轉(zhuǎn)移到另一個地區(qū),這將對那些希望獲得干預(yù)措施有效性數(shù)據(jù)以便做出明智決定的社區(qū)來說會很有用。”
研究人員的模型顯示,在最近的高峰期,圣巴巴拉縣經(jīng)歷了與梅克倫堡、威克和北卡羅來納州達(dá)勒姆縣在3月底和4月初經(jīng)歷的相似傳播情況。通過利用這些縣來預(yù)測圣巴巴拉縣未來的病例,研究人員基于注意力的模型勝過了最常用的流行病學(xué)模型:SIR(疑似、感染、康復(fù))模型,該模型描述了個人在三個階段的流動情況;以及自回歸模型,這個模型只根據(jù)一段時間內(nèi)顯示的一系列數(shù)據(jù)點做出預(yù)測。基于人工智能的模型的平均絕對百分比誤差(MAPE, 統(tǒng)計中衡量預(yù)測精度的常用指標(biāo))為0.030,而SIR模型為0.11,自回歸模型為0.072。
Yan和Wang說,他們的模型預(yù)測更準(zhǔn)確,因為它消除了當(dāng)前模型的關(guān)鍵弱點。普查數(shù)據(jù)提供了現(xiàn)有模擬模型中缺少的細(xì)節(jié),而注意力機制還利用了現(xiàn)在公開獲得的大量數(shù)據(jù)。
Wang說:“人類無法像計算機算法那樣有效地處理海量數(shù)據(jù),即使是訓(xùn)練有素的專業(yè)人員也不例外。而我們的研究提供的工具可以自動從數(shù)據(jù)中提取有用的信息,從而簡化形勢,不會使它變得更加復(fù)雜。”
這個項目是與圣巴巴拉Cottage醫(yī)院的Richard Beswick博士和Lynn Fitzgibbons博士合作進行的,項目將在本月晚些時候的計算研究協(xié)會(CRA)虛擬會議上展示。CRA成立于1972年,是全國各地計算機科學(xué)系系主任的論壇,它的成員已經(jīng)包括200多個活躍在計算機研究領(lǐng)域的組織。
Yan和Wang的研究工作不會就此止步。他們計劃通過網(wǎng)站向公眾提供他們的模型和預(yù)測,并收集足夠的數(shù)據(jù),為全國各地的社區(qū)進行預(yù)測。Yan說:“我們希望為全國每個社區(qū)進行預(yù)測,因為我們相信,當(dāng)人們掌握了當(dāng)?shù)財?shù)據(jù)后,他們就會做出明智的決定。”
他們還希望他們的算法能夠用于預(yù)測在特定時間實施特定干預(yù)措施后可能發(fā)生的情況。
Yan補充道:“因為我們的研究集中在更基本的方面,所以開發(fā)的工具可以應(yīng)用于各種因素。希望下次遇到這種情況時,我們能更好地作出準(zhǔn)備,在正確的時間做出正確的決定。”