人工智能能為控制疫情做出什么貢獻(xiàn)?

騰訊科技&知乎
根據(jù)目前的新聞來看,機(jī)器學(xué)習(xí)等數(shù)據(jù)和計算科學(xué)在這次疫情中扮演的主要是輔助角色,其中對控制疫情最幫助的應(yīng)該是接觸者追蹤、數(shù)據(jù)預(yù)測和新的流行病學(xué)傳播模型。

對于如何抗擊新型冠狀病毒疫情這個問題,更多人首先想到的應(yīng)該是研發(fā)有效的治療藥物,但隨著人工智能技術(shù)逐漸成熟、強(qiáng)大,科學(xué)家們也開始依賴人工智能對抗各式各樣的疾病。

知乎答主“甜草莓”認(rèn)為,在這次新型冠狀病毒疫情當(dāng)中,機(jī)器學(xué)習(xí)等數(shù)據(jù)和計算科學(xué)在這次疫情中扮演的主要是輔助角色,其中對控制疫情最幫助的應(yīng)該是接觸者追蹤(contract tracing) 、數(shù)據(jù)預(yù)測和新的流行病學(xué)傳播模型。

以下為知乎答主“甜草莓”撰文全文,騰訊科技稍作整理:

如果說流行病學(xué)中較為嚴(yán)謹(jǐn)?shù)目茖W(xué)研究,比如疫苗制造,藥物研發(fā),那么機(jī)器學(xué)習(xí)暫時不能代替主流方法。主要是因?yàn)槟壳爸髁鞯臋C(jī)器學(xué)習(xí)手段可解釋性不強(qiáng),而流行病學(xué)等生物和醫(yī)藥學(xué)科需要發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在聯(lián)系,并通過這些聯(lián)系指導(dǎo)線下實(shí)踐??上У氖悄壳爸髁魉惴〞簳r無法滿足這些要求。

根據(jù)目前的新聞來看,機(jī)器學(xué)習(xí)等數(shù)據(jù)和計算科學(xué)在這次疫情中扮演的主要是輔助角色,其中對控制疫情最幫助的應(yīng)該是接觸者追蹤、數(shù)據(jù)預(yù)測和新的流行病學(xué)傳播模型。

接觸者追蹤

眾所周知,與流行傳染病患者密切接觸的人,自身被感染的風(fēng)險更高,并且有可能進(jìn)一步傳染他人。因此,追蹤并觀察這些密切接觸者有助于這些高危人群第一時間得到護(hù)理和治療,并防止病毒進(jìn)一步擴(kuò)展,這也是流行病控制的關(guān)鍵。

整個過程大概可以分為接觸者識別、建立接觸者列表和接觸者隨訪三步。

上一次大規(guī)模爆發(fā)的疫情是非洲的埃博拉病毒(2013-2015左右),但是在埃博拉病毒爆發(fā)期間,非洲整體信息系統(tǒng)普遍落后,當(dāng)時無法通過技術(shù)手段加速追蹤過程。

雖然也曾有學(xué)者在谷歌、愛立信和三星捐贈的支持下在幾內(nèi)亞開展實(shí)驗(yàn),但是這種依靠捐贈分發(fā)手機(jī)的小型實(shí)驗(yàn)只能小幅度提高接觸者隨訪的效率,當(dāng)時的主流追蹤手段依然是感染者自身回憶,主要的追蹤流程依然采用紙質(zhì)手段,以計算機(jī)數(shù)據(jù)手段為輔:

不過在這次的疫情中,我們應(yīng)該會有機(jī)會通過近些年的高度信息化工具來改變加速整個接觸者追蹤的速度和效率,從而控制疫情傳播。

到這里就衍生出了兩個問題。

問題1:如何識別接觸者?

從計算機(jī)的角度看,接觸者識別本質(zhì)上是尋找和感染者時間、空間上有重疊的人群。人所走過必有痕跡,尤其是在信息社會,雖然數(shù)據(jù)上的痕跡不能完全等同于線下接觸,但是依然能夠給接觸者尋找?guī)砗芏啾憷?/p>

如果我們考慮到已經(jīng)存在的各種數(shù)據(jù)源,其中可用、而且會非常有效的數(shù)據(jù)痕跡包括:基站數(shù)據(jù)(運(yùn)營商)、支付數(shù)據(jù)(銀聯(lián)&第三方支付機(jī)構(gòu))、出行數(shù)據(jù)(鐵路&飛機(jī)&住宿)、城市攝像頭&戶口等行政數(shù)據(jù)(公安)等。當(dāng)然如何高效組織和搜索這些數(shù)據(jù)還涉及個人隱私、以及誰有權(quán)限調(diào)用等重要問題,我們拋開這些問題不談,先說說能怎么做、以及做到什么程度。

基站數(shù)據(jù):呼叫詳細(xì)記錄(Call Detail Record,CDR):狹義上的CDR是指手機(jī)通話或者發(fā)送短信時的基本信息記錄,消息發(fā)送者身份(Points of origin),目的地的身份 (Endpoints),通話持續(xù)時間,總使用時間計費(fèi)等等,但是這只適用于2G/3G。4G以后,CDR通常指任何手機(jī)與基站交互后,被記錄的數(shù)據(jù),這里的數(shù)據(jù)可能包含用戶位置估計(源自于基站定位)。換句話說,只要已知基站分布位置,任何人攜帶手機(jī)后的粗略運(yùn)動軌跡,都可以通過CDR分析獲得。

CDR數(shù)據(jù)樣例(現(xiàn)在很可能不是這樣了),來源ITU

雖然目前基站覆蓋范圍通常在1K-3K米左右,并不能很精確的確定感染源和接觸人群是否存在物理接觸,但是對于感染源長期駐留的某些區(qū)域,可以考慮對該區(qū)域用戶進(jìn)行系統(tǒng)標(biāo)記,如果某標(biāo)記用戶存在繼續(xù)暴露的可能,可以視情況而定提示風(fēng)險或進(jìn)行醫(yī)學(xué)觀察。

CDR數(shù)據(jù)用戶軌跡復(fù)原

其實(shí)現(xiàn)在CDR分析已經(jīng)很成熟了,完全可以用在接觸者追蹤中。在國際電信聯(lián)盟(ITU)給出的CDR使用案例中,曾經(jīng)給出了埃博拉時期的一份案例。

在一個小鎮(zhèn)上出現(xiàn)了一例埃博拉病毒,電信部門通過CDR分析追蹤該小鎮(zhèn)居民(可能為高危接觸者)在48小時內(nèi)的擴(kuò)散情況(3小時間隔):

第一個12小時:

第二個12小時:

第三個12小時:

第四個12小時:

這個案例可以擴(kuò)展一下,如果當(dāng)時反應(yīng)迅速,相關(guān)數(shù)據(jù)機(jī)構(gòu)可以考慮定位武漢華南海鮮市場的常駐人群,并追蹤這些高危人群后續(xù)的行為軌跡,這樣可以精準(zhǔn)聯(lián)系到其密切接觸的具體人員,完成接觸者識別。

此外,CDR數(shù)據(jù)通常會在運(yùn)營商留存很久,因此對于已感染人員的行為軌跡可以準(zhǔn)確還原,并建立GEO數(shù)據(jù)庫做相關(guān)分析比對,多個感染源在短時間內(nèi)駐留或者通過的區(qū)域可以劃分為高危區(qū)域、做重點(diǎn)觀察。

其實(shí)現(xiàn)在對CDR數(shù)據(jù)的利用已經(jīng)有了一些成功案例:在2010年1月海地地震以及2010年10月霍亂爆發(fā)之后,瑞典卡羅林斯卡研究所的研究人員分析了兩百萬部手機(jī)的每日運(yùn)動數(shù)據(jù),并能夠確定霍亂暴發(fā)的關(guān)鍵區(qū)域,量化受災(zāi)難影響的人口及其在接下來的時期內(nèi)的流動,對當(dāng)時政府決策提供了巨大價值。

目前已經(jīng)曝出多個列車和航班上存在確診的感染人員,需要緊急擴(kuò)散尋找同程人員的示例,這就反映出目前的信息系統(tǒng)并沒有一個非常高效、自動化的交流渠道和平臺,很可能目前依然只是靠系統(tǒng)初步篩選、人工再篩選和聯(lián)系的階段。

問題2:識別接觸者之后,如何建立接觸者列表和接觸者隨訪?

相信自從微信和手機(jī)普及以后,簡單的添加接觸者、對接觸者的醫(yī)學(xué)觀察可以通過社交軟件高效完成,不必像埃博拉病毒期間需要各家各戶訪問、社區(qū)監(jiān)控。

但是考慮到目前本地醫(yī)務(wù)人員和志愿者不足,可以考慮通過構(gòu)建APP建立本地接觸者與外地富余醫(yī)療人員之間的觀察聯(lián)系,類似遠(yuǎn)程隨訪機(jī)制或線上專項(xiàng)醫(yī)生,這樣可以分擔(dān)部分疫區(qū)醫(yī)療壓力,同時可以引入心理志愿者,為相關(guān)接觸者分擔(dān)心理壓力。

如果存在一個統(tǒng)一的線上隨訪平臺,同時完成醫(yī)療資源分配和數(shù)據(jù)錄入,會提高很多工作者的工作效率,也有利于自閉在家的醫(yī)學(xué)觀察用戶或者普通用戶獲得專業(yè)的醫(yī)學(xué)建議,盡量不去醫(yī)院,避免交叉感染。。

更進(jìn)一步,從科研角度講,上述提到的CDR等數(shù)據(jù)可以建立實(shí)時的人口流動和疫情傳播模型,目前大部分對于疫情的數(shù)據(jù)分析往往基于傳統(tǒng)的流行病學(xué)方法,求解微分或者動力學(xué)模型,輔以社會經(jīng)濟(jì)或者人口統(tǒng)計學(xué)特征,求解足夠置信的預(yù)測數(shù)據(jù),比如R0數(shù)據(jù)或者對潛在感染人數(shù)預(yù)測。 這些模型雖然在指導(dǎo)公共衛(wèi)生政策方面很成功,但是往往無法精確體現(xiàn)復(fù)雜的人類行為、移動軌跡、真實(shí)接觸程度。

比如,采取嚴(yán)格的人口管制和衛(wèi)生措施的城市,其新增潛在傳染病例數(shù)目往往無法通過傳統(tǒng)動力學(xué)模型衡量,而鑒于目前醫(yī)療資源問題,每日新增病例可能只是因?yàn)樵噭┖惺芟?,無法精確衡量真實(shí)疫情變化趨勢,這些可以通過基于上述提到的數(shù)據(jù)分析完成。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論