2 月 4 日是世界癌癥日。據(jù)世界衛(wèi)生組織,全球范圍內(nèi),近六分之一的死亡由癌癥造成,近 70% 的癌癥死亡發(fā)生在低收入和中等收入國(guó)家。2015 年癌癥造成 880 萬(wàn)例死亡,最為常見(jiàn)的癌癥類(lèi)型為肺癌、肝癌、結(jié)腸直腸癌、胃癌和乳腺癌。在中國(guó),癌癥負(fù)擔(dān)也呈現(xiàn)逐年上升態(tài)勢(shì),2015 年,平均每天超過(guò) 1 萬(wàn)人被確診為癌癥,每分鐘有 7.5 個(gè)人被確診為癌癥。
以乳腺癌為例,乳腺 X 線(xiàn)影像技術(shù)是篩查乳腺癌的「黃金標(biāo)準(zhǔn)」。即便如此,對(duì)于醫(yī)學(xué)專(zhuān)家來(lái)說(shuō),閱讀 X 線(xiàn)影像仍然是一項(xiàng)困難的任務(wù),檢查結(jié)果經(jīng)常有假陽(yáng)性(誤診)和假陰性(漏診)的例子出現(xiàn)。這不僅為醫(yī)生帶來(lái)繁重的工作量,也會(huì)耽誤病患的治療,讓病患承擔(dān)不必要的壓力。
現(xiàn)在,隨著「AI 輔助醫(yī)療」,「AI 驅(qū)動(dòng)醫(yī)療」的話(huà)題被頻頻提起,這也意味著從醫(yī)療產(chǎn)業(yè)和健康產(chǎn)業(yè)來(lái)看,技術(shù)正在承擔(dān)愈加重要的角色,比如輔助醫(yī)生突破原先醫(yī)療水平的天花板、代替醫(yī)生承擔(dān)重復(fù)的例行工作,或是改善地區(qū)醫(yī)療配置不均衡的現(xiàn)狀等等。
對(duì)癥下藥
「過(guò)去幾年里,Google 團(tuán)隊(duì)將 AI 應(yīng)用于醫(yī)療保健領(lǐng)域——從通過(guò)分析和研究電子病歷預(yù)測(cè)患者疾病到輔助檢測(cè)肺癌等疾病,雖然我們?nèi)匀惶幱诩夹g(shù)開(kāi)發(fā)的早期階段,但是結(jié)果是充滿(mǎn)希望的。」Google CFO Ruth Porat 說(shuō)道。
去年 5 月,Nature Medicine 刊登了 Google 對(duì)于肺癌檢測(cè)的新進(jìn)展——根據(jù)低劑量計(jì)算機(jī)斷層掃描圖像來(lái)預(yù)測(cè)肺癌。
放射科醫(yī)生無(wú)法像計(jì)算機(jī)一樣審查 3D 掃描,他們需要審查數(shù)百?gòu)?2D 圖像才能發(fā)現(xiàn)問(wèn)題。Google 創(chuàng)建了機(jī)器學(xué)習(xí)模型,分析高通量的 3D 圖像,生成整體腫瘤預(yù)測(cè),還可以識(shí)別細(xì)微的惡性組織。輸入患者先前的 CT 圖像,該模型便可分析和評(píng)估可疑肺結(jié)節(jié)的生長(zhǎng)速度。
Google 團(tuán)隊(duì)利用 45856 例未經(jīng)識(shí)別的 CT 圖像進(jìn)行訓(xùn)練,并且將結(jié)果與六位經(jīng)認(rèn)證的放射科專(zhuān)家進(jìn)行了比較。在放射科醫(yī)生無(wú)輔助的情況下,Google 模型檢測(cè)到的假陰性減少 5%,假陽(yáng)性減少 11%。
Google 在乳腺癌診斷方面所作的努力要開(kāi)始于更早。一般來(lái)說(shuō),乳腺癌細(xì)胞的擴(kuò)散方式通常會(huì)先轉(zhuǎn)移到附近的淋巴結(jié)中,淋巴結(jié)轉(zhuǎn)移會(huì)影響放射治療、化療和手術(shù)切除額外淋巴結(jié)的治療決策。全球過(guò)去至少有 50 萬(wàn)人因患乳腺癌死亡,他們當(dāng)中有 90%都是轉(zhuǎn)移性腫瘤。
針對(duì)從原發(fā)部位擴(kuò)散轉(zhuǎn)移到附近淋巴結(jié)的癌癥的檢測(cè),是病理檢查中重要且艱難的一步。大多數(shù)癌癥都涉及到淋巴結(jié)轉(zhuǎn)移的檢測(cè),這項(xiàng)檢測(cè)則成為了被廣泛采用的 TNM 癌癥分期的基礎(chǔ)診斷依據(jù)之一。
Google 曾經(jīng)帶著工具 LYNA(LYmph Node Assistant)參加 2016 ISBI Camelyon Challenge,該競(jìng)賽主要是對(duì)乳腺癌在淋巴結(jié)中的轉(zhuǎn)移進(jìn)行病理切片的分類(lèi)和定位。
2018 年,Google 分別發(fā)表兩篇論文闡述在乳腺癌方面的進(jìn)展。在第一篇論文中,Google 將 LYNA 算法應(yīng)用于識(shí)別 Camelyon Challenge 和獨(dú)立數(shù)據(jù)集(由論文的共同作者提供)的病理切片。LYNA 被證明其在圖像可變性和組學(xué)偽影上具有穩(wěn)定的魯棒性,并且在兩個(gè)數(shù)據(jù)集上實(shí)現(xiàn)了相似的性能,而且無(wú)需額外更多的研發(fā)。
左側(cè):包含淋巴結(jié)的載波片有多個(gè)組學(xué)偽影 右側(cè):LYNA 識(shí)別腫瘤區(qū)域在中央(呈紅色),并正確地將周?chē)錆M(mǎn)偽影的區(qū)域分類(lèi)為非腫瘤區(qū)域(呈藍(lán)色)
兩個(gè)數(shù)據(jù)集中,LYNA 能夠以 99% 的正確率區(qū)分有轉(zhuǎn)移性癌癥和無(wú)轉(zhuǎn)移性癌癥的載玻片。此外,LYNA 可以確定每張載玻片內(nèi)癌癥和可疑癌癥的位置,其中一些由于體積太小而無(wú)法被病理學(xué)家檢測(cè)到。因此 Google 團(tuán)隊(duì)推測(cè),LYNA 的一個(gè)重要用途就是突出這些「可疑」區(qū)域,輔助病理學(xué)家做出最終診斷。
在第二篇論文中,六名獲認(rèn)證的病理學(xué)家在 LYNA 協(xié)助下和沒(méi)有 LYNA 協(xié)助下對(duì)轉(zhuǎn)移性乳腺癌的淋巴結(jié)做了檢查。得益于 LYNA,病理學(xué)家平均診斷時(shí)間減半,檢查每張載玻片只需要一分鐘,病理學(xué)家主觀上認(rèn)為有了 LYNA 的幫助,診斷「更加容易」。就診斷準(zhǔn)確性而言,在 LYNA 的幫助下,病理學(xué)家將淋巴結(jié)微轉(zhuǎn)移的遺漏率減少了一半。
左側(cè):含有微轉(zhuǎn)移淋巴結(jié)的載波片的放大圖 右側(cè):相同視圖,在 LYNA 輔助后用藍(lán)色標(biāo)注出腫瘤的位置
AI 診斷
這些進(jìn)步聽(tīng)上去令人興奮,但是更多處于科研試驗(yàn)階段,有限的數(shù)據(jù)庫(kù),模擬的診斷工作流程,單獨(dú)檢查每個(gè)患者的單個(gè)淋巴結(jié)的病理載玻片而非實(shí)際臨床病例中常見(jiàn)的檢查多個(gè)淋巴結(jié)病理載玻片等,都讓 LYNA 算法距離真正的臨床實(shí)踐還有很長(zhǎng)的路要走。
可喜的是,2020 年伊始,Google 又在癌癥診斷方面帶來(lái)了好消息。1 月 1 日,Google Health 部門(mén)聯(lián)手 DeepMind 在 Nature 學(xué)術(shù)期刊上發(fā)布乳腺癌人工智能檢測(cè)系統(tǒng)。該模型是在一個(gè)具有代表性數(shù)據(jù)集上進(jìn)行訓(xùn)練和調(diào)整的,數(shù)據(jù)集由 76000 多名英國(guó)女性和 15000 多名美國(guó)女性的未經(jīng)識(shí)別的乳腺 X 線(xiàn)影像組成。然后在一個(gè)單獨(dú)的未經(jīng)識(shí)別的數(shù)據(jù)集上進(jìn)行了評(píng)估(包括 25000 多名英國(guó)女性和 3000 多名美國(guó)女性)。評(píng)估結(jié)果顯示,對(duì)比放射科醫(yī)生,AI 模型的假陽(yáng)性低了 5.7%(美國(guó))和 1.2%(英國(guó)),假陰性低了 9.4%(美國(guó))和 2.7%(英國(guó))。另一項(xiàng)研究中,該系統(tǒng)的表現(xiàn)超越了六位放射科專(zhuān)家。
乳腺癌人工智能檢測(cè)系統(tǒng)的檢測(cè)表現(xiàn)
無(wú)論是 LYNA 算法還是這項(xiàng)乳腺癌檢測(cè)系統(tǒng),Google 的研究都表明,現(xiàn)階段最好的診療結(jié)果來(lái)自專(zhuān)業(yè)人類(lèi)和技術(shù)的共同努力。比如,英國(guó)的乳腺篩查流程由兩位醫(yī)生共同讀片(Double Reading Process),針對(duì)這類(lèi)情況,研究人員讓系統(tǒng)和人類(lèi)專(zhuān)家同時(shí)做第一個(gè)決定,意見(jiàn)一致便可不二次讀片,意見(jiàn)不一致,將會(huì)啟動(dòng)二次讀片。研究人員發(fā)現(xiàn)該人工智能系統(tǒng)保持了非劣效性能,相比傳統(tǒng)的「雙讀」,AI 可以減少第二個(gè)讀片者的 88% 工作量。
據(jù) Google 介紹,這項(xiàng)人工智能檢測(cè)系統(tǒng)未來(lái)對(duì)于臨床醫(yī)學(xué)有著深遠(yuǎn)的意義。為了驗(yàn)證該模型是否可以推廣到其他人群和篩查方案。Google 團(tuán)隊(duì)僅僅用英國(guó)數(shù)據(jù)重新訓(xùn)練系統(tǒng),在美國(guó)數(shù)據(jù)中評(píng)估。這項(xiàng)實(shí)驗(yàn)下,AI 模型表現(xiàn)仍然好于人類(lèi)專(zhuān)家,假陽(yáng)性減少了 3.5%,假陰性減少了 8.1%。盡管差距略有縮小,但是測(cè)試表明,在未來(lái)的臨床部署中,該系統(tǒng)可能提供強(qiáng)大的基礎(chǔ)能力,提高癌癥篩查的準(zhǔn)確性和效率,減少患者的等待時(shí)間和壓力,通過(guò)對(duì)本地?cái)?shù)據(jù)微調(diào),模型的表現(xiàn)性能會(huì)更好。但是為了達(dá)到這一目標(biāo),研究人員仍然需要持續(xù)的研究,前瞻性的臨床試驗(yàn)以及監(jiān)管部門(mén)的批準(zhǔn)。