對(duì)于生物醫(yī)學(xué)成像來(lái)說(shuō)構(gòu)建大數(shù)據(jù)集是非常困難的事情

木馬童年
近日,中科院自動(dòng)化研究所、中科院分子影像重點(diǎn)實(shí)驗(yàn)室在基于人工智能(AI)技術(shù)的新型成像方法研究上獲得了突破性進(jìn)展——研究人員將小鼠顱內(nèi)腦膠質(zhì)瘤的三維定位精度。

如果腫瘤細(xì)胞剛剛生成,就可以被精準(zhǔn)地“揪”出來(lái),那將給腫瘤的診斷和治療帶來(lái)巨大變革。而要想實(shí)現(xiàn)這一點(diǎn),成像方式就必須具有極高的靈敏度。

近日,中科院自動(dòng)化研究所、中科院分子影像重點(diǎn)實(shí)驗(yàn)室在基于人工智能(AI)技術(shù)的新型成像方法研究上獲得了突破性進(jìn)展——研究人員將小鼠顱內(nèi)腦膠質(zhì)瘤的三維定位精度,由傳統(tǒng)方法的百微米級(jí)誤差縮小到了十微米級(jí),為疾病動(dòng)物模型乃至臨床患者的影像學(xué)研究提供了全新的思路。相關(guān)研究論文已發(fā)表于《光》期刊。

“圖像不是憑空得到的,而是成像設(shè)備獲得的,傳統(tǒng)方法往往不能提供最好的成像質(zhì)量。在人類認(rèn)知圖像之前,在成像信號(hào)轉(zhuǎn)化為圖像的過(guò)程中,會(huì)損失很多關(guān)鍵信息,人工智能技術(shù)可以突破這一瓶頸。”論文第一作者、中科院自動(dòng)化研究所副研究員王坤告訴《中國(guó)科學(xué)報(bào)》,通過(guò)建立新的AI模型,把原始的物理信號(hào)轉(zhuǎn)化為更加精確、更高分辨、更少偽影、更高信噪比的高質(zhì)量圖像,無(wú)論是“人腦”還是“機(jī)器腦”,都可以更好地識(shí)別、認(rèn)知和學(xué)習(xí),這就是此項(xiàng)研究帶來(lái)的最本質(zhì)的創(chuàng)新。

一項(xiàng)極具挑戰(zhàn)性的工作

腫瘤的早期發(fā)現(xiàn)并不容易,特別是某些惡性腫瘤,潛伏期甚至長(zhǎng)達(dá)20年,當(dāng)身體發(fā)出警報(bào)時(shí),往往已經(jīng)走到了中晚期。如何實(shí)現(xiàn)早期微小腫瘤的精準(zhǔn)檢測(cè),及時(shí)觀測(cè)到腫瘤細(xì)胞剛出現(xiàn)時(shí)產(chǎn)生的某些特異性蛋白、酶甚至RNA,一直是科學(xué)家探索和研究的方向。

“不過(guò),在現(xiàn)實(shí)的物理世界中,能夠提供如此高靈敏度的成像媒介并不多。”王坤坦言,目前公認(rèn)最好的是高能伽馬射線和無(wú)輻射的光子,但是基于伽馬探測(cè)的放射性核素成像成本高,難以普及;光學(xué)成像成本低廉,但大都是二維圖像,缺乏三維信息。

“我們用人工智能解決的就是光學(xué)成像難以三維定量的問(wèn)題。”王坤說(shuō),“也就是既可以高靈敏度地看到有沒(méi)有腫瘤,是哪種分子類型的腫瘤,還可以高精確度地知道腫瘤在哪里,有多大規(guī)模。”

王坤提到的光學(xué)成像是指生物自發(fā)光斷層成像技術(shù),該技術(shù)是生物醫(yī)學(xué)成像的重要手段,廣泛應(yīng)用于疾病動(dòng)物模型的影像學(xué)研究。然而,由于光子在生物體內(nèi)具有非均勻化的高散射和高吸收的物理特性,通過(guò)探測(cè)動(dòng)物體表的發(fā)光光斑來(lái)逆向重建出生物體內(nèi)的光源位置(即腫瘤位置),是一項(xiàng)極具挑戰(zhàn)性的工作。

清華大學(xué)醫(yī)學(xué)院生物醫(yī)學(xué)工程系研究員羅建文告訴《中國(guó)科學(xué)報(bào)》,此前,光學(xué)斷層重建問(wèn)題大多是基于模型的方法,包括正問(wèn)題和逆問(wèn)題的求解。正問(wèn)題的求解一般是利用輻射傳輸方程或者擴(kuò)散方程等模型來(lái)模擬光子在組織體中的傳播過(guò)程,進(jìn)而得到系統(tǒng)矩陣;逆問(wèn)題的求解大多采用一些優(yōu)化方法,來(lái)獲得體內(nèi)光源的具體信息,如位置、形態(tài)、強(qiáng)度等。

“然而,這種基于模型的方法,勢(shì)必會(huì)受到模型近似的影響,導(dǎo)致重建精度降低。”羅建文強(qiáng)調(diào)。據(jù)了解,正問(wèn)題和逆問(wèn)題求解的兩種誤差疊加在一起,最終導(dǎo)致光學(xué)斷層成像對(duì)于動(dòng)物體內(nèi)腫瘤的三維定位具有數(shù)百微米到1毫米的誤差。

機(jī)器學(xué)習(xí)帶來(lái)突破

為減少誤差,王坤所在團(tuán)隊(duì)提出基于機(jī)器學(xué)習(xí)的AI重建:完全舍棄構(gòu)建前向模型去描述光子在生物體內(nèi)的傳播,通過(guò)構(gòu)建大量的仿真數(shù)據(jù)集,在仿真數(shù)據(jù)上確定動(dòng)物體表的光斑和體內(nèi)的光源,再通過(guò)該數(shù)據(jù)集訓(xùn)練計(jì)算機(jī)智能化學(xué)習(xí)體表光斑和體內(nèi)光源的非線性關(guān)系,從而構(gòu)建出適用于生物自發(fā)光斷層成像的AI模型,最終三維重建活體動(dòng)物荷瘤模型內(nèi)的腫瘤三維分布。

“此項(xiàng)研究首次將機(jī)器學(xué)習(xí)中的多層感知機(jī)方法應(yīng)用于光學(xué)斷層重建,并且提出了自己的數(shù)據(jù)集構(gòu)造方法,實(shí)現(xiàn)了直接由數(shù)據(jù)到結(jié)果的跨模型創(chuàng)新框架,使得重建定位誤差縮小到傳統(tǒng)方法的十分之一,同時(shí)這也提示了可以用人工智能方法去解決光學(xué)斷層重建問(wèn)題。”羅建文評(píng)價(jià)道。

不過(guò),王坤強(qiáng)調(diào),生物自發(fā)光斷層成像涉及到腫瘤細(xì)胞的基因編輯和改造,所以只能用在動(dòng)物身上,不能用于人體,但是他們發(fā)展出的基于AI的光學(xué)三維重建方法具有推廣性,理論上可以用在其它光學(xué)分子影像的成像技術(shù)上,例如激發(fā)熒光成像、近紅外成像等等。因此,該方法本身具有很好的臨床轉(zhuǎn)化應(yīng)用能力。

數(shù)據(jù)收集與分析面臨挑戰(zhàn)

機(jī)器學(xué)習(xí)的基礎(chǔ)是數(shù)據(jù),而對(duì)于生物醫(yī)學(xué)成像來(lái)說(shuō),構(gòu)建大數(shù)據(jù)集是非常困難的事情。

“比如我們的這個(gè)研究,構(gòu)建了近8000個(gè)腦膠質(zhì)瘤荷瘤的小鼠模型來(lái)訓(xùn)練我們的機(jī)器學(xué)習(xí)模型。如果真的讓生物學(xué)家去一個(gè)個(gè)構(gòu)建原位腦膠質(zhì)瘤小鼠模型,需要很長(zhǎng)時(shí)間,并投入巨大的人力和財(cái)力,是非常不切實(shí)際的。”王坤說(shuō)。

“我們構(gòu)建的仿真數(shù)據(jù),達(dá)到了非常高的精度,很好地模擬了現(xiàn)實(shí)的腫瘤動(dòng)物。”王坤表示,他們用生物學(xué)家構(gòu)建的真實(shí)腦膠質(zhì)瘤小鼠來(lái)驗(yàn)證訓(xùn)練出來(lái)的人工智能模型是否精確可靠,最終結(jié)果表明,新型人工智能方法對(duì)于腦膠質(zhì)瘤的三維定位誤差均小于80微米,而傳統(tǒng)方法的定位誤差為350微米以上。

不過(guò),在實(shí)際臨床應(yīng)用中,數(shù)據(jù)的收集和解析并不容易。羅建文表示,機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí),最重要的就是數(shù)據(jù),包括數(shù)據(jù)的質(zhì)量和數(shù)量。目前在醫(yī)學(xué)成像領(lǐng)域,雖然收集到大量的數(shù)據(jù)比較容易,但是這些數(shù)據(jù)被標(biāo)記后才能用于建模,受個(gè)體差異影響很大。由于不同醫(yī)生的診斷結(jié)果不同,數(shù)據(jù)的質(zhì)量會(huì)受到影響,用它訓(xùn)練出的網(wǎng)絡(luò)就會(huì)存在問(wèn)題。

同時(shí),羅建文表示,在診斷、治療、預(yù)后等一系列環(huán)節(jié)中,對(duì)于一些疾病的定性描述,不同的醫(yī)生也存在很大的自由度,很難統(tǒng)一說(shuō)法;不同品牌甚至同一品牌但不同型號(hào)的醫(yī)療設(shè)備采集到的圖像,也存在較大差異。這些不統(tǒng)一的數(shù)據(jù),都會(huì)影響深度學(xué)習(xí)的分析結(jié)果。

“還有一個(gè)重要的因素就是模型的因果性和可解釋性。”羅建文強(qiáng)調(diào),“醫(yī)學(xué)與人的生命息息相關(guān),所以做任何一件事都要有理有據(jù),都要有因果推論的關(guān)系。但是,做機(jī)器學(xué)習(xí)模型時(shí),很容易陷入直接對(duì)相關(guān)性進(jìn)行建模的陷阱。相關(guān)性建模涉及的兩個(gè)因素未必有直接的因果關(guān)系。得出的模型,如何解釋其結(jié)果的意義,是一個(gè)很難處理的事情。”

臨床任重道遠(yuǎn)

在羅建文看來(lái),深度學(xué)習(xí)擅長(zhǎng)處理的就是高維度、稀疏的信號(hào),圖像就是這些信號(hào)中一種有代表性的形式,因此,AI在醫(yī)學(xué)影像處理上的應(yīng)用必然是一個(gè)熱點(diǎn)方向。

“醫(yī)學(xué)影像處理的典型問(wèn)題包括影像分類、目標(biāo)檢測(cè)、圖像分割和影像檢索等,都能對(duì)應(yīng)到日常臨床應(yīng)用里的一些痛點(diǎn)或比較浪費(fèi)人力的問(wèn)題。”羅建文建議,影像醫(yī)師應(yīng)該投入到AI技術(shù)的學(xué)習(xí)和應(yīng)用中,AI技術(shù)也許很快就能協(xié)助影像醫(yī)生完成一部分工作,也有潛力使現(xiàn)有的工作得到提升。

不過(guò),上海中醫(yī)藥大學(xué)附屬曙光醫(yī)院放射科主任詹松華站在醫(yī)生的角度表示,AI在發(fā)現(xiàn)病變方面肯定大有作為,但是代替醫(yī)生來(lái)處理,很難。“發(fā)現(xiàn)病變特點(diǎn),然后區(qū)別正常和異常,到底是炎癥還是腫瘤,最終還是由醫(yī)生來(lái)做診斷。”

詹松華認(rèn)為,AI用于生物醫(yī)學(xué)影像的方向是對(duì)的,但是目前需要更多的科研投入,需要將醫(yī)師和工程師很好地整合起來(lái),AI人士需要傾聽(tīng)臨床的聲音,了解醫(yī)生的切實(shí)需求。另外,AI解決假陰性率是關(guān)鍵,要提高AI機(jī)器判斷的確定性,從而為醫(yī)生省時(shí)節(jié)力。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論