癌癥現(xiàn)已成為嚴(yán)重威脅人類健康的疾病之一。近百年,人類一直在研究癌癥的道路上探索,雖然取得了一定的成效,但效果并不是太理想。但隨著人工智能機(jī)器人和大數(shù)技術(shù)的不斷發(fā)展,癌癥或許可以被征服。
尋求治愈癌癥的復(fù)雜性已使研究人員困擾了幾十年。雖然他們?nèi)〉昧孙@著的進(jìn)步,但他們?nèi)栽跒橹畱?zhàn)斗,因為癌癥仍然是全世界死亡的主要原因之一。
然而,科學(xué)家可能很快就有一個在他們身邊的關(guān)鍵新盟友-人工智能機(jī)器-可以以不同的方式解決這些復(fù)雜性的問題。
考慮一個來自游戲世界的例子:去年谷歌的人工智能平臺AlphaGo,部署了深度學(xué)習(xí)的技術(shù),擊敗了世界頂級圍棋高手韓國著名圍棋手李世石,圍棋是極其復(fù)雜的游戲,每一步的走法可能性比宇宙中星星的數(shù)量都要多。
這些相同的機(jī)器學(xué)習(xí)和人工智能的技術(shù)也可以帶到解決癌癥的大規(guī)??茖W(xué)謎題中來。
有一件事是肯定的-如果我們沒有更多的數(shù)據(jù)可以使用,我們就無法利用這些新科技來征服癌癥。例如,許多數(shù)據(jù)資料,包括醫(yī)療記錄,基因測試和乳房X線照片,如果被封鎖,那就無法被最好的科學(xué)思想和最好的學(xué)習(xí)算法所利用到。
好消息是,大數(shù)據(jù)在癌癥研究中的作用現(xiàn)在已進(jìn)入主要發(fā)展階段,一些大規(guī)模政府主導(dǎo)的基因測序計劃正在向前發(fā)展。這些包括美國退伍軍人事務(wù)部百萬老兵計劃;英國的100,000基因組計劃;和NIH的癌癥基因組圖譜,其保存來自超過11,000個患者的數(shù)據(jù),并且通過云分析開放給任何地方的研究者。根據(jù)最近的一項研究,2025年可以測序多達(dá)20億個人類基因組。
據(jù)羿戓信息所了解,還有其他趨勢推動對新數(shù)據(jù)的需求,包括遺傳測試。在2007年,測序一個人的基因組成本1000萬美元。今天你只需要花不到1,000美元。換句話說,10年前排序一個人,我們現(xiàn)在可以做10000。這個影響是很大的:發(fā)現(xiàn)你有基因突變或患上某些類型癌癥的更高風(fēng)險有時可能是一個拯救生命的信息。而且隨著投入越來越多,研究工作也面臨巨大的潛在規(guī)模。
研究人員(和社會)的一個核心挑戰(zhàn)是,目前的數(shù)據(jù)集缺乏數(shù)量和種族多樣性。此外,研究人員經(jīng)常面臨限制性法律術(shù)語和不愿意分享合作伙伴關(guān)系。即使組織共享基因組數(shù)據(jù)集,協(xié)議通常在個體機(jī)構(gòu)之間針對單個數(shù)據(jù)集。雖然目前有更大的結(jié)算所和數(shù)據(jù)庫已經(jīng)做了偉大的工作,但我們需要更多的標(biāo)準(zhǔn)化術(shù)語和平臺工作來加速訪問。
這些新技術(shù)的潛在利益超出了識別風(fēng)險和篩查的范圍。機(jī)器學(xué)習(xí)的進(jìn)步可以幫助加速癌癥藥物的開發(fā)和治療選擇,使醫(yī)生能夠?qū)⒒颊吲c臨床試驗匹配,并提高他們?yōu)榘┌Y患者提供定制治療計劃的能力(赫賽汀,最早的例子之一,仍然是最好的例子之一)。
我們相信有三件事情需要發(fā)生,使數(shù)據(jù)更可用于癌癥研究和AI程序。首先,患者應(yīng)該能夠輕松地貢獻(xiàn)數(shù)據(jù)。這包括醫(yī)療記錄,放射學(xué)圖像和遺傳測試。實驗室公司和醫(yī)療中心應(yīng)采用共同的同意書,使數(shù)據(jù)共享容易和合法。第二,在人工智能領(lǐng)域,數(shù)據(jù)科學(xué)和癌癥的結(jié)合點(diǎn)上工作的研究人員需要更多的資金。正如Chan Zuckerberg基金會為醫(yī)藥新工具開發(fā)提供資金一樣,新的人工智能技術(shù)需要為醫(yī)療應(yīng)用提供資金。第三,應(yīng)該產(chǎn)生新的數(shù)據(jù)集,重點(diǎn)是所有種族的人。我們需要確保所有人都能獲得癌癥研究的進(jìn)展。
在研究治愈癌癥的的過程中,人工智能雖給癌癥研究提供了新的信息技術(shù)支撐,但如果沒有數(shù)據(jù)的支撐,人工智能技術(shù)在癌癥研究領(lǐng)域中的應(yīng)用不會如此的順利,沒有數(shù)據(jù),我們就無法利用人工智能技來征服癌癥。
(原標(biāo)題:解讀利用大數(shù)據(jù)技術(shù)可以打敗癌癥)