眾所周知,一款新藥的研發(fā)是一個風(fēng)險大、周期長、成本高的艱難歷程。國際上有一個傳統(tǒng)的“雙十”說法——10年時間,10億美金,才可能成功研發(fā)出一款新藥。即使如此,大約只有10%新藥能被批準進入臨床期,最終只有更小比例的藥物分子可以上市,甚至有人將這個過程形容為“死亡之谷”。
面對新藥研成本增加、收益率下降的雙重困境,人們將希望寄托于于人工智能(AI),畢竟AI發(fā)展至今,已經(jīng)成為社會生活和生產(chǎn)中一種非常真實的力量。
具體來看,通過AI技術(shù)卻可以尋找疾病、基因和藥物之間的深層次聯(lián)系,以降低高昂的研發(fā)費用和失敗率?;诩膊〈x數(shù)據(jù)、大規(guī)?;蚪M識別、蛋白組學(xué)、代謝組學(xué),AI可以對候選化合物進行虛擬高通量篩選,尋找藥物與疾病、疾病與基因的鏈接關(guān)系,提升藥物開發(fā)效率,提高藥物開發(fā)的成功率。
這從新冠疫情中就可見一般,人工智能在開發(fā)新冠特效藥中也出演了關(guān)鍵角色。要知道,新冠抗體是預(yù)防新冠感染,檢測人體對新冠病毒的免疫力的關(guān)鍵指標——抗體是由免疫系統(tǒng)產(chǎn)生的小型蛋白質(zhì),可以附著在病毒的特定部分以中和它。因此,一種可能的藥物就是研制出一種合成抗體,它能與病毒的刺突蛋白結(jié)合,防止病毒進入人體細胞。
為了開發(fā)出一種成功的合成抗體,研究人員必須準確了解這種結(jié)合將如何發(fā)生。蛋白質(zhì)具有包含許多褶皺的塊狀三維結(jié)構(gòu),可以以數(shù)百萬種組合粘在一起,因此在幾乎無數(shù)的候選者中找到正確的蛋白質(zhì)復(fù)合物是非常耗時的。
為了簡化這一過程,麻省理工學(xué)院的研究人員創(chuàng)建了一個機器學(xué)習(xí)模型,被稱為Equidock,該模型采用兩種蛋白質(zhì)的三維結(jié)構(gòu),并將這些結(jié)構(gòu)轉(zhuǎn)換為可由神經(jīng)網(wǎng)絡(luò)處理的三維圖形。蛋白質(zhì)是由氨基酸鏈形成的,其中每個氨基酸都由圖中的一個節(jié)點表示。
研究人員在模型中加入了幾何知識,因此它了解如果物體在三維空間中旋轉(zhuǎn)或平移,它們會如何變化。該模型還內(nèi)置了數(shù)學(xué)知識,確保蛋白質(zhì)總是以相同的方式附著,無論它們在三維空間中存在于何處。這就是蛋白質(zhì)在人體內(nèi)的對接方式。利用這些信息,可以直接預(yù)測兩個蛋白質(zhì)結(jié)合在一起時將形成的復(fù)合物。
Equidock比最先進的軟件方法快80到500倍,并且經(jīng)常預(yù)測的蛋白質(zhì)結(jié)構(gòu)更接近于實驗觀察到的實際結(jié)構(gòu)。
無疑,這項技術(shù)可以幫助科學(xué)家更好地理解一些涉及蛋白質(zhì)相互作用的生物過程,如DNA復(fù)制和修復(fù);它還可以加快開發(fā)新藥的進程。當前,人工智能制藥正在加速發(fā)展,雖然過程中多有坎坷,但在未來,人工智能藥物研發(fā)必不再是生物醫(yī)藥行業(yè)中一個概念性技術(shù),而是成為行業(yè)中非常核心的存在。