一般來說,人類疾病實質(zhì)上都是細胞故障的產(chǎn)物,例如,腫瘤之所以能夠生長,是因為基因沒能準確轉化為特定蛋白質(zhì);代謝疾病是因為線粒體沒能正常工作。要了解細胞的哪些部分出錯從而導致疾病的發(fā)生,科學家首先需要對細胞有完整的了解。
為了更深入地了解細胞的內(nèi)在機制,近日,美國加州大學地亞哥分校的研究人員開發(fā)了一種尺度集成細胞(MuSIC)的技術。該技術結合了生物化學和人工智能技術,揭示了以前未知的細胞成分,為人類發(fā)育和疾病研究提供了新途徑。
首先,科學家使用兩種技術來研究細胞內(nèi)部的主要結構——熒光顯微鏡成像和生物物理關聯(lián)。熒光顯微鏡成像是用熒光物質(zhì)標定蛋白質(zhì),并在顯微鏡范圍內(nèi)跟蹤它們的運動和關聯(lián),由此得到人類蛋白質(zhì)圖譜(HPA)數(shù)據(jù)。
生物物理關聯(lián),即使用一種特定的抗體將蛋白質(zhì)從細胞中分離出來,分析蛋白質(zhì)上結合著什么,由此得到BioPlex數(shù)據(jù)庫。之后,研究人員將HPA與BioPlex中的蛋白質(zhì)數(shù)據(jù)集合到一起,輸入深度神經(jīng)網(wǎng)絡中。
在機器學習過程中,它會將亞細胞分布或互作上相近的蛋白置于同一區(qū)塊中。然后AI不斷重復學習,對蛋白與蛋白之間的距離進行計算分析,最后形成一張多水平整合細胞圖譜(multi-scale integrated cell 1.0,MuSIC 1.0)。
實驗中,AI通過分析兩部分數(shù)據(jù)庫將一個催化前的剪接體放置在了48 nm蛋白社群中。AI還分析出這個蛋白下的兩個亞單位U1和U2分別為8 nm和33 nm。研究人員通過冷凍電鏡確定了這一預測結果,與實際相差不大。
值得一提的是,該研究還揭示了人類腎臟細胞系中包含的大約70種成分,其中一半是以前從未見過的。此外,還確定了一種新的結合RNA的蛋白質(zhì)復合物。該復合物可能參在細胞剪接中扮演重要角色,并可幫助確定哪些基因在哪些時間被激活。
未來,基于該技術比較健康細胞和患病細胞的不同之處,或許能夠更好地理解疾病的分子基礎,從而在根源處阻止疾病的產(chǎn)生。