近日,香山科學(xué)會議聚焦綠色生態(tài)與化學(xué)化工,除了各種前沿化學(xué)化工技術(shù)之外,人工智能在該領(lǐng)域的應(yīng)用成為被關(guān)注的新議題。
“合成化學(xué)過程中的變數(shù)太多確實給通量制備和通量反應(yīng)條件篩選增加了難度。但是在大數(shù)據(jù)與人工智能時代,這樣的狀況將會大大改變。”中科院上海有機化學(xué)研究所副所長馬大為在會議上介紹,人工智能有望助力合成化學(xué)研究邁上新的臺階。
“勞動密集型”將成過去
“在有機合成領(lǐng)域,合成化學(xué)家在上個世紀(jì)就號稱給予足夠的學(xué)生和經(jīng)費資助,可以合成任何復(fù)雜的有機小分子。但是直到今天,無論是新藥開發(fā)還是新材料發(fā)展,人們發(fā)現(xiàn)過程的決速步驟往往還是化合物的合成。”馬大為介紹。
馬大為解釋說,這是因為,盡管化合物性質(zhì)的評估大部分已進入通量篩選階段,但化學(xué)合成仍然停留在手工操作階段。
在化學(xué)合成領(lǐng)域,由于不同化學(xué)反應(yīng)條件下的無窮變化,研究人員設(shè)計化學(xué)合成路線基本上還是依靠手工——在藥物分子合成領(lǐng)域尤其突出。這就讓化學(xué)合成更像一種“勞動密集型”工作。
但在人工智能時代,這種狀況將逐漸成為過去?;诖髷?shù)據(jù)與人工智能的計算機程序在輔助研究人員進行化學(xué)合成路線設(shè)計方面開始變得越來越成熟實用。
去年4月,一個德國研究團隊在《自然》期刊發(fā)表論文稱,他們可以憑借人工智能系統(tǒng)以前所未有的速率進行化學(xué)合成分析,這將大大提升科研人員研發(fā)新藥和其他化合物的效率。
根據(jù)這篇論文的內(nèi)容,研究人員利用人工智能系統(tǒng)設(shè)計一個分子的合成路線,只需要5秒鐘。馬大為感嘆說,人工去設(shè)計的話,5秒鐘都來不及把分子結(jié)構(gòu)看清楚,5分鐘都不一定能把分子設(shè)計出來。
南京大學(xué)化學(xué)化工學(xué)院副教授李承輝了解到人工智能算法推薦分子的合成路線后,獲得不少啟發(fā)。他目前也在考慮如何用人工智能幫助他做化學(xué)研究。
李承輝前不久發(fā)現(xiàn)一種新的分子內(nèi)成環(huán)反應(yīng),希望了解這種反應(yīng)是否在其他分子內(nèi)也存在。按照以前的研究方式,他的工作量會非常大。因為要檢測這種反應(yīng)是否具有普適性,需要用不同的分子做大量的實驗才行。“如果有人工智能的幫助,就可以有針對性地去做這件事。” 李承輝說。
開始扮演得力助手
“小通量的反應(yīng)條件篩選設(shè)備已經(jīng)在一些公司和大學(xué)變成常規(guī)武器,大通量的大型反應(yīng)矩陣機器人已經(jīng)誕生。”馬大為認為,這些設(shè)備的普及化有可能為將來的合成化學(xué)研究帶來巨大變化,在很大程度上解放了合成化學(xué)家的雙手,讓研究人員花更多的時間進行數(shù)據(jù)分析和反應(yīng)的頂層設(shè)計。
馬大為在接受科技日報記者采訪時介紹,人工智能程序用于預(yù)測普通的化學(xué)小分子合成路線已趨于成熟。即使一些復(fù)雜的有機小分子比如藥物分子,由于結(jié)構(gòu)單元比較單一,合成反應(yīng)并不是很多,人工智能程序可以直接輔助設(shè)計出合成路線。這對于初級的研究人員而言,會提供很大幫助。
“現(xiàn)在做藥物合成研究,假如知道一個藥物分子的結(jié)構(gòu),人工智能系統(tǒng)可以根據(jù)它的結(jié)構(gòu)分析出很多種合成路線,并且推薦一個最佳路線。”李承輝說,如果是以前,這樣的研究需要非常有經(jīng)驗的有機化學(xué)專家才能實現(xiàn),但是將來在人工智能的幫助下,從事無機化學(xué)的研究人員也可以做到。
而在合成結(jié)構(gòu)比較復(fù)雜的目標(biāo)分子時,比如需要20多個步驟才能合成出來的天然界存在的復(fù)雜分子,人工智能程序可以預(yù)測出很多條不同的路線。
“研究人員可能只能想出20多個合成路線,而這些程序可能會提供上百條可能的合成路線,這對于研究人員來說非常有幫助,因為有些路線可能從未想過。”馬大為說。
馬大為告訴科技日報記者,根據(jù)人工智能程序提供的預(yù)測路線,有經(jīng)驗的研究人員可以從中判斷出哪些路線是好的,哪些是有提示意義的,進而幫助研究人員思考一些問題。這可以為化學(xué)合成提供更多的機會。因為根據(jù)人工智能程序的提示,再加上人腦進一步深度思考,可能會設(shè)計出更好的化學(xué)合成路線。
未來只需“照藥開方”
馬大為認為,上述變化對化學(xué)合成來說,意義非常重大。因為將來人工智能程序可能像“傻瓜機”一樣,科研人員在進行化學(xué)合成時只需按照它的推薦“照藥開方”。
過去,了解一個化學(xué)反應(yīng)條件是否可行,就是不斷試錯的過程。需要人工一個一個去測試,包含大量的重復(fù)性勞動。如今,可以利用人工智能對化學(xué)反應(yīng)數(shù)據(jù)進行快速檢測,然后在機器上進行通量的反應(yīng)條件測試,整個系統(tǒng)一天可以做上千個反應(yīng)條件的測試。換成人工,一個實驗室里每天做20個化學(xué)反應(yīng)測試就已經(jīng)很不錯了。
馬大為告訴科技日報記者,一些大型制藥公司已經(jīng)將人工智能用于輔助設(shè)計化學(xué)合成路線,成為此類技術(shù)的第一批用戶。除了藥物研發(fā),新材料研發(fā)等包含化合物合成的領(lǐng)域都可利用人工智能進行化學(xué)合成路線推薦。
“將來,合成以往不存在的分子就像蓋房子一樣,先讓人工智能把藍圖描繪出來,研究人員只要按著藍圖去搭建就行。”馬大為說。
李承輝也認為,人工智能在化學(xué)領(lǐng)域?qū)⒋笥锌蔀?。在他看來,未來化學(xué)領(lǐng)域的人工智能應(yīng)用將像人工智能醫(yī)生一樣,它能夠掌握和消化海量合成方法、合成路線、材料結(jié)構(gòu)和性能等,科研人員做化學(xué)合成研究時,它可以幫助分析和解決很多問題。
不過總的來說,人工智能扮演的角色仍是輔助性的。它可以將化學(xué)研究人員從繁重的手工勞動中解放出來,并為他們的研究提供一些參考和借鑒。但其推薦的結(jié)果也需要研究人員利用專業(yè)知識和經(jīng)驗去判斷,哪些是真正可行的。
此外,人工智能推薦化學(xué)合成路線目前仍處于模型機階段。馬大為認為,化學(xué)研究人員需要不斷地為人工智能提供一些創(chuàng)新策略,推動人工智能系統(tǒng)不斷優(yōu)化,后者再反過來推動化學(xué)研究人員進行更深入的研究。
相關(guān)鏈接
人工智能機器人助力快速發(fā)現(xiàn)新分子
早在去年,英國格拉斯哥大學(xué)的化學(xué)家們已經(jīng)討論了如何訓(xùn)練一個人工智能有機化學(xué)合成機器人來自動探索大量的化學(xué)反應(yīng)。
這種“自我驅(qū)動”的系統(tǒng)以機器學(xué)習(xí)算法為基礎(chǔ),可以發(fā)現(xiàn)新的反應(yīng)和分子,允許利用數(shù)字化學(xué)數(shù)據(jù)驅(qū)動的方法來定位感興趣的新分子,而不是局限于一個已知的數(shù)據(jù)庫和常規(guī)的有機合成規(guī)則。其結(jié)果可能降低發(fā)現(xiàn)新的藥物分子、新化學(xué)產(chǎn)品(包括材料)、聚合物及用于高科技應(yīng)用(如成像)分子的成本。
研究小組通過使用18種不同的起始化學(xué)物質(zhì)的組合來模擬大約1000種反應(yīng),展示了該系統(tǒng)的潛力。在探索了大約100種的可能反應(yīng)后,機器人能夠以超過80%的準(zhǔn)確率預(yù)測出哪些初始化學(xué)物質(zhì)的組合應(yīng)該被探索以產(chǎn)生新的反應(yīng)和分子。通過探索這些反應(yīng),他們發(fā)現(xiàn)了一系列以前不為人知的新分子和反應(yīng)。研究人員發(fā)現(xiàn)了4個新反應(yīng),其中一個反應(yīng)被歸入已知最獨特反應(yīng)的前1%。
研究者表示,這種方法是化學(xué)數(shù)字化的關(guān)鍵一步,它將允許對化學(xué)空間(chemical space)進行實時檢索,從而幫助新藥物的發(fā)現(xiàn),并削減成本,節(jié)省時間,提高安全性,減少浪費,幫助化學(xué)進入一個新的數(shù)字時代。