本文來自IT之家(www.ithome.com),作者 | 遠洋。
IT之家11月4日消息,IT之家從中國農(nóng)科院基因組所官方微信公眾號獲悉,今日《自然?遺傳學(Nature Genetics)》在線發(fā)表了中國農(nóng)業(yè)科學院深圳農(nóng)業(yè)基因組研究所(嶺南現(xiàn)代農(nóng)業(yè)科學與技術(shù)廣東省實驗室深圳分中心)周永鋒團隊利用人工智能進行葡萄育種的最新研究成果。該研究將大幅縮短葡萄育種周期,且對葡萄農(nóng)藝性狀的預(yù)測準確度高達85%。相比傳統(tǒng)方法,育種效率可提高400%。該研究有望實現(xiàn)葡萄的精準設(shè)計育種,加速葡萄品種創(chuàng)新,并為其他多年生作物育種提供方法參考。
周永鋒團隊自2015年起,便開始聚焦葡萄的設(shè)計育種工作,并于2023年發(fā)布首個葡萄端粒到端粒完整參考基因組圖譜,相關(guān)研究以封面文章發(fā)表在《園藝研究(Horticulture Research)》上。
圖源Pexels
然而,要實現(xiàn)精準“設(shè)計”,一個基因組數(shù)據(jù)遠遠不夠。在此基礎(chǔ)上,周永鋒團隊又陸續(xù)對包括野生種和栽培品種在內(nèi)的9個二倍體葡萄品種進行測序、組裝,得到18個端粒到端粒的單倍型基因組,并整合已有的基因組數(shù)據(jù),構(gòu)建了目前首個最全面、最準確的葡萄泛基因組(Grapepan v1.0),總長度達1.43Gb,是單個參考基因組大小的近3倍。
為了進一步弄清楚葡萄基因與性狀之間的關(guān)聯(lián),周永鋒團隊從近萬份葡萄品種中選取了400多份有代表性的葡萄品種,連續(xù)3年對包括果穗大小、漿果中代謝物含量、漿果大小和果皮顏色等在內(nèi)的29個農(nóng)藝性狀進行調(diào)查,構(gòu)建了葡萄基因型圖譜和性狀圖譜。在此基礎(chǔ)上,周永鋒團隊利用數(shù)量遺傳學分析,鑒定到148個與農(nóng)藝性狀顯著相關(guān)的位點,其中122個位點為首次發(fā)現(xiàn)。研究發(fā)現(xiàn),調(diào)控不同性狀的位點間存在關(guān)聯(lián)性,如可溶性固形物含量和漿果寬度相關(guān)位點鄰近。此外,不同葡萄群體(釀酒、鮮食、美洲鮮食雜種)之間存在顯著分化的區(qū)域,這些區(qū)域中存在與漿果顏色、果皮澀味、漿果形狀、果穗重量、果肉硬度、果實大小等相關(guān)的多個性狀相關(guān)的遺傳位點,表明對農(nóng)藝性狀歧化選擇促進了釀酒與鮮食葡萄的分化。
全面、準確的基因組數(shù)據(jù)是精準“設(shè)計”育種的基礎(chǔ),而如何深入挖掘這些數(shù)據(jù)來優(yōu)化育種策略并指導育種?是智能育種必須回答的問題。周永鋒團隊決定引入機器學習,通過構(gòu)建預(yù)測模型,根據(jù)評分進行早期個體的預(yù)測和選擇,從而指導、優(yōu)化育種策略。
在本研究中,研究人員將包含了性狀和基因型的數(shù)據(jù)劃分為三個子集:訓練集、驗證集和測試集。利用機器學習算法解析基因型與性狀數(shù)據(jù)間的復雜網(wǎng)絡(luò)關(guān)系,運用訓練數(shù)據(jù)集構(gòu)建了首個葡萄全基因組選擇模型,研究進一步通過驗證集調(diào)整模型參數(shù),對模型進行優(yōu)化,最后測試數(shù)據(jù)集評估最終模型的性能。研究結(jié)果表明,結(jié)合了結(jié)構(gòu)變異信息和機器學習模型的計算多基因評分預(yù)測準確率高達85%。
通過這一模型,育種家可以快速準確地評估大量育種材料的遺傳潛力,從而更好地選擇優(yōu)良品種。與雜交育種需要根據(jù)葡萄成熟后的表型作出判斷相比,全基因組選擇育種技術(shù)在葡萄幼苗時期就可以預(yù)測其成熟后的性狀,盡早剔除掉不符合條件的幼苗,減少了不必要的人工成本和投入,在葡萄育種應(yīng)用中有很大的應(yīng)用潛力,提高葡萄育種效率,加速葡萄新種質(zhì)的創(chuàng)制,革新葡萄育種策略。
目前,相關(guān)研究成果已申請獲批國家發(fā)明專利6項,已申請國際專利1項。