幾個世紀(jì)以來,科學(xué)家們收集并保存了大量關(guān)于植物的信息,據(jù)統(tǒng)計科學(xué)家每年發(fā)現(xiàn)大約2000種植物,并要與分布在全球自然歷史博物館和研究機構(gòu)的400,000種已知物種進行比較,最后才能對其進行定義。
在過去的幾十年里,這些數(shù)據(jù)大部分進行了數(shù)字化,隨著AI技術(shù)的成熟,哥斯達(dá)黎加理工學(xué)院史密森學(xué)會的研究人員們開始試圖通過計算機視覺和GPU的結(jié)合,使用卷積神經(jīng)網(wǎng)絡(luò)來數(shù)字化自然歷史收藏,對博物館標(biāo)本欄中記錄的生物進行基于圖像的識別,從而加速和深化科學(xué)對植物生物多樣性的理解。
為了支撐這個項目,哥斯達(dá)黎加團隊使用兩塊NVIDIA GeForce GPU,以及開源深度學(xué)習(xí)框架Caffe和cuDNN,并用26萬張圖像進行卷積神經(jīng)網(wǎng)絡(luò)培訓(xùn)。
利用AI技術(shù),研究團隊能夠在短時間內(nèi)做更多的科學(xué)研究,研究團隊希望通過全新的技術(shù)為引發(fā)生物信息學(xué)領(lǐng)域的新革命。同時團隊還將在植物研究的基礎(chǔ)上,延伸至昆蟲、鳥類、魚類等學(xué)科中去。