亚洲愉拍自拍另类,亚洲中文字幕在线,乱色老熟女一区二区三区

Facebook利用10億張社交軟件圖片，訓(xùn)練AI新算法

2021-03-09 09:52

科技行者

我愛至尊寶

Facebook研究人員日前發(fā)布了一個(gè)新的人工智能模型SEER，SEER模型可以利用互聯(lián)網(wǎng)上任何一組隨機(jī)的、未被標(biāo)記的圖像進(jìn)行學(xué)習(xí)。Facebook這一“突破”雖然還處于早期階段，但團(tuán)隊(duì)預(yù)計(jì)該“突破”將導(dǎo)致計(jì)算機(jī)視覺領(lǐng)域的一場(chǎng)"革命"。

SEER是SElf-SupERvised（自我監(jiān)督[學(xué)習(xí)]）的英文縮寫，SEER的訓(xùn)練用了10億張公開的Instagram圖片，這些圖片是未經(jīng)人工策劃過的。即圖片沒有做過通常用于算法訓(xùn)練的標(biāo)簽和注釋處理，但SEER仍然能夠自主地利用數(shù)據(jù)集一邊學(xué)習(xí)一邊處理數(shù)據(jù)，最終可以在物體檢測(cè)等任務(wù)上達(dá)到最高的準(zhǔn)確度。

SEER用的這種方法被稱為「自我監(jiān)督學(xué)習(xí)」，自我監(jiān)督學(xué)習(xí)在人工智能領(lǐng)域已經(jīng)非常成熟，可以直接從用于訓(xùn)練的信息創(chuàng)建學(xué)習(xí)系統(tǒng)，不必依靠經(jīng)過仔細(xì)標(biāo)記的數(shù)據(jù)集訓(xùn)練如何執(zhí)行任務(wù)，例如識(shí)別照片里的對(duì)象，或翻譯一段文字等任務(wù)。

自我監(jiān)督學(xué)習(xí)最近在科學(xué)界受到大量關(guān)注，因?yàn)檫@個(gè)方法，意味著對(duì)人類標(biāo)注數(shù)據(jù)的需要少很多，標(biāo)注數(shù)據(jù)是一項(xiàng)費(fèi)力費(fèi)時(shí)的任務(wù)，是大多數(shù)研究人員都不愿做的事情。同時(shí)，由于自監(jiān)督模型不需要經(jīng)人工策劃的數(shù)據(jù)集，因此可以利用更大、更多樣化的數(shù)據(jù)集。

在某些領(lǐng)域（尤其是自然語言處理領(lǐng)域），自我監(jiān)督學(xué)習(xí)方法已經(jīng)取得了突破性的進(jìn)展。許多利用無標(biāo)記文本訓(xùn)練的算法使得諸如答疑、機(jī)器翻譯、自然語言推理等應(yīng)用取得了各種進(jìn)展。

相比之下，計(jì)算機(jī)視覺還沒有完全投入自我監(jiān)督學(xué)習(xí)的革命之中。Facebook AI Research的軟件工程師Priya Gopal稱，SEER標(biāo)志著計(jì)算機(jī)視覺領(lǐng)域的第一次。她告訴記者，"SEER是第一個(gè)完全自我監(jiān)督的計(jì)算機(jī)視覺模型，是利用互聯(lián)網(wǎng)的隨機(jī)圖像進(jìn)行訓(xùn)練的，而相比之下，計(jì)算機(jī)視覺領(lǐng)域現(xiàn)有的自我監(jiān)督方面的工作，都是利用經(jīng)大量編輯過的ImageNet數(shù)據(jù)集進(jìn)行訓(xùn)練。"

ImageNet實(shí)際上是個(gè)由數(shù)百萬張圖片組成的大規(guī)模數(shù)據(jù)庫(kù)，這些圖片都被研究人員標(biāo)注了標(biāo)簽，ImageNet面向廣大計(jì)算機(jī)視覺界開放，目的是推動(dòng)人工智能的發(fā)展。

Facebook的研究人員以該項(xiàng)目的數(shù)據(jù)庫(kù)，作為基準(zhǔn)評(píng)估SEER的性能，他們發(fā)現(xiàn)，自監(jiān)督模型在低照、物體檢測(cè)、分割和圖像分類等任務(wù)上的表現(xiàn)優(yōu)于最先進(jìn)的監(jiān)督型AI系統(tǒng)。

Goyal表示，"SEER僅利用隨機(jī)圖像進(jìn)行訓(xùn)練，性能卻優(yōu)于現(xiàn)有的自我監(jiān)督模型。這個(gè)結(jié)果基本上表明，我們?cè)谟?jì)算機(jī)視覺中不需要像ImageNet這種經(jīng)高度策劃過的數(shù)據(jù)集，利用隨機(jī)圖像進(jìn)行自我監(jiān)督學(xué)習(xí)已經(jīng)可以產(chǎn)生非常高質(zhì)量的模型。"

由于自我監(jiān)督學(xué)習(xí)需要的精密程度較高，研究人員在這方面的工作也并非沒有挑戰(zhàn)。在涉及到文本時(shí)，人工智能模型要做的是賦予單詞特定的意思；但對(duì)于圖像而言，算法必須給每個(gè)像素賦予一個(gè)對(duì)應(yīng)的概念，同時(shí)要考慮同一個(gè)概念在不同圖片中的各種角度、視圖和形狀。

換句話說，研究人員處理圖像時(shí)，需要大量的數(shù)據(jù)以及可以復(fù)雜的信息庫(kù)中推導(dǎo)出所有可能的視覺概念的模型。

Goyal和她的團(tuán)隊(duì)為了達(dá)到這個(gè)目的，在Facebook AI自我監(jiān)督學(xué)習(xí)方面的現(xiàn)有基礎(chǔ)上，開發(fā)了名為「SwAV」的新算法，SwAV算法將那些顯示相似概念的圖像分類為不同的組。Facebook科學(xué)家們還設(shè)計(jì)了一個(gè)深度學(xué)習(xí)算法的卷積網(wǎng)絡(luò)，該卷積網(wǎng)絡(luò)可以模擬人腦中神經(jīng)元的連接模式，以及為圖像中的不同對(duì)象賦予不同的重要性。

該系統(tǒng)用了10億Instagram圖的強(qiáng)大數(shù)據(jù)集，至少規(guī)模是夠大了。Facebook的團(tuán)隊(duì)用了V100 Nvidia GPU和32GB內(nèi)存，模型規(guī)模增大后，團(tuán)隊(duì)也只得用模型去套可用的內(nèi)存。但Goyal解釋說，下一步的研究將有助于確保計(jì)算能力可以適應(yīng)新系統(tǒng)。

她表示，"我們要在越來越多的GPU上訓(xùn)練模型時(shí)，GPU之間的通信需要足夠快速，以達(dá)到實(shí)現(xiàn)更快訓(xùn)練的目的。這樣的挑戰(zhàn)可以通過開發(fā)明確的軟件和研究技術(shù)得到解決，開發(fā)的軟件和技術(shù)能夠針對(duì)特定的內(nèi)存和運(yùn)行時(shí)間預(yù)算行之有效。"

因此，在SEER付諸實(shí)際使用案例之前還有一些工作要做。但Goyal認(rèn)為，SEER技術(shù)的影響不應(yīng)該被低估。她表示，"SEER技術(shù)使得我們現(xiàn)在可以利用大量豐富的互聯(lián)網(wǎng)隨機(jī)圖像訓(xùn)練大型模型，可以在計(jì)算機(jī)視覺領(lǐng)域取得各種進(jìn)展。"

Goyal稱，"這一突破，可以實(shí)現(xiàn)計(jì)算機(jī)視覺領(lǐng)域的自我監(jiān)督學(xué)習(xí)革命，其和我們?cè)谧匀徽Z言處理里看到的涉及文本的自我監(jiān)督學(xué)習(xí)革命有些類似。"

SEER在Facebook內(nèi)部可以用在廣泛的計(jì)算機(jī)視覺任務(wù)上，包括自動(dòng)生成圖像描述、幫助識(shí)別違反政策的內(nèi)容等等。SEER技術(shù)在Facebook以外的地方也可以在圖像和元數(shù)據(jù)有限的領(lǐng)域發(fā)揮作用，比如醫(yī)療成像。

Facebook的團(tuán)隊(duì)呼吁各方面做更多的工作，以推動(dòng)SEER進(jìn)入下一個(gè)發(fā)展階段。Facebook團(tuán)隊(duì)還開發(fā)了基于PyTorch的多用途庫(kù)，可用于自我監(jiān)督學(xué)習(xí)，庫(kù)名為「VISSL」，已開源，目的是鼓勵(lì)廣泛的AI社區(qū)使用該技術(shù)進(jìn)行測(cè)試。

THEEND

免責(zé)聲明：凡注明為其它來源的信息均轉(zhuǎn)自其它平臺(tái)，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對(duì)此類作品本站僅提供交流平臺(tái)，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益，請(qǐng)作者持權(quán)屬證明與本站聯(lián)系，我們將及時(shí)更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點(diǎn)資訊

電信聯(lián)通5G迎利好!工信部發(fā)布2100MHz頻段5G基站射頻技術(shù)試行要求

Facebook利用10億張社交軟件圖片，訓(xùn)練AI新算法

2024 信息化觀察網(wǎng)

長(zhǎng)按掃描二維碼閱讀原文

Facebook利用10億張社交軟件圖片，訓(xùn)練AI新算法

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

突破送貨傳統(tǒng) 無人配送打通物流“最后一公里

層出不窮的AI問題，該如何監(jiān)管？

谷歌NotebookLM現(xiàn)在可引導(dǎo) AI 生成音頻對(duì)話,并啟動(dòng)商業(yè)試點(diǎn)

寬帶人工智能的未來：對(duì)網(wǎng)絡(luò)需求和功耗的影響

本月熱門

AI 原生時(shí)代，字節(jié)想要復(fù)刻第三次增長(zhǎng)奇跡

2024 年預(yù)防網(wǎng)絡(luò)攻擊的 12 項(xiàng)網(wǎng)絡(luò)安全最佳實(shí)踐措施

手機(jī)soc廠商自研架構(gòu)成趨勢(shì)

2024年上半年中國(guó)云終端市場(chǎng)跟蹤報(bào)告：出貨量達(dá)到166.3萬臺(tái)，同比增長(zhǎng)22.4%

從5G到6G：開啟無線通信的未來

權(quán)威解答+圖解 | 《工業(yè)和信息化領(lǐng)域數(shù)據(jù)安全事件應(yīng)急預(yù)案（試行）》

精選文章

業(yè)票財(cái)稅檔一體化解決方案助力企業(yè)稅務(wù)數(shù)字化轉(zhuǎn)型

工控行業(yè)重獎(jiǎng)!北信源榮獲中國(guó)石油和化學(xué)工業(yè)聯(lián)合會(huì)“科技進(jìn)步一等獎(jiǎng)

紫光云一網(wǎng)統(tǒng)管2.0，開啟“大模型”賦能城市“智理”新時(shí)代!

數(shù)字孿生智慧運(yùn)維|金云數(shù)據(jù)持續(xù)賦能建筑運(yùn)維數(shù)字化管理提升

區(qū)塊鏈寒冬來臨：該堅(jiān)守還是放棄？

重慶軟件園總裁孫丕宏受邀出席RCEP數(shù)字貿(mào)易合作發(fā)展論壇并作主題演講

熱點(diǎn)資訊

繼“512軸”的新突破：華龍訊達(dá)在2024中國(guó)自動(dòng)化大會(huì)上分享具身智能生產(chǎn)線實(shí)踐

DevSecOps建設(shè)標(biāo)桿丨民生證券攜手懸鏡安全，共建敏捷安全開發(fā)體系

ESIS 2024第三屆中國(guó)電子半導(dǎo)體數(shù)智峰會(huì)正式啟動(dòng)，邀您共創(chuàng)電子半導(dǎo)體行業(yè)美好未來!

榮耀應(yīng)用市場(chǎng)攜手?jǐn)?shù)智融合應(yīng)用伙伴共創(chuàng)綠色生態(tài)

“皇冠丹麥曲奇”勝訴 “藍(lán)罐曲奇”敗訴——市場(chǎng)競(jìng)爭(zhēng)需遵守法律底線

電信聯(lián)通5G迎利好!工信部發(fā)布2100MHz頻段5G基站射頻技術(shù)試行要求

聚焦“兩會(huì)”：智能汽車成攻擊新目標(biāo)，網(wǎng)絡(luò)安全會(huì)成為標(biāo)配嗎？

Facebook利用10億張社交軟件圖片，訓(xùn)練AI新算法

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

欄目推薦

突破送貨傳統(tǒng) 無人配送打通物流“最后一公里

層出不窮的AI問題，該如何監(jiān)管？

谷歌NotebookLM現(xiàn)在可引導(dǎo) AI 生成音頻對(duì)話,并啟動(dòng)商業(yè)試點(diǎn)

寬帶人工智能的未來：對(duì)網(wǎng)絡(luò)需求和功耗的影響

本月熱門

精選文章

熱點(diǎn)資訊

電信聯(lián)通5G迎利好!工信部發(fā)布2100MHz頻段5G基站射頻技術(shù)試行要求

聚焦“兩會(huì)”：智能汽車成攻擊新目標(biāo)，網(wǎng)絡(luò)安全會(huì)成為標(biāo)配嗎？

層出不窮的AI問題，該如何監(jiān)管？

聚焦“兩會(huì)”：智能汽車成攻擊新目標(biāo)，網(wǎng)絡(luò)安全會(huì)成為標(biāo)配嗎？