制服丝袜国产一区在线播放,五月丁香六月综合久久欧美,亚洲一区中文

阿里打破自然語言理解世界紀錄，AI常識推理水平正在逼近人類

2019-07-16 15:08

今日頭條

量子位

在機器翻譯、閱讀理解等NLP任務上，AI的表現(xiàn)已經接近或超過人類水平，阿里AI就先后在國際頂級的機器翻譯賽事WMT、機器閱讀理解賽事SQuAD、文本閱讀理解挑戰(zhàn)賽MS MARCO等賽事奪冠甚至趕超人類紀錄。

近日，阿里AI在常識QA領域的權威數(shù)據(jù)集CommonsenseQA上刷新世界紀錄，超過微軟取得第一名，顯著提升AI的常識推理能力。這一技術是“95后”實習生葉志秀在達摩院科學家指導下完成的實習成果。

CommonsenseQA是為了研究基于常識知識的問答而提出的數(shù)據(jù)集，比此前的SWAG、SQuAD數(shù)據(jù)集難度更高。目前最流行的語言模型BERT在SWAG、SQuAD上的性能已經接近或超過人類，但在CommonsenseQA上的準確率還遠低于人類。

CommonsenseQA數(shù)據(jù)集上的常識問題，大拇指朝上的選項為正確答案

自然語言理解（NLP，Natural Language Processing）是人工智能皇冠上的明珠，常識推理則是難度最高的NLP任務之一。在機器翻譯、閱讀理解等NLP任務上，AI的表現(xiàn)已經接近或超過人類水平，阿里AI就先后在國際頂級的機器翻譯賽事WMT、機器閱讀理解賽事SQuAD、文本閱讀理解挑戰(zhàn)賽MS MARCO等賽事奪冠甚至趕超人類紀錄。

相比之下，AI的常識推理能力比人類差得多。常識是指絕大部分人都了解并接受的客觀事實，比如鹽是咸的、下雨了要打傘、村莊位于陸地上而非湖泊內等等。人在回答問題時，常會結合這些不言而喻的背景知識。但機器沒有常識，無法將“馬路上，人們撐著傘”的原始陳述與“外面正在下雨”的邏輯假設自動關聯(lián)。

深度學習領軍人物之一、圖靈獎獲得者Yann LeCun 曾有斷言：最聰明的AI在常識方面也不如貓。在包含1.2萬多個常識問題的CommonsenseQA數(shù)據(jù)集上，最流行的AI模型BERT的答題準確率為56.7%，遠低于人類的89%。

阿里巴巴達摩院語音實驗室提出了AMS方法，顯著提升BERT模型的常識推理能力。AMS方法使用與BERT相同的模型，僅預訓練BERT，在不提升模型計算量的情況下，將 CommonsenseQA數(shù)據(jù)集上的準確率提升了5.5%，達到62.2%。

CommonsenseQA數(shù)據(jù)集的得分榜單，阿里AI刷新了世界紀錄

阿里的技術突破將大幅提升下一代人機交互產品的常識理解能力，可應用于語音導航、智能電視、語音售票機等產品。

設想這樣的場景：你開車尋找一個地處偏僻的村莊，村子不久前已經搬遷，但導航還沒更新位置信息。村子所在地塊被開挖成了人工湖，由于AI沒有常識，導航直接就把你往湖心方向帶。AI如果擁有常識，就不會犯這類“蠢萌”的錯誤。

達摩院表示今后將開源該模型和論文，與業(yè)界共享最新成果。

THEEND

免責聲明：凡注明為其它來源的信息均轉自其它平臺，由網友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權負責。本網站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。若有來源標注錯誤或侵犯了您的合法權益，請作者持權屬證明與本站聯(lián)系，我們將及時更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點資訊

電子檔案檔案數(shù)據(jù)離線光盤刻錄歸檔長期保存方案

11月14日
走進智能工廠，見證卓越智造的力量

11月13日
美妝界的數(shù)字化奇跡：漠小曼的電商轉型與國潮崛起

11月12日
2024 數(shù)智化創(chuàng)新應用技術大會 | 一號邀請

11月11日
SRM趨勢洞察：供應商關系管理將走向何方？

11月11日

安卓新標準：不用再集成每家OEM的功能啦!

阿里打破自然語言理解世界紀錄，AI常識推理水平正在逼近人類

2024 信息化觀察網

長按掃描二維碼閱讀原文

阿里打破自然語言理解世界紀錄，AI常識推理水平正在逼近人類

最新評論（評論僅代表用戶觀點）

探討人工智能在零售業(yè)的意義

數(shù)智化升級，如何跨越數(shù)字世界與實體產業(yè)的鴻溝？

2024 企業(yè)數(shù)字化轉型的五大趨勢!

總投資額近900億，北京石景山改革計劃聚焦元宇宙產業(yè)

本月熱門

AI 原生時代，字節(jié)想要復刻第三次增長奇跡

2024 年預防網絡攻擊的 12 項網絡安全最佳實踐措施

從5G到6G：開啟無線通信的未來

2024年上半年中國云終端市場跟蹤報告：出貨量達到166.3萬臺，同比增長22.4%

DevSecOps建設標桿丨民生證券攜手懸鏡安全，共建敏捷安全開發(fā)體系

ESIS 2024第三屆中國電子半導體數(shù)智峰會正式啟動，邀您共創(chuàng)電子半導體行業(yè)美好未來!

精選文章

大數(shù)據(jù)技術在環(huán)境應急防范預警和指揮決策中的研究與實踐

宏誠創(chuàng)新獲2023行業(yè)信息技術應用創(chuàng)新大會兩項大獎

深信服科技應邀出席首屆中國電子政務安全大會，助力構建智能高效政務安全新體系

以信源密信為安全底座護航“數(shù)據(jù)要素X金融市場”安全

【喜訊】藍創(chuàng)智能在信創(chuàng)領域再獲榮譽!

市委統(tǒng)戰(zhàn)部領導一行赴武漢大數(shù)據(jù)公司調研數(shù)據(jù)要素市場化發(fā)展及實踐成果

熱點資訊

電子檔案檔案數(shù)據(jù)離線光盤刻錄歸檔長期保存方案

走進智能工廠，見證卓越智造的力量

美妝界的數(shù)字化奇跡：漠小曼的電商轉型與國潮崛起

2024 數(shù)智化創(chuàng)新應用技術大會 | 一號邀請

SRM趨勢洞察：供應商關系管理將走向何方？

安卓新標準：不用再集成每家OEM的功能啦!

中國工業(yè)互聯(lián)網平臺突破瓶頸期后發(fā)展勢頭猛烈

阿里打破自然語言理解世界紀錄，AI常識推理水平正在逼近人類

最新評論（評論僅代表用戶觀點）

欄目推薦

探討人工智能在零售業(yè)的意義

數(shù)智化升級，如何跨越數(shù)字世界與實體產業(yè)的鴻溝？

2024 企業(yè)數(shù)字化轉型的五大趨勢!

總投資額近900億，北京石景山改革計劃聚焦元宇宙產業(yè)

本月熱門

精選文章

熱點資訊

安卓新標準：不用再集成每家OEM的功能啦!

中國工業(yè)互聯(lián)網平臺突破瓶頸期后發(fā)展勢頭猛烈

數(shù)智化升級，如何跨越數(shù)字世界與實體產業(yè)的鴻溝？

總投資額近900億，北京石景山改革計劃聚焦元宇宙產業(yè)