国产精品每日更新,国产亚洲av电影在线观看

谷歌：人工智能可以自動(dòng)完成文本摘要

2019-12-31 08:52

網(wǎng)易智能

自動(dòng)文本摘要是機(jī)器學(xué)習(xí)算法正在努力的方向之一，微軟近期發(fā)布的相關(guān)論文也表明了這一趨勢(shì)。對(duì)于那些每天要閱讀大量文字信息的工作者們來(lái)說(shuō)，這是一個(gè)值得慶賀的好消息。有調(diào)查顯示，這類工作者每天僅在閱讀信息上就要花費(fèi)大約2.6小時(shí)。

相應(yīng)的，Google Brain和倫敦帝國(guó)理工學(xué)院的一個(gè)團(tuán)隊(duì)構(gòu)建了一個(gè)系統(tǒng)——Pegasus（Pre-training with Extracted Gap-sentences for Abstractive Summarization Sequence-to-sequence），它使用了谷歌的變形金剛架構(gòu)，結(jié)合了針對(duì)文本摘要能力的預(yù)訓(xùn)練目標(biāo)。據(jù)稱，它在12種測(cè)試中均達(dá)到了達(dá)到最先進(jìn)的水平，這些測(cè)試包括了科學(xué)、故事、電子郵件、專利和立法法案等。不僅如此，它在材料缺乏的文本整合測(cè)試中也表現(xiàn)驚人。

正如研究人員指出的那樣，文本摘要的目的是總結(jié)輸入的文檔，生成其準(zhǔn)確和簡(jiǎn)潔的摘要。

抽象的摘要也不是簡(jiǎn)單地從輸入的文本中復(fù)制粘貼文字的片段，而是會(huì)產(chǎn)生新單詞或總結(jié)重要信息，從而使輸出的語(yǔ)言保持流暢。

變形金剛是Google Brain (谷歌的人工智能研究部門)的研究人員在介紹的一種神經(jīng)結(jié)構(gòu)。

它提取特征以及學(xué)習(xí)做出預(yù)測(cè)的方式和所有的深度神經(jīng)網(wǎng)絡(luò)一樣：神經(jīng)元被安排在相互連接的層中，這些層傳遞著輸入數(shù)據(jù)的信號(hào)，調(diào)整每個(gè)連接的權(quán)重。

但變形金剛架構(gòu)又有其獨(dú)特之處：每個(gè)輸出元素和每個(gè)輸入元素都有連接，并動(dòng)態(tài)計(jì)算它們之間的權(quán)重。

在測(cè)試中，研究小組選擇了表現(xiàn)最佳的Pegasus模型，該模型包含了5.68億個(gè)參數(shù)。它有兩個(gè)訓(xùn)練材料。一個(gè)是從3.5億個(gè)網(wǎng)頁(yè)中提取出來(lái)的文本，有750GB。還有一個(gè)訓(xùn)練材料則覆蓋了15億篇新聞?lì)愋偷奈恼?，總?jì)3.8TB。研究人員說(shuō)，在后者的情況下，他們用白名單域來(lái)植入網(wǎng)絡(luò)爬蟲(chóng)工具，覆蓋了質(zhì)量參差不齊的內(nèi)容。

根據(jù)研究員的說(shuō)法，Pegasus生成的摘要語(yǔ)言非常優(yōu)秀，流暢性和連貫性都達(dá)到了高水準(zhǔn)。此外，在文本匱乏的環(huán)境中，即使只有100篇示例文章，它生成的摘要質(zhì)量與在20,000到200,000篇文章的完整數(shù)據(jù)集上訓(xùn)練過(guò)的模型相當(dāng)。

THEEND

免責(zé)聲明：凡注明為其它來(lái)源的信息均轉(zhuǎn)自其它平臺(tái)，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對(duì)此類作品本站僅提供交流平臺(tái)，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益，請(qǐng)作者持權(quán)屬證明與本站聯(lián)系，我們將及時(shí)更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點(diǎn)資訊

關(guān)于分析IT系統(tǒng)宕機(jī)對(duì)業(yè)務(wù)影響的10個(gè)提示

谷歌：人工智能可以自動(dòng)完成文本摘要

2024 信息化觀察網(wǎng)

長(zhǎng)按掃描二維碼閱讀原文

谷歌：人工智能可以自動(dòng)完成文本摘要

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

預(yù)防人工智能網(wǎng)絡(luò)安全攻擊的7大策略

人工智能如何推動(dòng)能源行業(yè)走向數(shù)字化

歐盟的半導(dǎo)體野心

人機(jī)合智：安全運(yùn)營(yíng)中的人工智能

本月熱門

AI 原生時(shí)代，字節(jié)想要復(fù)刻第三次增長(zhǎng)奇跡

2024 年預(yù)防網(wǎng)絡(luò)攻擊的 12 項(xiàng)網(wǎng)絡(luò)安全最佳實(shí)踐措施

從5G到6G：開(kāi)啟無(wú)線通信的未來(lái)

2024年上半年中國(guó)云終端市場(chǎng)跟蹤報(bào)告：出貨量達(dá)到166.3萬(wàn)臺(tái)，同比增長(zhǎng)22.4%

DevSecOps建設(shè)標(biāo)桿丨民生證券攜手懸鏡安全，共建敏捷安全開(kāi)發(fā)體系

ESIS 2024第三屆中國(guó)電子半導(dǎo)體數(shù)智峰會(huì)正式啟動(dòng)，邀您共創(chuàng)電子半導(dǎo)體行業(yè)美好未來(lái)!

精選文章

王欽敏：數(shù)治安全智理未來(lái)

為什么現(xiàn)代計(jì)算使用的是64位操作系統(tǒng)，而非32位？

“眾工云”助力行業(yè)企業(yè)發(fā)展

汽車也能使用指紋解鎖？現(xiàn)代汽車：沒(méi)錯(cuò)

激勵(lì)轉(zhuǎn)型加速 CFCA數(shù)字生態(tài)大會(huì)奏響數(shù)字發(fā)展最強(qiáng)音

零數(shù)科技林樂(lè)：助力新時(shí)代數(shù)字中國(guó)建設(shè)，區(qū)塊鏈賦能數(shù)字經(jīng)濟(jì)蓬勃發(fā)展

熱點(diǎn)資訊

電子檔案檔案數(shù)據(jù)離線光盤刻錄歸檔長(zhǎng)期保存方案

走進(jìn)智能工廠，見(jiàn)證卓越智造的力量

美妝界的數(shù)字化奇跡：漠小曼的電商轉(zhuǎn)型與國(guó)潮崛起

2024 數(shù)智化創(chuàng)新應(yīng)用技術(shù)大會(huì) | 一號(hào)邀請(qǐng)

SRM趨勢(shì)洞察：供應(yīng)商關(guān)系管理將走向何方？

關(guān)于分析IT系統(tǒng)宕機(jī)對(duì)業(yè)務(wù)影響的10個(gè)提示

智慧城市下沉?xí)r代如何成為贏家？

谷歌：人工智能可以自動(dòng)完成文本摘要

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

欄目推薦

預(yù)防人工智能網(wǎng)絡(luò)安全攻擊的7大策略

人工智能如何推動(dòng)能源行業(yè)走向數(shù)字化

歐盟的半導(dǎo)體野心

人機(jī)合智：安全運(yùn)營(yíng)中的人工智能

本月熱門

精選文章

熱點(diǎn)資訊

關(guān)于分析IT系統(tǒng)宕機(jī)對(duì)業(yè)務(wù)影響的10個(gè)提示

智慧城市下沉?xí)r代 如何成為贏家？

智慧城市下沉?xí)r代如何成為贏家？