女女同性女同一区二区三区,国产一级A免费无码视频在线播放

人工智能“飆臟話”，研究人員正糾偏

2022-02-28 14:02

陳述根本

陳根

實(shí)際上，人工智能“飆臟話”已經(jīng)不是第一次被發(fā)現(xiàn)了，此前，佐治亞理工學(xué)院和華盛頓大學(xué)的研究人員曾發(fā)現(xiàn)，AI也繼承了人類對“臟話”的喜愛。其中，研究人員開發(fā)了一個(gè)名叫“ToxiChat”的數(shù)據(jù)集，其中包含了2000條從Reddit上選取的對話。

現(xiàn)在，人工智能（AI）不僅能夠與人對話，甚至還能與“飆臟話”。

被AAAI 2022收錄的一篇新研究發(fā)現(xiàn)，在7013個(gè)兒童視頻中，接近40%的節(jié)目出現(xiàn)了少兒不宜或臟話等詞匯。甚至在一個(gè)113集的兒童機(jī)器人學(xué)習(xí)欄目中，AI就“爆粗”了103次，平均接近一集一次。

具體來看，研究人員一共從YouTube上選出了24個(gè)兒童頻道，分別記錄了這些頻道的播放量和訂閱量。這些篩選出來的視頻播放量基本都達(dá)到了百萬級，訂閱人數(shù)也同樣不少。隨后，研究人員分別嘗試了Google和AWS（亞馬遜網(wǎng)頁服務(wù)）的字幕生成效果。

結(jié)果令人吃驚，在7013個(gè)視頻中，GoogleAI出現(xiàn)錯(cuò)誤字幕的次數(shù)達(dá)到2768次，接近40%。亞馬遜的AI字幕錯(cuò)誤率還要更高，達(dá)到了3672次，超過52%。

隨后，OpenAI的GPT-3和微軟的DialoGPT被派去挨個(gè)回復(fù)這些對話。由于數(shù)據(jù)量十分的龐大，于是研究人員在亞馬遜Mechanical Turk上招募了一群“人工智能”來為“人工智能”的回復(fù)進(jìn)行標(biāo)注。

如果回復(fù)使用的語言非常地粗魯甚至謾罵，就會(huì)被標(biāo)記為“冒犯”；如果沒有，則是“安全”。此外，對于之前的評論，回復(fù)的立場也被標(biāo)記為“同意”、“不同意”或“中立”。分析顯示，42%的用戶回復(fù)贊同有侵略性的評論，而只有13%的用戶同意安全性評論。

對于人工智能“飆臟話”這件事，研究人員提出了一個(gè)新的數(shù)據(jù)集，利用近音字詞來構(gòu)建禁忌詞的“替換”備選。比如，對于crap這一可能出現(xiàn)的“臟話”，研究人員給它設(shè)置了crab、craft等讀音相似的字詞，便于AI在搞錯(cuò)時(shí)進(jìn)行替換。

具體來說，研究人員在BERT、XLM、XLNet等NLP模型上，針對“完形填空”任務(wù)進(jìn)行了重新訓(xùn)練，也就是用“MASK”遮住部分單詞，讓AI來填寫對應(yīng)的內(nèi)容。結(jié)果顯示，在語序正常、前后文案有邏輯的視頻中，AI替換的準(zhǔn)確率更高。

顯然，在開發(fā)人工智能的過程中，人工智能也不得不面對一些人類可能出現(xiàn)的問題，而研究則要對于這些存在的問題進(jìn)行糾偏。從人工智能“飆臟話”來說，想要糾正人工智能這一“陋習(xí)”，可能還需要不少時(shí)間。

THEEND

免責(zé)聲明：凡注明為其它來源的信息均轉(zhuǎn)自其它平臺，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益，請作者持權(quán)屬證明與本站聯(lián)系，我們將及時(shí)更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點(diǎn)資訊

數(shù)據(jù)中心液冷技術(shù)發(fā)展分析

人工智能“飆臟話”，研究人員正糾偏

2024 信息化觀察網(wǎng)

長按掃描二維碼閱讀原文

人工智能“飆臟話”，研究人員正糾偏

最新評論（評論僅代表用戶觀點(diǎn)）

AIoT 革命：人工智能和物聯(lián)網(wǎng)如何改變我們的世界

物聯(lián)網(wǎng)預(yù)計(jì)到2030年年增長率將達(dá)到17%|報(bào)告

算力產(chǎn)業(yè)規(guī)模性增長賦能產(chǎn)業(yè)效應(yīng)明顯

寧夏印發(fā)《促進(jìn)人工智能創(chuàng)新發(fā)展政策措施》

本月熱門

云計(jì)算的江湖，風(fēng)云再起

揭秘，IOTE國際物聯(lián)網(wǎng)展2025年巡展預(yù)告!

防勒索病毒攻擊關(guān)鍵措施

匯聚行業(yè)精英，探討前沿技術(shù) 第十九屆汽車涂裝工藝技術(shù)研討會(huì)即將啟幕!

網(wǎng)博會(huì)革新升級：“區(qū)域頻道”精準(zhǔn)選型引領(lǐng)，引領(lǐng)智能制造新風(fēng)潮

萬億賽道!AI算力趨勢發(fā)展深度分析 2024

精選文章

惟實(shí)勵(lì)新，嘉速起航 | 上海嘉誠將于10月10日盛大開業(yè)!

夢網(wǎng)科技獲“2024年數(shù)字化轉(zhuǎn)型卓越創(chuàng)新企業(yè)”

重慶市政務(wù)云容災(zāi)備份解決方案

華為云網(wǎng)安一體解決方案，助力城市智能體安全建設(shè)

2022中國數(shù)據(jù)商業(yè)生態(tài)大會(huì)將于7月14日-15日在廣州召開

@開放銀行，提升商業(yè)銀行API安全可以這樣做!

熱點(diǎn)資訊

“皇冠丹麥曲奇”勝訴 “藍(lán)罐曲奇”敗訴——市場競爭需遵守法律底線

什么是 OSI 模型？OSI 模型的七層是哪些？

自動(dòng)化測試有哪些常見的挑戰(zhàn)和解決方案？

政策寶閃耀2024數(shù)智融合應(yīng)用論壇，榮獲“數(shù)智融合標(biāo)桿案例”

共筑數(shù)字未來|深度解析數(shù)字化轉(zhuǎn)型與建設(shè)的戰(zhàn)略指南

數(shù)據(jù)中心液冷技術(shù)發(fā)展分析

華為丁耘：華為已累計(jì)簽署超3000個(gè)5G行業(yè)商用合同

人工智能“飆臟話”，研究人員正糾偏

最新評論（評論僅代表用戶觀點(diǎn)）

欄目推薦

AIoT 革命：人工智能和物聯(lián)網(wǎng)如何改變我們的世界

物聯(lián)網(wǎng)預(yù)計(jì)到2030年年增長率將達(dá)到17%|報(bào)告

算力產(chǎn)業(yè)規(guī)模性增長 賦能產(chǎn)業(yè)效應(yīng)明顯

寧夏印發(fā)《 促進(jìn)人工智能創(chuàng)新發(fā)展政策措施 》

本月熱門

精選文章

熱點(diǎn)資訊

數(shù)據(jù)中心液冷技術(shù)發(fā)展分析

華為丁耘：華為已累計(jì)簽署超3000個(gè)5G行業(yè)商用合同

人工智能“飆臟話”，研究人員正糾偏

算力產(chǎn)業(yè)規(guī)模性增長賦能產(chǎn)業(yè)效應(yīng)明顯

寧夏印發(fā)《促進(jìn)人工智能創(chuàng)新發(fā)展政策措施》