人人干人人爽爽,亚洲av无码毛片,樱花视频成人版无码视频在线观看

維基百科使用AI 整治社區(qū)惡意評論

2018-08-17 09:21

信息化觀察網(wǎng)

編譯

維基百科社區(qū)是一個由可公開編輯的內(nèi)容模型構(gòu)建的免費百科全書平臺，但是因用戶可以惡意篡改詞條而臭名昭著。這個問題的嚴(yán)重性導(dǎo)致活躍的貢獻(xiàn)者或編輯人員（每月進(jìn)行一次編輯）的人數(shù)在八年期間下降了40％。盡管沒有...

維基百科社區(qū)是一個由可公開編輯的內(nèi)容模型構(gòu)建的免費百科全書平臺，但是因用戶可以惡意篡改詞條而臭名昭著。這個問題的嚴(yán)重性導(dǎo)致活躍的貢獻(xiàn)者或編輯人員（每月進(jìn)行一次編輯）的人數(shù)在八年期間下降了40％。盡管沒有一個解決方案可以解決這個問題，但支持維基百科的非營利組織維基媒體基金會決定使用AI來更多地了解問題，并考慮如何解決這個問題。

注：維基媒體基金會（英語：Wikimedia Foundation, Inc.），簡稱維基媒體，是負(fù)責(zé)維基百科、維基詞典、維基語錄、維基教科書、維基文庫、維基物種、維基新聞、維基導(dǎo)游和維基共享資源項目的非營利組織。

維基媒體基金會和Jigsaw合作以阻止惡意評論泛濫

為了阻止惡意評論，維基媒體基金會與Jigsaw（科技孵化器，前身為Google Ideas）合作開展一項名為Detox的研究項目，目的是使用機器學(xué)習(xí)來標(biāo)記可能涉及到人身攻擊的評論。該項目是Jigsaw計劃的一部分，旨在構(gòu)建開源AI工具，以幫助打擊社交媒體平臺和網(wǎng)絡(luò)論壇上的騷擾行為。

該項目的第一步是使用來自Wikipedia Talk頁面的10萬條惡意評論來訓(xùn)練機器學(xué)習(xí)算法，這些評論由一個4,000人組成的團(tuán)隊標(biāo)記，其中每條評論都由十個人審核。這個最大的網(wǎng)絡(luò)濫用數(shù)據(jù)集不僅包括直接的人身攻擊，還包括第三方和間接的人身攻擊（“你太可怕了”、“鮑勃太可怕了”、“莎莉說鮑勃很可怕”）。經(jīng)過訓(xùn)練，機器能夠和人類一樣決定一條評論是否涉及到人身攻擊。

然后該項目團(tuán)隊通過算法審查了14年期間（從2001年至2015年）發(fā)表的6300萬條英語維基百科評論，以研究惡意評論的類別。他們將研究成果發(fā)表在名為Ex Machina：Personal Attacks Seen at Scale paper的論文中：

●在所有的惡意評論中，有超過80％是由9,000多名用戶發(fā)表的，這些用戶在一年內(nèi)發(fā)表的評論少于5次；

●在所有涉及人身攻擊的評論中，近10％是由34名用戶發(fā)出的；

●匿名用戶發(fā)表的評論占維基百科所有評論的34％；

●雖然匿名用戶發(fā)表人身攻擊的評論可能性是注冊用戶的六倍，但是超過一半的人身攻擊評論是由注冊用戶發(fā)表的（注冊用戶數(shù)比匿名用戶多20倍）。

現(xiàn)在，算法已經(jīng)能夠清晰地指出哪些用戶在社區(qū)發(fā)表了惡意評論，維基百科也可以找出消除負(fù)面評論的最佳方法。雖然可能仍需要人工監(jiān)管，但算法可以幫助整理這些評論，并標(biāo)記需要人工介入的評論。

物件版本評估服務(wù)（ORES系統(tǒng)）

維基百科編輯人數(shù)大幅下降的另一個原因被認(rèn)為是該組織復(fù)雜的官僚主義以及苛刻的編輯策略。對于首次撰稿人/編輯而言，通常系統(tǒng)會在沒有任何解釋的情況下把他們編輯的內(nèi)容完全刪除。他們希望通過使用ORES系統(tǒng)來解決這一問題，ORES系統(tǒng)可以充當(dāng)編輯系統(tǒng)機器，由經(jīng)過訓(xùn)練的算法驅(qū)動，可以對修改和編輯的質(zhì)量進(jìn)行評分。維基百科的編輯人員使用在線工具來標(biāo)記以前編輯的示例，并且也是通過這種方法來讓算法學(xué)習(xí)到這些編輯錯誤的嚴(yán)重性。

AI編寫維基百科文章

AI可以“寫”維基百科的文章，但你必須要給它開個頭，不是嗎？Google Brain中的一個團(tuán)隊教授軟件來總結(jié)網(wǎng)頁上的信息，并撰寫一篇維基百科風(fēng)格的文章。事實證明，文本摘要比我們大多數(shù)人想象的要困難得多。Google Brain讓機器總結(jié)的內(nèi)容質(zhì)量略好于以前，但是要讓機器像人類一樣可以寫出抑揚頓挫的文章，還要付出更多的努力。而且我們還沒有準(zhǔn)備好讓機器自動生成維基百科條目，但是我們正在朝著這個目標(biāo)努力。

雖然我們還在不斷優(yōu)化維基百科運營中AI的使用案例，但機器無疑可以幫助公司分析他們每天產(chǎn)生的大量數(shù)據(jù)。更好的信息和分析可以幫助維基百科創(chuàng)建成功的策略，以解決其社區(qū)的負(fù)面影響和詞條貢獻(xiàn)者的招募問題。

原文作者：Bernard Marr

THEEND

免責(zé)聲明：凡注明為其它來源的信息均轉(zhuǎn)自其它平臺，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益，請作者持權(quán)屬證明與本站聯(lián)系，我們將及時更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點資訊

安徽省住建廳：“智慧審批”，目標(biāo)是“一次都不用跑”

維基百科使用AI 整治社區(qū)惡意評論

2024 信息化觀察網(wǎng)

長按掃描二維碼閱讀原文

維基百科使用AI 整治社區(qū)惡意評論

最新評論（評論僅代表用戶觀點）

本月熱門

AI 原生時代，字節(jié)想要復(fù)刻第三次增長奇跡

2024年上半年中國云終端市場跟蹤報告：出貨量達(dá)到166.3萬臺，同比增長22.4%

從5G到6G：開啟無線通信的未來

權(quán)威解答+圖解 | 《工業(yè)和信息化領(lǐng)域數(shù)據(jù)安全事件應(yīng)急預(yù)案（試行）》

光芯片，時代“芯”寵

金融行業(yè)信創(chuàng)運維體系建設(shè)

精選文章

品茗科技榮獲“2022年度中國軟件技術(shù)領(lǐng)軍企業(yè)獎”

朱杰：印章物聯(lián)網(wǎng)，賦能企業(yè)印章管理數(shù)字化轉(zhuǎn)型

功能發(fā)布| 亞科鴻禹發(fā)布面向硬件輔助驗證的高效并行邏輯綜合解決方案--hsSynth!

只有靠它才能打敗“魔法”

李紅：數(shù)字化轉(zhuǎn)型與企業(yè)核心能力重構(gòu)

QuickBIM智慧建筑管家平臺

熱點資訊

DevSecOps建設(shè)標(biāo)桿丨民生證券攜手懸鏡安全，共建敏捷安全開發(fā)體系

ESIS 2024第三屆中國電子半導(dǎo)體數(shù)智峰會正式啟動，邀您共創(chuàng)電子半導(dǎo)體行業(yè)美好未來!

榮耀應(yīng)用市場攜手?jǐn)?shù)智融合應(yīng)用伙伴共創(chuàng)綠色生態(tài)

“皇冠丹麥曲奇”勝訴 “藍(lán)罐曲奇”敗訴——市場競爭需遵守法律底線

什么是 OSI 模型？OSI 模型的七層是哪些？

安徽省住建廳：“智慧審批”，目標(biāo)是“一次都不用跑”

人工智能語音技術(shù)試水網(wǎng)絡(luò)鑒黃可識別多國語言多地方言

維基百科使用AI 整治社區(qū)惡意評論

最新評論（評論僅代表用戶觀點）

本月熱門

精選文章

熱點資訊

安徽省住建廳：“智慧審批”，目標(biāo)是“一次都不用跑”

人工智能語音技術(shù)試水網(wǎng)絡(luò)鑒黃 可識別多國語言多地方言

安徽省住建廳：“智慧審批”，目標(biāo)是“一次都不用跑”

人工智能語音技術(shù)試水網(wǎng)絡(luò)鑒黃可識別多國語言多地方言