助力網(wǎng)絡內(nèi)容安全,人工智能走上舞臺

科技日報
劉園園
每天通過互聯(lián)網(wǎng)上傳的視頻、圖片、文字數(shù)據(jù),用“海量”形容毫不為過——超過15億條,而且還在呈數(shù)量級增長。 將其中涉及恐怖、暴力、色情等違法違規(guī)內(nèi)容過濾出來,使其不污染、威脅網(wǎng)絡空間...

每天通過互聯(lián)網(wǎng)上傳的視頻、圖片、文字數(shù)據(jù),用“海量”形容毫不為過——超過15億條,而且還在呈數(shù)量級增長。

將其中涉及恐怖、暴力、色情等違法違規(guī)內(nèi)容過濾出來,使其不污染、威脅網(wǎng)絡空間,以前靠的是人工審核,現(xiàn)在人工智能(AI)開始走上舞臺。

21日,由中國互聯(lián)網(wǎng)協(xié)會和阿里巴巴等共同舉辦的“2018網(wǎng)絡安全生態(tài)峰會”在北京開幕。AI在助力網(wǎng)絡內(nèi)容安全上扮演的重要角色成為此次峰會的熱點議題之一。

AI是必然選擇

可以說,面對海量互聯(lián)網(wǎng)數(shù)據(jù),用人工智能進行互聯(lián)網(wǎng)數(shù)據(jù)的治理,是一個不得不做出的選擇。

“相比AI技術,現(xiàn)有的人工審核方式無論是成本還是效率都處于顯著劣勢。”中國互聯(lián)網(wǎng)協(xié)會在此次峰會上發(fā)布的《AI技術賦能網(wǎng)絡內(nèi)容安全保障研究報告》(以下簡稱《報告》)稱。

根據(jù)《報告》,人工智能已經(jīng)在網(wǎng)絡文本內(nèi)容檢測、文本分類技術、視頻和圖片內(nèi)容識別、語音內(nèi)容檢測等方面發(fā)揮重要作用。

例如,阿里巴巴開發(fā)的云盾內(nèi)容安全系統(tǒng)可以基于深度學習技術,提供文字、圖片、視頻等多媒體的內(nèi)容風險智能識別服務,有效減少涉及恐怖、暴力、色情等違法違規(guī)信息。

國家互聯(lián)網(wǎng)應急中心高級工程師徐杰介紹,傳統(tǒng)的網(wǎng)絡安全治理方法涉及人工建模和提取特征,也就是描述某個事物,并構成特征向量。越是復雜的事物,特征向量的復雜程度就越呈指數(shù)增長。

“AI技術,特別是近期比較火的深度學習技術,為我們處理這些問題提供了新的可能。”徐杰說,因為深度學習技術不再需要人工去描述事物的特征,而是直接把相關事物的圖片或視頻交給機器去學習,由機器自己建立模型。

阿里巴巴集團資深算法專家薛暉認為,除了以上優(yōu)勢,AI技術也增加了網(wǎng)絡內(nèi)容治理的可靠性。因為,人工審核的經(jīng)驗因人而異,而且這種經(jīng)驗較難傳承,但是AI技術無論是模型還是數(shù)據(jù)都更容易被繼承。

還需要更加靠譜

盡管AI在保障網(wǎng)絡內(nèi)容安全方面已顯出種種優(yōu)勢,但作為一種新興的科技手段,難免還有諸多不足。

“AI本身還有一些問題,比如說AI很大程度上基于模型和算法,而模型和算法本身具有脆弱性。”移動安全聯(lián)盟秘書長楊正軍說,如果其模型和算法遭受攻擊,就會失效。另外,AI是基于海量數(shù)據(jù)進行訓練,假如數(shù)據(jù)遭到污染,或被攻擊者獲取,后果也不堪設想。

來自科大訊飛的技術專家李劍鋒則認為,AI在網(wǎng)絡內(nèi)容治理方面存在的最大挑戰(zhàn),是現(xiàn)在AI的能力還有待提升。

李劍鋒舉例說,有用戶發(fā)微博表達心情,內(nèi)容是“黑夜總會過去,白天總會到來”。這句話反復發(fā)不出來,該用戶百思不得其解。后來有朋友提醒他,是因為其中出現(xiàn)了“夜總會”。

“現(xiàn)在我們用AI技術,哪怕是一個非常簡單的技術也很難做到100%正確。”李劍鋒解釋說,因為現(xiàn)在的機器學習屬于統(tǒng)計學機器學習,包括深度學習、神經(jīng)網(wǎng)絡在內(nèi)都是基于概率論,理論上不能保證100%正確。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論