人工智能鑒黃技術(shù)正從傳統(tǒng)的圖片、視頻、文字,趟進(jìn)語音鑒黃這片藍(lán)海。記者前幾日獲悉,阿里AI語音反垃圾服務(wù)上線公測,它可以通過聲紋識別技術(shù),識別語音中存在的涉黃、廣告等違規(guī)信息。
這項服務(wù)不僅可以識別中文、日文、英文、俄文等多國語言,還可以識別湖南、湖北、河南、東北、四川、廣東等地方言。
在日常生活中,阿里AI語音鑒黃服務(wù)支持離線文件和實時語音流。阿里安全部技術(shù)人員介紹,對那些有語義的內(nèi)容,系統(tǒng)先將語音識別轉(zhuǎn)成文字,然后再將這些文字跟文本反垃圾模型或關(guān)鍵詞庫比對,判斷是否涉黃。對那些無語義的聲音,通過聲紋也能識別出來。
當(dāng)然,識別多國語言和多地方言的能力,需要進(jìn)行訓(xùn)練學(xué)習(xí)。“可以把它想象成一個機(jī)器人,像一個小孩,需要不斷的喂養(yǎng)、訓(xùn)練、學(xué)習(xí),它才具備這樣的能力。”阿里安全部技術(shù)人員介紹,比如廣東話,可以用一些粵語電視劇來訓(xùn)練學(xué)習(xí)。
今年6月,全國掃黃打非辦通報,多個網(wǎng)絡(luò)平臺上存在以ASMR(即自發(fā)性知覺經(jīng)絡(luò)反應(yīng),主要產(chǎn)品為聲音內(nèi)容,用于放松、助眠)形式傳播低俗甚至淫穢色情的問題。解決類似這種社會問題,人工智能語音鑒黃技術(shù)未來大有可為。