數據龐大難運營?YouTube請了AI來幫忙!

網易智能
每個月都有超過19億的用戶登錄YouTube,他們每天觀看超過10億小時的視頻。每分鐘,創(chuàng)作者上傳300小時的視頻到這個平臺。鑒于如此驚人的用戶數量、活躍度和內容數量,YouTube利用人工智能的力量來幫助運營可謂意義重大。

每個月都有超過19億的用戶登錄YouTube,他們每天觀看超過10億小時的視頻。每分鐘,創(chuàng)作者上傳300小時的視頻到這個平臺。鑒于如此驚人的用戶數量、活躍度和內容數量,YouTube利用人工智能的力量來幫助運營可謂意義重大。

以下是YouTube借助人工智能來助力運營的幾種方式。

自動刪除不良內容

今年第一季度,多達830萬條視頻從YouTube上被刪除,其中76%是由人工智能分類器自動識別和標記出來的。當中超過70%還沒被用戶觀看過就被識別出來了。雖然這些算法不是萬無一失的,但它們在清理內容方面要比人工單獨監(jiān)控平臺快速得多。

事實上,據YouTube的EMEA區(qū)負責人塞西爾·弗洛特-庫塔茲(Cecile Frot-Coutaz)稱,YouTube的“首要任務”是保護用戶免受有害內容的侵害。為了實現(xiàn)這一目標,該公司不僅投資于人力專家,還投資于機器學習技術。人工智能極大地提高了YouTube快速識別不良內容的能力。在使用人工智能之前,只有8%的不良視頻在觀看量達10次之前被標記并刪除;但在使用機器學習之后,刪除的視頻中有一半以上的觀看量不到10次。

該公司還使用“垃圾視頻分類器”來掃描YouTube主頁和“接著播放”展板。它會關注來自觀眾的反饋,他們可能會舉報誤導性的標題、不宜或其他不良的內容。

視頻特效

谷歌的人工智能研究人員訓練了一個神經網絡,使其能夠在不需要借助專門設備的情況下更換視頻背景。雖然這一點幾十年來都是能夠做到的——想想綠色背景被數字效果所替代——但這是一個復雜而耗時的過程。研究人員用經過仔細標記的圖像訓練了一種算法,使得它能夠學習模式,由此創(chuàng)造出一個能夠跟上視頻進度的快速系統(tǒng)。

“接著播放”(Up Next)功能

由于YouTube上的數據集因為每分鐘都有用戶不斷上傳視頻而不斷變化,驅動其內容推薦引擎的人工智能需要不同于Netflix或Spotify的推薦引擎。它必須能夠在用戶不斷添加新數據的同時處理實時推薦。YouTube得出的解決方案是一個由兩部分構成的系統(tǒng)。第一部分是生成候選內容,讓算法評估用戶的YouTube觀看歷史。第二部分是給每個視頻打分的排名系統(tǒng)。

前谷歌員工吉拉姆·查斯洛特(Guillaume Chaslot)說,這對平臺和廣告商來說都是好事,但對用戶來說就不那么好了。這種推薦機制可能會“強化”那些稀奇古怪的視頻,人們觀看的時間越多,那種內容就被推薦的越多。

深度預測訓練

由于數據如此之多,YouTube視頻為人工智能算法提供了肥沃的訓練土壤。谷歌人工智能研究人員利用平臺上發(fā)布的2000多個“人體模型挑戰(zhàn)”視頻,創(chuàng)建了一個能夠識別視頻景深的人工智能模型。在“人體模型挑戰(zhàn)”中,一群人在視頻中站著一動不動,就像被凍住了一樣,讓一個人給它們拍攝視頻。最終,這種深度預測技術將有助于推動增強現(xiàn)實體驗的發(fā)展。

 

 

THEEND