近日,F(xiàn)acebook聲稱,該公司的人工智能工程師采用了一種名為“自我監(jiān)督學(xué)習(xí)”(self-supervised learning)的技術(shù),這樣這家社交網(wǎng)絡(luò)的技術(shù)就能更快地適應(yīng)挑戰(zhàn),比如發(fā)現(xiàn)新的仇恨言論形式。
例如,F(xiàn)acebook人工智能研究負(fù)責(zé)人馬諾哈爾·帕魯里(Manohar Paluri)周三在該公司的F8開發(fā)者大會(huì)上表示,自我監(jiān)督學(xué)習(xí)方法將所需的培訓(xùn)數(shù)據(jù)減少了10倍。這種速度對(duì)于讓Facebook變得有趣和安全至關(guān)重要,而不是成為充斥著有毒評(píng)論、錯(cuò)誤信息、虐待和詐騙的“糞坑”。
Facebook首席技術(shù)官M(fèi)ike Schroepfer在一次主題演講中說(shuō):“真的很容易失去希望,收拾行李回家。”
“但我們不能這樣做。我們來(lái)這里是為了用科技給人們帶來(lái)更美好的未來(lái)。”
“自我監(jiān)督學(xué)習(xí)”是什么技術(shù)?
隨著讓計(jì)算機(jī)識(shí)別模式并做出決策的新方法流行起來(lái),人工智能正在席卷科技行業(yè)以及其他領(lǐng)域。
如今的人工智能技術(shù)被稱為“深度學(xué)習(xí)”(deep learning),你可以讓一臺(tái)電腦通過(guò)訓(xùn)練來(lái)識(shí)別一只貓,方法是給它看很多貓的照片,而不是弄清楚如何定義貓的特征,比如兩只眼睛、尖尖的耳朵和胡須。
人工智能訓(xùn)練數(shù)據(jù)通常是“受監(jiān)督的”,這意味著它依賴于經(jīng)過(guò)仔細(xì)標(biāo)記的訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)很難積累,因?yàn)楹玫娜斯ぶ悄芟到y(tǒng)通常訓(xùn)練所需的是海量的數(shù)據(jù)。
帶標(biāo)簽的貓咪照片或許非常好找,但使用人工智能的公司需要應(yīng)對(duì)的是從信用卡欺詐交易到電腦漏洞等一切問(wèn)題。
自主學(xué)習(xí)是人工智能關(guān)鍵訓(xùn)練階段的一個(gè)新轉(zhuǎn)折。
與常規(guī)人工智能訓(xùn)練相比,自我監(jiān)督學(xué)習(xí)所需的訓(xùn)練數(shù)據(jù)要少得多,這減少了收集訓(xùn)練數(shù)據(jù)和訓(xùn)練系統(tǒng)所需的時(shí)間。
Facebook首席技術(shù)官M(fèi)ike Schroepfer稱,在自我監(jiān)督學(xué)習(xí)中,人工智能使用未標(biāo)記的訓(xùn)練數(shù)據(jù)。但這并不完全是原始數(shù)據(jù)。相反,一些位被刪除,比如文本中的單詞或照片中的像素矩形。
這讓人工智能系統(tǒng)通過(guò)找出如何重建缺失部分來(lái)學(xué)習(xí)其中的模式,而且更容易提供“海量數(shù)據(jù)”,這些數(shù)據(jù)對(duì)于自然語(yǔ)言處理(NLP)或理解人類語(yǔ)音和文本等任務(wù)非常有用。
Schroepfer說(shuō),F(xiàn)acebook在處理照片、視頻和文本時(shí)也在使用自我監(jiān)督學(xué)習(xí)。
他說(shuō):“你可以同時(shí)生成訓(xùn)練集和答案。由于使用了如此多的數(shù)據(jù),這些NLP系統(tǒng)開始捕捉到對(duì)語(yǔ)言更深層次、更細(xì)致入微的理解。”
人工智能成眾平臺(tái)“好幫手”
對(duì)于專注于技術(shù)的Facebook來(lái)說(shuō),使用人工智能來(lái)幫助解決問(wèn)題是一個(gè)自然的想法。Facebook已經(jīng)聘請(qǐng)了專家Yann LeCun,他是今年著名的圖靈獎(jiǎng)三位獲得者之一。
Facebook稱,其人工智能正在改善這個(gè)世界上最大的社交網(wǎng)絡(luò)的許多問(wèn)題:欺凌、仇恨言論、暴力、恐怖主義宣傳、兒童色情、垃圾郵件、成人內(nèi)容和虛假賬戶。
谷歌旗下YouTube、Twitter和其他在線平臺(tái)等也正面臨管控平臺(tái)上網(wǎng)絡(luò)言論的困境。
為了凈化網(wǎng)絡(luò)討論環(huán)境,Google推出一個(gè)叫Tune的Chrome插件,用戶可以打開按鈕,對(duì)一些惡毒評(píng)論進(jìn)行屏蔽。這個(gè)小工具來(lái)自Jigsaw公司,它的前身為Google Ideas,是Google 創(chuàng)建的一個(gè)技術(shù)孵化器,致力于用技術(shù)解決網(wǎng)絡(luò)暴力、言論自由、信息透明等難題。
Tune 的作用就是屏蔽惡毒評(píng)論。它目前支持 YouTube、Twitter、Facebook、Reddit、Disqus五個(gè)平臺(tái),開啟之后,用戶會(huì)看到一個(gè)調(diào)整惡毒程度的按鈕,有 quit、low、medium、loud、blaring 五檔,級(jí)別越高,可以看到的惡毒評(píng)論越多,反之則是一個(gè)安靜友善的網(wǎng)絡(luò)環(huán)境。
谷歌還使用“排名算法”來(lái)組織和呈現(xiàn)內(nèi)容,這些算法不會(huì)形成個(gè)人意識(shí)形態(tài)觀點(diǎn),以應(yīng)對(duì)虛假信息。
此外,谷歌還面臨由人工智能(AI)產(chǎn)生的“換臉”(deep fakes)或“洗稿”內(nèi)容的威脅。谷歌和YouTube在這方面也進(jìn)行了投資,以用AI檢測(cè)這類合成與造假內(nèi)容的出現(xiàn)。
創(chuàng)業(yè)公司Deeptrace將用于創(chuàng)建“AI換臉”的相同的對(duì)抗機(jī)器學(xué)習(xí)作為檢測(cè)“AI換臉”的主要工具。該公司還專門開發(fā)了一些“AI換臉”案例來(lái)培訓(xùn)其防御軟件。該公司甚至正在探索將音頻和視頻通道配對(duì)以提高檢測(cè)的準(zhǔn)確度。
2019年愚人節(jié)當(dāng)天,阿里巴巴宣布要用人工智能打破謠言。這項(xiàng)新技術(shù)被稱為“AI謠言粉碎機(jī)”。這項(xiàng)技術(shù)的算法模型由達(dá)摩院機(jī)器智能實(shí)驗(yàn)室研發(fā)。對(duì)通過(guò)深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò),該團(tuán)隊(duì)設(shè)計(jì)了包括發(fā)布信息、社交畫像、回復(fù)者立場(chǎng)、回復(fù)信息、傳播路徑在內(nèi)的判斷系統(tǒng),將謠言識(shí)別和社交用戶觀點(diǎn)識(shí)別打通,最快1秒內(nèi)判定結(jié)果。
阿里巴巴方面宣稱,在特定場(chǎng)景中的準(zhǔn)確率達(dá)到了81%。2019年初,SemEval語(yǔ)義測(cè)試大賽中,根據(jù)主辦方提供的過(guò)去兩年社交媒體推特和Reddit上的近500個(gè)真實(shí)言論和1萬(wàn)多條相關(guān)反饋數(shù)據(jù),阿里巴巴的人工智能技術(shù)對(duì)假新聞識(shí)別的準(zhǔn)確率創(chuàng)造了新的紀(jì)錄。
人工智能的應(yīng)用已經(jīng)遠(yuǎn)遠(yuǎn)不止在科技領(lǐng)域。
咨詢公司德勤(Deloitte)周三公布的一項(xiàng)調(diào)查顯示,全球57%較早采用人工智能技術(shù)的企業(yè)預(yù)計(jì)人工智能將改變它們的業(yè)務(wù),它們現(xiàn)在往往在進(jìn)行投資,試圖趕在預(yù)期的更廣泛變革之前。
但是,盡管人工智能可以解決計(jì)算機(jī)科學(xué)的問(wèn)題,它也增加了新的問(wèn)題,比如,如何消除人工智能的偏見成為了一個(gè)新的難點(diǎn)。