在過去一年中,科技公司侵犯消費(fèi)者個(gè)人隱私成為輿論關(guān)注焦點(diǎn),而老牌科技巨頭IBM似乎和這樣的丑聞并無關(guān)聯(lián)。不過據(jù)外媒最新消息,IBM最近也陷入了一個(gè)爭(zhēng)議中,被指未經(jīng)個(gè)人用戶批準(zhǔn)擅自利用海量個(gè)人照片對(duì)圖像識(shí)別系統(tǒng)進(jìn)行訓(xùn)練。
據(jù)國(guó)外媒體報(bào)道,IBM從網(wǎng)絡(luò)相冊(cè)Flickr上拍攝了近100萬張個(gè)人照片,用它們來研究如何訓(xùn)練面部識(shí)別訓(xùn)練程序,并與外部研究人員分享照片。
但是據(jù)美國(guó)全國(guó)廣播公司(NBC)爆料稱,在Flickr上傳照片的用戶并不同意把他們的照片用來開發(fā)面部識(shí)別系統(tǒng),要知道考慮到這些系統(tǒng)最終可能會(huì)被用來監(jiān)視和識(shí)別他們,他們自然不愿意輕易批準(zhǔn)。
雖然攝影師可能已經(jīng)獲得了為這些人拍照的許可,但一些人告訴NBC,被拍照的人不知道他們的照片上有面部識(shí)別注釋,可以用來訓(xùn)練識(shí)別算法。
一位攝影師告訴NBC:“我拍攝的人中沒有一個(gè)人知道他們的照片是以這種方式使用的。”
順便說一句,這些照片最初不是由IBM匯編的-它們是被稱為YFCC100M的更大的9920萬張照片庫(kù)的一部分,YFCC100M是Flickr之前的東家雅虎公司最初為進(jìn)行研究而收集的。所有照片都是在CreativeCommonsLicense版權(quán)協(xié)議下共享的,這種版權(quán)協(xié)議表明照片可以自由使用,但存在一些限制。
但事實(shí)上,他們可能被用來訓(xùn)練面部識(shí)別系統(tǒng),以按種族劃分,或是作為一個(gè)人臉案例。
值得一提的是,IBM公司過去開發(fā)了一款視頻分析產(chǎn)品,它使用人體攝像頭來了解人們的種族。對(duì)于此次拍攝網(wǎng)絡(luò)相冊(cè)的人臉照片,IBM否認(rèn)將“參與涉及種族相貌識(shí)別的工作”。
同樣值得注意的是,IBM的初衷可能是為了防止人工智能對(duì)某些群體產(chǎn)生偏見。今年1月,當(dāng)IBM宣布收集數(shù)據(jù)時(shí),該公司解釋稱,它需要一個(gè)如此龐大的數(shù)據(jù)庫(kù),以幫助進(jìn)行“公平”和準(zhǔn)確的圖像識(shí)別培訓(xùn)。
無論如何,對(duì)于一般人來說,很難檢查他們的照片是否被用于人工智能訓(xùn)練,并請(qǐng)求刪除他們的照片,因?yàn)镮BM對(duì)任何和學(xué)術(shù)或公司研究無關(guān)的人都不會(huì)公開數(shù)據(jù)庫(kù)。
NBC從不同的來源獲得了數(shù)據(jù)集,并在其文章中為攝影師制作了一個(gè)工具,用于檢查他們的Flickr賬戶名是否包含在IBM的數(shù)據(jù)庫(kù)中。
IBM在一份聲明中告訴媒體稱,“我們非常重視個(gè)人隱私,并非常小心地遵守隱私原則。”它指出,照片數(shù)據(jù)庫(kù)只能由經(jīng)過驗(yàn)證的研究人員訪問,而且只能包括網(wǎng)絡(luò)上可公開獲取的圖像。它補(bǔ)充說,“用戶個(gè)人可以選擇退出這個(gè)數(shù)據(jù)庫(kù)。”
IBM只是探索面部識(shí)別領(lǐng)域的幾家公司之一,它并不是唯一家使用普通人照片而不明確征求民眾同意的公司。例如,F(xiàn)acebook有80萬張臉部照片可供其他研究人員下載。