你的臉被明碼標(biāo)價,價值......0.5元。
技術(shù)變革總有著雙面性。“刷臉”越來越多的應(yīng)用到了生活中的場景,“人臉”作為每個人獨一無二的生物特征替代了交易密碼,似乎是安全性更強的支付方式,然而真的是這樣嗎?
但你有沒有想過,我們在App上刷的“臉“都去了哪里?
本月,新華網(wǎng)發(fā)表了一篇名為《0.5元一份!誰在出賣我們的人臉信息?》的調(diào)查文章,發(fā)現(xiàn)一些網(wǎng)絡(luò)黑產(chǎn)從業(yè)者利用電商平臺,批量倒賣非法獲取的人臉等身份信息和‘照片活化’網(wǎng)絡(luò)工具及教程。這些被倒賣的人臉圖像和個人信息數(shù)據(jù)包多達2萬套。
在這些黑市,單個人臉數(shù)據(jù)只賣0.5元一份。
“一張臉”賣5毛,“照片動態(tài)化”工具35元一套
在央視財經(jīng)頻道的相關(guān)報道中,記者調(diào)查發(fā)現(xiàn),在淘寶、閑魚等網(wǎng)絡(luò)交易平臺上,通過搜索特定關(guān)鍵詞,就能找到專門出售人臉數(shù)據(jù)和“照片活化”工具的店鋪,五千多張人臉照片集,僅售10元。
這些淘寶賣家都打著暗語,比如“人臉全國各地區(qū)行業(yè)可做,信譽第一”、“出售人臉?biāo)募祝膩?rdquo;等。有些店鋪點開后直接跳轉(zhuǎn)到閑魚界面。
當(dāng)買家表示有興趣時,賣家就會以“說多了會被封”為由把對話轉(zhuǎn)移到微信或QQ等App上。隨后商家會告訴買者,單個人臉數(shù)據(jù)0.5元一份。
如果需要利用人臉照片完成“眨眼、張嘴、點頭”等動態(tài)驗證操作,商家還可提供一份價值35元的類似Deepfake的軟件包,其中不僅包含靜止的人臉圖像,還有虛擬視頻刷機包、虛擬視頻模擬器和人臉視頻修改軟件等“照片活化”工具,還有這些工具的操作教程文件。
有了這個軟件包,你就可以操控照片完成一些比較高難度的認證動作,比如系統(tǒng)要求將攝像頭再次對準(zhǔn)自己,按照指令作出眨眼、搖頭、張嘴等動作,完成認定,讓機器確認這個人的確是你。
商家表示,拍下后直接付款即可,確認收貨后就把鏈接發(fā)給買家。
利用這些工具就可以完成靜態(tài)圖像動態(tài)化,網(wǎng)絡(luò)黑產(chǎn)從業(yè)者一般是利用軟件,將靜態(tài)的人臉照片處理成動態(tài)視頻,進而騙過部分手機應(yīng)用中的活體認證環(huán)節(jié),認證后實名賬戶則可以被倒賣,用于商業(yè)推廣或小額網(wǎng)貸等用途。
在商家發(fā)給新華視點記者的人臉圖像中,有一些單人手持身份證的樣本照片,隨后還向記者展示了其利用工具修改上述照片后欺騙某網(wǎng)絡(luò)社交平臺人臉識別機制的效果視頻。
那這些包含人臉信息和其他身份信息的數(shù)據(jù)從何而來?有賣家向記者透露,自己所售賣的人臉信息來自一些網(wǎng)貸和招聘平臺;至于如何從這些平臺中獲取此類信息,對方?jīng)]有作答。
報道發(fā)布后,相關(guān)部門也對于這些交易網(wǎng)站上的相關(guān)商家進行了徹查,文摘菌發(fā)稿前也在淘寶和閑魚搜索了一番,目前已經(jīng)無法再搜到相關(guān)店鋪售賣信息了。
那么這些信息可以用來干嘛呢?
部分公司和個人會利用這些數(shù)據(jù)訓(xùn)練人臉識別算法,提升模型的精準(zhǔn)性;
但更嚴(yán)重的情況下,有部分商家表示,買家可以利用這些人臉數(shù)據(jù)幫他人解封微信和支付寶的凍結(jié)賬號,還能繞過知名婚戀交友平臺及手機卡實名認證的人臉識別機制,大批賬號認證后,甚至可以用來給自己的某些平臺賬號做“水軍”,畢竟一張照片5毛錢,比刷評論還要劃算。
去年8月,深圳龍崗警方發(fā)現(xiàn)有轄區(qū)居民的身份信息被人冒用,其駕駛證被不法分子通過網(wǎng)絡(luò)服務(wù)平臺冒用扣分。
據(jù)警方介紹,在上述案件中,犯罪嫌疑人利用非法獲取的公民照片進行一定預(yù)處理,而后通過“照片活化”軟件生成動態(tài)視頻,騙過人臉核驗機制。就可以登錄各網(wǎng)絡(luò)服務(wù)平臺注冊會員或進行實名認證。
印度10萬份身份證駕照照片被售賣,黑客90塊就能登陸你的各種賬號
個人人臉等私密信息被售賣,這在全球不是個例。
上個月,印度也剛剛發(fā)生了一起重大的數(shù)據(jù)泄漏事件,將近100GB的數(shù)據(jù)包在暗網(wǎng)中售賣,數(shù)據(jù)包中包括超過10萬印度人的身份證件掃描件,包括護照,PAN卡,Aadhar卡,選民ID和駕照。
整個數(shù)據(jù)隨后被全球網(wǎng)絡(luò)情報機構(gòu)Cyble以大約4,800美元(約合3.4萬人民幣)的比特幣收購。數(shù)據(jù)樣本表明,這些文件是政府頒發(fā)的各種身份證明文件的掃描副本,這些證據(jù)表面上看來是合法的。
此外在美國,人臉識別初創(chuàng)公司Clearview AI今年上半年曾報告過一起黑客攻擊,其全部客戶名單都被黑客竊取了。“一名入侵者‘未經(jīng)授權(quán)進入’其客戶名單,獲取了這些客戶已設(shè)置的用戶帳戶數(shù)量以及搜索數(shù)量,涉及到的客戶包括執(zhí)法機構(gòu)和銀行等。”
據(jù)稱,Clearview AI的人臉數(shù)據(jù)庫里包括了從互聯(lián)網(wǎng)上搜集了30多億張照片,并為美國和加拿大600多家執(zhí)法機構(gòu)的嫌疑人身份識別系統(tǒng)提供便利。
這些被盜的人臉信息去了哪里呢?
VPNOverview去年曾在一份報告中指出,像“Financial Oasis”和“PayPal Cent”這樣的暗網(wǎng)網(wǎng)站是盜取金融信息的主要市場,人們可以在那里挑選自己喜歡的賬戶。受害者的原籍國、是否有與PayPal掛鉤的卡以及余額等信息都被公開列出。
而且,在暗網(wǎng)上的個人信息可是很值錢的,以下是報告中列出的一些被明碼標(biāo)價的數(shù)據(jù)內(nèi)容。
黑客在獲取個人信息后,只需花費$12.99(約合人民幣91元)就可以登錄你的各種社交賬號,并且借此賺到一大筆錢。
比如可以出售這些盜取的帳戶或轉(zhuǎn)移可用資金,還可以使用你關(guān)聯(lián)的信用卡購物,以及借用你的身份做更多事情。
面部特征信息應(yīng)與其他身份信息隔離儲存
過去,防止身份盜竊和保證身份安全的基本步驟包括粉碎文件、定期更改密碼、不要相信任何名人在電子郵件或推特中“撒幣”等。
隨著我們進入數(shù)字時代,安全威脅更加復(fù)雜和嚴(yán)重。我們的生活基于網(wǎng)絡(luò),我們的財產(chǎn)、重要的法律文件等經(jīng)常以這樣或那樣的方式被拴在網(wǎng)上。
只要有足夠的個人信息和基本的技術(shù)知識,即使是技術(shù)有限的小偷也有可能進入你的一些最重要的賬戶。
所以,一旦你的面部信息被盜用,將意味著什么?
你的個人信息很可能在暗網(wǎng)中出售,對于黑客和詐騙者而言,信息業(yè)務(wù)是一項極為有利可圖的業(yè)務(wù)。由于大多數(shù)人都有多個在線帳戶,因此,如果黑客可以訪問您的一個帳戶,則通常會使其他帳戶更容易被黑客入侵。
專家提醒,這些人臉信息有可能被用于虛假注冊、電信網(wǎng)絡(luò)詐騙等違法犯罪活動。
中國的許多電信基礎(chǔ)設(shè)施都與面部識別相關(guān)聯(lián),這意味著互聯(lián)網(wǎng)提供商、社交媒體應(yīng)用程序和銀行在使用設(shè)備時都需要通過面部掃描來驗證個人身份。要想騙過這些系統(tǒng),基本上就需要在網(wǎng)上假定另一個人的身份。
如果大部分人臉識別都是用類似iPhone這種3D面部掃描技術(shù),而不僅是二維圖像,那么盜取面部信息就相對困難一些。然而,目前國內(nèi)的智能手機沒有這種傳感器。
其他國家的大多數(shù)應(yīng)用程序都依賴于智能手機的身份驗證,無論是指紋掃描儀還是像FaceID這樣的面部識別。而這些應(yīng)用本身并沒有嘗試進行面部識別,這使得這些技術(shù)在別國也不太可能發(fā)揮同樣的作用。
從互聯(lián)網(wǎng)提供商、社交媒體應(yīng)用程序到銀行,所有人都要求通過面部掃描來驗證個人身份。
在這個“臉”即密碼的時代,一旦面部特征被竊取,身份證、電話號碼和銀行信息等數(shù)據(jù)也會一并被偷走,幾乎毫無安全感可言。
對此,人臉識別技術(shù)專家、廈門瑞為信息技術(shù)有限公司研究中心總監(jiān)賈寶芝博士建議,相關(guān)平臺在制定人臉識別安全規(guī)范的過程中,要強調(diào)“人臉數(shù)據(jù)等生物特征信息”與“其他身份信息”實行完全隔離存儲,避免將人臉數(shù)據(jù)與身份信息相關(guān)聯(lián)后發(fā)生批量化泄露。
合法的人臉識別數(shù)據(jù)如何獲得?
最后,對于想要提升人臉識別算法的公司和個人,其實有很多合法途徑可以獲得個人為了學(xué)術(shù)研究貢獻出來的免費“臉”,文摘菌也在這里提供一些免費的人臉數(shù)據(jù)來源。
1. CelebA數(shù)據(jù)集
僅出于非商業(yè)研究目的,來自MMLAB的數(shù)據(jù)集包含200,000多個名人圖像。
http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
2.帶邊框的圖像中的人臉檢測
圖像中的人臉檢測是一個簡單但有用的數(shù)據(jù)集,其中包含500幅圖像,其中約有1100張人臉已經(jīng)用邊框框標(biāo)記。
https://dataturks.com/projects/devika.mishra/face_detection
3. 帶有標(biāo)記地標(biāo)點的人臉圖像
該數(shù)據(jù)集包括7,000多個面部圖像,并在每個圖像上標(biāo)注了關(guān)鍵點。每個圖像上的關(guān)鍵點數(shù)量各不相同,單個圖像上的最大關(guān)鍵點數(shù)量為15。關(guān)鍵點數(shù)據(jù)包含在單獨的CSV文件中。
https://www.kaggle.com/drgilermo/face-images-with-marked-landmark-points
4.Flickr的面孔
使用從Flickr拍攝的圖像,該數(shù)據(jù)集包含210,000張圖像。總圖像數(shù)量由來自Flickr的70,000張原始圖像,以1024 x 1024像素裁剪的70,000張圖像和以128 x 128像素裁剪的70,000張組成。
https://github.com/NVlabs/ffhq-dataset
5.Google面部表情比較
來自Google AI的Google面部表情比較數(shù)據(jù)集包含156,000張面部圖像。這些圖像以三胞胎形式出現(xiàn),每個三聯(lián)體中的兩個圖像在面部表情方面被標(biāo)注為三聯(lián)體中“最相似”。以真正的Google方式,對這些圖像進行了精心的注釋,每個三元組均由至少六個獨立的人類注釋者進行處理。
https://ai.google/tools/datasets/google-facial-expression/
6.野外標(biāo)記的人臉數(shù)據(jù)
該數(shù)據(jù)集由馬薩諸塞大學(xué)的研究人員創(chuàng)建,最初是為了研究無約束的人臉識別而制作的。總共有5700多人的13,000張圖像。數(shù)據(jù)集還包含CSV格式的有用元數(shù)據(jù)。
https://www.kaggle.com/jessicali9530/lfw-dataset
7.真實和假臉檢測數(shù)據(jù)庫
該數(shù)據(jù)集用于訓(xùn)練面部識別模型,以區(qū)分真實面部圖像和生成的面部圖像。該數(shù)據(jù)集包括1,000多個真實的面部圖像和900多個偽造的面部圖像,這些圖像的識別難度從容易,中等和難于改變。
https://www.kaggle.com/ciplab/real-and-fake-face-detection
8.辛普森一家
使用從流行的美國卡通系列的第25季到第28季拍攝的圖像,該數(shù)據(jù)集包含超過9,800張Simpsons人物的裁剪面孔。
https://www.kaggle.com/kostastokis/simpsons-faces
9.tufts臉數(shù)據(jù)庫
tufts人臉數(shù)據(jù)庫擁有超過100,000張圖像,其中包括分成9類的大量人臉圖像。類別包括計算機素描,熱敏,熱裁剪,三維,Lytro,2D RGB周圍,2D RGB情感,夜視和視頻。
https://www.kaggle.com/kpvisionlab/tufts-face-database
10.UMDFaces
到目前為止,該列表中最大的數(shù)據(jù)集是UMDFaces數(shù)據(jù)集,它在靜態(tài)圖像中的8,200多個不同主題上具有超過367,000個面部注釋。除了這些圖像之外,數(shù)據(jù)集還包括超過370萬個視頻幀,全部帶有超過3,100個對象的面部關(guān)鍵點。應(yīng)該注意的是,該數(shù)據(jù)集嚴(yán)格僅用于非商業(yè)研究目的。
https://www.umdfaces.io/
11.UTKFace
UTKFace數(shù)據(jù)集包括年齡范圍廣泛的面孔。這些圖像中的人范圍從不到一歲到一百多歲。該數(shù)據(jù)集包括超過20,000張帶有年齡,性別和種族注釋的面部圖像。
https://susanqq.github.io/UTKFace/
12.wider face數(shù)據(jù)庫
該數(shù)據(jù)集包含超過10,000張圖像,其中包含多人或僅一個人。圖像被分為許多設(shè)置,例如會議,交通,游行等等。
https://www.kaggle.com/mksaad/wider-face-a-face-detection-benchmark
13.耶魯人臉數(shù)據(jù)庫
耶魯人臉數(shù)據(jù)庫是一個數(shù)據(jù)集,包含在各種光照條件下的15個不同主體的165張GIF圖像。圖像中的被攝對象表現(xiàn)出不同的情感和表情。
https://www.kaggle.com/olgabelitskaya/yale-face-database
14.標(biāo)記面部關(guān)鍵點的YouTube面孔
該數(shù)據(jù)集由名人的Youtube公共視頻組成,總共155,560個靜止幀。這些視頻被裁剪成圍繞名人的臉,并為每個視頻的每一幀都標(biāo)注了面部關(guān)鍵點。
https://www.kaggle.com/selfishgene/youtube-faces-with-facial-keypoints