今年2月,卡巴斯基實(shí)驗(yàn)室的欺詐偵查小組搗毀了一個(gè)名為“創(chuàng)世紀(jì)”(Genesis)的暗網(wǎng)市場(chǎng)。該市場(chǎng)出售“數(shù)字身份”(互聯(lián)網(wǎng)用戶的電子身份信息),每條信息起價(jià)5美元,最高可達(dá)200美元。
出價(jià)取決于所購(gòu)買信息的價(jià)值——例如,一個(gè)包含用戶銀行登錄信息完整配置文件的數(shù)字掩碼,會(huì)比一個(gè)瀏覽器指紋的價(jià)格要高的多。
數(shù)字掩碼是指用戶設(shè)備指紋(設(shè)備ID、硬件、操作系統(tǒng)、IP地址、屏幕分辨率、固件版本、瀏覽器、瀏覽器插件、時(shí)區(qū)、gpu信息、WebRTCIPs、Tcp/IP指紋、cookie等)及其個(gè)人行為屬性(在特定網(wǎng)上商店花費(fèi)的時(shí)間、與興趣相關(guān)的行為、鼠標(biāo)/觸摸屏行為等)的唯一組合。
黑客們通常會(huì)用惡意軟件攻擊他人電腦,并且找到并復(fù)制這些個(gè)人數(shù)據(jù)以及其他個(gè)人身份識(shí)別信息。
用AI在暗網(wǎng)再造一個(gè)“你”
“在這一點(diǎn)上,黑客們已經(jīng)能夠收集、管理和維護(hù)他們所侵入的用戶的大量數(shù)據(jù),”一家基于機(jī)器學(xué)習(xí)的技術(shù)公司的產(chǎn)品經(jīng)理ImranMalek說(shuō),“這意味著,如果你的筆記本電腦被黑客入侵,黑客的戰(zhàn)利品不一定是被入侵的電腦,而是你電腦上的所有數(shù)據(jù),包括所有的身份識(shí)別信息。”
有了這些信息,通過(guò)特定瀏覽器和代理服務(wù)器來(lái)模仿真實(shí)用戶的活動(dòng)。再加上盜取的互聯(lián)網(wǎng)用戶的帳戶信息,攻擊者就可以自由地以該用戶的名義進(jìn)行新的、可信的交易——包括使用信用卡消費(fèi)。
卡巴斯基實(shí)驗(yàn)室(KasperskyLab)全球研究與分析團(tuán)隊(duì)(Global Research&Analysis team)高級(jí)安全研究員SergeyLozhkin表示:“我們看到了一個(gè)明顯的趨勢(shì),全球范圍內(nèi)的信用卡欺詐行為日益增多,盡管該行業(yè)在反欺詐措施方面投入了大量資金,但這種數(shù)字孿生(Digital Twins)很難被發(fā)現(xiàn)。”
用AI對(duì)抗AI
在打擊“暗網(wǎng)”犯罪的過(guò)程中,人工智能正成為一把利器。
MIT在今年5月13日的一篇文章指出,暗網(wǎng)犯罪有一些特點(diǎn)可以被追蹤。
消失速度極快是“暗網(wǎng)”犯罪的一大特征,因?yàn)樗鼈兛赡茉獾狡渌诳凸簟踩块T突擊搜查,或者本身就是被設(shè)計(jì)成一個(gè)“退出騙局”——顧客為未完成的訂單付費(fèi)后,該網(wǎng)站會(huì)故意關(guān)閉。
林肯實(shí)驗(yàn)室(MIT Lincoln Laboratory)人工智能技術(shù)與系統(tǒng)集團(tuán)(Artificial INTELligence Technology and Systems Group)研究員CharliEDAgli就表示:“暗網(wǎng)交易市場(chǎng)的‘彈出式’特性使得跟蹤參與者及其活動(dòng)變得極其困難。”
賣家和買家在網(wǎng)絡(luò)的多個(gè)層面(從表面到黑暗)以及在黑暗網(wǎng)絡(luò)論壇上進(jìn)行聯(lián)系。“這種網(wǎng)站之間的不斷切換現(xiàn)在已經(jīng)成為暗網(wǎng)市場(chǎng)運(yùn)作方式的既定組成部分。”Dagli說(shuō)。針對(duì)這一情況,林肯實(shí)驗(yàn)室正在開(kāi)發(fā)新的人工智能軟件工具來(lái)分析表面和暗網(wǎng)數(shù)據(jù),他們訓(xùn)練機(jī)器學(xué)習(xí)算法來(lái)計(jì)算不同論壇上用戶之間的相似度,自動(dòng)形成人物角色鏈接。
該算法首先從一個(gè)論壇a的用戶那里獲取數(shù)據(jù),并為每個(gè)用戶創(chuàng)建一個(gè)著作權(quán)模型。然后,將論壇b上用戶的數(shù)據(jù)與論壇a上的所有用戶模型進(jìn)行對(duì)比,該算法尋找簡(jiǎn)單的線索,比如在兩個(gè)論壇中一個(gè)叫“sergeygork”,另一個(gè)叫“sergeygorkin”,或者把“joenightmare”拼寫為“joeknight”等等。
算法關(guān)注的另一個(gè)特性是內(nèi)容相似性。
“因?yàn)楹芏鄡?nèi)容都是復(fù)制粘貼的,所以類似的話可能會(huì)來(lái)自同一個(gè)用戶,”Dagli說(shuō)。然后,系統(tǒng)查找用戶網(wǎng)絡(luò)中的相似點(diǎn),即用戶交叉的區(qū)域,以及用戶討論的主題。然后將配置文件、內(nèi)容和網(wǎng)絡(luò)特性融合為一個(gè)輸出:兩個(gè)論壇中的兩個(gè)人物角色代表同一個(gè)現(xiàn)實(shí)生活中的人物的概率,這個(gè)匹配正確率高達(dá)95%。
這個(gè)項(xiàng)目在實(shí)際應(yīng)用中取得了很好的效果,林肯實(shí)驗(yàn)室參與開(kāi)發(fā)了美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(DARPA)的Memex,曼哈頓地區(qū)檢察官Cyrus Vance jr.在一份提交給美國(guó)眾議院的書面證詞中稱,僅在2017年,他的辦公室就使用Memex工具搜索出超過(guò)6000名人口販賣嫌疑人。
Memex
黑客利用機(jī)器學(xué)習(xí)進(jìn)行對(duì)抗性訓(xùn)練
安全部門及相關(guān)公司利用機(jī)器學(xué)習(xí)打擊“暗網(wǎng)”犯罪的同時(shí),黑客也開(kāi)始利用機(jī)器學(xué)習(xí)進(jìn)行對(duì)抗和犯罪。
比如上文中提及的“創(chuàng)世紀(jì)”,黑客利用“數(shù)字孿生”作為數(shù)字面具模仿真實(shí)的用戶,并選擇網(wǎng)絡(luò)安全技術(shù)來(lái)通過(guò)欺詐檢測(cè)協(xié)議。“如果一邊是機(jī)器學(xué)習(xí),那么另一邊也是機(jī)器學(xué)習(xí),”Malek說(shuō),“現(xiàn)在,黑客和壞蛋們正在實(shí)施他們自己的方案,作為一種對(duì)抗性的機(jī)器學(xué)習(xí)訓(xùn)練。”
另外,早在2017年的DEFCON大會(huì)上,安全公司Endgame也披露了OpenAI框架可以被用來(lái)定制惡意軟件,用以創(chuàng)建安全引擎無(wú)法檢測(cè)到的惡意軟件。其原理是自動(dòng)改變一部分被認(rèn)為是惡意的二進(jìn)制文件,使其在殺毒軟件中看起來(lái)是值得信賴的。
同樣還有網(wǎng)絡(luò)犯罪自動(dòng)化(Cyber crime Automation),有一種叫做Hivenet的智能僵尸網(wǎng)絡(luò)。他們就像寄生蟲一樣潛伏在人們的設(shè)備中,自動(dòng)決定誰(shuí)是下一個(gè)使用受害者資源的人。
而這類似于這種惡意欺詐和攻擊的軟件,多數(shù)是在暗網(wǎng)中發(fā)布的。根據(jù)英國(guó)虛擬專用網(wǎng)絡(luò)(VPN)比較服務(wù)發(fā)布的暗網(wǎng)價(jià)格指數(shù),從用于攻擊知名品牌的即時(shí)釣魚網(wǎng)頁(yè)到密碼破解工具、WiFi網(wǎng)絡(luò)黑客程序,以及各種功能的黑客工具,有一些只需要2美元就可以買到,其中就包括一些用人工智能生成的定制惡意軟件。
結(jié)語(yǔ)
人工智能作為一項(xiàng)技術(shù)本無(wú)善惡之分,但是正如互聯(lián)網(wǎng)除了我們?nèi)粘?梢越佑|到的表面,還存在一個(gè)“暗網(wǎng)”一樣,人工智能也可能被心懷不軌的人利用,作為一個(gè)犯罪工具。
而對(duì)于AI從業(yè)者來(lái)說(shuō),也許以后在進(jìn)行開(kāi)發(fā)時(shí),不僅需要考慮技術(shù)本身,還需要評(píng)估是否存在隨之而來(lái)的負(fù)效應(yīng),以決定這項(xiàng)成果是否適合發(fā)布或者開(kāi)源。