什么是暗網(wǎng)?
如果互聯(lián)網(wǎng)是一座冰山,那么我們普通人能接觸到的,只是作為冰山一角的表層網(wǎng)絡(luò)。而隱藏在水下的,標(biāo)準(zhǔn)搜索引擎無法進(jìn)入的部分,被稱為深網(wǎng)和暗網(wǎng)。
據(jù)一些非正式數(shù)據(jù)統(tǒng)計,暗網(wǎng)的數(shù)量是明網(wǎng)的400-500倍,占全部網(wǎng)絡(luò)信息的90%以上。
「深網(wǎng)」與「暗網(wǎng)」和互聯(lián)網(wǎng)冰山
傳說,作為互聯(lián)網(wǎng)的陰暗面,在暗網(wǎng)上可以買到想買的一切。色情片、開房信息、人肉搜索、違禁藥品等等,這些都在暗網(wǎng)公開售賣。你甚至可以買到槍支,更有極端傳言,暗網(wǎng)可以雇兇殺人。
總之,暗網(wǎng)就像互聯(lián)網(wǎng)的黑市一般,只要通過特殊的瀏覽器就能進(jìn)入其中只要你付得起錢,就能買到想要的一切。正是由于暗網(wǎng)具有難追查的特性,使其成為網(wǎng)絡(luò)不法交易的“天堂”。
暗網(wǎng)被部署于匿名網(wǎng)絡(luò)之中,訪問者和被訪問者都被隱藏起來。而匿名網(wǎng)絡(luò)由全球的動態(tài)網(wǎng)絡(luò)節(jié)點組成,跨越不同國家與地區(qū),加之通信加密,難以實施監(jiān)聽與定位。
人工智能作為一項技術(shù)本無善惡之分,但是正如互聯(lián)網(wǎng)除了我們?nèi)粘?梢越佑|到的表面,還存在一個“暗網(wǎng)”一樣,人工智能也可能被心懷不軌的人利用,作為一個犯罪工具。
用AI在暗網(wǎng)再造一個“你”
今年2月,卡巴斯基實驗室的欺詐偵查小組搗毀了一個名為“創(chuàng)世紀(jì)”(Genesis)的暗網(wǎng)市場。該市場出售“數(shù)字身份”(互聯(lián)網(wǎng)用戶的電子身份信息),每條信息起價5美元,最高可達(dá)200美元。黑客們通常會用惡意軟件攻擊他人電腦,并且找到并復(fù)制這些個人數(shù)據(jù)以及其他個人身份識別信息。
“在這一點上,黑客們已經(jīng)能夠收集、管理和維護(hù)他們所侵入的用戶的大量數(shù)據(jù),”一家基于機器學(xué)習(xí)的技術(shù)公司的產(chǎn)品經(jīng)理ImranMalek說,“這意味著,如果你的筆記本電腦被黑客入侵,黑客的戰(zhàn)利品不一定是被入侵的電腦,而是你電腦上的所有數(shù)據(jù),包括所有的身份識別信息。”
有了這些信息,通過特定瀏覽器和代理服務(wù)器來模仿真實用戶的活動。再加上盜取的互聯(lián)網(wǎng)用戶的帳戶信息,攻擊者就可以自由地以該用戶的名義進(jìn)行新的、可信的交易——包括使用信用卡消費。
暗網(wǎng)上某交易市場
用AI對抗AI
在打擊“暗網(wǎng)”犯罪的過程中,人工智能正成為一把利器。
消失速度極快是“暗網(wǎng)”犯罪的一大特征,因為它們可能遭到其他黑客攻擊、安全部門突擊搜查,或者本身就是被設(shè)計成一個“退出騙局”——顧客為未完成的訂單付費后,該網(wǎng)站會故意關(guān)閉。
賣家和買家在網(wǎng)絡(luò)的多個層面(從表面到黑暗)以及在黑暗網(wǎng)絡(luò)論壇上進(jìn)行聯(lián)系。“這種網(wǎng)站之間的不斷切換現(xiàn)在已經(jīng)成為暗網(wǎng)市場運作方式的既定組成部分。”
針對這一情況,林肯實驗室(MIT Lincoln Laboratory)正在開發(fā)新的人工智能軟件工具來分析表面和暗網(wǎng)數(shù)據(jù),他們訓(xùn)練機器學(xué)習(xí)算法來計算不同論壇上用戶之間的相似度,自動形成人物角色鏈接。
黑客利用AI進(jìn)行對抗性訓(xùn)練
安全部門及相關(guān)公司利用機器學(xué)習(xí)打擊“暗網(wǎng)”犯罪的同時,黑客也開始利用機器學(xué)習(xí)進(jìn)行對抗和犯罪。
黑客能利用“數(shù)字孿生”作為數(shù)字面具模仿真實的用戶,并選擇網(wǎng)絡(luò)安全技術(shù)來通過欺詐檢測協(xié)議。如果一邊是機器學(xué)習(xí),那么另一邊也是機器學(xué)習(xí),現(xiàn)在,黑客正在實施他們自己的方案,作為一種對抗性的機器學(xué)習(xí)訓(xùn)練。
網(wǎng)絡(luò)攻擊難以防范,AI該如何應(yīng)對呢?
網(wǎng)絡(luò)安全防御確實存在難度。防御是一個面,攻擊是一個點,攻擊方與防御方不對等,攻擊方只需要找到一個突破點即可宣告攻擊成功,而防御者需要做好方方面面的防御工作。
其次,網(wǎng)絡(luò)攻擊溯源難。網(wǎng)絡(luò)攻擊的攻擊路徑可能跨越多個國家,很容易涉及跨司法管轄區(qū)域的問題,這在一定程度上限制了溯源范圍。另外,現(xiàn)有的網(wǎng)絡(luò)攻擊溯源方法離不開網(wǎng)絡(luò)基礎(chǔ)設(shè)施的輔助,而目前網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)仍存不足。”
維護(hù)網(wǎng)絡(luò)安全也并非毫無辦法。
近年來,網(wǎng)絡(luò)安全威脅情報研究興起, 即利用共享威脅情報提前部署防御計劃。網(wǎng)絡(luò)安全專家指出,“威脅情報及AI人工智能技術(shù)不僅能為攻擊溯源提供更多的數(shù)據(jù)支撐,還可能追蹤到實施攻擊的個人或組織。
就取證而言,針對龐大的暗網(wǎng),一方面可以研發(fā)出更有針對性的爬蟲技術(shù),以便獲取后臺數(shù)據(jù)庫;另一方面可與暗網(wǎng)網(wǎng)站合作,促進(jìn)信息對接,這兩種方法對暗網(wǎng)溯源都能起到一定作用。”
另外,曾有國際網(wǎng)絡(luò)安全專家推出了一個新的智能采集系統(tǒng),它能在暗網(wǎng)(dark web)和深網(wǎng)(deep net)中使用機器學(xué)習(xí)來研究黑客論壇以及他們的交易市場。該系統(tǒng)能搜尋潛在漏洞的線索。
他們使用機器學(xué)習(xí)算法來檢測相關(guān)站點上的討論的物品和主題信息。他們使用的機器學(xué)習(xí)原理是通過手工標(biāo)記約25%的數(shù)據(jù),表明哪些相關(guān)、哪些無關(guān),然后該機器學(xué)習(xí)算法通過自主學(xué)習(xí)剩下的相關(guān)數(shù)據(jù)并進(jìn)行判斷。
對于人類來說需要一分鐘來標(biāo)記五個交易市場或者相關(guān)論壇上的兩個主題,但是讓機器學(xué)習(xí)算法來干的話這個時間可以大大縮小。
利用機器學(xué)習(xí)查找暗網(wǎng)、深網(wǎng)中信息示意圖
人工智能技術(shù)的興起為網(wǎng)絡(luò)攻防雙方提供了新工具。道高一尺,魔高一丈。在網(wǎng)絡(luò)安全上這最終還是會否變成一個貓鼠游戲?
我們不禁思考,當(dāng)黑客們意識到他們會被機器學(xué)習(xí)算法這樣監(jiān)測之后肯定會改變他們的活動方式,到那時機器學(xué)習(xí)算法是否還能高精度的進(jìn)行監(jiān)控識別呢?在不久的將來,網(wǎng)絡(luò)攻防之間的對抗或許會演變成人工智能技術(shù)之間的對抗。