大數(shù)據(jù)自身面臨的安全挑戰(zhàn)
隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,個(gè)人數(shù)據(jù)、工業(yè)數(shù)據(jù)等快速匯聚成為常態(tài),數(shù)據(jù)泄露、數(shù)據(jù)竊取呈現(xiàn)出高發(fā)態(tài)勢(shì),大數(shù)據(jù)自身面臨的安全風(fēng)險(xiǎn)不斷加大。目前,數(shù)據(jù)泄露頻發(fā),個(gè)人大數(shù)據(jù)成為數(shù)據(jù)泄露的重災(zāi)區(qū)。2018年6月,AcFun彈幕視頻網(wǎng)發(fā)公告稱,平臺(tái)有800-1000萬(wàn)左右的用戶數(shù)據(jù)被黑客竊取。隨后,該網(wǎng)站用戶數(shù)據(jù)在暗網(wǎng)中被銷售,共計(jì)泄露900萬(wàn)條用戶數(shù)據(jù)。2019年2月,深網(wǎng)視界科技有限公司的MongoDB數(shù)據(jù)庫(kù)被發(fā)現(xiàn)未做訪問(wèn)限制,導(dǎo)致超過(guò)250萬(wàn)人的數(shù)據(jù)可被獲取,數(shù)據(jù)類型包括人臉識(shí)別圖像及圖像拍攝地點(diǎn)等。據(jù)統(tǒng)計(jì),2019年第一季度我國(guó)累計(jì)泄露簡(jiǎn)歷數(shù)據(jù)5.9億份,多是我國(guó)企業(yè)的MongoDB數(shù)據(jù)庫(kù)和ElasticSearch服務(wù)器沒(méi)有做訪問(wèn)限制,或者是防火墻出現(xiàn)錯(cuò)誤所導(dǎo)致的。
大數(shù)據(jù)平臺(tái)安全面臨架構(gòu)和軟件的安全風(fēng)險(xiǎn)
大數(shù)據(jù)清洗、存儲(chǔ)、分析、挖掘相關(guān)的平臺(tái)和軟件近年來(lái)漏洞頻出,引發(fā)安全風(fēng)險(xiǎn)。Hadoop框架核心組件之一YARN曾被發(fā)現(xiàn)存在信息泄露漏洞,黑客能夠利用該漏洞獲取用戶密碼。我國(guó)研究人員發(fā)現(xiàn),一些俄羅斯黑客曾利用Hadoop Yarn資源管理系統(tǒng)REST API未授權(quán)訪問(wèn)漏洞開展網(wǎng)絡(luò)攻擊。2018年11月,研究人員發(fā)現(xiàn)Apache Spark中存在安全漏洞,攻擊者可通過(guò)發(fā)送特制的請(qǐng)求利用該漏洞在服務(wù)器上執(zhí)行惡意代碼。
大數(shù)據(jù)挖掘技術(shù)帶來(lái)的安全挑戰(zhàn)
一是傳統(tǒng)安全防護(hù)技術(shù)難以滿足大數(shù)據(jù)時(shí)代隱私保護(hù)需求。傳統(tǒng)隱私安全保護(hù)技術(shù)以匿名化技術(shù)為主,如K匿名、L多樣性等,但相關(guān)技術(shù)在大數(shù)據(jù)挖掘技術(shù)下可能失效,大數(shù)據(jù)挖掘和分析能夠?qū)δ涿麛?shù)據(jù)進(jìn)行重新識(shí)別,引發(fā)隱私安全擔(dān)憂。例如,2019年8月,澳大利亞某政府部門將部分匿名化交通數(shù)據(jù)向社會(huì)開放,但由于安全風(fēng)險(xiǎn)未做到位,導(dǎo)致交通數(shù)據(jù)經(jīng)分析和挖掘后被重新識(shí)別,個(gè)人交通出行隱私因此被泄露,給政府部門敲響了開放數(shù)據(jù)風(fēng)險(xiǎn)的警鐘。
二是大數(shù)據(jù)挖掘技術(shù)帶來(lái)數(shù)據(jù)濫用風(fēng)險(xiǎn),如大數(shù)據(jù)殺熟、價(jià)格歧視等。攜程等互聯(lián)網(wǎng)公司被質(zhì)疑利用用戶的行為、喜好等數(shù)據(jù),在同一產(chǎn)品上對(duì)不同用戶區(qū)別定價(jià),由此引來(lái)網(wǎng)友一片聲討;滴滴則被網(wǎng)友發(fā)現(xiàn)存在同一出發(fā)點(diǎn)和目的地,不同賬戶面對(duì)的估價(jià)不同的現(xiàn)象,因此懷疑滴滴在定價(jià)方面存在大數(shù)據(jù)殺熟和價(jià)格歧視,滴滴對(duì)此回應(yīng)稱估價(jià)是實(shí)時(shí)變化,因此出現(xiàn)該現(xiàn)象。