灰色地帶中的隱私之墻,怎么攻?怎么守?

“隱私”一詞第一次出現(xiàn)是在周朝初年,指代“衣服”,即把私處藏起來的東西。按照現(xiàn)在的說法,所謂的“隱私”,即一種與公共利益、群體利益無關(guān),當(dāng)事人不愿他人知道或他人不便知道的個人信息,當(dāng)事人不愿他人干涉或他人不便干涉的個人私事,以及當(dāng)事人不愿他人侵入或他人不便侵入的個人領(lǐng)域。

去年年初,網(wǎng)上流傳這樣一個段子,一位已婚男性用戶向支付寶發(fā)出“抱怨”,稱后者發(fā)布的2017賬單暴露了他過去一年的開房記錄,以致于家庭被迫走在毀滅的邊緣(圖片如下):

一時間,支付寶賬單被頂上了輿論的風(fēng)口浪尖,這一切的背后是用戶數(shù)據(jù)隱私的被采集和利用。

而一波未平一波又起,時隔不到兩個月,F(xiàn)acebook也因為同樣的理由遭遇了比支付寶更嚴(yán)重的考驗,即臭名昭著的“劍橋分析”事件,數(shù)據(jù)泄露范圍高達(dá)8700萬用戶。因為這一事件,小扎經(jīng)歷了長達(dá)5個小時的國會聽證,并針對用戶隱私政策和數(shù)據(jù)泄露事件接受了44位議員的質(zhì)詢。

在這之后,華住集團(tuán)5億條數(shù)據(jù)遭泄露、平臺頻現(xiàn)“大數(shù)據(jù)殺熟”、騷擾電話接連不斷……可以說,自去年年初開始,關(guān)于“數(shù)據(jù)隱私”的討論就一直很激烈。

技術(shù)面前,隱私不再“隱私”

“隱私”一詞第一次出現(xiàn)是在周朝初年,指代“衣服”,即把私處藏起來的東西。按照現(xiàn)在的說法,所謂的“隱私”,即一種與公共利益、群體利益無關(guān),當(dāng)事人不愿他人知道或他人不便知道的個人信息,當(dāng)事人不愿他人干涉或他人不便干涉的個人私事,以及當(dāng)事人不愿他人侵入或他人不便侵入的個人領(lǐng)域。

隱私的周圍或多或少都會存在窺探者,出于不同的目的,他們往往能夠把隱私玩出許多花樣,并由此誕生了許多不同的職業(yè)和市場,比如致力于圍繞個人或群體調(diào)查信息的私家偵探,又比如滿足人們對明星生活好奇心的娛樂記者……而隨著互聯(lián)網(wǎng)時代,人們窺探隱私的手段也以可見的速度進(jìn)行升級換代,尤其是在用戶服務(wù)、市場營銷等領(lǐng)域。

以市場營銷為例,今年315晚會現(xiàn)場所揭露的數(shù)據(jù)灰色產(chǎn)業(yè)至今令人記憶猶新。通過一種“探針盒子”設(shè)備,設(shè)備持有人便能夠捕捉手機(jī)的局域網(wǎng)信號,繼而獲取MAC地址。只需要將這段地址數(shù)據(jù)與大數(shù)據(jù)系統(tǒng)進(jìn)行配合,包括性別、年齡、收入、婚姻狀況、教育程度、新老客屬性等在內(nèi)的機(jī)主信息都將一覽無余?;谶@些信息,服務(wù)商即可幫助商家勾勒出用戶精準(zhǔn)畫像,進(jìn)而開展廣告精準(zhǔn)推送等等。

一套流程下來,整個步驟就是如此的簡單粗暴且有效。而在以往,這些信息的收集和用戶畫像的勾勒往往需要消耗大量人力和時間去進(jìn)行用戶調(diào)查、數(shù)據(jù)歸納整理等工作,且精準(zhǔn)度也因為用戶的主觀意識而存在不確定性。

而在線上,在得到類似效果的前提下,獲取用戶數(shù)據(jù)隱私的成本則更低。明面上,APP會要求用戶同意并授權(quán)諸如相機(jī)、麥克風(fēng)、位置信息等服務(wù),從而正大光明的采集各類數(shù)據(jù);暗地里,無需用戶同意或授權(quán),平臺往往也能夠通過cookie等技術(shù)手段采集用戶數(shù)據(jù),繼而勾勒畫像,提供個性化服務(wù)或精準(zhǔn)營銷。

令人氣憤或無奈的是,為了正常使用服務(wù),用戶往往不得不同意那些存在隱私泄露隱患的隱私政策,并授權(quán)平臺使用相機(jī)、麥克風(fēng)等。

可以說,在智能算法等技術(shù)面前,人們的隱私已經(jīng)不再私密,甚至比以往更易獲得。

選擇隱私與服務(wù),這道選擇題沒有絕對的答案

如何保護(hù)隱私?傳統(tǒng)做法是閉緊嘴巴、避開他人耳目行事。直到1980年,“隱私權(quán)”這一概念才被提出,讓人們在法律層面找到了保衛(wèi)隱私的武器。而隨著互聯(lián)網(wǎng)時代、智能化時代的到來,這一法律武器也“學(xué)會了”與時俱進(jìn)。

比如歐盟,其在2016年通過了被稱為史上最嚴(yán)的《常規(guī)數(shù)據(jù)保護(hù)條例》(簡稱GDPR),要求數(shù)據(jù)控制者(收集歐盟公民數(shù)據(jù)的任何公司)嚴(yán)格執(zhí)行條例所規(guī)定的數(shù)據(jù)處理規(guī)范,及時告知數(shù)據(jù)主體的使用情況。GDPR已經(jīng)于2018年5月份正式實施,彼時依舊身陷“劍橋分析”事件泥潭的Facebook剛好撞在槍口上。

可以注意到,GDPR所強(qiáng)調(diào)的是公司要將數(shù)據(jù)使用情況及時告知用戶,而非要求公司停止收集數(shù)據(jù)。為什么?因為就現(xiàn)實情況而言,用戶數(shù)據(jù)在多數(shù)情況下是避無可避的。

比如那些正在使用APP的用戶,他們難道不知道自己的數(shù)據(jù)正在被收集嗎?非也?,F(xiàn)實情況是,他們出于社交等目的不得不繼續(xù)使用這些APP,且能夠在不受到直接物質(zhì)傷害的前提下享受到一些有價值的服務(wù)。

當(dāng)然,或許有人為了信息不被收集而拒絕使用那些APP,甚至不主動使用任何聯(lián)網(wǎng)設(shè)備,但這樣就能夠避免數(shù)據(jù)隱私被采集嗎?不是的。

數(shù)據(jù)的收集主要依賴于各類終端設(shè)備,據(jù)前瞻產(chǎn)業(yè)研究院發(fā)布的《2018-2023年中國物聯(lián)網(wǎng)行業(yè)細(xì)分市場需求與投資機(jī)會分析報告》初步估算,2020年物聯(lián)網(wǎng)設(shè)備數(shù)量將達(dá)到204億。

針對手機(jī)、電腦等自可控智能設(shè)備,用戶可以選擇斷網(wǎng)、遮擋攝像頭等物理操作來阻止它們收集并上傳數(shù)據(jù),但在超市、商場,甚至是大街等被充斥海量智能設(shè)備的不可控場景中,出于安全等多樣性的目的,被留下數(shù)據(jù)痕跡是不可避免的事情。

與此同時,數(shù)據(jù)隱私的控制權(quán)也從用戶手中轉(zhuǎn)移到采集數(shù)據(jù)的公司手中。

還記得此前,針對數(shù)據(jù)隱私以及基于數(shù)據(jù)訓(xùn)練算法而來的個性化服務(wù),李彥宏曾發(fā)表一番言論,在業(yè)內(nèi)引發(fā)一場熱議。關(guān)于“中國用戶愿意拿數(shù)據(jù)隱私換取服務(wù)”的觀點,這里不予置評,但他所提到的一個觀點說的有幾分道理,他說“我們也要遵循一些原則,如果這個數(shù)據(jù)能讓用戶受益,他們又愿意給我們用,我們就會去使用它的。我想這就是我們能做什么和不能做什么的基本標(biāo)準(zhǔn)。”

在網(wǎng)絡(luò)四通八達(dá)、處處充斥著智能設(shè)備的當(dāng)今,如果沒有花費(fèi)心思進(jìn)行隱藏的話,人們的一舉一動都將近乎完全暴露。這時候,人們需要擔(dān)心的不是自己的數(shù)據(jù)是否被收集,而是這些數(shù)據(jù)是否被不正當(dāng)利用。而除了正常的法律約束,技術(shù)支撐往往也是不可或缺的,尤其是在一切事物都被“數(shù)據(jù)化”的當(dāng)下。

保護(hù)隱私,法律之外還需要“以毒攻毒”

上至國家、下至普羅大眾,”未來是AI時代“已經(jīng)成為了一個共識。經(jīng)過這幾年的發(fā)展,AI已經(jīng)走下神壇,從一個深奧的話題演變的更為貼近民生。與此同時,人們也享受到了AI所帶來的便利。而這其中,最大的功臣之一就是數(shù)據(jù)。

有了數(shù)據(jù),算法能夠在不斷的訓(xùn)練中提升精準(zhǔn)性;有了數(shù)據(jù),算法才能針對性的面向用戶提供服務(wù),而不是成為一個雞肋;有了數(shù)據(jù),人們所設(shè)想和期待的萬物智聯(lián)才會成為現(xiàn)實……可以說,數(shù)據(jù)是智能化實現(xiàn)的動力。

圍繞智能化趨勢所帶來的數(shù)據(jù)隱私安全以及是否被濫用問題,諸多國家正在從法律層面進(jìn)行完善,除了前面提到的歐盟GDPR,我國也于去年5月份正式實施《信息安全技術(shù)個人信息安全規(guī)范》,要求平臺在收集個人敏感信息時,平臺應(yīng)征得用戶的明示同意,并區(qū)分核心功能和附加功能,以打破”一攬子授權(quán)“的難題……

理性的來說,健全的法律只是利用一種合法的手段為人們提供一個武器,對收集數(shù)據(jù)的公司起到一個震懾的作用,但并不能完全消除人們對于數(shù)據(jù)隱私被收集和利用的擔(dān)憂。而基于這股擔(dān)憂,用戶也將在一定程度上”不信任“公司基于數(shù)據(jù)而提供的服務(wù),久而久之,用戶與公司之間必然將產(chǎn)生裂縫,這并不是后者所愿意見到的。

為了避免這種情況的發(fā)生,越來越多的公司開始關(guān)注起”數(shù)據(jù)隱私“這一以往被忽略的問題。比如谷歌,在日前舉辦的I/O大會上全程不忘提及他們在隱私保護(hù)上做出的努力。

目前,為了讓用戶對數(shù)據(jù)隱私放心,企業(yè)的解決方案分為兩大方向,一個側(cè)重于數(shù)據(jù)收集的源頭,另一個則將重點放在數(shù)據(jù)收集之后的保護(hù):

· 數(shù)據(jù)脫敏

前面也提到,為了達(dá)到個性化服務(wù)、精準(zhǔn)營銷等服務(wù),數(shù)據(jù)被收集是一個必然的事實,只是需要注意的是,并不是所有數(shù)據(jù)都要被收集。在這方面,部分企業(yè)選擇收集那些非敏感數(shù)據(jù),即脫敏數(shù)據(jù)。

這一過程中,當(dāng)涉及客戶安全數(shù)據(jù)或者一些商業(yè)性敏感數(shù)據(jù)的情況,在不違反系統(tǒng)規(guī)則條件下,企業(yè)會通過脫敏規(guī)則對數(shù)據(jù)進(jìn)行改造,剔除身份證、手機(jī)號、卡號、年齡、性別等個人敏感信息。

目前,“數(shù)據(jù)脫敏”這一方法被大多數(shù)企業(yè)所采用,區(qū)別只在于具體方式不一樣。經(jīng)過脫敏處理后,留下則是結(jié)構(gòu)化數(shù)據(jù),不存在過于敏感的隱私問題。一般而言,基于脫敏數(shù)據(jù)而形成的用戶畫像是不完整的,做不到特別精準(zhǔn)的個性化推薦、服務(wù),但是對于一些商業(yè)目的而言,這些已經(jīng)足夠。

與此同時,從數(shù)據(jù)智能化的流程上講,收集脫敏數(shù)據(jù)意味著用戶的敏感信息從最初就被剔除在外,相當(dāng)于從源頭即開始保護(hù)用戶的數(shù)據(jù)隱私,從而保證了數(shù)據(jù)隱私的安全性。

· 邊緣計算

自去年開始,邊緣計算就一直被業(yè)界所推崇,而在探討其優(yōu)勢的時候,“提高數(shù)據(jù)的安全性與可靠性”這一點必定在列。

在邊緣計算被提出之前,終端設(shè)備在云計算模式下需要將所收集的用戶數(shù)據(jù)上傳至數(shù)據(jù)中心,也就是所謂的云端,某些時候常常造成數(shù)據(jù)擁堵的現(xiàn)場,而更需要提高警惕的是,這些數(shù)據(jù)極有可能在上傳過程中,亦或是在終端服務(wù)器內(nèi)遭到泄漏。

不同于云計算的操作模式,邊緣計算將包含用戶隱私的數(shù)據(jù)放在邊緣節(jié)點,以進(jìn)行保存和處理分析,相對提高數(shù)據(jù)的安全性。

另外,因為是將數(shù)據(jù)放在邊緣節(jié)點,邊緣計算的數(shù)據(jù)隱私避免了長途跋涉的過程,在縮減數(shù)據(jù)上傳時間、躲開數(shù)據(jù)擁堵的同時,也提升了設(shè)備的響應(yīng)速度。

· 聯(lián)邦學(xué)習(xí)

邊緣計算之后,近期出現(xiàn)了又一個針對數(shù)據(jù)隱私保護(hù)的新概念,即“聯(lián)邦學(xué)習(xí)”。

“聯(lián)邦學(xué)習(xí)就像一個安全的道路網(wǎng)絡(luò),可以既滿足人工智能的訓(xùn)練要求,又保障我們的個人隱私不被濫用,因為這個道路網(wǎng)絡(luò)上跑的是無法還原到原始數(shù)據(jù)的加密信息。”創(chuàng)新工場南京國際人工智能研究院執(zhí)行院長馮霽表示。

以學(xué)生的個性化教育為例,圍繞該學(xué)生的所有數(shù)據(jù)被分散化的,這并不利于最佳模型的訓(xùn)練。同時,若將數(shù)據(jù)在不進(jìn)行加密或不在安全標(biāo)準(zhǔn)下進(jìn)行跨地域、跨數(shù)據(jù)源的聚合和交換,企業(yè)也無法在所有不同數(shù)據(jù)源上訓(xùn)練最能反應(yīng)該學(xué)生學(xué)歷歷程的AI模型,也需要承擔(dān)極大的數(shù)據(jù)隱私風(fēng)險。

而借助聯(lián)邦學(xué)習(xí),業(yè)界可以建立一個安全的共享機(jī)制,不需要交換原始隱私數(shù)據(jù),企業(yè)只需要在加密的數(shù)據(jù)上進(jìn)行聚合訓(xùn)練,就可以得出完整反映學(xué)生情況的AI模型,并基于該模型為學(xué)生針對性的定制學(xué)習(xí)計劃。

聯(lián)邦學(xué)習(xí)的這種做法,相當(dāng)于在原始數(shù)據(jù)外圍增加了一把鎖頭,并進(jìn)行模糊化處理等二次加工。

在智能化時代,數(shù)據(jù)就是新的生產(chǎn)力,兩者之間相互扶持,一榮俱榮、一損俱損。沒有數(shù)據(jù)的支撐,智能化也只能停留在淺層表面,相比于它真正所能夠提供的價值,停留在表面的智能化只能算是碌碌一生。

若要得到數(shù)據(jù)的支撐,那么安全性則是一個始終都繞不開的話題。只有安全性得到保障,用戶才會信任算法、信任服務(wù),繼而才會使用它,并向提供服務(wù)方進(jìn)行反饋,形成一個良性循環(huán)。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論