前言
2021年的今天,相信大家對字節(jié)跳動(dòng)這個(gè)名字不會(huì)陌生,作為目前全國數(shù)一數(shù)二的資訊類企業(yè),它旗下的兩個(gè)平臺(tái)——「今日頭條」和「抖音」,都是貫穿人們生活點(diǎn)點(diǎn)滴滴的App應(yīng)用。
字節(jié)跳動(dòng)作為近兩年的新興之秀,卻有著直逼騰訊和阿里的勢頭,可以肯定的是,它的成功并非偶然,甚至可以略帶溢美之詞地說,是字節(jié)跳動(dòng)定義了現(xiàn)代化移動(dòng)資訊、信息流以及短視頻……
在這個(gè)數(shù)據(jù)為王的時(shí)代,人們一方面受益于平臺(tái)算法,在日常瀏覽中得以閱讀自己喜歡的內(nèi)容;但另一方面,人們又時(shí)刻害怕自己的隱私在這個(gè)數(shù)字時(shí)代扮演著皇帝的新裝。直到2020年11月底,字節(jié)跳動(dòng)打響了標(biāo)桿性的一槍,率先宣布不再為廣告主的任何品牌投放提供回傳受眾的設(shè)備ID(Device ID)服務(wù),廣告主和媒體平臺(tái)兩者之間的友好合作就此作古。
由兩個(gè)數(shù)據(jù)關(guān)系主體的角度進(jìn)行分析,一方面廣告主自此無法通過廣告投放獲取用戶數(shù)據(jù),無法定向追蹤目標(biāo)群體;而另一方面,媒體平臺(tái)拒絕數(shù)據(jù)回傳則構(gòu)建出了相對封閉的「數(shù)據(jù)圍墻」。如此,二者均無法通過合作得到相應(yīng)的商業(yè)利益,導(dǎo)致了如今「傷敵一千,自損八百」的局面。
不過,媒體平臺(tái)不可能不清楚這一點(diǎn)。就在字節(jié)跳動(dòng)公開消息后不久,其他媒體平臺(tái)明面上云淡風(fēng)輕,背地里卻暗潮涌動(dòng)。相信在字節(jié)跳動(dòng)的帶頭作用下,其他媒體平臺(tái)會(huì)陸續(xù)效仿,不再為廣告主提供任何數(shù)據(jù)回傳,畢竟數(shù)據(jù)的核心不僅僅在于經(jīng)濟(jì)利益,更關(guān)乎用戶的隱私,抑或是未來的法律。
在數(shù)據(jù)隱私保衛(wèi)之戰(zhàn)不斷升級的背景下,如何解決數(shù)據(jù)收集者、使用者和所有者三者之間的矛盾?就目前發(fā)展現(xiàn)狀和趨勢看,隱私計(jì)算技術(shù)或能成為解決這一問題的關(guān)鍵。
何為隱私計(jì)算
行業(yè)背景
隱私在大數(shù)據(jù)時(shí)代中的表現(xiàn)即為數(shù)據(jù),凡是所有者不愿意被披露的敏感信息或是數(shù)據(jù)所能推導(dǎo)出的特征都屬于隱私的范疇。一方面國家在大力提倡建設(shè)數(shù)字經(jīng)濟(jì)社會(huì),鼓勵(lì)數(shù)據(jù)開放共享、互聯(lián)互通;另一方面,在用戶隱私意識(shí)覺醒的今天,人們對于隱私保護(hù)的強(qiáng)烈需求掀起了下一波技術(shù)浪潮,而隱私計(jì)算便是這波技術(shù)浪潮帶來的產(chǎn)物。近兩年隱私計(jì)算由小眾到廣為人知,商業(yè)與資本的加持可謂是功不可沒,近幾年出臺(tái)的法律法規(guī)文件同樣起到了正向催化劑的作用?!鸽[私計(jì)算」一詞最早于2016年發(fā)布的《隱私計(jì)算研究范疇及發(fā)展趨勢》中正式提出。在2021年6月10日,第十三屆全國人民代表大會(huì)常務(wù)委員會(huì)第二十九次會(huì)議通過《中華人民共和國數(shù)據(jù)安全法》,這項(xiàng)舉措不僅填補(bǔ)了數(shù)據(jù)安全這一方面的法律空白,更是催生出無數(shù)團(tuán)隊(duì)進(jìn)入這一賽道,也極大地推動(dòng)了隱私計(jì)算行業(yè)的規(guī)范和快速發(fā)展。不過,法律法規(guī)始終難以從整體上對隱私計(jì)算技術(shù)進(jìn)行合法性判斷,只能說隱私計(jì)算是當(dāng)下針對數(shù)據(jù)管理和應(yīng)用的新方案。
基本概念
先來看官方的定義:“隱私計(jì)算是指面向隱私信息全生命周期保護(hù)的計(jì)算理論和方法,是隱私信息的所有權(quán)、管理權(quán)和使用權(quán)分離時(shí)隱私度量、隱私泄漏代價(jià)、隱私保護(hù)與隱私分析復(fù)雜性的可計(jì)算模型與公理化系統(tǒng)。”用通俗的話來解釋,隱私計(jì)算是指通過算法系統(tǒng)和技術(shù),貫穿數(shù)據(jù)產(chǎn)生、存儲(chǔ)、應(yīng)用、計(jì)算、銷毀的全過程,使數(shù)據(jù)在此過程中「可用卻不可見」,既保護(hù)了數(shù)據(jù)提供者的隱私,又有效地解決了數(shù)據(jù)流通、應(yīng)用問題,這樣就能在合法合規(guī)的范圍內(nèi)對數(shù)據(jù)進(jìn)行更深層次的價(jià)值挖掘。
提到隱私計(jì)算,大家都會(huì)聯(lián)想到最經(jīng)典的“百萬富翁”難題:“從前有兩個(gè)富翁在街上相遇,他們都想知道兩人中誰更富有,但又不愿意讓對方知道自己真正擁有多少財(cái)富。那么如何在沒有第三方參與的情況下,知道誰更有錢?”這項(xiàng)難題的解決方案就運(yùn)用了隱私計(jì)算技術(shù)。兩個(gè)富翁分別將自己的財(cái)產(chǎn)數(shù)進(jìn)行同一個(gè)計(jì)算,最終只需要公開計(jì)算結(jié)果,就能知道究竟誰更富有一些。以上的例子就體現(xiàn)出了隱私計(jì)算中數(shù)據(jù)「可用卻不可見」的含義所在——其中「可用」是指兩個(gè)富翁提供了資產(chǎn)數(shù)參與計(jì)算過程,最終得到了數(shù)據(jù)結(jié)果;而「不可見」是指資產(chǎn)數(shù)只有自己了解,并沒有透露給第三方,哪怕是得到了計(jì)算結(jié)果也無法倒推出資產(chǎn)數(shù)額為多少。
隱私計(jì)算技術(shù)體系
“百萬富翁”難題,是1982年由華裔計(jì)算機(jī)科學(xué)家、圖靈獎(jiǎng)獲得者姚期智教授提出的。而這個(gè)經(jīng)典問題的解決辦法是安全多方計(jì)算,也是現(xiàn)目前主流隱私計(jì)算技術(shù)之一,另外比較著名的兩類分別是基于現(xiàn)代密碼的聯(lián)邦學(xué)習(xí)和基于硬件的可信執(zhí)行環(huán)境。我們分別來解釋:
安全多方計(jì)算
安全多方計(jì)算(Secure Multi-Party Computation)是電子選舉、門限簽名以及電子拍賣等諸多應(yīng)用得以實(shí)施的密碼學(xué)基礎(chǔ),主要是針對一組互不信任的參與方之間保護(hù)隱私的協(xié)同計(jì)算問題,為數(shù)據(jù)需求方提供不泄露原始數(shù)據(jù)前提下的多方協(xié)同計(jì)算能力。
在整個(gè)計(jì)算協(xié)議執(zhí)行過程中,用戶對個(gè)人數(shù)據(jù)始終擁有控制權(quán),只會(huì)公開計(jì)算邏輯。計(jì)算參與方只需參與計(jì)算協(xié)議,無需依賴第三方就能完成數(shù)據(jù)計(jì)算,并且參與各方拿到計(jì)算結(jié)果后也無法反推出原始數(shù)據(jù)。
聯(lián)邦學(xué)習(xí)
聯(lián)邦學(xué)習(xí)(Federated machine learning/Federated Learning)是一個(gè)機(jī)器學(xué)習(xí)框架,其主要解決的是在一個(gè)分布式的環(huán)境下,參與方持有各自的數(shù)據(jù),如何打破數(shù)據(jù)孤島、充分運(yùn)用起所有參與方數(shù)據(jù)進(jìn)行模型訓(xùn)練,又能滿足各參與方的隱私保護(hù)訴求的問題。聯(lián)邦學(xué)習(xí)要求該模型建立形式應(yīng)當(dāng)無限接近傳統(tǒng)模式,即將多個(gè)數(shù)據(jù)擁有方的數(shù)據(jù)匯聚到一處進(jìn)行建模的結(jié)果。在聯(lián)邦機(jī)制下,各參與者的身份和地位相同,可建立共享數(shù)據(jù)策略。由于數(shù)據(jù)不發(fā)生轉(zhuǎn)移,因此不會(huì)泄露參與方隱私或影響數(shù)據(jù)規(guī)范。
可信執(zhí)行環(huán)境
可信執(zhí)行環(huán)境(Trusted Execution Environment,后文簡稱TEE)是CPU中的一個(gè)特殊區(qū)域,該區(qū)域與其他區(qū)域嚴(yán)格隔離,避免了存儲(chǔ)在內(nèi)部的數(shù)據(jù)遭受黑客攻擊或者影響到內(nèi)部安全執(zhí)行的環(huán)境。
例如,用戶的身份、密鑰和證書等數(shù)據(jù)需要高度保護(hù),TEE依靠軟硬件實(shí)現(xiàn)數(shù)據(jù)加密,訪問數(shù)據(jù)只能由TEE授權(quán)的可信應(yīng)用訪問或修改。同時(shí)還可利用TEE中存儲(chǔ)的密鑰對普通執(zhí)行環(huán)境下用戶數(shù)據(jù)進(jìn)行加密,保證存儲(chǔ)在普通執(zhí)行環(huán)境中數(shù)據(jù)的安全性。綜上,數(shù)據(jù)本身作為數(shù)字經(jīng)濟(jì)時(shí)代下重要的生產(chǎn)要素,只有在不斷的產(chǎn)生、流動(dòng)、共享、計(jì)算中才能發(fā)揮更好的價(jià)值,而隱私計(jì)算打破了現(xiàn)有數(shù)據(jù)價(jià)值流通的顧慮,通過技術(shù)實(shí)現(xiàn)了數(shù)據(jù)孤島的連通,既能保證數(shù)據(jù)安全,又能應(yīng)用數(shù)據(jù)進(jìn)行運(yùn)算,使其更好地服務(wù)于數(shù)字經(jīng)濟(jì)發(fā)展。
開啟數(shù)據(jù)價(jià)值新篇章
隨著字節(jié)跳動(dòng)率先打響標(biāo)桿性的一槍,人們開始重新思考數(shù)據(jù)安全與數(shù)據(jù)使用之間的關(guān)系,作為開啟數(shù)據(jù)價(jià)值新篇章的關(guān)鍵突破口,隱私計(jì)算技術(shù)的未來發(fā)展前景非常廣闊。
現(xiàn)目前,無論阿里、騰訊、字節(jié)跳動(dòng)等大廠還是初創(chuàng)型的科技公司,都紛紛開始發(fā)力、入局隱私計(jì)算賽道搶跑占位。而頭部互聯(lián)網(wǎng)公司憑借自身實(shí)力和規(guī)模效益加快研發(fā),也在積極推動(dòng)隱私計(jì)算相關(guān)產(chǎn)品的落地。
我們不能否認(rèn),作為新興事物之一的隱私計(jì)算,同樣會(huì)面臨一些問題:
1.隱私計(jì)算難以實(shí)現(xiàn)多方平等參與,計(jì)算過程和結(jié)果缺乏可驗(yàn)證性。
為解決這點(diǎn),隱私計(jì)算正嘗試著與區(qū)塊鏈結(jié)合,構(gòu)建一整套完整的解決方案。借助了區(qū)塊鏈去中心化、不可篡改、公開透明的特點(diǎn),實(shí)現(xiàn)了多方參與,并且隱私計(jì)算的過程數(shù)據(jù)和關(guān)鍵計(jì)算環(huán)節(jié)等可以上鏈存證,增強(qiáng)了隱私計(jì)算結(jié)果的可驗(yàn)證性、可審計(jì)性。
2.隱私計(jì)算如何保證數(shù)據(jù)的安全?
隱私計(jì)算技術(shù)初衷是為保證數(shù)據(jù)安全,所以技術(shù)本身的安全性是重中之重。另外,隱私計(jì)算需進(jìn)行大規(guī)模的數(shù)據(jù)計(jì)算,因此計(jì)算效率、性能同樣不可忽視。
為解決這點(diǎn),需要軟硬件協(xié)同優(yōu)化提升技術(shù)可用性,在算法不斷優(yōu)化的基礎(chǔ)上,一些專用芯片和組件的使用將進(jìn)一步提升隱私計(jì)算的性能。
我們可以肯定的是,數(shù)字產(chǎn)業(yè)的發(fā)展和隱私計(jì)算行業(yè)的發(fā)展是相輔相成的。
大數(shù)據(jù)時(shí)代下,單個(gè)數(shù)據(jù)的價(jià)值微乎其微,只有大量數(shù)據(jù)互聯(lián)互通,在保證數(shù)據(jù)安全的前提下計(jì)算才能挖掘出真正的價(jià)值,再落地到具體應(yīng)用場景。而在這整個(gè)價(jià)值挖掘過程中,高投入的創(chuàng)造性勞動(dòng)便是數(shù)字產(chǎn)業(yè)發(fā)展的關(guān)鍵環(huán)節(jié)。
我們期待著更豐富的數(shù)據(jù)價(jià)值實(shí)現(xiàn)的那天,但我們更加期待用戶數(shù)據(jù)安全得以實(shí)現(xiàn)的那天,到那時(shí),數(shù)據(jù)價(jià)值才能真正稱得上是翻開了嶄新的篇章。
后記
數(shù)據(jù)作為21世紀(jì)如「石油」般珍貴的資源,人們對待數(shù)據(jù)就像是在勘探開發(fā)石油的過程中注重環(huán)境保護(hù)一樣,既然想要挖掘更多的數(shù)據(jù)價(jià)值,那么保護(hù)數(shù)據(jù)安全自然也是重中之重的東西。
目前,隱私計(jì)算行業(yè)仍處于最初期的階段,未來的潛力不可估量,甚至遠(yuǎn)超我們想象。
而在數(shù)據(jù)安全、基礎(chǔ)建設(shè)等方面,隱私計(jì)算仍須面對諸多難題和挑戰(zhàn),未來想要獲得長足發(fā)展,首先是要提高隱私計(jì)算技術(shù)的可用性和兼容性。
對此,有不少人的焦點(diǎn)都放在了區(qū)塊鏈和隱私計(jì)算的結(jié)合中,秉承著「開放」、「透明」、「共享」理念的區(qū)塊鏈技術(shù)誠然為我們提供了一個(gè)嶄新而又有效的思路,而落到實(shí)處的發(fā)展進(jìn)程值得我們長期關(guān)注。