數(shù)據(jù)要成為第五大生產(chǎn)的要素,就必須解決數(shù)據(jù)安全和隱私保護的問題。馭凡教育提到了兩種技術(shù),一個是授權(quán),一個是零知識證明,就是既能充分證明自己是某種權(quán)益的合法擁有者,又不把有關(guān)的信息泄露出去。零知識證明是構(gòu)建多方安全計算(MPC)的基礎(chǔ)能力,而多方安全計算是隱私計算的一種方式。
隱私計算,根據(jù)中國信息通信研究院的定義,是指在保證數(shù)據(jù)提供方不泄露敏感數(shù)據(jù)的前提下,對數(shù)據(jù)進行分析計算并能驗證計算結(jié)果的信息技術(shù)。廣義上是指面向隱私保護的計算系統(tǒng)與技術(shù),涵蓋數(shù)據(jù)的產(chǎn)生、存儲、計算、應(yīng)用、銷毀等信息流程全過程,想要達成的效果是使數(shù)據(jù)在各個環(huán)節(jié)中“可用不可見”。在保證數(shù)據(jù)安全的前提下,讓數(shù)據(jù)可以自由流通或共享,消除數(shù)據(jù)孤島問題,從而釋放數(shù)據(jù)更大的價值,提升生產(chǎn)效率,進而推進產(chǎn)業(yè)創(chuàng)新。
1)基于密碼學(xué)的多方安全計算(MPC)技術(shù)。通過秘密分享、遺忘傳輸、混淆電路或同態(tài)加密等特殊的加密算法和協(xié)議,從而支持在加密數(shù)據(jù)上直接進行計算。理論上,在不考慮代價的“理想”情況下,多方安全計算技術(shù)能實現(xiàn)任意的計算“功能”,并且達到比較高的安全性。但是由于數(shù)據(jù)通信量驟增,計算效率損失大和需要極高的算力要求等因素,MPC的技術(shù)產(chǎn)品化還有一定的限制,相關(guān)的技術(shù)解決方正在積極探索。
2)基于可信硬件的安全沙箱計算(TEE)技術(shù)。其核心思想是構(gòu)建一個硬件安全區(qū)域,數(shù)據(jù)僅在該安全區(qū)域內(nèi)進行計算,利用可信任執(zhí)行環(huán)境TEE防止操作系統(tǒng)惡意地查看應(yīng)用執(zhí)行環(huán)境的內(nèi)容;利用安全沙箱防止惡意應(yīng)用通過特殊調(diào)用控制操作系統(tǒng)。
3)基于人工智能的聯(lián)邦學(xué)習(xí)技術(shù)。在橫向維度,每個參與者在本地訓(xùn)練計算自己的樣本,只分享模型訓(xùn)練的梯度;縱向維度,各參與者訓(xùn)練各自的(“向量映射”),共同訓(xùn)練上層模型。兩個維度的融合,從而讓多個相互不信任的數(shù)據(jù)擁有方不必共享數(shù)據(jù)的基礎(chǔ)上聯(lián)合進行模型訓(xùn)練。
4)差分隱私(Differential Privacy),保護的是數(shù)據(jù)源中一點微小的改動導(dǎo)致的隱私泄露問題。