隨著國(guó)家大數(shù)據(jù)戰(zhàn)略的實(shí)施,數(shù)字經(jīng)濟(jì)時(shí)代加速發(fā)展,數(shù)據(jù)作為一種關(guān)鍵的生產(chǎn)要素已經(jīng)滲透到了每一個(gè)領(lǐng)域當(dāng)中。如何更好的專業(yè)化處理數(shù)據(jù)并實(shí)現(xiàn)數(shù)據(jù)的增值成為了未來企業(yè)競(jìng)爭(zhēng)的重點(diǎn)。
數(shù)據(jù)的價(jià)值在于多源數(shù)據(jù)的融合共享,只有不同源數(shù)據(jù)更好的開放、流通、共享,才能更好的實(shí)現(xiàn)數(shù)據(jù)的“增值”,但是現(xiàn)階段大部分?jǐn)?shù)據(jù)都獨(dú)立保存于各個(gè)政府部門、企業(yè),這些數(shù)據(jù)互不共享,形成了一個(gè)個(gè)數(shù)據(jù)孤島。
再加上全球互聯(lián)網(wǎng)信息技術(shù)的快速發(fā)展,數(shù)據(jù)的頻繁跨境、跨系統(tǒng)、跨生態(tài)交互已成為常態(tài),隨之而來的數(shù)據(jù)泄露、隱私侵犯、隱私追蹤溯源難等問題也越來越嚴(yán)重。
雖然區(qū)塊鏈、人工智能、云計(jì)算等技術(shù)逐步成熟,數(shù)據(jù)的采集、存儲(chǔ)、處理等問題都得到了很好的解決,但數(shù)據(jù)安全開放共享卻至今都未出現(xiàn)一套成熟的解決方案,在數(shù)字經(jīng)濟(jì)發(fā)展過程中,互聯(lián)網(wǎng)、教育、醫(yī)藥、能源等領(lǐng)域侵犯用戶隱私、大數(shù)據(jù)殺熟等問題層出不窮。
那么如何才能在數(shù)據(jù)隱私安全和數(shù)據(jù)開放共享之間找到合適的解決方法與平衡點(diǎn)呢?
其中一個(gè)答案是:隱私計(jì)算。
圖片
隱私計(jì)算(Privacy compute)是指在保護(hù)數(shù)據(jù)本身不對(duì)外泄露的前提下實(shí)現(xiàn)數(shù)據(jù)分析計(jì)算的技術(shù)集合,是面向隱私信息全生命周期保護(hù)的計(jì)算理論和方法,是隱私信息的所有權(quán)、管理權(quán)和使用權(quán)分離時(shí)隱私度量、隱私泄漏代價(jià)、隱私保護(hù)與隱私分析復(fù)雜性的可計(jì)算模型與公理化系統(tǒng)。
隱私計(jì)算良好解決了數(shù)據(jù)在計(jì)算環(huán)節(jié)隱私性問題,為區(qū)塊鏈、人工智能、云計(jì)算等技術(shù)的大數(shù)據(jù)應(yīng)用提供了隱私性和數(shù)權(quán)歸屬的基礎(chǔ)。
簡(jiǎn)而言之,數(shù)據(jù)平臺(tái)可以使用隱私計(jì)算技術(shù)對(duì)多源數(shù)據(jù)進(jìn)行安全共享,使數(shù)據(jù)可用而不可見。這樣既可以對(duì)數(shù)據(jù)的隱私性進(jìn)行保護(hù),又可以安全共享給其他使用方,從而產(chǎn)生更大價(jià)值。
隱私計(jì)算
隱私計(jì)算最常使用的技術(shù)有安全多方計(jì)算技術(shù)(Secure Multi-Party Computation,MPC)和可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE)兩種。下文著重對(duì)MPC技術(shù)進(jìn)行介紹,TEE將在下篇文章為大家分析。
安全多方計(jì)算可以在沒有可信第三方的情況下,安全地計(jì)算一個(gè)約定函數(shù)。這項(xiàng)技術(shù)能夠在不泄露數(shù)據(jù)的情況下,對(duì)多方數(shù)據(jù)進(jìn)行聯(lián)合計(jì)算并得到計(jì)算結(jié)果,最終實(shí)現(xiàn)數(shù)據(jù)的所有權(quán)和數(shù)據(jù)使用權(quán)的分離,被認(rèn)為是解決企業(yè)數(shù)據(jù)協(xié)同計(jì)算過程中的數(shù)據(jù)安全和隱私保護(hù)問題的方案之一。
1982年,姚期智院士提出了一個(gè)“姚氏百萬富翁”問題:兩個(gè)富翁想知道誰的財(cái)產(chǎn)更多,但是他們都不想公布自己到底有多少財(cái)產(chǎn),如何在不借助可信第三方的情況下,證明誰更有錢。在這個(gè)經(jīng)典問題之下,誕生了安全多方計(jì)算這一技術(shù)。
目前,安全多方計(jì)算技術(shù)的實(shí)現(xiàn)方案主要包括同態(tài)加密(Homomorphic Encryption,HE)、不經(jīng)意傳輸(Oblivious Transfer,OT)、混淆電路(Garbled Circuit,GC)、秘密共享(Secret Sharing,SS)等。
同態(tài)加密
上圖為同態(tài)加密結(jié)構(gòu)圖,同態(tài)加密是基于數(shù)學(xué)難題的計(jì)算復(fù)雜性理論的密碼學(xué)技術(shù)。同態(tài)加密可以直接對(duì)加密數(shù)據(jù)進(jìn)行處理,對(duì)密文的計(jì)算結(jié)果與直接對(duì)明文進(jìn)行計(jì)算的結(jié)果一致,由于這個(gè)良好的性質(zhì),可以委托第三方對(duì)數(shù)據(jù)進(jìn)行處理而不泄露信息。
按照支持密文運(yùn)算的種類和次數(shù),可以分為部分同態(tài)加密(Partially Homomorphic Encryption)、類同態(tài)加密(Somewhat Homomorphic Encryption)和完全同態(tài)加密(Fully Homomorphic Encryption)。
全同態(tài)加密是指同時(shí)滿足加同態(tài)和乘同態(tài)性質(zhì),可以對(duì)密文進(jìn)行任意形式的計(jì)算,例如進(jìn)行任意多次加和乘運(yùn)算的加密函數(shù)。
用數(shù)學(xué)公式來表達(dá):
Dec(f(En(m1),En(m2),…,En(mk)))=f(m1,m2,…,mk)
或?qū)懗桑?/p>
f(En(m1),En(m2),…,En(mk))=En(f(m1,m2,…,mk))
其中En是加密運(yùn)算,Dec是解密運(yùn)算。如果f是任意函數(shù),稱為全同態(tài)加密。
全同態(tài)計(jì)算開銷極大,實(shí)際應(yīng)用較少。
部分同態(tài)加密只支持同態(tài)加法運(yùn)算和數(shù)乘運(yùn)算,但部分同態(tài)加密開銷較小,容易實(shí)現(xiàn),在實(shí)際中應(yīng)用較多。
目前,同態(tài)加密算法已經(jīng)在區(qū)塊鏈+數(shù)據(jù)隱私計(jì)算的場(chǎng)景實(shí)現(xiàn)了初步落地應(yīng)用。
不經(jīng)意傳輸(OT)
不經(jīng)意傳輸(Oblivious Transfer,OT)是一種密碼學(xué)協(xié)議,被廣泛應(yīng)用于多方安全計(jì)算等領(lǐng)域。
OT允許通信雙方使用一種選擇模糊化的方式傳送消息,使得服務(wù)的接收方以不經(jīng)意的方式得到服務(wù)發(fā)送方輸入的某些消息,這樣就可以保護(hù)接收方的隱私不被發(fā)送方所知。
以較為實(shí)用的2選1不經(jīng)意傳輸方案(1-out-of-2 Oblivious Transfer)為例,Alice發(fā)兩條信息(m1,m2)給Bob,Bob提供一個(gè)輸入,并根據(jù)輸入獲得輸出信息,在協(xié)議結(jié)束后,B得到了自己想要的那條信息,而Alice并不知道Bob最終得到的是哪條信息。Bob除了得到的那條信息,對(duì)其他信息也一無所知。
所有可計(jì)算問題都可以轉(zhuǎn)換為不同的電路,例如加法電路,比較電路,乘法電路等。而電路是由一個(gè)個(gè)門(gate)組成,例如與門,非門,或門,與非門等。
混淆電路
混淆電路通過將計(jì)算任務(wù)轉(zhuǎn)化為布爾電路,并對(duì)真值表進(jìn)行加密打亂等混淆操作以保護(hù)輸入隱私。
如上圖所示,Alice和Bob要進(jìn)行多方計(jì)算,首先需要構(gòu)建一個(gè)由與門,或門,非門組成的布爾邏輯電路,每個(gè)門都包括輸入線,輸出線,再通過不經(jīng)意傳輸?shù)燃夹g(shù)來掩蓋信息,最后在不泄露隱私的前提下計(jì)算出結(jié)果。
秘密共享
秘密共享是在一組參與者中共享秘密的技術(shù),它主要用于保護(hù)重要信息,防止信息被丟失、被破壞、被篡改。簡(jiǎn)單來說,秘密共享將秘密以適當(dāng)?shù)姆绞讲鸱郑鸱趾蟮拿恳粋€(gè)模塊由不同的參與者管理,單個(gè)參與者無法恢復(fù)秘密信息,只有若干個(gè)參與者一同協(xié)作才能恢復(fù)秘密消息。
在秘密共享中,當(dāng)某些秘密模塊丟失或損壞時(shí),參與者利用其它的秘密模塊仍能夠獲得秘密,提高了系統(tǒng)的可靠性。
總結(jié)
目前,安全多方計(jì)算已經(jīng)在不同行業(yè)初步應(yīng)用,例如銀行風(fēng)控、聯(lián)合營(yíng)銷,但是受限于效率、性能等問題,該技術(shù)依然面臨挑戰(zhàn),對(duì)海量數(shù)據(jù)共享場(chǎng)景的支撐能力還有待提升。不過隨著未來技術(shù)優(yōu)化、軟硬件設(shè)計(jì)創(chuàng)新、國(guó)家政策支持,安全多方計(jì)算應(yīng)用的場(chǎng)景將會(huì)更加豐富。