本文來自安全牛。
隨著數(shù)據(jù)和AI技能在許多組織普及開來,各種信息數(shù)據(jù)需要更廣泛地共享,實(shí)現(xiàn)其價值的最大化利用。但這些數(shù)據(jù)中包含了很多個人隱私信息,需要在數(shù)據(jù)使用過程中得到有效的保護(hù)。智能產(chǎn)品和服務(wù)正面臨功能與隱私之間的取舍,這種取舍表現(xiàn)為“我們能從事數(shù)據(jù)科學(xué)的利用,也可以有效保護(hù)數(shù)據(jù)隱私,但兩者無法兼得”。
目前,行業(yè)監(jiān)管部門對個人隱私保護(hù)的要求非常嚴(yán)格,如果組織不能有效保護(hù)用戶的隱私數(shù)據(jù),會面臨后果嚴(yán)重的合規(guī)處罰。因此,組織需要在保護(hù)用戶隱私的前提下,使用個人數(shù)據(jù)來構(gòu)建智能產(chǎn)品。
新一代隱私保護(hù)技術(shù)盤點(diǎn)
在AI時代,確保個人隱私安全尤為重要也更加困難,因?yàn)榻柚?dāng)今的高速計算能力,連匿名化數(shù)據(jù)集都可以進(jìn)行逆向工程處理,從而識別個人身份,并推測其隱私活動信息。傳統(tǒng)的數(shù)據(jù)保護(hù)措施難以滿足隱私保護(hù)要求,組織需要盡快了解并應(yīng)用新一代隱私保護(hù)技術(shù)來保護(hù)智能化應(yīng)用的安全開展。
•聯(lián)邦學(xué)習(xí):該技術(shù)允許AI模型用保存在許多不同設(shè)備或服務(wù)器上的數(shù)據(jù)進(jìn)行訓(xùn)練。因此,無需從單一設(shè)備獲取數(shù)據(jù)或?qū)?shù)據(jù)進(jìn)行復(fù)制,模型就能開展學(xué)習(xí)。這可以被視為“共享模型,而不是共享數(shù)據(jù)”,創(chuàng)建一個從本地數(shù)據(jù)學(xué)習(xí)的全局模型。
•安全多方計算:該技術(shù)主要能夠?qū)崿F(xiàn)不同使用者能夠處理他們不想彼此共享的數(shù)據(jù)。它可以讓一組授權(quán)同意的使用者之間共享加密數(shù)據(jù),并允許他們處理由所有方的個人數(shù)據(jù)組成的數(shù)據(jù)集,確不用訪問數(shù)據(jù)所有者的原始數(shù)據(jù)。
•同態(tài)加密:該技術(shù)允許數(shù)據(jù)在加密后進(jìn)行處理利用。比如說,可以從可穿戴設(shè)備數(shù)據(jù)集找到關(guān)于關(guān)節(jié)炎患者的數(shù)據(jù),對其進(jìn)行運(yùn)算處理,基于群組級洞察力來創(chuàng)建實(shí)用模型,根本不需要解密個人記錄。同態(tài)加密越來越受歡迎,研究人員希望有一天可以針對加密后的數(shù)據(jù)執(zhí)行幾乎所有的應(yīng)用計算。
•可信執(zhí)行環(huán)境:這是一種硬件特性的隱私保護(hù)技術(shù),可在計算設(shè)備上創(chuàng)建安全區(qū),能夠單獨(dú)執(zhí)行某些批準(zhǔn)的功能。智能手機(jī)使用這種環(huán)境可以進(jìn)行用戶生物特征身份驗(yàn)證,也可以創(chuàng)建可信執(zhí)行環(huán)境,以便在個人數(shù)據(jù)上運(yùn)行AI模型,但是使用者確無法拿走該數(shù)據(jù)。
•差分隱私:即使建模者看不到原始數(shù)據(jù),不法分子仍有可能對模型的輸出進(jìn)行逆向工程處理以窺視個人身份。差分隱私有助于應(yīng)對這個問題,還有助于保持匿名性。它為數(shù)據(jù)添加隨機(jī)的干擾信息,這會破壞數(shù)據(jù)點(diǎn),但保留整個數(shù)據(jù)集的屬性。由于建模者知道這種隨機(jī)性,他們?nèi)钥梢詷?gòu)建準(zhǔn)確的的群組級模型,能可靠地預(yù)測。但是任何竊取數(shù)據(jù)的人不知道任何個人數(shù)據(jù)記錄是否準(zhǔn)確。
隱私保護(hù)技術(shù)的應(yīng)用
以上這些技術(shù)不僅僅是學(xué)術(shù)概念,它們已經(jīng)在實(shí)際工作中得到切實(shí)運(yùn)用。MELLODDY是一個由多家生命科學(xué)公司組成的行業(yè)聯(lián)盟,這些公司正在使用聯(lián)合學(xué)習(xí)來共享藥物發(fā)現(xiàn)數(shù)據(jù)。而最新的美國人口普查數(shù)據(jù)發(fā)布時,則采用了差分隱私技術(shù),以確保個人無法被識別身份,同時提供了匯總的人口數(shù)據(jù)。聯(lián)合國PETS(隱私增強(qiáng)技術(shù))實(shí)驗(yàn)室正在測試一系列上述技術(shù),旨在讓國家統(tǒng)計局、研究人員和公司企業(yè)能夠協(xié)作處理共享數(shù)據(jù)。
不過,在AI時代開展隱私保護(hù)工作并不容易,隱私保護(hù)技術(shù)的應(yīng)用也面臨很多挑戰(zhàn)。例如同態(tài)加密等技術(shù)是計算密集型技術(shù),對組織的計算能力有較高要求,而差分隱私在隱藏原始真實(shí)數(shù)據(jù)過程中,其準(zhǔn)確性在一些特定場景下會難以保證。
沒有哪一種技術(shù)是萬能的!組織在開展隱私保護(hù)工作中需要綜合考慮這些新技術(shù)的特點(diǎn),并結(jié)合實(shí)際使用場景,探索真正適合的隱私保護(hù)解決方案。
而且與所有數(shù)據(jù)項(xiàng)目一樣,好的隱私保護(hù)模型也同樣需要充分的底層數(shù)據(jù)支撐,隱私保護(hù)技術(shù)若要發(fā)揮實(shí)效,數(shù)據(jù)所有者需要采取良好的數(shù)據(jù)管理方法。由于一些建模者無法看到原始數(shù)據(jù),對數(shù)據(jù)進(jìn)行篩選以便處理匿名查詢顯得尤為重要。
最后,隱私保護(hù)技術(shù)不應(yīng)該是事后添加的,而應(yīng)該在業(yè)務(wù)系統(tǒng)開發(fā)過程中同步考慮。任何需要共享個人數(shù)據(jù)的程序都應(yīng)該采取隱私保護(hù)優(yōu)先的做法,先要考慮產(chǎn)品背后數(shù)據(jù)對隱私帶來的影響,并從一開始就添加合適的工具,這樣組織才能在保護(hù)用戶隱私的同時,獲得所需的洞察力。
穩(wěn)定可靠的隱私保護(hù)技術(shù)措施有助于說服客戶共享數(shù)據(jù),并合理兼顧尊重隱私和數(shù)據(jù)使用間的平衡。更廣泛、更深入、更具代表性的數(shù)據(jù)使組織能夠構(gòu)建更準(zhǔn)確、更通用、更實(shí)用的模型,從而支持智能化個性化的產(chǎn)品和服務(wù)。這么做非常重要,但也意味著必須保護(hù)和尊重與組織共享數(shù)據(jù)的用戶隱私安全。