早前,Intel官方宣布和微軟合作簽下了美國(guó)國(guó)防高級(jí)研究局(DARPA)的同態(tài)加密研究項(xiàng)目。DARPA資助的同態(tài)加密項(xiàng)目全稱(chēng)是“數(shù)字環(huán)境中的數(shù)據(jù)安全”(data protection in virtual environments),該項(xiàng)目目前總共資助金額預(yù)計(jì)在五千萬(wàn)美元左右,其中Intel主要負(fù)責(zé)研發(fā)用于同態(tài)加密的加速芯片,和微軟則負(fù)責(zé)將Intel的加速硬件整合進(jìn)其云服務(wù)中,從而打通整個(gè)硬件、軟件和應(yīng)用的生態(tài)。Intel官方宣布,這個(gè)項(xiàng)目的目標(biāo)是通過(guò)加速芯片把同態(tài)加密的硬件執(zhí)行速度提升10000倍以上。
這一新聞顯示了美國(guó)整體對(duì)于同態(tài)加密這一技術(shù)的重視,國(guó)家層面的DARPA以巨資支持同態(tài)加密技術(shù),而科技巨頭如Intel和微軟則在積極研發(fā)和布局這一市場(chǎng)。本文我們將為大家分析同態(tài)加密技術(shù)的應(yīng)用前景,其中的芯片技術(shù)以及未來(lái)可能的芯片市場(chǎng)競(jìng)爭(zhēng)格局分析。
什么是同態(tài)加密?
同態(tài)加密(Homomorphic Encryption)對(duì)于從事芯片行業(yè)的朋友們或許比較陌生,但是相關(guān)理論在密碼學(xué)領(lǐng)域已經(jīng)有了多年的歷史。
我們首先來(lái)看一下傳統(tǒng)的加密技術(shù)。在傳統(tǒng)的加密方案中,用戶(hù)A將自己的數(shù)據(jù)加密,并將該加密的數(shù)據(jù)通過(guò)信道傳輸給授權(quán)用戶(hù)B,用戶(hù)B使用秘鑰解密用戶(hù)A傳給他/她的加密數(shù)據(jù),以完成整個(gè)過(guò)程。在這個(gè)過(guò)程中,除了用戶(hù)A和用戶(hù)B之外,沒(méi)有第三方(包括提供數(shù)據(jù)傳輸服務(wù)的IT服務(wù)提供商)可以使用合法手段解密并看到用戶(hù)傳輸?shù)脑紨?shù)據(jù)。
隨著世界各國(guó)對(duì)于用戶(hù)數(shù)據(jù)隱私方面的立法規(guī)范工作逐步展開(kāi),用戶(hù)數(shù)據(jù)加密得到了越來(lái)越多的重視,例如不少APP已經(jīng)提供了端到端加密的信息傳輸,即除了用戶(hù)之外即使是APP運(yùn)營(yíng)商也無(wú)法解密看到用戶(hù)傳輸信息的明文。然而,用戶(hù)信息加密和目前基于大數(shù)據(jù)和人工智能的各種服務(wù)是一對(duì)矛盾。舉例來(lái)說(shuō),目前不少智能攝像頭提供基于人工智能的居家安全監(jiān)測(cè),在人工智能模型檢測(cè)到異常情況時(shí)會(huì)給用戶(hù)推送通知。如果用戶(hù)數(shù)據(jù)完全加密,那么使用傳統(tǒng)的加密技術(shù),這種需要使用用戶(hù)數(shù)據(jù)的人工智能服務(wù)就無(wú)法實(shí)現(xiàn)了,因?yàn)橛脩?hù)加密的數(shù)據(jù)第三方是不能合法解密,那么自然也就無(wú)法將其視頻送到人工智能模型以檢測(cè)異常。
同態(tài)加密技術(shù)則能解決這一對(duì)矛盾。使用同態(tài)加密技術(shù),第三方可以在加密數(shù)據(jù)上直接做運(yùn)算,并且將加密的計(jì)算結(jié)果直接返回給用戶(hù),而用戶(hù)則可以通過(guò)解密獲得計(jì)算結(jié)果。在這整個(gè)過(guò)程中,第三方都不會(huì)看到加密數(shù)據(jù)的明文,甚至計(jì)算結(jié)果對(duì)于第三方來(lái)說(shuō)也是加密的,這樣就解決了大數(shù)據(jù),人工智能和用戶(hù)隱私之間的矛盾?;氐街暗娜斯ぶ悄茏鼍蛹覚z測(cè)的例子上,從用戶(hù)側(cè)來(lái)說(shuō),雖然居家安全檢測(cè)對(duì)用戶(hù)有價(jià)值,但是用戶(hù)其實(shí)并不希望把自己家里的視頻監(jiān)控一直上傳到智能攝像頭的服務(wù)器端,因?yàn)榧依锏囊曨l監(jiān)控錄像屬于用戶(hù)的隱私。通過(guò)同態(tài)加密,用戶(hù)可以將加密的視頻(而不是原始視頻)上傳到服務(wù)器端,而在服務(wù)器端人工智能提供商可以以同態(tài)加密的方式在加密視頻上直接跑人工智能算法,并將加密的結(jié)果返回給用戶(hù),用戶(hù)只需解密結(jié)果即可。在這個(gè)過(guò)程中,人工智能服務(wù)商在不看到用戶(hù)家庭監(jiān)控原始視頻的情況下仍然能夠完成異常檢測(cè),這樣一來(lái)用戶(hù)即享受到了人工智能服務(wù),又不必?fù)?dān)心隱私泄露。
在用戶(hù)隱私越來(lái)越受到重視的今天,同態(tài)加密技術(shù)在大數(shù)據(jù)和人工智能領(lǐng)域?qū)缪菰絹?lái)越重要的角色,而正如我們所看到的,芯片將會(huì)在同態(tài)加密領(lǐng)域起到核心賦能的作用。
加速芯片是同態(tài)加密的基礎(chǔ)
同態(tài)加密的基礎(chǔ)密碼學(xué)理論目前已經(jīng)足夠成熟,而目前同態(tài)加密具體落地的一大瓶頸就是硬件算力,我們認(rèn)為解決這個(gè)瓶頸需要設(shè)計(jì)專(zhuān)用的加速芯片,而這也正對(duì)應(yīng)了上周Intel高調(diào)官宣同態(tài)加密加速芯片的消息。
同態(tài)加密需要什么樣的加速芯片?首先,從最底層的運(yùn)算來(lái)看,同態(tài)加密運(yùn)算中主要的算子在常規(guī)的乘法和加法之外,還有移位(rotation)和NTT(number theoretic transform,可以認(rèn)為是傅里葉變換的一種推廣,也可以使用快速傅里葉變換算法)。根據(jù)紐約大學(xué)和哈佛大學(xué)在2020年發(fā)表的一項(xiàng)研究中,使用同態(tài)加密的ResNet-50神經(jīng)網(wǎng)絡(luò)計(jì)算中,移位和NTT需要的算力事實(shí)上遠(yuǎn)大于乘法和加法的算力需求,而另一方面,如果需要同態(tài)加密的ResNet-50執(zhí)行速度和未加密的ResNet-50一樣快,則這些算子的執(zhí)行速度需要提升4000-16000倍不等。因此,在算子層面,同態(tài)加密技術(shù)加速芯片首先需要能很好地支持和優(yōu)化移位、NTT等傳統(tǒng)CPU優(yōu)化不夠的算子,同時(shí)在另一個(gè)角度在執(zhí)行速度方面,則需要能實(shí)現(xiàn)大大超越傳統(tǒng)的CPU,其加速比在10000倍這個(gè)數(shù)量級(jí)。
此外,在算子層面之外,如果同態(tài)加密需要支持人工智能/神經(jīng)網(wǎng)絡(luò)這類(lèi)在基礎(chǔ)算法層需要大量計(jì)算且有大量并行計(jì)算機(jī)會(huì)的應(yīng)用,則加速芯片需要在算法層也能支持大規(guī)模并行計(jì)算。在這個(gè)方面,如何把基礎(chǔ)算法中的并行計(jì)算機(jī)會(huì)結(jié)合同態(tài)加密計(jì)算的特點(diǎn)進(jìn)行專(zhuān)門(mén)的優(yōu)化將會(huì)很大程度上決定整個(gè)加速芯片的整體性能,包括并行化優(yōu)化和流水線(xiàn)優(yōu)化等。從另一個(gè)角度來(lái)看這個(gè)問(wèn)題,則是神經(jīng)網(wǎng)絡(luò)本來(lái)已經(jīng)需要非常大的算力,而搭配同態(tài)加密則是對(duì)算力的需求又上了幾個(gè)數(shù)量級(jí),這也從另一個(gè)角度印證了同態(tài)加密+人工智能中加速芯片將扮演極其關(guān)鍵的角色。
最后,如何針對(duì)同態(tài)加密加速芯片設(shè)計(jì)一個(gè)好的軟件生態(tài)也是一個(gè)重要的課題。類(lèi)似CUDA在人工智能中起到的角色,一個(gè)高效率、兼容性好的編譯器和軟件生態(tài)也將是同態(tài)加密硬件能夠普及的關(guān)鍵。目前,微軟的SEAL系列同態(tài)加密軟件生態(tài)得到了大量應(yīng)用,而這次Intel選擇和微軟合作也可以說(shuō)是強(qiáng)強(qiáng)聯(lián)手,有望在同態(tài)加密軟硬件生態(tài)協(xié)同開(kāi)發(fā)起重要推動(dòng)作用。
同態(tài)加密芯片市場(chǎng)格局前瞻
我們認(rèn)為,未來(lái)針對(duì)同態(tài)加密的芯片市場(chǎng)主要是在云端,同態(tài)加密加速卡將作為服務(wù)器的一部分硬件得到部署。Intel作為服務(wù)器芯片市場(chǎng)的主導(dǎo)者,目前以其在同態(tài)加密領(lǐng)域的布局,未來(lái)有可能會(huì)成為同態(tài)加密加速芯片的領(lǐng)導(dǎo)者和推動(dòng)者之一。
除了Intel主推的專(zhuān)用加速芯片方案之外,我們認(rèn)為以Xilinx為代表的FPGA方案在同態(tài)加密加速市場(chǎng)也有機(jī)會(huì)。FPGA的主要優(yōu)勢(shì)在于其可編程性強(qiáng),可以靈活適配各種應(yīng)用,其機(jī)會(huì)在于將同態(tài)加密和各類(lèi)長(zhǎng)尾應(yīng)用(例如視頻編解碼)等結(jié)合到一起,從而覆蓋專(zhuān)用加速器難以覆蓋的應(yīng)用。
此外,Nvidia也可能加入同態(tài)加密的戰(zhàn)局。同態(tài)加密從宏觀(guān)上看很適合GPU的SIMD架構(gòu),但是目前GPU對(duì)于同態(tài)加密中的一些算子支持不夠完善,同時(shí)在軟件生態(tài)上也沒(méi)有發(fā)力。但是,這些都可以作為新的設(shè)計(jì)特性加到下一代GPU中,從而實(shí)現(xiàn)GPU對(duì)于同態(tài)加密計(jì)算的支持。結(jié)合Nvidia本來(lái)已經(jīng)在人工智能領(lǐng)域的領(lǐng)導(dǎo)者地位,未來(lái)預(yù)計(jì)如果同態(tài)加密+人工智能得到普及的話(huà),Nvidia將會(huì)是在這個(gè)領(lǐng)域的重要廠(chǎng)商之一。同時(shí),同態(tài)加密+人工智能這對(duì)于中國(guó)目前如火如荼的GPU初創(chuàng)公司或許也是一個(gè)值得探索的領(lǐng)域。