智能技術(shù)的引入是一個既令人興奮又令人恐懼的主題。人工智能,機器學習和深度學習三位一體的結(jié)合,將有潛力實現(xiàn)人類大腦無法達到的速度分析數(shù)據(jù)。
由此產(chǎn)生的見解可能會對社會產(chǎn)生深遠的有益影響,這一點毫無置疑。但是,圍繞如何使數(shù)據(jù)在開放和共享的同時能夠保持隱私和安全性?
英特爾公司AI產(chǎn)品高級總監(jiān)Casimir Wierzynski說:“隱私和AI的這種交匯處是英特爾以數(shù)據(jù)為中心的使命的核心。您如何同時尊重基礎(chǔ)數(shù)據(jù)的隱私和安全性?同時還能訓(xùn)練和使用AI系統(tǒng)?”
英特爾公司AI產(chǎn)品高級總監(jiān)在舊金山舉行的RSA大會上分享了了如何通過共享機器學習模型的數(shù)據(jù)來討論安全性和隱私問題,以及英特爾在同態(tài)加密方面的研究如何解決該問題。
分享或不分享
機器學習的一個問題是它幾乎總是多方交互。一方擁有數(shù)據(jù),而另一方擁有模型,而該模型又在另一方的硬件上運行。這使得共享數(shù)據(jù)成為一種信任行為-這不是一個好的計劃,因為數(shù)據(jù)中可能包含敏感的個人信息,這對于犯罪分子來說是金礦。但是,如果不共享數(shù)據(jù),機器學習的希望就無法實現(xiàn)。
衛(wèi)生保健部門就是一個例子。“您有多家擁有患者數(shù)據(jù)的醫(yī)院,” Wierzynski說。“如果以某種方式,他們可以將所有數(shù)據(jù)匯總在一起,您將獲得更有效的模型,更好的患者預(yù)后。但是出于非常好的隱私原因,不允許他們這樣做。”
他說,答案在于一種稱為同態(tài)加密的技術(shù)。這種前沿技術(shù)允許共享和訪問加密數(shù)據(jù)以進行分析。所有結(jié)果也會被加密,只有數(shù)據(jù)的實際所有者才具有加密密鑰。
同態(tài)加密的發(fā)明者Craig Gentry博士將其解釋為就像一個鎖著的手套箱。任何人都可以把手戴在手套上來操縱盒子里面的東西,但是只有盒子的所有者才能解鎖它并檢索結(jié)果。
“這看起來像魔術(shù),”維爾森斯基說。“有了這項功能,您就可以啟用各種新的用例,而第三方無法對您的敏感數(shù)據(jù)采取任何行動,而不會以任何方式公開這些新用例。”
為數(shù)據(jù)科學家提供一鍵式加密
不幸的是,大多數(shù)數(shù)據(jù)科學家也不是密碼學專家。因此,英特爾創(chuàng)造了一種使同態(tài)加密民主化的產(chǎn)品,開源軟件包稱為HE Transformer ,HE代表同態(tài)加密。
Wierzynski說:“它使數(shù)據(jù)科學家可以用Python或以前使用過的方法進行常規(guī)數(shù)據(jù)科學。” “但是后來他們輕按了開關(guān),突然之間他們的模型能夠在加密數(shù)據(jù)上運行。如果您知道,只要[個人]數(shù)據(jù)在四處移動并且人們正在對其進行操作,但是數(shù)據(jù)一直在始終保持加密狀態(tài),而不僅僅是在傳輸過程中,這將提供更高的舒適度。”