提高數(shù)據(jù)庫(kù)安全性的11項(xiàng)技術(shù)

小二郎
數(shù)據(jù)庫(kù)中含有大量個(gè)人信息,甚至包含一些敏感信息,為管理這些數(shù)據(jù)的公司帶來了不少麻煩?,F(xiàn)在,復(fù)雜的工具和技術(shù)使得數(shù)據(jù)庫(kù)開發(fā)人員可以通過保持信息的私密性來整體提升數(shù)據(jù)庫(kù)的安全性。

數(shù)據(jù)庫(kù)不應(yīng)成為危及安全和隱私的“切入口”,以下技術(shù)可以幫助降低數(shù)據(jù)庫(kù)安全風(fēng)險(xiǎn)并確保合規(guī)性。

數(shù)據(jù)庫(kù)中含有大量個(gè)人信息,甚至包含一些敏感信息,為管理這些數(shù)據(jù)的公司帶來了不少麻煩?,F(xiàn)在,復(fù)雜的工具和技術(shù)使得數(shù)據(jù)庫(kù)開發(fā)人員可以通過保持信息的私密性來整體提升數(shù)據(jù)庫(kù)的安全性。

這些解決方案主要取決于對(duì)數(shù)學(xué)的巧妙應(yīng)用。例如,一些最簡(jiǎn)單的機(jī)制看起來只是現(xiàn)代版本的密碼,本質(zhì)上是經(jīng)典解碼輪的數(shù)字版本。其他更復(fù)雜的擴(kuò)展,也進(jìn)一步推動(dòng)數(shù)學(xué)提供更多的靈活性和功能性。許多在實(shí)驗(yàn)室中試驗(yàn)了幾十年的技術(shù)想法最終得到了研發(fā)和應(yīng)用,成為了現(xiàn)實(shí)。

這些算法正在成為鞏固業(yè)務(wù)關(guān)系和確保準(zhǔn)確“無欺詐”工作流程的基礎(chǔ)。這些方法使公司可以更輕松地向客戶提供個(gè)性化服務(wù),同時(shí)保護(hù)他們的隱私。此外,這些方法還能夠在不妨礙服務(wù)交付的情況下更好地遵守管理數(shù)據(jù)流的法規(guī)。

以下是讓數(shù)據(jù)庫(kù)變得更安全、更簡(jiǎn)單的11種工具和技術(shù):

1.基礎(chǔ)加密

有時(shí)候,最簡(jiǎn)單的解決方案就足夠了?,F(xiàn)代加密算法用一把鑰匙加密數(shù)據(jù),因此只有擁有鑰匙的人才能讀取數(shù)據(jù)。許多數(shù)據(jù)庫(kù)可以使用AES等標(biāo)準(zhǔn)加密數(shù)據(jù)。這些解決方案最能防止硬件丟失(也可能是被盜)的情況,因?yàn)槿绻麤]有正確的加密密鑰,數(shù)據(jù)仍然是安全的。

但是,這種基礎(chǔ)加密并非一勞永逸的方法。如果攻擊者能夠侵入計(jì)算機(jī),對(duì)稱加密算法對(duì)運(yùn)行中的計(jì)算機(jī)的保護(hù)程度也是有限的。攻擊者可以找到允許數(shù)據(jù)庫(kù)處理合法操作的相同密鑰。許多數(shù)據(jù)庫(kù)提供了對(duì)“靜止”信息進(jìn)行加密的選項(xiàng)。例如,Oracle將其選項(xiàng)稱為“透明數(shù)據(jù)加密(TDE)”,TDE可以對(duì)數(shù)據(jù)和日志文件進(jìn)行實(shí)時(shí)I/O加密和解密。

2.差分隱私

這種技術(shù)以不同的方式部署數(shù)學(xué)。它沒有將信息鎖定在數(shù)字保險(xiǎn)箱中,而是添加了精心調(diào)整的噪音量,以使其難以確定哪條記錄對(duì)應(yīng)哪個(gè)特定的數(shù)據(jù)個(gè)體。如果噪聲數(shù)值正常,那么便不會(huì)影響整體統(tǒng)計(jì)數(shù)據(jù),如平均值。也就是說,如果您從數(shù)據(jù)集中的年齡隨機(jī)增加或減少幾年,平均年齡將保持不變,但這樣一來可能很難通過年齡尋找到特定個(gè)人。

該解決方案的效用各不相同。最好將數(shù)據(jù)集發(fā)布給想要研究數(shù)據(jù)的不受信任的合作伙伴,通常是通過計(jì)算數(shù)據(jù)平均值和數(shù)據(jù)集的大小。在某種程度上來說,許多算法添加噪聲做得很好,因?yàn)樗麄儾粫?huì)扭曲許多聚合的統(tǒng)計(jì)數(shù)據(jù)。目前,了解哪些機(jī)器學(xué)習(xí)算法仍然可以很好地處理失真位是一個(gè)非?;钴S的研究領(lǐng)域。

微軟和谷歌提供將算法與數(shù)據(jù)存儲(chǔ)的機(jī)器學(xué)習(xí)算法集成工具。例如,谷歌的Privacy-On-Beam將噪聲添加機(jī)制與Apache Beam管道處理相結(jié)合。

3.哈希函數(shù)

這些計(jì)算有時(shí)被稱為“消息驗(yàn)證代碼”或“單向函數(shù)”,它將大文件歸結(jié)為較小的數(shù)字,從而使其實(shí)際上幾乎無法逆轉(zhuǎn)。給定一個(gè)特定的結(jié)果或代碼,找到將生成該特定代碼的文件將花費(fèi)太長(zhǎng)時(shí)間。

哈希函數(shù)是區(qū)塊鏈的重要組成部分,它以一種可跟蹤和識(shí)別篡改的方式將它們應(yīng)用于數(shù)據(jù)的所有更新中。這可以防止加密貨幣交易中的欺詐行為,并且許多人正在將這些技術(shù)應(yīng)用于需要確保數(shù)據(jù)一致的其他數(shù)據(jù)庫(kù)。添加哈希函數(shù)可以幫助企業(yè)應(yīng)對(duì)數(shù)據(jù)合規(guī)性挑戰(zhàn)。

美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)的安全散列算法(SHA)是廣泛使用的標(biāo)準(zhǔn)集合。一些早期版本(如SHA-0和SHA-1)具有已知的漏洞,但較新的版本(如SHA-2和SHA-3)則被認(rèn)為非常安全。

4.數(shù)字簽名

像RSA或DSA這樣的數(shù)字簽名算法算是更為復(fù)雜的計(jì)算,它將散列函數(shù)的篡改檢測(cè)特性與帶有認(rèn)證信息的特定個(gè)人或機(jī)構(gòu)相結(jié)合。它們依賴一個(gè)只有責(zé)任方知道的秘密密鑰。例如,加密貨幣將財(cái)富的所有權(quán)與知道正確密鑰的人聯(lián)系起來。跟蹤個(gè)人責(zé)任的數(shù)據(jù)庫(kù)可以包括驗(yàn)證特定交易的數(shù)字簽名。

5.SNARK

簡(jiǎn)明的非交互式知識(shí)論證(SNARK)是一種更為復(fù)雜的數(shù)字簽名版本,可以證明復(fù)雜的個(gè)人信息而不會(huì)泄露信息本身。這種技巧依賴于更復(fù)雜的數(shù)學(xué),有時(shí)被稱為“零知識(shí)證明”(ZKP)。

包含SNARK和其他類似證明的數(shù)據(jù)庫(kù)可以保護(hù)用戶的隱私,同時(shí)確保自己合規(guī)性。例如,一個(gè)非常簡(jiǎn)單的例子可能就是數(shù)字駕駛執(zhí)照,它可以證明一個(gè)人的年齡能夠飲酒而又不會(huì)透露他們具體的出生日期。一些人正在研究將該技術(shù)應(yīng)用于疫苗護(hù)照。

SNARK和其他非交互式證明同樣屬于研究熱門。使用各種編程語言的數(shù)十種算法實(shí)現(xiàn)也為新項(xiàng)目奠定了良好的基礎(chǔ)。

6.同態(tài)加密

處理使用傳統(tǒng)加密算法鎖定的數(shù)據(jù)的唯一方法是對(duì)其進(jìn)行解密,這個(gè)過程可以將其暴露給任何有權(quán)訪問計(jì)算機(jī)進(jìn)行工作的人。同態(tài)加密算法旨在使對(duì)加密信息進(jìn)行計(jì)算而無需對(duì)其進(jìn)行解密成為可能。最簡(jiǎn)單的算法允許進(jìn)行一次算術(shù)運(yùn)算,例如將兩個(gè)加密數(shù)字相加。更復(fù)雜的算法可以進(jìn)行任意計(jì)算,但速度通常要慢得多。為特定問題尋找最有效的方法也是一個(gè)熱門的研究領(lǐng)域。

作為該領(lǐng)域研究的先驅(qū)之一,IBM發(fā)布了一個(gè)工具包,用于將其同態(tài)加密與適用于iOS和MacOS的應(yīng)用程序集成。

7.“聯(lián)邦”處理

一些開發(fā)人員將他們的數(shù)據(jù)集拆分成更小的部分,有時(shí)甚至出奇得小,然后將它們分發(fā)到許多獨(dú)立的計(jì)算機(jī)中。有時(shí)這些位置會(huì)被打亂,因此無法預(yù)測(cè)哪臺(tái)計(jì)算機(jī)將保存哪條記錄。該解決方案主要用于軟件包,這些軟件包旨在通過并行運(yùn)行搜索或分析算法來加速所謂的大數(shù)據(jù)工作。最初的目的是速度,但也可能導(dǎo)致增加攻擊彈性的副作用。

8.全分布式數(shù)據(jù)庫(kù)

如果將一個(gè)數(shù)據(jù)集拆分成幾塊可以保護(hù)隱私,那么為什么不是十億塊或更多塊呢?更常見的解決方案是將數(shù)據(jù)直接存儲(chǔ)在創(chuàng)建和使用的位置。用戶的智能手機(jī)通常具有大量額外的計(jì)算力和存儲(chǔ)空間。如果幾乎不需要集中分析和處理功能,那么避免將其傳送到云服務(wù)器處理速度會(huì)更快、更具成本效益。

例如,許多瀏覽器支持復(fù)雜數(shù)據(jù)結(jié)構(gòu)的本地存儲(chǔ)。W3C標(biāo)準(zhǔn)包括用于具有鍵和值的文檔樣式模型的本地存儲(chǔ)以及用于更多關(guān)系模型的索引版本。

9.合成數(shù)據(jù)

一些研究人員正在通過隨機(jī)生成新值來創(chuàng)建純合成的數(shù)據(jù)集,但其方式遵循相同的模式并且在統(tǒng)計(jì)上基本相同。例如,一個(gè)名為RTI的研究智囊團(tuán)創(chuàng)建了2010年美國(guó)人口普查數(shù)據(jù)的一個(gè)副本,其中包含隨機(jī)住址的隨機(jī)人群。這些人完全是虛構(gòu)的,但他們的家庭住址和個(gè)人信息被選擇為具有與真實(shí)值相同的基本統(tǒng)計(jì)資料。在許多情況下,研究人員可以測(cè)試算法生成與處理真實(shí)數(shù)據(jù)一樣準(zhǔn)確的解決方案。

10.中介和代理人

一些研究人員正在構(gòu)建工具來限制數(shù)據(jù)收集,并在存儲(chǔ)數(shù)據(jù)之前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。例如,Mozilla的Rally會(huì)跟蹤想要研究互聯(lián)網(wǎng)信息流的研究人員的瀏覽習(xí)慣。它會(huì)在調(diào)查期間安裝一個(gè)特殊的插件,然后在最后將其刪除。該工具將人群的關(guān)系正式化并強(qiáng)制執(zhí)行收集和聚合的規(guī)則。

11.無數(shù)據(jù)

無狀態(tài)計(jì)算是大部分網(wǎng)絡(luò)的基礎(chǔ),當(dāng)以盡可能少的記錄保存方式重新構(gòu)建工作時(shí),許多高效驅(qū)動(dòng)器都能夠發(fā)揮效用。在某些極端情況下,如果合規(guī)性允許,并且用戶愿意接受極少(甚至沒有)得個(gè)性化服務(wù)時(shí),刪除數(shù)據(jù)庫(kù)可以最大程度地保護(hù)用戶隱私。

本文翻譯自:https://www.csoonline.com/article/3623814/11-technologies-improving-database-security.html

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論