數(shù)據(jù)脫敏(Data Masking),又稱數(shù)據(jù)漂白、數(shù)據(jù)去隱私化或數(shù)據(jù)變形。數(shù)據(jù)脫敏的定義為:指對(duì)某些敏感信息通過(guò)脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù) 的可靠保護(hù)。這樣,就可以在開(kāi)發(fā)、測(cè)試和其它非生產(chǎn)環(huán)境以及外包環(huán)境中安全地使用脫敏后的真實(shí)數(shù)據(jù)集。
敏感數(shù)據(jù),又稱隱私數(shù)據(jù),常見(jiàn)的敏感數(shù)據(jù)有: 姓名、身份證號(hào)碼、地址、電話號(hào)碼、銀行賬號(hào)、郵箱地址、所屬城市、郵編、密碼類 ( 如賬戶查詢密碼、取款密碼、登錄密碼等 )、組織機(jī)構(gòu)名稱、營(yíng)業(yè)執(zhí)照號(hào)碼、銀行帳號(hào)、交易日期、交易金額等。
隨著大數(shù)據(jù)時(shí)代的到來(lái),大數(shù)據(jù)商業(yè)價(jià)值的挖掘,用戶的精準(zhǔn)定位,大數(shù)據(jù)中蘊(yùn)藏的巨大商業(yè)價(jià)值被逐步挖掘出來(lái),但是同時(shí)也帶來(lái)了巨大的挑戰(zhàn)--個(gè)人隱私信息 的保護(hù)。個(gè)人信息與個(gè)人行為(比如位置信息、消費(fèi)行為、網(wǎng)絡(luò)訪問(wèn)行為)等,這些都是人的隱私,也是我們所關(guān)注的一類敏感信息,在大數(shù)據(jù)價(jià)值挖掘的基礎(chǔ)上如何保護(hù)人的隱私信息,也將是數(shù)據(jù)脫敏必須解決的難題。對(duì)于企業(yè)而言,數(shù)據(jù)脫敏也尤為重要。
企業(yè)對(duì)脫敏的需求:
“數(shù)據(jù)變現(xiàn)”的需要——數(shù)據(jù)版權(quán)及隱私保護(hù)
“內(nèi)部限權(quán)”的需要——即使企業(yè)內(nèi)部,數(shù)據(jù)也需要授權(quán)的訪問(wèn),典型場(chǎng)景:財(cái)務(wù),業(yè)務(wù),支持部門
“數(shù)據(jù)外測(cè)”的需要——工信部下達(dá)了《電信和互聯(lián)網(wǎng)用戶個(gè)人信息保護(hù)規(guī)定》,對(duì)個(gè)人隱私信息保護(hù)做了詳細(xì)要求和規(guī)定
脫敏規(guī)則,一般的脫敏規(guī)則分類為可恢復(fù)與不可恢復(fù)兩類。
可恢復(fù)類,指脫敏后的數(shù)據(jù)可以通過(guò)一定的方式,可以恢復(fù)成原來(lái)的敏感數(shù)據(jù),此類脫敏規(guī)則主要指各類加解密算法規(guī)則。
不可恢復(fù)類,指脫敏后的數(shù)據(jù)被脫敏的部分使用任何方式都不能恢復(fù)出。一般可分為替換算法和生成算法兩大類。替換算法即將需要脫敏的部分使用定義好的字符或字符串替換,生成類算法則更復(fù)雜一些,要求脫敏后的數(shù)據(jù)符合邏輯規(guī)則,即是“看起來(lái)很真實(shí)的假數(shù)據(jù)”。
使用環(huán)境,主要指脫敏之后的數(shù)據(jù)在哪些環(huán)境中使用。普遍按照生產(chǎn)環(huán)境和非生產(chǎn)環(huán)境(開(kāi)發(fā)、測(cè)試、外包、數(shù)據(jù)分析等)進(jìn)行劃分。
在最近一期的Gartner關(guān)于數(shù)據(jù)脫敏的報(bào)告(Magic Quadrant for Data Masking Technology-2014年12月)中根據(jù)數(shù)據(jù)脫敏產(chǎn)品應(yīng)用場(chǎng)景的將數(shù)據(jù)脫敏劃分為靜態(tài)數(shù)據(jù)脫敏(static data masking[SDM])和動(dòng)態(tài)數(shù)據(jù)脫敏(dynamic data masking[DDM])。
靜態(tài)數(shù)據(jù)脫敏(SDM)與動(dòng)態(tài)數(shù)據(jù)脫敏(DDM)主要的區(qū)別是:是否在使用敏感數(shù)據(jù)當(dāng)時(shí)進(jìn)行脫敏。
靜態(tài)數(shù)據(jù)脫敏(SDM)一般用在非生產(chǎn)環(huán)境,在敏感數(shù)據(jù)從生產(chǎn)環(huán)境脫敏完畢之后再在非生產(chǎn)環(huán)境使用,一般用于解決測(cè)試、開(kāi)發(fā)庫(kù)需要生產(chǎn)庫(kù)的數(shù)據(jù)量與數(shù)據(jù)間的關(guān)聯(lián),以排查問(wèn)題或進(jìn)行數(shù)據(jù)分析等,但又不能將敏感數(shù)據(jù)存儲(chǔ)于非生產(chǎn)環(huán)境的問(wèn)題。
動(dòng)態(tài)數(shù)據(jù)脫敏(DDM)一般用在生產(chǎn)環(huán)境,在訪問(wèn)敏感數(shù)據(jù)當(dāng)時(shí)進(jìn)行脫敏,一般用來(lái)解決在生產(chǎn)環(huán)境需要根據(jù)不同情況對(duì)同一敏感數(shù)據(jù)讀取時(shí)需要進(jìn)行不同級(jí)別脫敏的問(wèn)題。
靜態(tài)脫敏應(yīng)用場(chǎng)景:
1、測(cè)試、開(kāi)發(fā)、培訓(xùn)
靜態(tài)脫敏是將數(shù)據(jù)抽取進(jìn)行脫敏處理后,下發(fā)至測(cè)試庫(kù)。開(kāi)發(fā)、測(cè)試、培訓(xùn)、分析人員可以隨意取用測(cè)試數(shù)據(jù),并進(jìn)行讀寫操作,脫敏后的數(shù)據(jù)與生產(chǎn)環(huán)境隔離,滿足業(yè)務(wù)需要的同時(shí)保障生產(chǎn)數(shù)據(jù)庫(kù)的安全。
2、數(shù)據(jù)共享
企業(yè)需要根據(jù)不同的脫敏策略把數(shù)據(jù)共享給其它企業(yè)。
動(dòng)態(tài)脫敏應(yīng)用場(chǎng)景:
1、業(yè)務(wù)脫敏
一般情況,應(yīng)用系統(tǒng)本身會(huì)根據(jù)用戶的權(quán)限對(duì)數(shù)據(jù)進(jìn)行處理,對(duì)于遺留系統(tǒng)(舊系統(tǒng)無(wú)法再作升級(jí)改造)以及開(kāi)發(fā)時(shí)未考慮《網(wǎng)絡(luò)安全法》中要求的個(gè)人隱私保護(hù)問(wèn)題,如若重新更改代碼過(guò)于復(fù)雜,只能依賴于外部技術(shù)實(shí)現(xiàn)數(shù)據(jù)的隱私保護(hù),這個(gè)時(shí)候也需要使用動(dòng)態(tài)脫敏技術(shù)。
2、運(yùn)維脫敏
運(yùn)維人員擁有的是管理員帳號(hào)DBA賬號(hào),但業(yè)務(wù)系統(tǒng)的數(shù)據(jù)是屬于業(yè)務(wù)單位而不是運(yùn)維部門。從職責(zé)分離的原則上,如何實(shí)現(xiàn)既允許運(yùn)維人員訪問(wèn)業(yè)務(wù)生產(chǎn)數(shù)據(jù)庫(kù)又不能讓他們看到敏感數(shù)據(jù)。
3、數(shù)據(jù)交換脫敏
業(yè)務(wù)系統(tǒng)與業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)訪問(wèn)(稱作數(shù)據(jù)交換更合適)。在滿足隱私保護(hù)時(shí)需要對(duì)交換的數(shù)據(jù)進(jìn)行脫敏處理,但又不像傳統(tǒng)的靜態(tài)脫敏一樣需導(dǎo)出數(shù)據(jù)脫敏后再移交,而是通過(guò)業(yè)務(wù)系統(tǒng)之間的接口直接調(diào)用。這就屬于應(yīng)用系統(tǒng)之間不落地的數(shù)據(jù)交換,針對(duì)這種交換的數(shù)據(jù)需要作脫敏處理。