用戶密碼到底要怎么加密存儲?

當密碼并不是6位純數(shù)字密碼,而是數(shù)字、大小寫字母結合的10位密碼時,建立一個這樣的表需要(26+26+10)^10≈83億億(條記錄),存儲在硬盤上至少要占用2000W TB的空間,這么大的存儲空間,成本太大,幾乎不可行。

作為互聯(lián)網(wǎng)公司的信息安全從業(yè)人員經(jīng)常要處理撞庫掃號事件,產(chǎn)生撞庫掃號的根本原因是一些企業(yè)發(fā)生了信息泄露事件,且這些泄露數(shù)據(jù)未加密或者加密方式比較弱,導致黑客可以還原出原始的用戶密碼。

目前已經(jīng)曝光的信息泄露事件至少上百起,其中包括多家一線互聯(lián)網(wǎng)公司,泄露總數(shù)據(jù)超過10億條。

要完全防止信息泄露是非常困難的事情,除了防止黑客外,還要防止內(nèi)部人員泄密。但如果采用合適的算法去加密用戶密碼,即使信息泄露出去,黑客也無法還原出原始的密碼(或者還原的代價非常大)。

也就是說我們可以將工作重點從防止泄露轉換到防止黑客還原出數(shù)據(jù)。下面我們將分別介紹用戶密碼的加密方式以及主要的破解方法。

一、用戶密碼加密

用戶密碼保存到數(shù)據(jù)庫時,常見的加密方式有哪些,我們該采用什么方式來保護用戶的密碼呢?以下幾種方式是常見的密碼保存方式:

1、直接明文保存,比如用戶設置的密碼是“123456”,直接將“123456”保存在數(shù)據(jù)庫中,這種是最簡單的保存方式,也是最不安全的方式。但實際上不少互聯(lián)網(wǎng)公司,都可能采取的是這種方式。

2、使用對稱加密算法來保存,比如3DES、AES等算法,使用這種方式加密是可以通過解密來還原出原始密碼的,當然前提條件是需要獲取到密鑰。不過既然大量的用戶信息已經(jīng)泄露了,密鑰很可能也會泄露,當然可以將一般數(shù)據(jù)和密鑰分開存儲、分開管理,但要完全保護好密鑰也是一件非常復雜的事情,所以這種方式并不是很好的方式。

3、使用MD5、SHA1等單向HASH算法保護密碼,使用這些算法后,無法通過計算還原出原始密碼,而且實現(xiàn)比較簡單,因此很多互聯(lián)網(wǎng)公司都采用這種方式保存用戶密碼,曾經(jīng)這種方式也是比較安全的方式,但隨著彩虹表技術的興起,可以建立彩虹表進行查表破解,目前這種方式已經(jīng)很不安全了。

4、特殊的單向HASH算法,由于單向HASH算法在保護密碼方面不再安全,于是有些公司在單向HASH算法基礎上進行了加鹽、多次HASH等擴展,這些方式可以在一定程度上增加破解難度,對于加了“固定鹽”的HASH算法,需要保護“鹽”不能泄露,這就會遇到“保護對稱密鑰”一樣的問題,一旦“鹽”泄露,根據(jù)“鹽”重新建立彩虹表可以進行破解,對于多次HASH,也只是增加了破解的時間,并沒有本質上的提升。拓展:驗證碼及登錄中的漏洞分析

5、PBKDF2算法,該算法原理大致相當于在HASH算法基礎上增加隨機鹽,并進行多次HASH運算,隨機鹽使得彩虹表的建表難度大幅增加,而多次HASH也使得建表和破解的難度都大幅增加。使用PBKDF2算法時,HASH算法一般選用sha1或者sha256,隨機鹽的長度一般不能少于8字節(jié),HASH次數(shù)至少也要1000次,這樣安全性才足夠高。

一次密碼驗證過程進行1000次HASH運算,對服務器來說可能只需要1ms,但對于破解者來說計算成本增加了1000倍,而至少8字節(jié)隨機鹽,更是把建表難度提升了N個數(shù)量級,使得大批量的破解密碼幾乎不可行,該算法也是美國國家標準與技術研究院推薦使用的算法。

6、bcrypt、scrypt等算法,這兩種算法也可以有效抵御彩虹表,使用這兩種算法時也需要指定相應的參數(shù),使破解難度增加。

下表對比了各個算法的特性:

二、用戶密碼破解

用戶密碼破解需要針對具體的加密方式來實施,如果使用對稱加密,并且算法足夠安全(比如AES),必須獲取到密鑰才能解密,沒有其它可行的破解方式。

如果采用HASH算法(包括特殊HASH),一般使用彩虹表的方式來破解,彩虹表的原理是什么呢?我們先來了解下如何進行HASH碰撞。

單向HASH算法由于不能進行解密運算,只能通過建表、查表的方式進行碰撞,即將常用的密碼及其對應的HASH值全計算出來并存儲,當獲取到HASH值是,直接查表獲取原始密碼,假設用MD5算法來保護6位數(shù)字密碼,可以建如下表:

全表共100W條記錄,因為數(shù)據(jù)量不大,這種情況建表、查表都非常容易。但是當密碼并不是6位純數(shù)字密碼,而是數(shù)字、大小寫字母結合的10位密碼時,建立一個這樣的表需要(26+26+10)^10≈83億億(條記錄),存儲在硬盤上至少要占用2000W TB的空間,這么大的存儲空間,成本太大,幾乎不可行。

有什么辦法可以減少存儲空間?一種方法是“預計算哈希鏈”,“預計算哈希鏈”可以大幅減少HASH表的存儲空間,但相應的增加了查表時的計算量,其原理大致如下:

建表過程:

先對原始數(shù)據(jù)“000000”進行一次HASH運算得到“670B1E”,再對HASH值進行一次R運算,R是一個定制的算法可以將HASH值映射到明文空間上(這里我們的明文空間是000000~999999),R運算后得到“283651”,再對“283651”進行hash運算得到“1A99CD”,然后在進行R運算得到“819287”,如此重復多次,得到一條哈希鏈。然后再選用其它原始數(shù)據(jù)建立多條哈希鏈。最終僅將鏈頭和鏈尾保存下來,中間節(jié)點全都去掉。

查表過程:假設拿到了一條HASH值“670B1E”,首先進行一次R運算,得到了“283651”,查詢所有鏈尾是否有命中,如果沒有,則再進行一次HASH、一次R,得到了“819287”,再次所有鏈尾,可以得到看出已經(jīng)命中。

這樣我們就可以基本確認“670B1E”對應的明文就在這條鏈上,然后我們把這條鏈的生成過程進行重新計算,計算過程中可以發(fā)現(xiàn)“000000”的HASH值就是“670B1E”,這樣就完成了整個查表過程。這種表就是“預計算哈希鏈”。這種方式存在一個問題,多條鏈之間可能存在大量的重復數(shù)據(jù),如下圖所示:

為了解決這個問題,我們將R算法進行擴展,一條鏈上的多次R運算采用不同的算法,如下圖:

一條鏈上的每個R算法都不一樣,就像彩虹的每層顏色一樣,因此取名的為彩虹表。

當然彩虹表除了可以用戶破解HASH算法外,理論上還可以用于破解對稱加密算法,比如DES算法,由于DES算法密鑰比較短,建立彩虹表破解是完全可行的;但對于AES算法,由于密鑰比較長,建表幾乎不可行(需要耗時N億年)。

三、小結

采用PBKDF2、bcrypt、scrypt等算法可以有效抵御彩虹表攻擊,即使數(shù)據(jù)泄露,最關鍵的“用戶密碼”仍然可以得到有效的保護,黑客無法大批量破解用戶密碼,從而切斷撞庫掃號的根源。當然,對于已經(jīng)泄露的密碼,還是需要用戶盡快修改密碼,不要再使用已泄露的密碼。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論