虛擬化系統(tǒng)數(shù)據(jù)保護(hù)的發(fā)展
服務(wù)器虛擬化作為企業(yè)級數(shù)據(jù)中心核心基數(shù)架構(gòu)的重要角色, 無論是現(xiàn)階段已經(jīng)普及虛擬化集群, 還是未來將要實(shí)現(xiàn)的云平臺,都離不開虛擬化的全面支持。隨著近些年信息化的沖擊,企業(yè)級虛擬化系統(tǒng)中數(shù)據(jù)體量也有了顯著提升。隨著數(shù)據(jù)量級的逐步增長,數(shù)據(jù)保護(hù)問題日漸凸顯。在各大虛擬化系統(tǒng)中,HA、FT 以及 DRS 等技術(shù)雖然保證了虛擬化集群的高可用性和持續(xù)支撐業(yè)務(wù)系統(tǒng)的能力, 但對于數(shù)據(jù)離線、 數(shù)據(jù)歷史版本保留以及防范數(shù)據(jù)邏輯錯等方面的保護(hù)越來越捉襟見肘。
在享受著虛擬化帶來的諸多經(jīng)濟(jì)效益后,也不得不得面對虛擬化環(huán)境中數(shù)據(jù)保護(hù)的幾大難題:首先,隨著數(shù)據(jù)價(jià)值的深度發(fā)掘,數(shù)據(jù)離線需求也越來越強(qiáng)烈。虛擬化規(guī)模提升后,憑借虛擬化系統(tǒng)自身的數(shù)據(jù)保護(hù)手段,數(shù)據(jù)離線任務(wù)就溢出諸多問題:數(shù)據(jù)歷史版本的保留、數(shù)據(jù)永久離線保留、數(shù)據(jù)保真防篡改等。其次,虛擬機(jī)規(guī)模量級增長后,對數(shù)據(jù)保護(hù)的資源消耗大幅增加,最終空閑時(shí)間窗口內(nèi)現(xiàn)有資源無法承載大量并行的數(shù)據(jù)保護(hù)任務(wù)。再者,隨著虛擬化的逐步普及,企業(yè)對虛擬化系統(tǒng)上的數(shù)據(jù)恢復(fù)要求也越來越高,甚至在數(shù)分鐘內(nèi)完成虛擬化數(shù)據(jù)的恢復(fù)任務(wù)。最后,各服務(wù)在虛擬化系統(tǒng)上應(yīng)用越來越廣泛,各類應(yīng)用的保護(hù)也成為虛擬化數(shù)據(jù)保護(hù)的主要任務(wù)之一。
面對服務(wù)器虛擬化上的數(shù)據(jù)保護(hù), 在虛擬化數(shù)據(jù)保護(hù)起步階段, 各大主流廠商主要采用備份代理服務(wù)器的方式備份虛擬化內(nèi)的虛擬機(jī)或數(shù)據(jù), 即部署一臺物理或虛擬服務(wù)器與虛擬化系統(tǒng)進(jìn)行集成, 使其識別到虛擬化系統(tǒng)內(nèi)所有計(jì)算、存儲資源,然后備份期間由虛擬化系統(tǒng)管理控制臺配合調(diào)度備份快照任務(wù),所有需要進(jìn)行數(shù)據(jù)保護(hù)的虛擬機(jī)或虛擬化數(shù)據(jù)都將掛在至備份代理服務(wù)器, 最后傳輸至備份存儲。這種備份方式不僅無法承載大批量級并行數(shù)據(jù)保護(hù)任務(wù)、效率相對較低,而且對虛擬化平臺的一體化管理維護(hù)造成不小困擾。
針對傳統(tǒng)虛擬化數(shù)據(jù)保護(hù)的方式,各大備份恢復(fù)系統(tǒng)廠商推陳出新。以軟件起家的 Commvault、Veeam 等廠商發(fā)力研究虛擬化引擎與快照技術(shù),充分優(yōu)化與虛擬化平臺數(shù)據(jù)保護(hù)的各個流程,取得了顯著成績。Commvault 主打智能化管理,Proxy與虛擬化系統(tǒng)之間完美兼容,通過 Commvault 的虛擬化保護(hù)配置流程即可自動完成部署。而 Veeam 主打與虛擬化平臺的高度集成, 通過在虛擬化管理平臺上可以嵌入Veeam相關(guān)模塊來完成數(shù)據(jù)保護(hù)任務(wù)。值得注意的是,Veeam 也能實(shí)現(xiàn)對特定的虛擬化存儲進(jìn)行快照管理,能夠借助存儲快照加速數(shù)據(jù)保護(hù)任務(wù);以軟硬件并驅(qū)的EMC 大力推廣 Networker/Avamar+Datadomain 解決方案,Networker 作為集中式備份恢復(fù)平臺,不僅可以管理虛擬化備份還可以管理維護(hù)其它平臺數(shù)據(jù)保護(hù)。若虛擬化體量巨大, Avamar 則可發(fā)揮其高效的重復(fù)數(shù)據(jù)刪除,百 GB 級別的虛擬機(jī)基本都可以在數(shù)分鐘之內(nèi)完成, 在滿足對應(yīng)條件的情況下, 無需恢復(fù)即可從備份系統(tǒng)中拉起虛擬機(jī),抽取虛擬機(jī)內(nèi)數(shù)據(jù)。Datadomain 作為后端備份存儲,具有最先進(jìn)的可變長重復(fù)數(shù)據(jù)刪除技術(shù)極大優(yōu)化備份恢復(fù)效率,提高其數(shù)據(jù)存儲使用率。DataDomain 拓展插件可以實(shí)現(xiàn)從客戶端直接到其的備份恢復(fù),不需要備份恢復(fù)系統(tǒng)參與調(diào)度。IBM 的 Spectrum Protect Plus 解決方案在虛擬化數(shù)據(jù)保護(hù)方面也同樣優(yōu)異:無需安裝客戶端軟件、無需恢復(fù)直接拉起虛擬機(jī)、高效一體化的集成平臺……
虛擬化系統(tǒng)的發(fā)展越來越成熟,數(shù)據(jù)保護(hù)的手段也越來越先進(jìn),不僅僅是數(shù)據(jù)保護(hù)的維度更加全面,數(shù)據(jù)保護(hù)的技術(shù)也在不斷革新。隨著云架構(gòu)的普及,數(shù)據(jù)保護(hù)即服務(wù)的技術(shù)理念也不斷滲透至備份恢復(fù)系統(tǒng)的核心,在不久的將來, 數(shù)據(jù)保護(hù) (備份恢復(fù)) 不再是機(jī)械式的配置任務(wù), 而是能以更自由的方式 (例如云) 定制各項(xiàng)策略,數(shù)據(jù)保護(hù)精度能從虛擬化集群、虛擬機(jī)、虛擬磁盤甚至縮小到虛擬機(jī)上某一個文件,更加靈活智能化完成對虛擬化系統(tǒng)上的數(shù)據(jù)保護(hù)。
虛擬化系統(tǒng)數(shù)據(jù)保護(hù)的典型問題
本章節(jié)主要簡述虛擬化系統(tǒng)數(shù)據(jù)保護(hù)中容易遇到的典型問題及其解決方案思路,以供各位參考,備份恢復(fù)技術(shù)也日益更新,錯漏之處歡迎各位指正、交流。
以下為方便描述與理解,案例均以 Vmware 為例進(jìn)行說明。
業(yè)務(wù)系統(tǒng)現(xiàn)狀:
虛擬化系統(tǒng)有三大業(yè)務(wù)區(qū),每個業(yè)務(wù)區(qū)之間網(wǎng)絡(luò)物理隔離,單臺虛擬機(jī)均不大,都在 100GB 以內(nèi)(部分虛擬機(jī)除外),但虛擬機(jī)規(guī)模較大,300 臺左右。絕大部分虛擬機(jī)主要是 web server 角色;少部分服務(wù)器作為中轉(zhuǎn)機(jī)承擔(dān)文件存儲,保留歷史過程文件,甚至將一部分永久保留文件寫入 NAS 中;還有幾臺數(shù)據(jù)庫虛擬機(jī),主要承載了部分非核心業(yè)務(wù)系統(tǒng)的數(shù)據(jù)服務(wù),作為中間平臺聯(lián)通業(yè)務(wù)。
數(shù)據(jù)保護(hù)現(xiàn)狀:
備份系統(tǒng)只有一臺備份恢復(fù)代理機(jī)(與備份存儲相連),備份窗口緊張,虛擬機(jī)備份模式僅支持全備份和增量備份。
優(yōu)化思路:
1, 如何提高并行效率?
在策略上:通過分析此場景下業(yè)務(wù)系統(tǒng)特點(diǎn)可以知曉,大部分虛擬機(jī)為Webserver,在運(yùn)行過程中除產(chǎn)生的 log 外其余數(shù)據(jù)相對靜止,若大幅提高這一部分虛擬機(jī)備份速度,那么數(shù)據(jù)保護(hù)的整體效率將提升一個臺階。大部分?jǐn)?shù)據(jù)靜止,小部分?jǐn)?shù)據(jù)不斷變更,這一特點(diǎn)恰好契合(CBT 狀態(tài)下)全備份+增量備份的策略,若是考慮到更高級別的數(shù)據(jù)保護(hù)要求呢,那么可以選擇直接從虛擬機(jī)對需要保護(hù)的文件范圍局部備份或采用重復(fù)數(shù)據(jù)刪除技術(shù)來實(shí)現(xiàn)。
在數(shù)據(jù)保護(hù)架構(gòu)上:當(dāng)虛擬機(jī)規(guī)模進(jìn)一步擴(kuò)大時(shí),一臺備份代理服務(wù)器終將不堪重負(fù)。因此推薦為各業(yè)務(wù)區(qū)單獨(dú)部署備份資源。
2, 如何保障備份數(shù)據(jù)的可靠性?
在實(shí)際管理維護(hù)中,經(jīng)常發(fā)現(xiàn)有運(yùn)行數(shù)據(jù)庫的虛擬機(jī)需要進(jìn)行數(shù)據(jù)保護(hù),而備份管理員常常是針對數(shù)據(jù)庫集群中某一臺虛擬機(jī)進(jìn)行備份。在備份整臺虛擬機(jī)的時(shí)候,虛擬化 tools 會攔截對虛擬機(jī)的流量、懸掛 IO,然后對虛擬機(jī)文件系統(tǒng)進(jìn)行凍結(jié)鎖,再進(jìn)行快照,在這個過程中數(shù)據(jù)庫內(nèi)存中的數(shù)據(jù)很可能發(fā)生變化并且與文件系統(tǒng)上數(shù)據(jù)不一致,因此對于運(yùn)行在虛擬機(jī)上的數(shù)據(jù)庫,最可靠的備份方式是通過數(shù)據(jù)庫的接口進(jìn)行備份,如 Oracle 的 Rman 工具。數(shù)據(jù)庫的備份接口在備份恢復(fù)過程可以實(shí)時(shí)感知數(shù)據(jù)保護(hù)進(jìn)程,然后將數(shù)據(jù)庫調(diào)整到一致狀態(tài)從而配合數(shù)據(jù)保護(hù),而虛擬化 tools 無法做到感知數(shù)據(jù)庫一致性。
3, 如何保障數(shù)據(jù)保護(hù)的健全性?
針對虛擬化上的數(shù)據(jù),強(qiáng)烈建議對所需要保護(hù)的數(shù)據(jù)進(jìn)行多層次備份,如虛擬機(jī)進(jìn)行一套策略的備份,對重要虛擬機(jī)上文件及目錄再進(jìn)行文件級別的備份, 對運(yùn)行數(shù)據(jù)庫的虛擬機(jī)通過數(shù)據(jù)庫接口再對數(shù)據(jù)庫單獨(dú)備份。另外,NAS 上的數(shù)據(jù)務(wù)必從最可靠 NAS 專用數(shù)據(jù)保護(hù)方面入手,對于 NAS 大量碎片文件的備份恢復(fù),在 10TB 級別內(nèi) NDMP 備份能夠勝任一定程度上的數(shù)據(jù)保護(hù);若是超過 10TB 級別,為了保障備份恢復(fù)效率,可以采用并行多路備份。虛擬化數(shù)據(jù)保護(hù),一定要從多層次、多精度、多方式的保護(hù)。
綜合以上分析與考慮,可以初步設(shè)計(jì)出新的改進(jìn)方式,每個業(yè)務(wù)區(qū)增加一臺重復(fù)數(shù)據(jù)刪除節(jié)點(diǎn)承擔(dān)每個區(qū)段的重復(fù)數(shù)據(jù)刪除壓力,避免對業(yè)務(wù)區(qū)產(chǎn)生明顯影響,同時(shí)提高了各個區(qū)段的數(shù)據(jù)保護(hù)并行性。
經(jīng)過重復(fù)數(shù)據(jù)刪除后,網(wǎng)絡(luò)傳輸?shù)教摂M化代理服務(wù)器的數(shù)據(jù)將顯著減少,若現(xiàn)有資源條件不允許,可以只部署一臺代理服務(wù)器將重刪后的數(shù)據(jù)寫入備份存儲。經(jīng)過綜合分析改進(jìn)后,整體架構(gòu)圖如下:
適合產(chǎn)品:
Commvault、 Networker、 Datadomain、 Avamar、 NetBackup、 Veeam 和 IBM Spectrum Protect 均可以實(shí)現(xiàn)上述功能,但如果需要軟硬件結(jié)合的重刪方案都需要用于存儲備份數(shù)據(jù)的磁帶存儲支持。
其他建議:
備份恢復(fù)系統(tǒng),可以說是一道保障。等到它派上用場的時(shí)候,那已經(jīng)是生死攸關(guān)的境況了。備份恢復(fù)系統(tǒng),更像是最后一座靠山,需要它持久可靠、穩(wěn)定、關(guān)鍵時(shí)候不掉鏈子,也因此對備份恢復(fù)系統(tǒng)的選擇也更要注重對支持服務(wù)的選擇。主流各大廠家售后服務(wù)及現(xiàn)場支持都不差,現(xiàn)場支持專家的水平也很高,若是對于現(xiàn)場服務(wù)有更高的需求, 還是建議購買第三方的技術(shù)專家駐場或現(xiàn)場支持服務(wù),關(guān)鍵時(shí)候也許有意外驚喜。