【摘要】本文簡單介紹當(dāng)前虛擬化環(huán)境備份恢復(fù)系統(tǒng)規(guī)劃與維護過程中可能會遇到的幾大典型問題,并提供解決思路。 【作者】Jerry,備份專家 虛擬化系統(tǒng)數(shù)據(jù)保護的發(fā)展 服務(wù)器虛擬化作為企業(yè)級數(shù)據(jù)中心核心基數(shù)架構(gòu)的重要角色, 無論是現(xiàn)階段已經(jīng)普及虛擬化集群, 還是未來將要實現(xiàn)的云平臺,都離不開虛擬化的全面支持。隨著近些年信息化的沖擊,企業(yè)級虛擬化系統(tǒng)中數(shù)據(jù)體量也有了顯著提升。隨著數(shù)據(jù)量級的逐步增長,數(shù)據(jù)保護問題日漸凸顯。在各大虛擬化系統(tǒng)中,HA、FT 以及 DRS 等技術(shù)雖然保證了虛擬化集群的高可用性和持續(xù)支撐業(yè)務(wù)系統(tǒng)的能力, 但對于數(shù)據(jù)離線、 數(shù)據(jù)歷史版本保留以及防范數(shù)據(jù)邏輯錯等方面的保護越來越捉襟見肘。 在享受著虛擬化帶來的諸多經(jīng)濟效益后,也不得不得面對虛擬化環(huán)境中數(shù)據(jù)保護的幾大難題:首先,隨著數(shù)據(jù)價值的深度發(fā)掘,數(shù)據(jù)離線需求也越來越強烈。虛擬化規(guī)模提升后,憑借虛擬化系統(tǒng)自身的數(shù)據(jù)保護手段,數(shù)據(jù)離線任務(wù)就溢出諸多問題:數(shù)據(jù)歷史版本的保留、數(shù)據(jù)永久離線保留、數(shù)據(jù)保真防篡改等。其次,虛擬機規(guī)模量級增長后,對數(shù)據(jù)保護的資源消耗大幅增加,最終空閑時間窗口內(nèi)現(xiàn)有資源無法承載大量并行的數(shù)據(jù)保護任務(wù)。再者,隨著虛擬化的逐步普及,企業(yè)對虛擬化系統(tǒng)上的數(shù)據(jù)恢復(fù)要求也越來越高,甚至在數(shù)分鐘內(nèi)完成虛擬化數(shù)據(jù)的恢復(fù)任務(wù)。最后,各服務(wù)在虛擬化系統(tǒng)上應(yīng)用越來越廣泛,各類應(yīng)用的保護也成為虛擬化數(shù)據(jù)保護的主要任務(wù)之一。 面對服務(wù)器虛擬化上的數(shù)據(jù)保護, 在虛擬化數(shù)據(jù)保護起步階段, 各大主流廠商主要采用備份代理服務(wù)器的方式備份虛擬化內(nèi)的虛擬機或數(shù)據(jù), 即部署一臺物理或虛擬服務(wù)器與虛擬化系統(tǒng)進行集成, 使其識別到虛擬化系統(tǒng)內(nèi)所有計算、存儲資源,然后備份期間由虛擬化系統(tǒng)管理控制臺配合調(diào)度備份快照任務(wù),所有需要進行數(shù)據(jù)保護的虛擬機或虛擬化數(shù)據(jù)都將掛在至備份代理服務(wù)器, 最后傳輸至備份存儲。這種備份方式不僅無法承載大批量級并行數(shù)據(jù)保護任務(wù)、效率相對較低,而且對虛擬化平臺的一體化管理維護造成不小困擾。 針對傳統(tǒng)虛擬化數(shù)據(jù)保護的方式,各大備份恢復(fù)系統(tǒng)廠商推陳出新。以軟件起家的 Commvault、Veeam 等廠商發(fā)力研究虛擬化引擎與快照技術(shù),充分優(yōu)化與虛擬化平臺數(shù)據(jù)保護的各個流程,取得了顯著成績。Commvault 主打智能化管理,Proxy與虛擬化系統(tǒng)之間完美兼容,通過 Commvault 的虛擬化保護配置流程即可自動完成部署。而 Veeam 主打與虛擬化平臺的高度集成, 通過在虛擬化管理平臺上可以嵌入Veeam相關(guān)模塊來完成數(shù)據(jù)保護任務(wù)。值得注意的是,Veeam 也能實現(xiàn)對特定的虛擬化存儲進行快照管理,能夠借助存儲快照加速數(shù)據(jù)保護任務(wù);以軟硬件并驅(qū)的EMC 大力推廣 Networker/Avamar Datadomain 解決方案,Networker 作為集中式備份恢復(fù)平臺,不僅可以管理虛擬化備份還可以管理維護其它平臺數(shù)據(jù)保護。若虛擬化體量巨大, Avamar 則可發(fā)揮其高效的重復(fù)數(shù)據(jù)刪除,百 GB 級別的虛擬機基本都可以在數(shù)分鐘之內(nèi)完成, 在滿足對應(yīng)條件的情況下, 無需恢復(fù)即可從備份系統(tǒng)中拉起虛擬機,抽取虛擬機內(nèi)數(shù)據(jù)。Datadomain 作為后端備份存儲,具有最先進的可變長重復(fù)數(shù)據(jù)刪除技術(shù)極大優(yōu)化備份恢復(fù)效率,提高其數(shù)據(jù)存儲使用率。DataDomain 拓展插件可以實現(xiàn)從客戶端直接到其的備份恢復(fù),不需要備份恢復(fù)系統(tǒng)參與調(diào)度。IBM 的 Spectrum Protect Plus 解決方案在虛擬化數(shù)據(jù)保護方面也同樣優(yōu)異:無需安裝客戶端軟件、無需恢復(fù)直接拉起虛擬機、高效一體化的集成平臺…… 虛擬化系統(tǒng)的發(fā)展越來越成熟,數(shù)據(jù)保護的手段也越來越先進,不僅僅是數(shù)據(jù)保護的維度更加全面,數(shù)據(jù)保護的技術(shù)也在不斷革新。隨著云架構(gòu)的普及,數(shù)據(jù)保護即服務(wù)的技術(shù)理念也不斷滲透至備份恢復(fù)系統(tǒng)的核心,在不久的將來, 數(shù)據(jù)保護 (備份恢復(fù)) 不再是機械式的配置任務(wù), 而是能以更自由的方式 (例如云) 定制各項策略,數(shù)據(jù)保護精度能從虛擬化集群、虛擬機、虛擬磁盤甚至縮小到虛擬機上某一個文件,更加靈活智能化完成對虛擬化系統(tǒng)上的數(shù)據(jù)保護。 虛擬化系統(tǒng)數(shù)據(jù)保護的典型問題 本章節(jié)主要簡述虛擬化系統(tǒng)數(shù)據(jù)保護中容易遇到的典型問題及其解決方案思路,以供各位參考,備份恢復(fù)技術(shù)也日益更新,錯漏之處歡迎各位指正、交流。 以下為方便描述與理解,案例均以 Vmware 為例進行說明。 業(yè)務(wù)系統(tǒng)現(xiàn)狀: 虛擬化系統(tǒng)有三大業(yè)務(wù)區(qū),每個業(yè)務(wù)區(qū)之間網(wǎng)絡(luò)物理隔離,單臺虛擬機均不大,都在 100GB 以內(nèi)(部分虛擬機除外),但虛擬機規(guī)模較大,300 臺左右。絕大部分虛擬機主要是 web server 角色;少部分服務(wù)器作為中轉(zhuǎn)機承擔(dān)文件存儲,保留歷史過程文件,甚至將一部分永久保留文件寫入 NAS 中;還有幾臺數(shù)據(jù)庫虛擬機,主要承載了部分非核心業(yè)務(wù)系統(tǒng)的數(shù)據(jù)服務(wù),作為中間平臺聯(lián)通業(yè)務(wù)。 數(shù)據(jù)保護現(xiàn)狀: 備份系統(tǒng)只有一臺備份恢復(fù)代理機(與備份存儲相連),備份窗口緊張,虛擬機備份模式僅支持全備份和增量備份。 優(yōu)化思路: 1, 如何提高并行效率? 在策略上:通過分析此場景下業(yè)務(wù)系統(tǒng)特點可以知曉,大部分虛擬機為Webserver,在運行過程中除產(chǎn)生的 log 外其余數(shù)據(jù)相對靜止,若大幅提高這一部分虛擬機備份速度,那么數(shù)據(jù)保護的整體效率將提升一個臺階。大部分?jǐn)?shù)據(jù)靜止,小部分?jǐn)?shù)據(jù)不斷變更,這一特點恰好契合(CBT 狀態(tài)下)全備份 增量備份的策略,若是考慮到更高級別的數(shù)據(jù)保護要求呢,那么可以選擇直接從虛擬機對需要保護的文件范圍局部備份或采用重復(fù)數(shù)據(jù)刪除技術(shù)來實現(xiàn)。 在數(shù)據(jù)保護架構(gòu)上:當(dāng)虛擬機規(guī)模進一步擴大時,一臺備份代理服務(wù)器終將不堪重負(fù)。因此推薦為各業(yè)務(wù)區(qū)單獨部署備份資源。 2, 如何保障備份數(shù)據(jù)的可靠性? 在實際管理維護中,經(jīng)常發(fā)現(xiàn)有運行數(shù)據(jù)庫的虛擬機需要進行數(shù)據(jù)保護,而備份管理員常常是針對數(shù)據(jù)庫集群中某一臺虛擬機進行備份。在備份整臺虛擬機的時候,虛擬化 tools 會攔截對虛擬機的流量、懸掛 IO,然后對虛擬機文件系統(tǒng)進行凍結(jié)鎖,再進行快照,在這個過程中數(shù)據(jù)庫內(nèi)存中的數(shù)據(jù)很可能發(fā)生變化并且與文件系統(tǒng)上數(shù)據(jù)不一致,因此對于運行在虛擬機上的數(shù)據(jù)庫,最可靠的備份方式是通過數(shù)據(jù)庫的接口進行備份,如 Oracle 的 Rman 工具。數(shù)據(jù)庫的備份接口在備份恢復(fù)過程可以實時感知數(shù)據(jù)保護進程,然后將數(shù)據(jù)庫調(diào)整到一致狀態(tài)從而配合數(shù)據(jù)保護,而虛擬化 tools 無法做到感知數(shù)據(jù)庫一致性。 3, 如何保障數(shù)據(jù)保護的健全性? 針對虛擬化上的數(shù)據(jù),強烈建議對所需要保護的數(shù)據(jù)進行多層次備份,如虛擬機進行一套策略的備份,對重要虛擬機上文件及目錄再進行文件級別的備份, 對運行數(shù)據(jù)庫的虛擬機通過數(shù)據(jù)庫接口再對數(shù)據(jù)庫單獨備份。另外,NAS 上的數(shù)據(jù)務(wù)必從最可靠 NAS 專用數(shù)據(jù)保護方面入手,對于 NAS 大量碎片文件的備份恢復(fù),在 10TB 級別內(nèi) NDMP 備份能夠勝任一定程度上的數(shù)據(jù)保護;若是超過 10TB 級別,為了保障備份恢復(fù)效率,可以采用并行多路備份。虛擬化數(shù)據(jù)保護,一定要從多層次、多精度、多方式的保護。 綜合以上分析與考慮,可以初步設(shè)計出新的改進方式,每個業(yè)務(wù)區(qū)增加一臺重復(fù)數(shù)據(jù)刪除節(jié)點承擔(dān)每個區(qū)段的重復(fù)數(shù)據(jù)刪除壓力,避免對業(yè)務(wù)區(qū)產(chǎn)生明顯影響,同時提高了各個區(qū)段的數(shù)據(jù)保護并行性。 經(jīng)過重復(fù)數(shù)據(jù)刪除后,網(wǎng)絡(luò)傳輸?shù)教摂M化代理服務(wù)器的數(shù)據(jù)將顯著減少,若現(xiàn)有資源條件不允許,可以只部署一臺代理服務(wù)器將重刪后的數(shù)據(jù)寫入備份存儲。經(jīng)過綜合分析改進后,整體架構(gòu)圖如下: 適合產(chǎn)品: Commvault、 Networker、 Datadomain、 Avamar、 NetBackup、 Veeam 和 IBM Spectrum Protect 均可以實現(xiàn)上述功能,但如果需要軟硬件結(jié)合的重刪方案都需要用于存儲備份數(shù)據(jù)的磁帶存儲支持。 其他建議: 備份恢復(fù)系統(tǒng),可以說是一道保障。等到它派上用場的時候,那已經(jīng)是生死攸關(guān)的境況了。備份恢復(fù)系統(tǒng),更像是最后一座靠山,需要它持久可靠、穩(wěn)定、關(guān)鍵時候不掉鏈子,也因此對備份恢復(fù)系統(tǒng)的選擇也更要注重對支持服務(wù)的選擇。主流各大廠家售后服務(wù)及現(xiàn)場支持都不差,現(xiàn)場支持專家的水平也很高,若是對于現(xiàn)場服務(wù)有更高的需求, 還是建議購買第三方的技術(shù)專家駐場或現(xiàn)場支持服務(wù),關(guān)鍵時候也許有意外驚喜。
|
|