我們該建立一個(gè)云災(zāi)備還是基于云下云上的多活中心?

某個(gè)企業(yè)自建云數(shù)據(jù)中心,僅僅作為災(zāi)備中心使用,除非這個(gè)企業(yè)未來想作為災(zāi)備服務(wù)的提供商,提供災(zāi)備云服務(wù),為更多的企業(yè)提供災(zāi)備服務(wù),我覺得才值得。

我們是要建立一個(gè)云災(zāi)備還是基于云下云上的多活中心?

對(duì)于云災(zāi)備的建設(shè),我們要明確一點(diǎn),我們是單純建立一個(gè)靜默的災(zāi)備中心用于接管故障時(shí)的主數(shù)據(jù)中心,還是建立一個(gè)與主數(shù)據(jù)中心互備的多活中心共同提供服務(wù)?對(duì)于云上、云下互備的多活中心,方案有哪些?

問題來自社區(qū)會(huì)員JanXC nec系統(tǒng)架構(gòu)師,下文來自twt社區(qū)眾多同行實(shí)踐經(jīng)驗(yàn)分享,歡迎大家參與交流,各抒己見。

*“爭議”欄目內(nèi)容來自同行分享的一手體驗(yàn)和觀察,僅代表個(gè)人觀點(diǎn)

張鵬中國金融電子化公司-中小金融機(jī)構(gòu)災(zāi)備服務(wù)中心高級(jí)技術(shù)主管:

某個(gè)企業(yè)自建云數(shù)據(jù)中心,僅僅作為災(zāi)備中心使用,除非這個(gè)企業(yè)未來想作為災(zāi)備服務(wù)的提供商,提供災(zāi)備云服務(wù),為更多的企業(yè)提供災(zāi)備服務(wù),我覺得才值得。

通常云計(jì)算中心還是以提供云服務(wù)為主,災(zāi)備服務(wù)只是云服務(wù)的一個(gè)很小部分。

災(zāi)備想先談?wù)剶?shù)據(jù)上云,系統(tǒng)核心數(shù)據(jù),尤其是數(shù)據(jù)庫,成為企業(yè)上云最不容忽視的隱性成本。

云模式下企業(yè)可以降低自己從頭建設(shè)數(shù)據(jù)庫及后期運(yùn)維的成本,吸引了大批企業(yè)規(guī)劃上云。但實(shí)際應(yīng)用中,絕大部分企業(yè)都并非從零開始,都具有一定的數(shù)據(jù)庫基礎(chǔ)。對(duì)于想要應(yīng)用云數(shù)據(jù)庫的企業(yè),“上云遷移”成為了其最大的門檻。“如何保證數(shù)據(jù)安全完整,如何建立失敗回滾標(biāo)準(zhǔn),如何對(duì)數(shù)據(jù)庫重新進(jìn)行設(shè)計(jì),如何進(jìn)行數(shù)據(jù)模型的轉(zhuǎn)換,如何對(duì)新架構(gòu)做調(diào)優(yōu)……”,這些問題都需要企業(yè)謹(jǐn)慎考慮,具備一定的難度。雖然各公有云廠商針對(duì)上云遷移都提供了相應(yīng)的工具,但由于遷移的復(fù)雜性,也催生了許多提供咨詢、選型、規(guī)劃、遷移、運(yùn)維、優(yōu)化等服務(wù)的中間廠商,近年來發(fā)展迅速。

第一步:分析判斷,根據(jù)企業(yè)自身具體需求判斷選擇云數(shù)據(jù)庫還是自建數(shù)據(jù)庫:對(duì)于一些大型企業(yè),出于安全性和個(gè)性化的考慮,通常采用自建本地?cái)?shù)據(jù)庫的方式,對(duì)于一些IT預(yù)算有限的中小企業(yè),云數(shù)據(jù)庫提供了可行的解決方案。

第二步:制定計(jì)劃,收集需求,判斷解決需求需要哪些能力,評(píng)估哪些數(shù)據(jù)庫需要遷移,(建議從非關(guān)鍵業(yè)務(wù)系統(tǒng)、非核心生產(chǎn)系統(tǒng)入手),評(píng)估應(yīng)用程序配合遷移數(shù)據(jù)庫需要作出的改變,建立成功的評(píng)判標(biāo)準(zhǔn)和失敗回滾原則。

第三步:執(zhí)行遷移,數(shù)據(jù)庫備份(熱備份or冷備份、部分備份or全部備份),重新設(shè)計(jì)數(shù)據(jù)庫(可選),復(fù)制并將數(shù)據(jù)(包括備份后對(duì)原始數(shù)據(jù)的更改)重新存儲(chǔ)在云中,移交后檢查:數(shù)據(jù)驗(yàn)證、端到端測試(驗(yàn)證基本功能)、性能測試、安全評(píng)估。

第四步:測試及調(diào)優(yōu),性能優(yōu)化:負(fù)載測試、分布優(yōu)化;可用性優(yōu)化:容災(zāi)恢復(fù)計(jì)劃、日志和系統(tǒng)檢測、變更檢測、系統(tǒng)測試。

JanXC nec系統(tǒng)架構(gòu)師:

我的建議是要多活中心而非單純的備份節(jié)點(diǎn),誠然多活中心的實(shí)施難度和運(yùn)維復(fù)雜度都很高,但是收益較大。

早期的時(shí)候,我們也僅僅是想單純的建設(shè)一個(gè)異地災(zāi)備的點(diǎn),將本地的應(yīng)用和數(shù)據(jù)備份到異地,防止單點(diǎn)故障,但后來發(fā)現(xiàn)單純恢復(fù)這些存儲(chǔ)在異地的備份集耗時(shí)較久,需要重新搭建部署服務(wù),后來則在災(zāi)備機(jī)房或是云上租賃一部分云主機(jī),將備份的應(yīng)用和數(shù)據(jù)直接在云主機(jī)拉起,作為冷備節(jié)點(diǎn)使用。在后來隨著異地網(wǎng)絡(luò)的增速以及帶寬的增大,數(shù)據(jù)之間、文件之間的實(shí)時(shí)同步具備實(shí)現(xiàn)可能,然后我們就對(duì)應(yīng)用、數(shù)據(jù)庫和文件進(jìn)行了集群改造,通過slb調(diào)度訪問流量到本地機(jī)房或云上主機(jī),數(shù)據(jù)庫以某一點(diǎn)為主,實(shí)時(shí)同步至備份點(diǎn)(未實(shí)現(xiàn)雙寫,較復(fù)雜),這樣實(shí)現(xiàn)了應(yīng)用和數(shù)據(jù)庫的異地高可用。另外對(duì)系統(tǒng)架構(gòu)進(jìn)行優(yōu)化,應(yīng)用和數(shù)據(jù)庫之間增加消息隊(duì)列和緩存,降低數(shù)據(jù)庫的讀寫壓力,系統(tǒng)的訪問性能及高可用進(jìn)一步提升。

chenmingfu西部某城商銀行基礎(chǔ)架構(gòu)組長:

是否建設(shè)云災(zāi)備中心還得依賴相關(guān)監(jiān)管部門政策要求,比如銀行業(yè)信息系統(tǒng)進(jìn)入云災(zāi)備中心可能無法滿足監(jiān)管安全要求,如果政策允許且單位的IT技術(shù)架構(gòu)支持的話,可以考慮部分關(guān)鍵信息系統(tǒng)采用云災(zāi)備中心方式,若資金允許且運(yùn)維管理水平能跟上步伐,那么建設(shè)為與主用生產(chǎn)中心保持雙活模式是很好的選擇,這樣能提升rto指標(biāo),日常引入一部分業(yè)務(wù)流量到云災(zāi)備中心,充分驗(yàn)證災(zāi)備中心的可用性,當(dāng)出現(xiàn)真實(shí)災(zāi)難場景時(shí)也能快速接管業(yè)務(wù)。

張文正dcits系統(tǒng)工程師:

個(gè)人理解,建立什么樣的災(zāi)備中心還是根據(jù)企業(yè)自身情況而定比較合適,如果僅僅作為災(zāi)備使用可以找云災(zāi)備服務(wù)商就可以了!如果企業(yè)業(yè)務(wù)比較重要,可以選擇云上云下互備方式比較合適。

前期要進(jìn)行一定的調(diào)研,制定詳細(xì)的方案,包含技術(shù)方案還有有一定的測試演練等等,周期相對(duì)來說比較長,需要多方面考慮!

chengliangliang某大型保險(xiǎn)系統(tǒng)架構(gòu)師:

1)個(gè)人認(rèn)為,如果可以還是使用雙活數(shù)據(jù)中心,雙活數(shù)據(jù)中心的最大優(yōu)勢是有效利用資源。災(zāi)備中心建設(shè)的投資巨大及每年運(yùn)維成本極高,如果資源處于閑置狀態(tài),資源是相當(dāng)浪費(fèi)的。

2)雙活數(shù)據(jù)中心的建設(shè)應(yīng)該要滿足三個(gè)條件,第一個(gè)是應(yīng)用雙活,也就是說數(shù)據(jù)庫一定要實(shí)現(xiàn)雙活,第二個(gè)是網(wǎng)絡(luò)要雙活,業(yè)務(wù)網(wǎng)絡(luò)要保證能夠同時(shí)聯(lián)通兩個(gè)數(shù)據(jù)中心,第三個(gè)是數(shù)據(jù)要雙活,兩邊的數(shù)據(jù)要能夠?qū)崿F(xiàn)被獨(dú)立使用。

3)雙活數(shù)據(jù)中心的建設(shè)難度是較大的,如果建成那對(duì)運(yùn)維和資源使用來說性價(jià)比是很高的。

趙海技術(shù)經(jīng)理:

對(duì)于企業(yè)的災(zāi)備建設(shè)來講,如果是雙中心或者是多中心的架構(gòu)目標(biāo),那么建立一個(gè)純粹的靜默等待容災(zāi)切換的數(shù)據(jù)中心與建立一套運(yùn)行中并且可以互備的數(shù)據(jù)中心體系,顯然后者是多數(shù)人追求的目標(biāo)。

一方面,從數(shù)據(jù)中心設(shè)備負(fù)荷以及生命周期角度來講,平均負(fù)荷總比單一滿負(fù)荷要好很多。

另外一方面,從數(shù)據(jù)中心容災(zāi)切換的角度來講,一個(gè)靜默的數(shù)據(jù)中心在危機(jī)時(shí)刻,真正能夠派上用場的概率有多大?

但是,究竟采用哪一種策略,完全要看企業(yè)的自身情況和目標(biāo)。有的企業(yè)建立一個(gè)靜默的數(shù)據(jù)中心,只為關(guān)鍵應(yīng)用系統(tǒng)所用,并非所有系統(tǒng)都實(shí)現(xiàn)AA;有的與企業(yè)可能不惜成本打造一個(gè)全系統(tǒng)的AA數(shù)據(jù)中心體系架構(gòu);有的企業(yè)多數(shù)依賴網(wǎng)點(diǎn)接入,有的企業(yè)屬于互聯(lián)網(wǎng)客戶端接入,這兩種模式?jīng)Q定了災(zāi)備的網(wǎng)絡(luò)架構(gòu)也不會(huì)完全相同。

對(duì)于云上的數(shù)據(jù)中心災(zāi)備,我相信不是所有系統(tǒng)都能實(shí)現(xiàn)的。由于系統(tǒng)架構(gòu)的差異、所用中間件及數(shù)據(jù)庫產(chǎn)品的差異,系統(tǒng)業(yè)務(wù)特性及安全性要求不同等等,部分系統(tǒng)可以云上災(zāi)備,或者說少數(shù)可以。所以對(duì)于大多數(shù)IT規(guī)模比較大,IT架構(gòu)比較復(fù)雜的企業(yè)來講,云上災(zāi)備就是一句廣告詞。如果是小企業(yè),尤其是門戶為主的一些企業(yè),也就無所謂云上云下聯(lián)動(dòng)了,直接上云,如果業(yè)務(wù)重要,那么選擇多家云廠商作為互備也就可以了。

黃飛展互聯(lián)網(wǎng)行業(yè)云計(jì)算架構(gòu)師:

對(duì)于某些有監(jiān)管要求的行業(yè),需要建立獨(dú)立的靜默災(zāi)備中心。除此之外,選擇云上云下的災(zāi)備多活數(shù)據(jù)中心對(duì)企業(yè)來說不失為一種好的選擇。

首先,公有云的優(yōu)勢是成本低,免維護(hù),擴(kuò)展性非常好??梢怨?jié)省災(zāi)備數(shù)據(jù)中心建設(shè)和設(shè)備購買的一次性投入。同時(shí)靜默災(zāi)備中心對(duì)于能源的消耗也較大,純?yōu)膫淠J皆斐梢欢ǔ潭荣Y源浪費(fèi),不利于碳中和目標(biāo)。

主流的公有云廠商都會(huì)提供全面數(shù)據(jù)庫,中間件,安全等保等服務(wù)。同時(shí)傳統(tǒng)行業(yè)使用的Oracle數(shù)據(jù)庫,VMware虛擬化等技術(shù)在一些公有云廠商也有支持。選擇公有云作為多活架構(gòu),架構(gòu)更為靈活,用戶可根據(jù)需求定制需要的服務(wù)類型,不用考慮設(shè)備更新?lián)Q代。

另一方面,傳統(tǒng)容災(zāi)技術(shù)多依賴SAN存儲(chǔ)的數(shù)據(jù)同步和復(fù)制功能。公有云多活架構(gòu)對(duì)容災(zāi)技術(shù)也提出的新的要求。

目前主流的多活架構(gòu)中,數(shù)據(jù)庫多會(huì)選擇分布式數(shù)據(jù)庫,如主流的OceanBase,TiDB等。分布式數(shù)據(jù)庫的使用,對(duì)用戶的業(yè)務(wù)架構(gòu)提出了更高的挑戰(zhàn)。為了應(yīng)對(duì)這些架構(gòu)變化,用戶需要對(duì)自身業(yè)務(wù)有更深入的了解。進(jìn)行業(yè)務(wù)邏輯拆分,數(shù)據(jù)庫的分表分庫等。在這個(gè)前提下,才能實(shí)現(xiàn)云上云下基于多副本技術(shù)的多活架構(gòu)。

shshiheng系統(tǒng)運(yùn)維工程師:

個(gè)人理解建立哪種模式的災(zāi)備中心才是目標(biāo),如果是要做多活中心,需要考慮實(shí)現(xiàn)哪個(gè)層面的多活,當(dāng)然至于用不用云方式來實(shí)現(xiàn)根據(jù)自身實(shí)際情況而定。我單位的主數(shù)據(jù)中心應(yīng)用層面上IAAS云,數(shù)據(jù)庫還是傳統(tǒng)模式部署,另外災(zāi)備中心也只是作為主數(shù)據(jù)中心的備份,未來如果做成雙活數(shù)據(jù)中心,也會(huì)存在云上、云下兼而有之的情況。

gk711某證券企業(yè)云平臺(tái)架構(gòu)師:

從實(shí)際能落地的效果看,兩地多中心云數(shù)據(jù)中心大多數(shù)目前以自建的私有云作為資源交付為主,Iass僅僅只能作為一個(gè)靜默的災(zāi)備中心用于將應(yīng)用和數(shù)據(jù)進(jìn)行同步部署和備份。要作為多中心雙活的架構(gòu),不是簡單的建一個(gè)資源交付的資源池,提供災(zāi)備所需的物理資源,更多的是要考慮全棧的云服務(wù)方案,雙活容災(zāi)需要通過云服務(wù)的方式提供跨數(shù)據(jù)中心的負(fù)載均衡服務(wù)、數(shù)據(jù)同步復(fù)制,以及最重要的是應(yīng)用架構(gòu)滿足多活的訪問。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論