今年10月21日就正式拉開電商“雙十一”狂歡購物節(jié)序幕。
數(shù)據(jù)中心如何保障購物平臺(tái)高速運(yùn)轉(zhuǎn)和交互的數(shù)據(jù),成為數(shù)據(jù)中心運(yùn)維部巨大的挑戰(zhàn)。為了防止在雙11出現(xiàn)訪問問題,數(shù)據(jù)中心需提前做好應(yīng)對措施。
首先,面對訪問流量洪峰的到來,數(shù)據(jù)中心能否承壓住,避免造成客戶平臺(tái)癱瘓,需首先與客戶平臺(tái)進(jìn)行提前預(yù)測和詳細(xì)的評(píng)估。是否需要數(shù)據(jù)中心提前進(jìn)行加固,如增加網(wǎng)絡(luò)訪問寬帶、優(yōu)化網(wǎng)絡(luò)、增加服務(wù)器、提供更多的訪問鏈接等等??梢愿鶕?jù)以往電商購物節(jié)流量洪峰進(jìn)行預(yù)判,并結(jié)合今年雙11提前做的促銷力度,進(jìn)行綜合評(píng)估。根據(jù)這些量化的數(shù)據(jù),然后再對現(xiàn)有數(shù)據(jù)中心進(jìn)行擴(kuò)容。為了盡量減少軟硬加的投入,可以將用于容災(zāi)備份的系統(tǒng),測試系統(tǒng)等數(shù)據(jù)中心設(shè)備加進(jìn)來共同保障雙11順利進(jìn)行。
其次,在雙11前進(jìn)行對整個(gè)網(wǎng)站的能力進(jìn)行壓力測試預(yù)演。通過模擬訪問流量提高整個(gè)數(shù)據(jù)中心的處理能力,減少訪問客戶平臺(tái)的響應(yīng)時(shí)間、無法訪問以及卡頓現(xiàn)象等。除壓力測試,還需對數(shù)據(jù)中心的冗余備份進(jìn)行演練,比如模擬某網(wǎng)絡(luò)設(shè)備故障或者服務(wù)器故障,此種故障下,業(yè)務(wù)需無感知地切換到其它數(shù)據(jù)中心集群上,并對設(shè)備鏈路進(jìn)行故障模擬,考驗(yàn)整個(gè)數(shù)據(jù)中心的穩(wěn)定性、冗余性。
第三,為防患于未然,關(guān)鍵節(jié)點(diǎn)上要做好冗余備份,數(shù)據(jù)中心和各種設(shè)備的備份。根據(jù)訪問流量情況,如果部分省市數(shù)據(jù)中心流量過重,影響到訪問體驗(yàn),在各個(gè)數(shù)據(jù)中心之間,可以通過變更路由,隨時(shí)將流量切換到其他數(shù)據(jù)中心進(jìn)行分擔(dān),動(dòng)態(tài)調(diào)整。在重要的數(shù)據(jù)中心里,尤其是網(wǎng)絡(luò)核心設(shè)備,要有一比一配置的設(shè)備在旁邊運(yùn)行,萬一發(fā)生故障,立即將所有的網(wǎng)線換到備用設(shè)備上,保障業(yè)務(wù)受到影響最小。還有數(shù)據(jù)中心里服務(wù)器的數(shù)量是非常龐大的,每天都可能有故障壞的,發(fā)現(xiàn)這樣的服務(wù)器直接將故障服務(wù)器剔出集群,確保業(yè)務(wù)正常。
最后,各大廠商有必要到現(xiàn)場進(jìn)行值守,一旦出現(xiàn)問題可以及時(shí)解決,深圳規(guī)避問題。因?yàn)閮H僅依靠網(wǎng)站本身的維護(hù)力量是薄弱的,畢竟數(shù)據(jù)中心里的設(shè)備類型和廠商很多,一旦出現(xiàn)特殊問題,靠網(wǎng)站的技術(shù)人員力量是無法短時(shí)間解決的。
雙11還有更多的細(xì)節(jié)保障工作,當(dāng)出現(xiàn)問題時(shí),必須要有當(dāng)機(jī)立斷、隨機(jī)應(yīng)變的能力,以最快速的辦法解決問題,確??蛻羝脚_(tái)的正常運(yùn)行,為客戶決戰(zhàn)雙11保駕護(hù)航。