云服務(wù)是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式,通常涉及通過(guò)互聯(lián)網(wǎng)來(lái)提供動(dòng)態(tài)易擴(kuò)展且經(jīng)常是虛擬化的資源。它最大的特點(diǎn),是通過(guò)使計(jì)算分布在大量的分布式計(jì)算機(jī)上,而非本地計(jì)算機(jī)或遠(yuǎn)程服務(wù)器中,企業(yè)數(shù)據(jù)中心的運(yùn)行將與互聯(lián)網(wǎng)更相似。這使得企業(yè)能夠?qū)①Y源切換到需要的應(yīng)用上,根據(jù)需求訪問(wèn)計(jì)算機(jī)和存儲(chǔ)系統(tǒng)。
2012年云服務(wù)開(kāi)始正式內(nèi)測(cè),時(shí)至今日已經(jīng)成為與企業(yè)和用戶息息相關(guān)的技術(shù)。目前,亞馬遜AWS、微軟Azure、阿里云、騰訊云等是市場(chǎng)主流的云計(jì)算服務(wù)商,提供包括彈性計(jì)算、數(shù)據(jù)庫(kù)、域名、CDN、存儲(chǔ)等支持。然而,云服務(wù)也不是絕對(duì)安全的,服務(wù)器的宕機(jī)勢(shì)必會(huì)對(duì)企業(yè)和用戶造成一定的影響,宕機(jī)也會(huì)讓黑客找到空子,從而進(jìn)行一些非法的活動(dòng)。
近期,亞馬遜Web服務(wù)遭到了部分停擺的尷尬,包括Netflix, Reddit, Adobe, Imgur均遭遇部分服務(wù)載入緩慢,亞馬遜用了11個(gè)小時(shí)才最終恢復(fù)。亞馬遜很快確認(rèn),是旗下大名鼎鼎的S3(Simple Storge Service)存儲(chǔ)服務(wù)問(wèn)題,現(xiàn)在原因已經(jīng)查明。
云服務(wù)宕機(jī)誰(shuí)的利益受侵害?
云存儲(chǔ)、云備份等產(chǎn)品及服務(wù)的確為眾多企業(yè),尤其是中小企業(yè)帶來(lái)了便利,但云存儲(chǔ)同時(shí)又是一把雙刃劍,在發(fā)生問(wèn)題時(shí)給企業(yè)帶來(lái)等影響和損失也是非常巨大的。
在云服務(wù)宕機(jī)之時(shí),對(duì)于從事網(wǎng)絡(luò)服務(wù)的企業(yè)來(lái)說(shuō),流量的影響最為巨大。對(duì)于從事電商的企業(yè)來(lái)說(shuō),每分每秒都能決定銷售額,在這背后損失的不僅僅是企業(yè)的誠(chéng)心,同時(shí)那些供應(yīng)商的利益也會(huì)受到重大的損失。
對(duì)于用戶來(lái)說(shuō),網(wǎng)絡(luò)的體驗(yàn)和即時(shí)信息的獲取都將受到影響,其中最關(guān)鍵的在于,那些守著網(wǎng)絡(luò)進(jìn)行股票、期貨交易的用戶來(lái)說(shuō),損失將會(huì)是巨大的。
如何預(yù)防云服務(wù)宕機(jī)?
云服務(wù)的宕機(jī)不是云服務(wù)廠商所希望看到的,可當(dāng)這種事情發(fā)生之時(shí),云服務(wù)商們應(yīng)該做點(diǎn)什么來(lái)應(yīng)對(duì)呢?
為了讓服務(wù)器在最佳狀況下運(yùn)行,需要保持合適的環(huán)境、積極主動(dòng)地維護(hù)和監(jiān)控,并且制定一項(xiàng)計(jì)劃,那樣萬(wàn)一服務(wù)器果真出現(xiàn)了故障,員工知道該怎么做。
大型數(shù)據(jù)中心大多有先進(jìn)的設(shè)備來(lái)監(jiān)控?cái)?shù)據(jù)中心的物理狀況,但是許多比較小的公司其服務(wù)器機(jī)房并不是處在適當(dāng)?shù)臏囟然驖穸确秶?或者沒(méi)有做到應(yīng)有的干凈。
如果采用預(yù)防性維護(hù)和合適的監(jiān)控軟件,就可以避免或減少另外的許多服務(wù)器問(wèn)題。預(yù)防性維護(hù)主要包括三項(xiàng)工作:仔細(xì)檢查錯(cuò)誤日志,查找固件或軟件的更新版,以及跑到機(jī)房去檢查。
除了在技術(shù)層面進(jìn)行防范外,企業(yè)或者用戶首先要對(duì)上傳到云端的資料進(jìn)行數(shù)據(jù)備份,同時(shí),將不同的數(shù)據(jù)在不同的云端進(jìn)行備份。備份還要記得定期更新,而且要保證這些備份存儲(chǔ)在一個(gè)與云服務(wù)器不同的位置。
云服務(wù)宕機(jī)編年史
2014年11月2日下午,騰訊云服務(wù)器出現(xiàn)了6分鐘的訪問(wèn)故障。騰訊云網(wǎng)站響應(yīng)速度慢,圖片打不開(kāi),并出現(xiàn)無(wú)法登錄管理中心控制臺(tái)等問(wèn)題。
2015年3月11日,Apple iCloud內(nèi)部DNS錯(cuò)誤導(dǎo)致其iTunes和App Store的服務(wù)宕機(jī),一些iCloud的電子郵件帳戶也受到短暫影響。
2015年,5月27日晚6點(diǎn)時(shí)左右,杭州、北京、上海、武漢等地用戶反映,支付寶無(wú)法正常使用。支付寶公司對(duì)故障的回應(yīng)稱,杭州蕭山某地光纖被挖斷,導(dǎo)致故障。
2015年6月21日,阿里云香港節(jié)點(diǎn)當(dāng)天9點(diǎn)30分左右突然全線崩潰,截至當(dāng)晚22點(diǎn)才逐漸恢復(fù),整體過(guò)程歷時(shí)近13小時(shí)。
2015年,8月22日,位于美國(guó)硅谷的富士通數(shù)據(jù)中心供電異常,導(dǎo)致公有云服務(wù)暫時(shí)下線,5天后才恢復(fù)正常。
2015年,9月20日,亞馬遜AWS宕機(jī),首先是亞馬遜DynamoDB服務(wù)出現(xiàn)問(wèn)題,此后亞馬遜的其他服務(wù)也受到影響,同時(shí)波及了很多著名網(wǎng)站。
可以說(shuō),云服務(wù)發(fā)展至今已經(jīng)成為了企業(yè)和用戶最為便捷的技術(shù)手段,宕機(jī)已經(jīng)成為了家常便飯,雖然人們不想看到宕機(jī)時(shí)間的發(fā)生,但防范于未然才是重點(diǎn)所在。