雷暴襲擊導(dǎo)致多家大廠數(shù)據(jù)中心癱瘓!

據(jù)媒體消息,除了服務(wù)全部離線外,這次事故還導(dǎo)致部分硬件被燒毀。此次事故持續(xù)將近24小時(shí)才陸續(xù)恢復(fù),其中由于硬件損壞,部分客戶的數(shù)據(jù)無法轉(zhuǎn)移只能通過恢復(fù)手段進(jìn)行復(fù)原。

本文來自中國IDC圈。

8月30日晚,悉尼數(shù)據(jù)中心遭遇了一場(chǎng)雷暴襲擊,導(dǎo)致甲骨文云、NetSuite和微軟Azure等主要云服務(wù)提供商中斷服務(wù)。

據(jù)報(bào)道,短短三個(gè)小時(shí)內(nèi),該市就記錄了約22,000次雷擊,約30,000人因風(fēng)暴而斷電。

Oracle當(dāng)時(shí)向客戶發(fā)送了電子郵件通知他們停電情況,并告知停電時(shí)間為當(dāng)?shù)貢r(shí)間上午10:15。

同樣,Microsoft也聯(lián)系了其客戶,告訴他們Azure云遇到了問題。微軟表示,停電發(fā)生的時(shí)間甚至更早,即當(dāng)?shù)貢r(shí)間上午8:30左右,并表示該問題是由澳大利亞東部地區(qū)的“公用事業(yè)電力激增”引起的。供電原因?qū)е聰?shù)據(jù)中心的一些冷卻裝置關(guān)閉,從而導(dǎo)致微軟“主動(dòng)關(guān)閉”部分計(jì)算和存儲(chǔ)裝置以避免損壞。

甲骨文旗下的NetSuite也受到了此次中斷的影響。該公司在其狀態(tài)頁面上表示,最初的原因是極端天氣。“雷暴影響了悉尼數(shù)據(jù)中心的冷水機(jī)組,大多數(shù)系統(tǒng)被暫時(shí)關(guān)閉以降低溫度。溫度已經(jīng)穩(wěn)定,系統(tǒng)正在系統(tǒng)地啟動(dòng)。”受停電影響的客戶包括昆士蘭銀行(BOQ)和捷星航空。

BOQ的應(yīng)用程序存在問題,交易未正確反映在客戶帳戶中。悉尼時(shí)間8月31日下午2點(diǎn)45分,該銀行的服務(wù)已恢復(fù)。同樣,捷星航空發(fā)現(xiàn)客戶無法登錄、管理預(yù)訂或辦理航班登機(jī)手續(xù)。

根據(jù)Oracle系統(tǒng)狀態(tài),許多服務(wù)現(xiàn)已恢復(fù)并完全運(yùn)行,而其他服務(wù)仍在恢復(fù)過程中。仍然受到標(biāo)記的是“Oracle云基礎(chǔ)設(shè)施數(shù)據(jù)流”,該公司表示存在“服務(wù)中斷”。微軟Azure的最新更新稱,約99%的存儲(chǔ)服務(wù)和受影響的虛擬機(jī)已恢復(fù)。

據(jù)媒體消息,除了服務(wù)全部離線外,這次事故還導(dǎo)致部分硬件被燒毀。此次事故持續(xù)將近24小時(shí)才陸續(xù)恢復(fù),其中由于硬件損壞,部分客戶的數(shù)據(jù)無法轉(zhuǎn)移只能通過恢復(fù)手段進(jìn)行復(fù)原。

據(jù)了解,在悉尼還有其他幾家主要數(shù)據(jù)中心提供商,包括Digital Realty、Equinix、Global Switch、Macquarie Data Centers、Vocus、NextDC、NTT、Keppel、Datacom和DCI。目前尚不清楚哪個(gè)數(shù)據(jù)中心遭受了停電。

微軟在事后分析報(bào)告中承認(rèn),由于數(shù)據(jù)中心規(guī)模較大,當(dāng)晚只有三名工作人員無法及時(shí)處理緊急情況。微軟表示已經(jīng)暫時(shí)將團(tuán)隊(duì)規(guī)模從三人增加到七人,直到找到更好的解決方案。此外,微軟還表示正在改進(jìn)現(xiàn)有的自動(dòng)化系統(tǒng),以提高數(shù)據(jù)中心在發(fā)生類似事件時(shí)的恢復(fù)能力。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論