日前,由于第三方管理的數(shù)據(jù)中心出現(xiàn)冷卻問(wèn)題,微軟公司在日本的Azure云服務(wù)受到影響。
受影響的Azure服務(wù)包括云主機(jī)和云存儲(chǔ)等,其中包括API管理,備份,站點(diǎn)恢復(fù),IoT Hub,SQL數(shù)據(jù)庫(kù),Azure機(jī)器學(xué)習(xí)和Azure通知中心。
Microsoft Azure公布了初步調(diào)查的結(jié)果,公布了導(dǎo)致云服務(wù)中斷的原因。"事故是由于UPS系統(tǒng)(不間斷電源系統(tǒng))導(dǎo)致數(shù)據(jù)中心空調(diào)系統(tǒng)故障,從而導(dǎo)致整個(gè)數(shù)據(jù)中心的溫度持續(xù)升高。"由于冷卻系統(tǒng)失效,"為了確保數(shù)據(jù)的完整性和彈性,某些資源自動(dòng)關(guān)閉以避免過(guò)熱。"數(shù)據(jù)中心現(xiàn)場(chǎng)工作人員重新啟動(dòng)了冷卻系統(tǒng)的空氣處理程序,并采用室外氣流冷卻數(shù)據(jù)中心。
據(jù)介紹,這個(gè)數(shù)據(jù)中心的冷卻系統(tǒng)的設(shè)計(jì)為"N + 1"冗余,配電設(shè)計(jì)為"N + 2" 冗余。 微軟公司補(bǔ)充說(shuō),UPS系統(tǒng)單元已被送修并進(jìn)行分析,并為中斷停機(jī)以及客戶(hù)可能遇到的問(wèn)題表示道歉。
不久前,微軟公司在日本西部的用戶(hù)在使用云主機(jī)時(shí)遇到問(wèn)題,其原因是在一個(gè)新的存儲(chǔ)規(guī)模單元在其數(shù)據(jù)中心被分配的IP地址應(yīng)該用在另一個(gè)數(shù)據(jù)中心。
微軟公司于2014年在日本開(kāi)通運(yùn)營(yíng)了兩個(gè)數(shù)據(jù)中心,一個(gè)建設(shè)在日本東部的埼玉縣,另一個(gè)建在日本西部的大阪。