可用性(Availability)是指軟件系統(tǒng)在一段給定時(shí)間內(nèi)正常工作的時(shí)間占總時(shí)間的比重,通常用百分比來(lái)衡量。在傳統(tǒng)的數(shù)據(jù)中心中,影響服務(wù)可用性的因素有服務(wù)器異常宕機(jī)、服務(wù)被攻擊、操作系統(tǒng)崩潰、軟件崩潰、停電、網(wǎng)絡(luò)中斷等。數(shù)據(jù)中心管理員需要采用冗余和災(zāi)難備份等方式來(lái)保證服務(wù)的可用性。然而,這些冗余或者災(zāi)難備份系統(tǒng)的引入又帶來(lái)了新的問(wèn)題,比如冗余備份帶來(lái)副本一致性問(wèn)題,以及更高的采購(gòu)和管理開(kāi)銷(xiāo)。軟、硬件設(shè)備和系統(tǒng)自身出現(xiàn)問(wèn)題是不可能完全避免的,云計(jì)算高可用性的本質(zhì)是通過(guò)技術(shù)創(chuàng)新,保證即使軟、硬件出現(xiàn)問(wèn)題服務(wù)仍然可用,比如虛擬化技術(shù)提供的快速部署、虛擬機(jī)實(shí)時(shí)遷移能力,都將云計(jì)算環(huán)境的可用性提到了一個(gè)新的高度。
云環(huán)境能夠在最大程度上減少資源的不可用對(duì)業(yè)務(wù)系統(tǒng)的影響,打造具有高可用性的計(jì)算環(huán)境。在云計(jì)算中,提供對(duì)運(yùn)行時(shí)間的保證和服務(wù)級(jí)別協(xié)定已經(jīng)成為對(duì)大多數(shù)云計(jì)算提供商的標(biāo)準(zhǔn)要求。這些云計(jì)算平臺(tái)大多聲稱(chēng)能夠提供99.999%的可用性。但實(shí)際上,現(xiàn)有的云計(jì)算環(huán)境也出現(xiàn)過(guò)可用性問(wèn)題,這些問(wèn)題的出現(xiàn)使得人們對(duì)現(xiàn)階段公有云計(jì)算產(chǎn)品和服務(wù)的高可用性產(chǎn)生了質(zhì)疑。
為了提供真正高可用的服務(wù),云計(jì)算的提供商正在研究常見(jiàn)故障的分析及預(yù)測(cè)模型?;趯?duì)這些模型的研究,云計(jì)算服務(wù)商希望能夠預(yù)測(cè)到可能的可用性問(wèn)題,并通過(guò)提前準(zhǔn)備副本、提前解決故障、通知用戶(hù)等手段來(lái)避免這些故障的發(fā)生,或者減少故障發(fā)生帶來(lái)的損失。