本文介紹了基于VMware的虛擬化建設(shè)中,如何進(jìn)行計(jì)算資源規(guī)劃、存儲(chǔ)資源規(guī)劃、網(wǎng)絡(luò)資源規(guī)劃、可用性規(guī)劃以及管理與監(jiān)控規(guī)劃。由skey_deng分享。
1、虛擬化的優(yōu)勢(shì)
虛擬化技術(shù)可以極大減少需要維護(hù)和管理的設(shè)備。虛擬化可以提高資源利用率,降低硬件采購(gòu)成本,同時(shí)更加節(jié)能和節(jié)省空間。
服務(wù)器虛擬化后,我們通過(guò)虛擬化集群,統(tǒng)一進(jìn)行管理。充分利用已有設(shè)備,同時(shí)也可以進(jìn)行縱向及橫向擴(kuò)展新設(shè)備。
虛擬化的深入應(yīng)用,將動(dòng)態(tài)增加虛擬化集群的規(guī)模,形成更健康的IT體系架構(gòu)。
客戶端方面,將不改變?cè)械脑L問(wèn)模式,不會(huì)對(duì)業(yè)務(wù)系統(tǒng)造成任何不利影響,可實(shí)現(xiàn)既有系統(tǒng)的平穩(wěn)遷移。
虛擬化對(duì)比傳統(tǒng)架構(gòu)的優(yōu)勢(shì)點(diǎn)總結(jié)如下:
規(guī)劃工作容易把控
硬件投資相對(duì)較小
資源利用率高,易整合
服務(wù)器功耗小,配套基礎(chǔ)設(shè)施消耗小
應(yīng)用部署快速,新業(yè)務(wù)上限周期短
業(yè)務(wù)連續(xù)性優(yōu)異,抗災(zāi)害能力強(qiáng)
2、虛擬化適用性
虛擬化平臺(tái)的適用性較強(qiáng),除個(gè)別類型應(yīng)用不適合虛擬化平臺(tái),其余皆可適用。
不適合采用虛擬化的應(yīng)用
具有特殊硬件訪問(wèn)要求的應(yīng)用
需求高性能圖形顯卡
不適用虛擬化,例如OCR文字識(shí)別系統(tǒng)
特殊的串/并行加密設(shè)備
不適用虛擬化,例如統(tǒng)一加密平臺(tái)
USB設(shè)備連接需求
可能不適用,可采用外置USB設(shè)備代替,需經(jīng)過(guò)測(cè)試,例如個(gè)別采用U盾授權(quán)的監(jiān)控等
即使在高配置的服務(wù)器上仍然具有很高負(fù)載的應(yīng)用
可能不適用,需分析當(dāng)前服務(wù)器配置情況
3、虛擬化建設(shè)規(guī)劃與分析
虛擬機(jī)上運(yùn)行著為各個(gè)用戶和整個(gè)業(yè)務(wù)線提供支持的應(yīng)用與服務(wù),其中有很多都是關(guān)鍵業(yè)務(wù)應(yīng)用,因此必須正確設(shè)計(jì)、調(diào)配和管理虛擬機(jī),以確保這些應(yīng)用與服務(wù)能夠高效運(yùn)行。
3.1計(jì)算資源規(guī)劃
VMware ESXi主機(jī)是數(shù)據(jù)中心的基本計(jì)算構(gòu)造塊,這些主機(jī)資源聚合起來(lái)可構(gòu)建高可用動(dòng)態(tài)資源池環(huán)境,作為數(shù)據(jù)中心各應(yīng)用的整體計(jì)算資源。
本小節(jié)主要介紹對(duì)計(jì)算資源進(jìn)行整體規(guī)劃的要求,包括物理服務(wù)器,虛擬機(jī)等資源。
指導(dǎo)原則與最佳實(shí)踐:
除非確實(shí)需要多個(gè)虛擬CPU(vCPU),否則默認(rèn)配置一個(gè),使用盡可能少的虛擬CPU。操作系統(tǒng)必須支持對(duì)稱多處理(SMP)功能。應(yīng)用必須是多線程的,才能受益于多個(gè)虛擬CPU。虛擬CPU的數(shù)量不得超過(guò)主機(jī)上物理CPU核心的數(shù)量。
不要規(guī)劃使用主機(jī)的所有CPU或內(nèi)存資源,在設(shè)計(jì)中保留一些可用資源。要實(shí)現(xiàn)虛擬機(jī)內(nèi)存性能最優(yōu)化,關(guān)鍵是在物理RAM中保留虛擬機(jī)的活動(dòng)內(nèi)存,應(yīng)避免過(guò)量分配活動(dòng)內(nèi)存。
始終將透明頁(yè)共享保持啟用狀態(tài),始終加載VMware Tools并啟用內(nèi)存釋放。
資源池CPU和內(nèi)存份額設(shè)置不能用于配置虛擬機(jī)優(yōu)先級(jí)。資源池可用于為虛擬機(jī)分配專用CPU和內(nèi)存資源。
在工作負(fù)載極易變化的環(huán)境中配置vSphere DPM,以降低能耗和散熱成本。
部署一個(gè)系統(tǒng)磁盤和一個(gè)單獨(dú)的應(yīng)用數(shù)據(jù)磁盤。如果系統(tǒng)磁盤和數(shù)據(jù)磁盤需要相同的I/O特征(RAID級(jí)別、存儲(chǔ)帶寬和延遲),應(yīng)將它們一起放置在一個(gè)數(shù)據(jù)存儲(chǔ)中。
應(yīng)用要求應(yīng)作為向虛擬機(jī)分配資源的主要指標(biāo)。
像保護(hù)物理機(jī)一樣保護(hù)虛擬機(jī)的安全。確保為虛擬基礎(chǔ)架構(gòu)中的每個(gè)虛擬機(jī)啟用了防病毒、反間諜軟件、入侵檢測(cè)和FW。確保隨時(shí)更新所有的安全保護(hù)措施。應(yīng)用合適的最新補(bǔ)丁,要將虛擬機(jī)軟件和應(yīng)用保持在最新狀態(tài),應(yīng)使用補(bǔ)丁程序管理工具,或者安裝和配置Update Manager。入侵檢測(cè)及FW可以在網(wǎng)絡(luò)上配置。
為避免管理連接問(wèn)題,應(yīng)向每個(gè)ESXi主機(jī)分配靜態(tài)IP地址和主機(jī)名。為便于管理,應(yīng)為DNS配置每個(gè)ESXi主機(jī)的主機(jī)名和IP地址,考慮到成本問(wèn)題的話可以在VM中搭建簡(jiǎn)單DNS服務(wù)。
確保數(shù)據(jù)中心有足夠的電源和散熱容量以避免服務(wù)中斷。
無(wú)論選擇了哪個(gè)硬件平臺(tái),都應(yīng)設(shè)計(jì)一致的平臺(tái)配置,特別是在VMware集群中。一致性包括CPU類型、內(nèi)存容量和內(nèi)存插槽分配、網(wǎng)卡和主機(jī)總線適配器類型,以及PCI插槽分配,參見VMware的兼容性列表。
使用一個(gè)或多個(gè)啟用了vSphere HA和DRS的集群,以增加可用性和可擴(kuò)展性。
使用橫向擴(kuò)展還是縱向擴(kuò)展集群由集群用途、基礎(chǔ)架構(gòu)規(guī)模、vSphere限制以及資金和運(yùn)營(yíng)成本等因素確定。
每臺(tái)服務(wù)器的運(yùn)算能力按照峰值而非平均值進(jìn)行估算,確??梢灾С痔摂M機(jī)應(yīng)用同時(shí)運(yùn)行的最高值。
CPU和內(nèi)存的估算需要預(yù)留20%的空間用于突發(fā)的計(jì)算能力過(guò)量。
內(nèi)存共享按照50%的比例進(jìn)行估算。
使用以下公式來(lái)估算可以滿足數(shù)據(jù)中心中虛擬機(jī)在CPU峰值時(shí)正常運(yùn)行所需的ESXi主機(jī)個(gè)數(shù)。
所有虛擬機(jī)的CPU峰值頻率需求量總和/每臺(tái)ESXi主機(jī)的可用CPU=需要的ESXi主機(jī)個(gè)數(shù)
使用以下公式來(lái)估算可以滿足數(shù)據(jù)中心中這些虛擬機(jī)在內(nèi)存峰值時(shí)正常運(yùn)行所需的ESXi主機(jī)個(gè)數(shù)。
所有虛擬機(jī)的內(nèi)存峰值總需求量/每臺(tái)ESXi主機(jī)的可用內(nèi)存=需要的ESXi主機(jī)個(gè)數(shù)
為使用vSphere的高可用功能,我們需要考慮增加一定數(shù)量的ESXi主機(jī)個(gè)數(shù)。
3.2存儲(chǔ)資源規(guī)劃
正確的存儲(chǔ)設(shè)計(jì)對(duì)組織實(shí)現(xiàn)業(yè)務(wù)目標(biāo)有著積極的影響,可以為性能良好的虛擬數(shù)據(jù)中心奠定基礎(chǔ)??梢员Wo(hù)數(shù)據(jù)免受惡意或者意外破壞的影響,同時(shí)防止未經(jīng)授權(quán)的用戶訪問(wèn)數(shù)據(jù)。存儲(chǔ)設(shè)計(jì)必須經(jīng)過(guò)合理優(yōu)化,以滿足應(yīng)用、服務(wù)、管理員和用戶的多樣性需求。
存儲(chǔ)資源規(guī)劃的目標(biāo)是戰(zhàn)略性地協(xié)調(diào)業(yè)務(wù)應(yīng)用與存儲(chǔ)基礎(chǔ)架構(gòu),從而降低成本、改善性能、提高可用性、提供安全性,以及增強(qiáng)功能。
本小節(jié)對(duì)存儲(chǔ)資源進(jìn)行整體規(guī)劃,包括共享存儲(chǔ)邏輯規(guī)劃,存儲(chǔ)空間規(guī)劃,存儲(chǔ)I/O控制規(guī)劃,存儲(chǔ)分層規(guī)劃等。
指導(dǎo)原則與最佳實(shí)踐:
在規(guī)劃存儲(chǔ)資源時(shí),我們會(huì)遵循如下的指導(dǎo)原則與最佳實(shí)踐。
構(gòu)建模塊化存儲(chǔ)解決方案,該方案可以隨時(shí)間推移不斷擴(kuò)展,以滿足組織的需求,用戶無(wú)需替換現(xiàn)有的存儲(chǔ)基礎(chǔ)架構(gòu)。在模塊化存儲(chǔ)解決方案中,應(yīng)同時(shí)考慮容量和性能。
每個(gè)存儲(chǔ)層具有不同的性能、容量和可用性特征,只要不是每個(gè)應(yīng)用都需要昂貴、高性能、高度可用的存儲(chǔ),設(shè)計(jì)不同的存儲(chǔ)層將十分經(jīng)濟(jì)高效。
配置存儲(chǔ)多路徑功能,配置主機(jī)、交換機(jī)和存儲(chǔ)陣列級(jí)別的冗余以便提高可用性、可擴(kuò)展性和性能。
允許集群中的所有主機(jī)訪問(wèn)相同的數(shù)據(jù)存儲(chǔ)。
配置存儲(chǔ)DRS以根據(jù)使用和延遲進(jìn)行平衡。
對(duì)于光纖通道、NFS和iSCSI存儲(chǔ),可對(duì)存儲(chǔ)進(jìn)行相應(yīng)設(shè)計(jì),以降低延遲并提高可用性。對(duì)于每秒要處理大量事務(wù)的工作負(fù)載來(lái)說(shuō),將工作負(fù)載分配到不同位置尤其重要(如數(shù)據(jù)采集或事務(wù)日志記錄系統(tǒng))。通過(guò)減少存儲(chǔ)路徑中的躍點(diǎn)數(shù)量來(lái)降低延遲。
NFS存儲(chǔ)的最大容量取決于陣列供應(yīng)商。單個(gè)NFS數(shù)據(jù)存儲(chǔ)的容量取決于將訪問(wèn)數(shù)據(jù)存儲(chǔ)的每個(gè)虛擬機(jī)所需的空間,乘以在延遲可接受的情況下可以訪問(wèn)數(shù)據(jù)存儲(chǔ)的虛擬機(jī)數(shù)量。考慮將存儲(chǔ)DRS配置為使其成員數(shù)據(jù)存儲(chǔ)的使用量保持在80%(默認(rèn)設(shè)置)的均衡水平。
單個(gè)VMFS數(shù)據(jù)存儲(chǔ)的容量取決于將訪問(wèn)數(shù)據(jù)存儲(chǔ)的每個(gè)虛擬機(jī)所需的空間,乘以在延遲可接受的情況下可以訪問(wèn)數(shù)據(jù)存儲(chǔ)的虛擬機(jī)數(shù)量??紤]配置存儲(chǔ)DRS,使數(shù)據(jù)存儲(chǔ)使用量保持在80%的均衡水平。保留10%到20%的額外容量,用于容納快照、交換文件和日志文件
為促進(jìn)對(duì)iSCSI資源的穩(wěn)定訪問(wèn),應(yīng)該為iSCSI啟動(dòng)器和目標(biāo)配置靜態(tài)IP地址。
對(duì)于基于IP的存儲(chǔ),應(yīng)使用單獨(dú)的專用網(wǎng)絡(luò)或VLAN以隔離存儲(chǔ)流量,避免與其他流量類型爭(zhēng)用資源,從而可以降低延遲并提高性能。
根據(jù)可用性要求選擇一個(gè)RAID級(jí)別,對(duì)大多數(shù)虛擬機(jī)工作負(fù)載而言,如果陣列具有足夠的電池供電緩存,RAID級(jí)別對(duì)性能不會(huì)產(chǎn)生影響。
對(duì)于大多數(shù)應(yīng)用,除非存在對(duì)RDM的特定需求,否則請(qǐng)使用VMDK磁盤。
共享存儲(chǔ)邏輯規(guī)劃
對(duì)于屬主機(jī)與存儲(chǔ)的連接應(yīng)采用多鏈路,以提高負(fù)載及冗余。
確保每個(gè)ESXi主機(jī)內(nèi)虛擬機(jī)并發(fā)IO隊(duì)列長(zhǎng)度與HBA適配卡設(shè)置保持一致。
底層LUN的需求根據(jù)實(shí)際虛擬機(jī)應(yīng)用對(duì)存儲(chǔ)IOPS的實(shí)際需求進(jìn)行規(guī)劃。
根據(jù)應(yīng)用的需要設(shè)置LUN的RAID結(jié)構(gòu),如對(duì)于隨機(jī)讀寫的數(shù)據(jù)庫(kù)如Oracle、SQL數(shù)據(jù)庫(kù),建議在LUN級(jí)別采用RAID10結(jié)構(gòu),對(duì)于數(shù)據(jù)庫(kù)日志通常為連續(xù)寫或恢復(fù)時(shí)連續(xù)讀,建議在LUN級(jí)別采用RAID5結(jié)構(gòu)。
對(duì)于IO密集型的應(yīng)用盡量采用單獨(dú)的VMFS存儲(chǔ),避免在存儲(chǔ)端與其他應(yīng)用產(chǎn)生IO爭(zhēng)用。
多個(gè)虛擬機(jī)共用一個(gè)數(shù)據(jù)存儲(chǔ)或者多個(gè)主機(jī)共享一個(gè)數(shù)據(jù)存儲(chǔ)時(shí),可以啟用存儲(chǔ)隊(duì)列QoS確保核心應(yīng)用的延時(shí)在可控范圍以及對(duì)數(shù)據(jù)存儲(chǔ)讀寫的優(yōu)先級(jí)。
通常情況下1~2TB的LUN大小具有較好的性能和可管理性。
磁盤陣列的選擇應(yīng)該滿足整個(gè)虛擬化環(huán)境最大IOPS的吞吐量需求,并配置足夠的存儲(chǔ)處理器、緩存和端口數(shù)。
存儲(chǔ)空間規(guī)劃
規(guī)劃LUN容量時(shí),建議每個(gè)LUN運(yùn)行10到20個(gè)VM(數(shù)據(jù)事務(wù)類應(yīng)用可以適當(dāng)減少),并且每個(gè)LUN的使用量不超過(guò)容量的80%。
若VM需要直接訪問(wèn)存儲(chǔ)卷,如NTFS或EXT3,應(yīng)在存儲(chǔ)中另外創(chuàng)建一LUN,以RDM方式映射到VM,VM以裸磁盤方式使用。
LUN容量規(guī)劃的公式如下所示。
LUN容量=(Z x(X+Y)*1.25)
其中:
Z=每LUN上駐留10個(gè)虛擬機(jī)
Y=虛擬磁盤文件容量
X=內(nèi)存大小
根據(jù)XXX客戶的實(shí)際生產(chǎn)環(huán)境的情況,即:1GB內(nèi)存,單一VMDK文件需要80GB,LUN容量計(jì)算如下:
LUN容量=(10 x(1+80)*1.25)≈1000 GB
存儲(chǔ)分層規(guī)劃
每個(gè)存儲(chǔ)層具有不同的性能、容量和可用性特征,只要不是每個(gè)應(yīng)用都需要昂貴、高性能、高度可用的存儲(chǔ),設(shè)計(jì)不同的存儲(chǔ)層將十分經(jīng)濟(jì)高效。
在規(guī)劃存儲(chǔ)分層時(shí),我們主要考量應(yīng)用和服務(wù)的如下存儲(chǔ)特征。
每秒I/O操作數(shù)(IOPS)要求
每秒兆字節(jié)數(shù)(MBps)要求
容量要求
可用性要求
延遲要求
并依據(jù)下列信息將應(yīng)用及服務(wù)移至設(shè)計(jì)有匹配特征的存儲(chǔ)層。
考慮任何現(xiàn)有的服務(wù)級(jí)別協(xié)議(SLA)
數(shù)據(jù)在信息生命周期中可能會(huì)在存儲(chǔ)層之間移動(dòng)
數(shù)據(jù)存儲(chǔ)群集規(guī)劃
數(shù)據(jù)存儲(chǔ)以及與數(shù)據(jù)存儲(chǔ)群集關(guān)聯(lián)的主機(jī)必須符合特定要求,才能成功使用數(shù)據(jù)存儲(chǔ)群集功能。
創(chuàng)建數(shù)據(jù)存儲(chǔ)群集時(shí),應(yīng)遵循下列準(zhǔn)則。
數(shù)據(jù)存儲(chǔ)群集必須包含類似的或可互換的數(shù)據(jù)存儲(chǔ)。
一個(gè)數(shù)據(jù)存儲(chǔ)群集中可以混用不同大小和I/O能力的數(shù)據(jù)存儲(chǔ),還可以混用來(lái)自不同陣列和供應(yīng)商的數(shù)據(jù)存儲(chǔ)。但是,下列類型的數(shù)據(jù)存儲(chǔ)不能共存于一個(gè)數(shù)據(jù)存儲(chǔ)群集中。
在同一個(gè)數(shù)據(jù)存儲(chǔ)群集中,不能組合使用NFS和VMFS數(shù)據(jù)存儲(chǔ)。
在同一個(gè)啟用了存儲(chǔ)DRS的數(shù)據(jù)存儲(chǔ)群集中,不能結(jié)合使用復(fù)制的數(shù)據(jù)存儲(chǔ)和非復(fù)制的數(shù)據(jù)存儲(chǔ)。
連接到數(shù)據(jù)存儲(chǔ)群集中的數(shù)據(jù)存儲(chǔ)的所有主機(jī)必須是ESXi 5.0及更高版本。如果數(shù)據(jù)存儲(chǔ)群集中的數(shù)據(jù)存儲(chǔ)連接到ESX/ESXi 4.x及更早版本的主機(jī),則存儲(chǔ)DRS不會(huì)運(yùn)行。
數(shù)據(jù)存儲(chǔ)群集中不能包含跨多個(gè)數(shù)據(jù)中心共享的數(shù)據(jù)存儲(chǔ)。
最佳做法是,啟用了硬件加速的數(shù)據(jù)存儲(chǔ)不能與未啟用硬件加速的數(shù)據(jù)存儲(chǔ)放在同一個(gè)數(shù)據(jù)存儲(chǔ)群集中。數(shù)據(jù)存儲(chǔ)群集中的數(shù)據(jù)存儲(chǔ)必須屬于同類,才能保證實(shí)現(xiàn)硬件加速支持的行為。
3.3網(wǎng)絡(luò)資源規(guī)劃
正確的網(wǎng)絡(luò)設(shè)計(jì)對(duì)組織實(shí)現(xiàn)其業(yè)務(wù)目標(biāo)有著積極的影響,它可確保經(jīng)過(guò)授權(quán)的用戶能夠及時(shí)訪問(wèn)業(yè)務(wù)數(shù)據(jù),同時(shí)防止未經(jīng)授權(quán)的用戶訪問(wèn)數(shù)據(jù)。網(wǎng)絡(luò)設(shè)計(jì)必須經(jīng)過(guò)合理優(yōu)化,以滿足應(yīng)用、服務(wù)、存儲(chǔ)、管理員和用戶的各種需求。
網(wǎng)絡(luò)資源規(guī)劃的目標(biāo)是設(shè)計(jì)一種能降低成本、改善性能、提高可用性、提供安全性,以及增強(qiáng)功能的虛擬網(wǎng)絡(luò)基礎(chǔ)架構(gòu),該架構(gòu)能夠更順暢地在應(yīng)用、存儲(chǔ)、用戶和管理員之間傳遞數(shù)據(jù)。
本小節(jié)對(duì)網(wǎng)絡(luò)資源進(jìn)行整體規(guī)劃,包括虛擬交換機(jī),網(wǎng)卡綁定等。
在規(guī)劃網(wǎng)絡(luò)設(shè)計(jì)時(shí),我們主要從以下幾個(gè)方面進(jìn)行考量并進(jìn)行相關(guān)的設(shè)計(jì)。
連接要求
帶寬要求
延遲要求
可用性要求
成本要求
指導(dǎo)原則與最佳實(shí)踐:
在規(guī)劃網(wǎng)絡(luò)資源時(shí),我們會(huì)遵循如下的指導(dǎo)原則與最佳實(shí)踐。
構(gòu)建模塊化網(wǎng)絡(luò)解決方案,該方案可隨時(shí)間的推移不斷擴(kuò)展以滿足組織的需求,使得用戶無(wú)需替換現(xiàn)有的網(wǎng)絡(luò)基礎(chǔ)架構(gòu),進(jìn)而降低成本。
為了減少爭(zhēng)用和增強(qiáng)安全性,應(yīng)該按照流量類型(vSphere管理網(wǎng)絡(luò)(HA心跳互聯(lián)網(wǎng)絡(luò))、vMotion在線遷移網(wǎng)絡(luò)、虛擬機(jī)對(duì)外提供服務(wù)的網(wǎng)絡(luò)、FT、IP存儲(chǔ))對(duì)網(wǎng)絡(luò)流量進(jìn)行邏輯分離。
VLAN可減少所需的網(wǎng)絡(luò)端口和電纜數(shù)量,但需要得到物理網(wǎng)絡(luò)基礎(chǔ)架構(gòu)的支持。
首選分布式交換機(jī),并應(yīng)盡可能少配置虛擬交換機(jī)。對(duì)于每一個(gè)虛擬交換機(jī)vSwitch應(yīng)該配置至少兩個(gè)上行鏈路物理網(wǎng)絡(luò)端口。
可以在不影響虛擬機(jī)或在交換機(jī)后端運(yùn)行的網(wǎng)絡(luò)服務(wù)的前提下,向標(biāo)準(zhǔn)或分布式交換機(jī)添加或從中移除網(wǎng)絡(luò)適配器。如果移除所有正在運(yùn)行的硬件,虛擬機(jī)仍可互相通信。如果保留一個(gè)網(wǎng)絡(luò)適配器原封不動(dòng),則所有的虛擬機(jī)仍然可以與物理網(wǎng)絡(luò)相連。
連接到同一vSphere標(biāo)準(zhǔn)交換機(jī)或分布式交換機(jī)的每個(gè)物理網(wǎng)絡(luò)適配器還應(yīng)該連接到同一物理網(wǎng)絡(luò)。將所有VMkernel網(wǎng)絡(luò)適配器配置為相同MTU。
實(shí)施網(wǎng)絡(luò)組件和路徑冗余,以支持可用性和負(fù)載分配。
使用具有活動(dòng)/備用端口配置的網(wǎng)卡綁定,以減少所需端口的數(shù)量,同時(shí)保持冗余。
對(duì)于多網(wǎng)口的冗余配置應(yīng)該遵循配置在不同PCI插槽間的物理網(wǎng)卡口之間。
對(duì)于物理交換網(wǎng)絡(luò)也應(yīng)該相應(yīng)的進(jìn)行冗余設(shè)置,避免單點(diǎn)故障。建議采用千兆以太網(wǎng)交換網(wǎng)絡(luò),避免網(wǎng)絡(luò)瓶頸。
對(duì)吞吐量和并發(fā)網(wǎng)絡(luò)帶寬有較高使用要求的情況,可以考慮采用10GbE,不過(guò)采用萬(wàn)兆網(wǎng)絡(luò)在適配器和交換機(jī)上的投入成本也會(huì)相應(yīng)增加。簡(jiǎn)單的方法是通過(guò)在虛擬機(jī)網(wǎng)絡(luò)vSwitch或vPortGroup上通過(guò)對(duì)多塊1GbE端口捆綁負(fù)載均衡實(shí)現(xiàn)。
將直通設(shè)備與Linux內(nèi)核2.6.20或更低版本配合使用時(shí),避免使用MSI和MSI-X模式,因?yàn)檫@會(huì)明顯影響性能。
為了保護(hù)大部分敏感的虛擬機(jī),要在虛擬機(jī)中部署防火墻,以便在帶有上行鏈路(連接物理網(wǎng)絡(luò))的虛擬網(wǎng)絡(luò)和無(wú)上行鏈路的純虛擬網(wǎng)絡(luò)之間路由。
虛擬交換機(jī)規(guī)劃
所選用的網(wǎng)卡必須在vSphere服務(wù)器的網(wǎng)絡(luò)I/O設(shè)備兼容列表里。
對(duì)于虛擬交換機(jī)的雙端口冗余,如果網(wǎng)卡自帶軟件支持可以在ESXi操作系統(tǒng)級(jí)別實(shí)現(xiàn)NIC Teaming,本方案建議通過(guò)在vSwitch交換機(jī)層面配置雙網(wǎng)卡的負(fù)載均衡或主備切換策略,負(fù)載均衡策略可以基于虛擬機(jī)源地址或目標(biāo)地址IP哈希值,也可以設(shè)置為基于MAC地址哈希值。
對(duì)于虛擬機(jī)應(yīng)用的網(wǎng)絡(luò),為了確保虛擬機(jī)在執(zhí)行了vMotion遷移到另一物理主機(jī)時(shí)保持其原有的VLAN狀態(tài),建議根據(jù)實(shí)際需要在虛擬交換機(jī)端口啟用802.1q的VLAN標(biāo)記(VST)方式。采用此方式可以確保遷移主機(jī)可以保留原有的網(wǎng)絡(luò)配置如網(wǎng)關(guān)等,并且建議在網(wǎng)絡(luò)設(shè)置中啟用通知物理交換機(jī)功能,該功能可以確保遷移主機(jī)通過(guò)反向ARP通知物理交換機(jī)虛擬機(jī)端口的更改,確保新的用戶會(huì)話可以被正確建立。
對(duì)于虛擬機(jī)存儲(chǔ),采用IPSAN網(wǎng)絡(luò),通過(guò)虛擬機(jī)vmkernel包含的PSA多路徑模塊進(jìn)行存儲(chǔ)路徑匯聚及故障策略選擇。
網(wǎng)卡綁定
服務(wù)器整合會(huì)將各種故障影響混在一起,從而增加對(duì)冗余的需要。而通過(guò)使用來(lái)自多個(gè)網(wǎng)卡和主板接口的端口配置網(wǎng)卡綁定可進(jìn)一步減少單點(diǎn)故障的數(shù)量。除此之外,網(wǎng)卡綁定還可以增加網(wǎng)絡(luò)路徑的可用帶寬
網(wǎng)卡綁定要求滿足以下條件:
將兩個(gè)或更多網(wǎng)卡分配到同一虛擬交換機(jī)
同一端口組中的所有網(wǎng)卡都位于相同的第二層廣播域中
3.4可用性規(guī)劃
本次規(guī)劃充分考慮了虛擬化環(huán)境的可用性設(shè)計(jì),例如:在網(wǎng)絡(luò)層面和存儲(chǔ)層面分別利用了VMware vSphere內(nèi)置的網(wǎng)絡(luò)冗余和存儲(chǔ)多路徑控制確保高可用。在服務(wù)器高可用性上,vSphere內(nèi)置了HA,DRS和vMotion等功能可以應(yīng)對(duì)本地站點(diǎn)多種虛擬機(jī)應(yīng)用計(jì)劃內(nèi)和計(jì)劃外意外停機(jī)的問(wèn)題。
本小節(jié)對(duì)可用性進(jìn)行整體規(guī)劃,可用性相關(guān)技術(shù)的說(shuō)明與配置指導(dǎo)原則如下:
指導(dǎo)原則與最佳實(shí)踐:
在高可用性集群中配置所有vSphere主機(jī),最少應(yīng)實(shí)現(xiàn)n+1冗余。
按照需求啟用HA策略,并且對(duì)于業(yè)務(wù)連續(xù)性要求較高的系統(tǒng)設(shè)置業(yè)務(wù)自啟動(dòng)腳本,保證虛擬機(jī)在其他宿主機(jī)重啟后能夠在最短時(shí)間內(nèi)啟動(dòng)服務(wù)。
按照需求啟用DRS策略,并設(shè)置互斥規(guī)則,尤其針對(duì)采用多機(jī)負(fù)載技術(shù)的應(yīng)用,避免多機(jī)處于統(tǒng)一宿主機(jī)。
VMware HA提供了簡(jiǎn)單易用、高效、高可用的虛擬機(jī)應(yīng)用運(yùn)行環(huán)境。在物理機(jī)發(fā)生故障時(shí),可以被集群中的其他物理節(jié)點(diǎn)偵測(cè)到并且自動(dòng)在備用物理機(jī)或其他有空閑資源的物理機(jī)啟動(dòng)故障節(jié)點(diǎn)在線的虛擬機(jī)。此外,如果虛擬機(jī)操作系統(tǒng)故障也可以被VMware HA偵測(cè)到并嘗試重啟該虛擬機(jī),最大限度保持虛擬機(jī)應(yīng)用的可用性。
利用VMware DRS動(dòng)態(tài)資源調(diào)配可以收集各物理主機(jī)和虛擬機(jī)資源(CPU、內(nèi)存等)使用情況,并且提供虛擬機(jī)最佳放置策略,可以自動(dòng)或手動(dòng)進(jìn)行虛擬機(jī)的在線遷移功能滿足最佳負(fù)載平衡需求。利用DRS建立資源池,可以最大限度的保證XXXX信息中心虛擬化環(huán)境的核心應(yīng)用,例如針對(duì)辦公系統(tǒng)的SQL數(shù)據(jù)庫(kù)設(shè)置高優(yōu)先級(jí)別,確保其在資源池中CPU、內(nèi)存等資源的配比保持最優(yōu)。同時(shí),可以構(gòu)建DRS HA集群在確保負(fù)載平衡的同時(shí)滿足高可用的要求。
對(duì)于需要對(duì)虛擬機(jī)所在物理機(jī)運(yùn)行環(huán)境進(jìn)行升級(jí)維護(hù)時(shí),可以采用VMware VMotion技術(shù)在線將該物理機(jī)運(yùn)行的虛擬機(jī)通過(guò)網(wǎng)絡(luò)遷移到其他物理主機(jī),并且確保遷移過(guò)程中對(duì)虛擬機(jī)應(yīng)用沒(méi)有影響。遷移后所有與客戶端的會(huì)話連接不會(huì)中斷,目前千兆網(wǎng)絡(luò)vSphere可以同時(shí)并發(fā)遷移4個(gè)虛擬主機(jī)。
3.5管理與監(jiān)控規(guī)劃
VMware vSphere虛擬基礎(chǔ)架構(gòu)每天都必須持續(xù)高效運(yùn)行。而保持這種高效性首先要從正確設(shè)計(jì)管理和監(jiān)視組件開始。
本小節(jié)對(duì)管理與監(jiān)控組建進(jìn)行整體規(guī)劃,包括vCenter Server及其數(shù)據(jù)庫(kù),警報(bào)和ESXi主機(jī)安裝與配置等。
指導(dǎo)原則與最佳實(shí)踐:
在進(jìn)行管理與監(jiān)控規(guī)劃時(shí),我們會(huì)遵循如下的指導(dǎo)原則與最佳實(shí)踐。
首選使用虛擬機(jī)部署vCenter Server和數(shù)據(jù)庫(kù)系統(tǒng)。根據(jù)虛擬基礎(chǔ)架構(gòu)的大小部署一個(gè)或多個(gè)vCenter Server系統(tǒng)。
配置靜態(tài)IP地址和主機(jī)名稱,以避免與vCenter Server實(shí)例的連接中斷。
如果可以允許停機(jī)一兩分鐘,請(qǐng)使用vSphere HA保護(hù)vCenter Server系統(tǒng)。如果無(wú)法容忍停機(jī)一或兩分鐘以上,請(qǐng)使用vCenter Server Heartbeat
之類的產(chǎn)品或第三方集群解決方案保護(hù)vCenter Server系統(tǒng)。
如果為vSphere HA集群?jiǎn)⒂昧薉RS,請(qǐng)禁用vCenter Server虛擬機(jī)遷移。
對(duì)于除包括少量主機(jī)的小型基礎(chǔ)架構(gòu)外的所有基礎(chǔ)架構(gòu)而言,請(qǐng)勿將vCenter Server數(shù)據(jù)庫(kù)系統(tǒng)和vCenter Server置于相同的系統(tǒng)中。
使用數(shù)據(jù)庫(kù)供應(yīng)商提供的可用性方法(如果可能),如果數(shù)據(jù)庫(kù)供應(yīng)商未提供特定的方法,請(qǐng)使用vSphere HA保護(hù)數(shù)據(jù)庫(kù)服務(wù)器。
如果組織擔(dān)心在使用管理界面連接vCenter Server系統(tǒng)或ESXi
主機(jī)時(shí)會(huì)有中間人攻擊,請(qǐng)使用證書。如果配置了vCenter鏈接模式(僅限基于Windows的vCenter Server系統(tǒng))或vSphere Fault Tolerance(FT),必須啟用vCenter Server證書檢查。
使用自動(dòng)化方法安裝和配置ESXi主機(jī)。為基礎(chǔ)架構(gòu)服務(wù)創(chuàng)建獨(dú)立的管理集群。
限制具有vCenter Server訪問(wèn)權(quán)限的用戶數(shù)量。對(duì)具有vCenter Server訪問(wèn)權(quán)限的用戶采用最低特權(quán)原則。
將vCenter Server系統(tǒng)和托管管理接口的所有服務(wù)器(VMware vSphere Client、vSphere PowerCLI等)添加到目錄服務(wù)。然后在目錄服務(wù)中創(chuàng)建用戶和組
使用文件夾為需要相似訪問(wèn)權(quán)限的對(duì)象分配角色,通過(guò)簡(jiǎn)化權(quán)限分配來(lái)簡(jiǎn)化管理和增強(qiáng)安全性
在獨(dú)立于vCenter Server系統(tǒng)的系統(tǒng)中安裝vCenter Server可選模塊。最好在虛擬機(jī)上安裝可選模塊。
如果設(shè)計(jì)包括多個(gè)vCenter Server系統(tǒng),應(yīng)該配置vCenter鏈接模式。vCenter鏈接模式要求所有vCenter Server系統(tǒng)都是同一個(gè)域中的Active Directory成員,或至少是受信任域的成員。
必須在虛擬機(jī)、ESX/ESXi主機(jī)和管理系統(tǒng)中保持時(shí)間同步。
快照不是備份解決方案,但卻是很有用的撤消操作解決方案。對(duì)于生產(chǎn)環(huán)境,建議每個(gè)虛擬機(jī)對(duì)應(yīng)一個(gè)快照和清除策略:
盡可能自動(dòng)執(zhí)行性能監(jiān)視,并在超過(guò)性能閾值時(shí)創(chuàng)建用于通知的警報(bào)。但避免采用過(guò)于嚴(yán)格的vCenter Server警報(bào)設(shè)置。
在包含70–100臺(tái)主機(jī)或者更多主機(jī)的大型基礎(chǔ)架構(gòu)中,考慮至少創(chuàng)建一個(gè)啟用了vSphere HA和DRS且包含三臺(tái)主機(jī)的管理集群。
如果已存在管理集群,請(qǐng)優(yōu)先使用現(xiàn)有管理工具與流程執(zhí)行操作系統(tǒng)和應(yīng)用的更新操作。否則,請(qǐng)使用Update Manager。