超融合基礎(chǔ)設(shè)施(HCI)能夠使企業(yè)IT資源供應(yīng)(包括存儲)變得不那么復(fù)雜,這得益于它的擴展方式。當(dāng)企業(yè)需要向應(yīng)用程序交付更多的處理能力或存儲容量,或需要支持更多的工作負(fù)載時,管理員可以直接添加更多服務(wù)器,為集群增加節(jié)點。每個節(jié)點都包含一定量的計算能力和存儲容量,并且環(huán)境會根據(jù)需要自動擴展。
其中的挑戰(zhàn)在于,超融合基礎(chǔ)設(shè)施會犧牲效率來簡化資源配置。大多數(shù)數(shù)據(jù)中心并不需要以相同的規(guī)格增加計算能力、存儲性能和存儲容量。在幾乎每個HCI環(huán)境中,這些資源中都有一兩個是不平衡的,這意味著可用的資源一般多于所需資源。計算密集型環(huán)境最終會有多余的存儲容量,而要求存儲容量的環(huán)境最終會有空閑CPU。
行業(yè)已經(jīng)發(fā)現(xiàn)了第一代HCI產(chǎn)品的效率問題。今天,IT專業(yè)人員使用兩種主要方法來提高下一代HCI環(huán)境在提供計算、網(wǎng)絡(luò)和存儲資源方面的效率。
方法1:節(jié)點更少,更強大
第一個方法是將功能更強大、容量更大的節(jié)點與可以利用它們的HCI軟件集成在一起。第一代HCI往往會出于性能和可用性的原因而首選高節(jié)點數(shù)的集群,在這種情況下,使用更強大節(jié)點的HCI環(huán)境,可以使總節(jié)點數(shù)保持最少。盡管這些功能更強的單節(jié)點成本更高,但是一般會降低總支出,因為節(jié)點數(shù)更少,同時也只需要更少的網(wǎng)絡(luò)基礎(chǔ)架構(gòu)和更簡單的管理。在大多數(shù)情況下,6個以上功能更強的節(jié)點的群集可以勝過16節(jié)點的更弱硬件群集。
這些更強大的節(jié)點可以像第一代HCI一樣橫向擴展,并且也可以縱向擴展以確保每個節(jié)點在添加另一個節(jié)點之前都能充分利用。IT管理者可以以最少的配置購買節(jié)點,并根據(jù)需要增加計算能力和存儲容量。這些節(jié)點的內(nèi)部擴展意味著HCI軟件的存儲組件還必須以不同的方式實現(xiàn)資源管理和數(shù)據(jù)保護,因為每個節(jié)點可能具有不同的配置。
當(dāng)節(jié)點配置了全NVMe閃存和高內(nèi)核數(shù)CPU時,這種設(shè)計下的節(jié)點負(fù)載能力最好,因為這樣每個節(jié)點可以支持幾十個虛擬機,并可能交付數(shù)百萬個IOPS。由于具有高基線性能,HCI集群可以同時支持各種工作負(fù)載,并使組織能夠?qū)σ郧爸豢紤]裸機的工作負(fù)載實現(xiàn)虛擬化。
HCI軟件還需要充分利用所有NVMe 閃存環(huán)境,將數(shù)據(jù)直接提供給每個節(jié)點上運行的虛擬機(VM)。使用NVMe時,任何需要網(wǎng)絡(luò)訪問數(shù)據(jù)的I/O都可能會抵消掉NVMe的很多性能優(yōu)勢。甚至數(shù)據(jù)保護策略也必須優(yōu)化。HCI供應(yīng)商需要重新考慮HCI集群中的典型的擦除編碼技術(shù),數(shù)據(jù)保護應(yīng)該利用更簡單的復(fù)制技術(shù),更高級的擦除編碼或HCI軟件應(yīng)該從超聚合集群中卸載。
與第一代HCI相比,功能更強大的節(jié)點策略提供了更簡單的資源配置,因為需要管理的節(jié)點更少,而且可以在環(huán)境中運行更多的工作負(fù)載。它甚至有可能成為整個數(shù)據(jù)中心的單一環(huán)境,在同一接口下統(tǒng)一所有供應(yīng)任務(wù)。
這種提供計算和存儲的策略還提高了效率,通過向HCI的基本橫向擴展技術(shù)增加縱向擴展能力。在添加額外的節(jié)點,可以通過向每個節(jié)點添加額外的計算和容量進行擴展。這種方法不僅更有效,而且可以平滑購買曲線。
從成本效率的角度來看,使用更強大節(jié)點的方法不僅通過需要更少的服務(wù)器來降低總的硬件獲取成本,而且還提高了授權(quán)效率,因為大多數(shù)HCI供應(yīng)商都是根據(jù)節(jié)點和內(nèi)核的數(shù)量來授權(quán)軟件的。雖然這一方法會訪問大量的內(nèi)核,但是由于使用了NVMe,就能夠用更少的內(nèi)核做更多的事情。最后,由于節(jié)點的減少,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的需求也降低了。因此,組織需要購買交換機和網(wǎng)絡(luò)接口卡就更少,從而進一步降低成本。
方法2:混合超融合基礎(chǔ)設(shè)施
HCI被認(rèn)為比其他數(shù)據(jù)中心基礎(chǔ)設(shè)施方法更簡單的一個原因是它將計算、存儲和網(wǎng)絡(luò)整合到一個單層中。整合的一個優(yōu)點是,HCI軟件可以確保與虛擬機相關(guān)的數(shù)據(jù)直接存儲在虛擬機運行的節(jié)點上。這種對數(shù)據(jù)的直接訪問消除了網(wǎng)絡(luò)對存儲I/O性能的影響,但它確實限制了HCI供應(yīng)商在調(diào)用分層策略之前每個節(jié)點可以存儲的數(shù)據(jù)量。分層或緩存在HCI環(huán)境中是有問題的,因為它必須跨節(jié)點集群進行,這會增加所有I/O的網(wǎng)絡(luò)流量,并危及存儲性能。混合工作負(fù)載的能力也處于危險之中,因為要求容量的工作負(fù)載可能會迫使HCI分層或緩存軟件卸載存儲密集型工作負(fù)載所需的數(shù)據(jù)。
第一代超融合的一個替代方案是采用一種更混合的存儲資源配置方法,將共享存儲與HCI結(jié)合使用。其中的挑戰(zhàn)在于如何使用共享存儲,在不會重新將復(fù)雜性引入到流程中的前提下。在混合模式中,所有節(jié)點都使用共享存儲池來卸載舊的數(shù)據(jù),因此每個節(jié)點中的內(nèi)部非池化存儲專用于該節(jié)點上的VM。如果非池化層是NVMe閃存驅(qū)動器,那么這些VM的存儲I/O將非常高。
共享存儲池使商品節(jié)點的規(guī)格變小,其配置主要關(guān)注于將計算能力交付給它們所支持的VM。在這種體系結(jié)構(gòu)中,HCI軟件將所有新的或修改的數(shù)據(jù)存儲在I/O發(fā)生的節(jié)點中,然后將其復(fù)制到共享存儲區(qū)域。所有的數(shù)據(jù)保護,比如RAID或擦除編碼,都是在共享存儲區(qū)域執(zhí)行的,這就減輕了節(jié)點分配數(shù)據(jù)保護所需的計算開銷,使計算能力更加關(guān)注VM性能。
當(dāng)VM請求較舊的非緩存數(shù)據(jù)時,節(jié)點只需要訪問共享存儲區(qū)域,因此共享存儲區(qū)域的性能不高,這進一步降低了成本。共享存儲區(qū)域通??墒褂茫喝W存,用于緩存丟失的潛在性能下降可能影響VM環(huán)境的情況;也可使用HDD,用于緩存丟失的影響可以忽略不計的情況。
這種混合方法使HCI資源供應(yīng)比第一代HCI更有效。IT人員只在需要響應(yīng)更多計算能力需求時(通常是由于新應(yīng)用程序)向集群添加節(jié)點。當(dāng)它必須響應(yīng)更多容量的請求時,提供更多存儲只需要擴展單個共享存儲區(qū)域。最好的結(jié)果應(yīng)該是負(fù)載運行在具有非常高的CPU利用率水平的節(jié)點上,而不會產(chǎn)生過多的存儲容量。
由于大多數(shù)HCI擴展是為了增加容量而不是計算能力,所以大多數(shù)數(shù)據(jù)中心會發(fā)現(xiàn)混合HCI往往需要更少的節(jié)點。
在更強節(jié)點和混合模式之間進行選擇
當(dāng)比較這兩個方法時,與第一代HCI相比,它們都極大地提高了計算和存儲供應(yīng)效率。更強節(jié)點概念可以與現(xiàn)有的管理程序和HCI軟件協(xié)同工作,但是需要定制的、專門構(gòu)建的節(jié)點。另外一方面,混合模型可以與更傳統(tǒng)的現(xiàn)成服務(wù)器硬件一起工作,但是需要對管理程序軟件進行一些定制。從本質(zhì)上講,混合供應(yīng)商會將他們提供的存儲軟件組件替換為一個更智能的組件,該組件從節(jié)點卸載非活動數(shù)據(jù)并實現(xiàn)數(shù)據(jù)保護。
這兩種資源供應(yīng)方法的目標(biāo)都是減少總體節(jié)點數(shù),并提供改進的存儲I/O性能,從而降低總體基礎(chǔ)設(shè)施成本。每個方法還應(yīng)該能夠支持多種工作負(fù)載。混合模式為更多節(jié)點的集群帶來了效率,而更強節(jié)點消除了集群擴展的大部分需求,IT部門需要根據(jù)自身業(yè)務(wù)規(guī)模進行確定。
原文作者:George Crump