1概述
集中式存儲具有著較高的安全性、可靠性,在以往很長一段時間內(nèi)一直是企業(yè)關鍵業(yè)務的數(shù)據(jù)支撐。近些年,云計算技術得到了較為廣泛的使用,也進一步推動了企業(yè)IT基礎架構的轉型與發(fā)展。相比技術架構層面的變革,云服務模式更加深入人心。云服務將企業(yè)各種IT技術組件抽象成靈活、透明、彈性的資源對象,并以服務的形式提供給授權用戶,更加貼合以客戶中心的IT服務理念。
數(shù)據(jù)是企業(yè)的核心資產(chǎn),而存儲是數(shù)據(jù)的載體,其重要性不言而喻。云存儲是在云計算基礎上衍生、發(fā)展而來,遵循云服務理念,為用戶提供高效、可靠、彈性擴展的存儲服務。下文將以筆者所處的某傳統(tǒng)中小保險公司為例,從云存儲架構演進的驅動力和演進的PDCA過程這兩方面內(nèi)容,談談云模式下的存儲架構變革與演進策略,希望對同行有一定的借鑒和參考價值。
2存儲架構演進之驅動力
任何一種架構體系都不會一成不變,而是需要與時俱進。采用逐步穩(wěn)妥推進還是除舊迎新式變革的方式,關鍵在于弄清楚促使架構演進變革的驅動力。而促使企業(yè)IT技術架構變革的驅動力可以概括為外在與內(nèi)在兩種,外在驅動力主要是外部環(huán)境變化的驅動,內(nèi)在驅動力可以理解為內(nèi)在的優(yōu)化需求驅動。理解IT技術架構變化的驅動因素,從而發(fā)現(xiàn)原有技術架構可預見的缺陷,進而為決策技術架構演進提供依據(jù)。存儲作為IT技術架構的底層支撐,在研究其架構演進時,也可以從這兩個方面來剖析。
2.1外在驅動力
業(yè)務創(chuàng)新
對于保險行業(yè)來說,IT服務關注于面向產(chǎn)品、渠道、銷售這三個方面業(yè)務內(nèi)容。以我司傳統(tǒng)保險業(yè)務為例,傳統(tǒng)保險產(chǎn)品研發(fā)周期長、同質化嚴重,更依賴于渠道和銷售;渠道方面,傳統(tǒng)險企對于銀保等線下渠道較為依賴,互聯(lián)網(wǎng)渠道、線上業(yè)務渠道的業(yè)務占比過?。讳N售模式方面,傳統(tǒng)保險業(yè)務特別是傳統(tǒng)壽險產(chǎn)品,由于其周期較長、保險規(guī)則較復雜的特性,其銷售模式較為依賴于線下銷售。整體來看,IT技術對于傳統(tǒng)保險業(yè)務更多是基礎的服務支持作用,對技術變革的需求并不迫切。
但在最近五年間,商業(yè)健康險的原保費收入規(guī)模年復合增長率達到35%,遠遠超過整體保險行業(yè)原保費的增速,疊加國家對于商業(yè)健康險不斷加碼的利好政策,是各家險企不可不重視的業(yè)務模塊。健康險有別于傳統(tǒng)保險模式,離不開科技和數(shù)據(jù)的支撐,對于保險服務內(nèi)容、服務環(huán)節(jié)、核保核賠、風險控制等環(huán)節(jié)提出了更高的要求;同時,今年突如其來的疫情是一個契機,既是風險也是機遇,傳統(tǒng)保險業(yè)務的線下展業(yè)方式受到較大影響,線上銷售、服務之間的差距凸顯,但居民對于健康險和監(jiān)控管理服務的需求進一步得到提升,我司也堅定了逐步轉型線上模式的IT戰(zhàn)略規(guī)劃,堅持渠道和銷售模式的創(chuàng)新。
產(chǎn)品、渠道、銷售模式為主的業(yè)務創(chuàng)新是至關重要的技術架構演進的驅動力,對應的是海量、高性能、高可用、彈性擴容的存儲需求。在面向互聯(lián)網(wǎng)保險業(yè)務模式場景時,傳統(tǒng)的集中式存儲架構會存在明顯的性能與容量瓶頸,只能通過不斷地硬件遷移或擴容來應對。
技術創(chuàng)新
技術創(chuàng)新也會帶來存儲架構的變革,可以分為兩個層面來考慮:一是新技術的成熟應用需求,二是不同技術架構應用、落地后的融合需求。
存儲新技術主要在存儲介質、數(shù)據(jù)傳輸以及上層數(shù)據(jù)應用這三個方面突破。目前主流存儲介質已經(jīng)從HDD向SSD過渡,帶來了存儲訪問速度和整體容量的大幅提升;數(shù)據(jù)傳輸方面,數(shù)據(jù)帶寬的倍增和存儲協(xié)議技術的發(fā)展,帶來了存儲帶寬和傳輸效率的提升;而在上層數(shù)據(jù)應用方面,伴隨著存儲使用場景,存儲技術發(fā)展相對更為多樣化,大數(shù)據(jù)對應的是分布式文件存儲,云計算對應的是分布式云存儲,海量非結構數(shù)據(jù)對應的是對象存儲等。企業(yè)需要引入逐漸成熟的新技術來服務于自身不同層次的應用需求。
新技術的應用和落地后,還需要做好技術實踐的總結,從而能更好地與現(xiàn)有的技術架構融合。而不同存儲架構的融合,也會進一步推動整體存儲架構的演進。多云平臺的融合,分布式云存儲與大數(shù)據(jù)的融合,云平臺與集中式存儲的融合,對象存儲與傳統(tǒng)應用的融合等等多種融合方式,可以進一步演進出特定的存儲使用場景和存儲架構。
2.2內(nèi)在驅動力
IT服務質量
IT服務管理的目的是以客戶為中心,提供高質量、低成本的服務。對于企業(yè)IT技術架構來說,IT服務質量也是重要的內(nèi)在驅動力。在企業(yè)IT服務實踐過程中,IT服務質量評價指標主要包括功能特性、可靠性、易用性、效率性、可維護性等。對于企業(yè)存儲架構來說,功能性主要體現(xiàn)的是滿足多種業(yè)務場景、技術架構的需求;可靠性體現(xiàn)在存儲的可用性,安全可靠,滿足架構冗余和災備需求;易用性體現(xiàn)在技術可視化程度高;效率性體現(xiàn)在通過標準化、自動化等方式提供存儲服務,存儲資源供給等方面服務效率提升;可維護性體現(xiàn)在整體存儲架構耦合性低,維護成本低。IT服務質量工作貫穿IT服務的整個生命周期,通過PDCA循環(huán)指導質量策劃、質量實施、質量檢查、質量改進等活動,從而實現(xiàn)存儲架構的優(yōu)化演進。
3存儲架構演進之PDCA過程
在理清了促使企業(yè)IT技術架構演進的內(nèi)外在驅動力之后,才能更好地從實際需求出發(fā),去制定技術架構演進目標。云存儲架構的演進可以參考如圖3.1所示的PDCA模型方法,采用循序漸進、不斷優(yōu)化的方式實現(xiàn)。
圖3.1 PDCA模型圖
3.1計劃(Plan)
該階段著重于確立整體存儲架構目標。對于我司來說,分布式存儲架構主要用于新的線上業(yè)務場景,集中式SAN存儲和NAS存儲在傳統(tǒng)業(yè)務場景依然占據(jù)重要地位。從行業(yè)發(fā)展趨勢和企業(yè)IT戰(zhàn)略轉型方向來看,傳統(tǒng)業(yè)務依然處于基礎性的重要地位,這也決定了集中式存儲架構將與分布式存儲架構的長期并存的狀態(tài),亦即傳統(tǒng)穩(wěn)態(tài)IT與敏態(tài)IT共存的雙模IT模式。
新的線上業(yè)務場景中,需要構建起開放共享、透明高效、按需供給的云計算資源管理模式,以適應分布式的整體IT架構。相比于傳統(tǒng)的快存儲和文件存儲接口,分布式存儲還需要提供對象存儲接口的存儲服務。同時,海量的半結構化和非結構化數(shù)據(jù)也需要通過分布式存儲來構建可彈性擴容的數(shù)據(jù)湖,采用基于策略的數(shù)據(jù)全生命周期管理,提供熱、溫、冷不同資源池,實現(xiàn)數(shù)據(jù)在不同資源池以及云平臺間的流動和分層。
最終確立了云存儲架構的目標,建立面向多種云平臺,統(tǒng)一納管異構存儲資源,提供多種類型數(shù)據(jù)接口、面向海量數(shù)據(jù)場景的數(shù)據(jù)湖。整體架構圖如下所示:
圖3.2整體云存儲架構圖
3.2實施(Do)
實施階段主要是按照存儲架構規(guī)劃目標,實施云存儲架構演進的落地。相比于原有集中式存儲架構,新架構引入了分布式云存儲、異構存儲管理以及存儲訪問層組件。分布式云存儲通過虛擬化技術將集群存儲資源高效聚合,以存儲池的形式提供快、文件和對象存儲接口服務。分布式存儲具備多副本及數(shù)據(jù)一致性特性,支持分級存儲,擁有極強的橫向擴展能力;異構存儲管理組件實現(xiàn)了分布式存儲和集中式存儲的統(tǒng)一自動化資源供給、監(jiān)控、數(shù)據(jù)可視化等功能,實現(xiàn)各存儲設備間的協(xié)調(diào)工作;存儲訪問層組件是將分布式存儲層的接口封裝為WebService(基于RESTful協(xié)議等)服務,并實現(xiàn)存儲資源與多種云平臺存儲訪問接口的對接。
分布式存儲部署在通用X86服務器上,基于TCP/IP網(wǎng)絡協(xié)議,通過分布式存儲軟件將分散的存儲盤整合為存儲池,為上層提供存儲服務??紤]到初期數(shù)據(jù)量較小,引入試點采用6存儲節(jié)點3數(shù)據(jù)副本的策略,可提供近60T的存儲空間。其中大容量低成本機械硬盤存儲數(shù)據(jù),高速SSD存放元數(shù)據(jù),有效平衡性能、容量和成本。分布式存儲初期用于新的線上業(yè)務場景應用,為OpenStack私有云平臺、容器云平臺提供存儲服務,后續(xù)可以按需無縫擴容存儲。
3.3檢查(Check)
檢查階段重點對已實施的存儲架構進行檢查和評價,評價指標主要包括:功能特性、可靠性、性能、存儲管理等方面。
功能特性:主要評價存儲架構的場景適用性,分布式云存儲系統(tǒng)面向多種類型的網(wǎng)絡在線存儲服務,而傳統(tǒng)存儲主要面向事務處理以及傳統(tǒng)業(yè)務場景。
可靠性:評價存儲架構的數(shù)據(jù)安全可靠性,分布式云存儲通過多數(shù)據(jù)副本和糾刪碼技術保障了數(shù)據(jù)的可靠性,存儲組件分布式,可用性高;而傳統(tǒng)存儲主要通過Raid技術保障數(shù)據(jù)可靠性,通過存儲冗余部件實現(xiàn)高可用。
性能:評價存儲架構的性能及其瓶頸,分布式存儲可以通過擴容存儲節(jié)點提供更高的存儲性能,傳統(tǒng)存儲在性能的擴容方面較為乏力,需要設備升級或遷移。
存儲管理:評價存儲架構易用性、效率性、可維護性等方面的特性,分布式云存儲提供全面的存儲可視化,彈性擴容,自動化程度高;而傳統(tǒng)存儲的可管理性較差。
3.4改進(Act)
改進階段的工作是總結云存儲架構演進的得失,并規(guī)劃后續(xù)的演進優(yōu)化方案。云存儲架構演進的過程中的成功點在于,在新的線上業(yè)務場景,特別是在OpenStack云平臺和容器云平臺架構中,分布式存儲可以很好地滿足相關的存儲需求,按需擴容,有效平衡性能、容量與成本。與傳統(tǒng)集中式存儲相比,在存儲性能、可靠性、可擴展性與自動化管理方面都有一定的優(yōu)勢,有效解決存儲資源準備與分配周期過長的難點。但是在傳統(tǒng)保險業(yè)務模塊中,還存在著相當?shù)膫鹘y(tǒng)豎井式的應用系統(tǒng)架構,并不適合適配分布式池化存儲架構,還將繼續(xù)使用集中式存儲架構。這類應用架構的改造需要通過業(yè)務層面的演進去實現(xiàn)。
后續(xù)的改進工作在于繼續(xù)挖掘云存儲架構的應用場景,增加分布式云存儲在整體存儲架構中的占比。改進策略是從邊緣場景展開,在生產(chǎn)實踐中進一步的驗證云存儲架構的穩(wěn)定性和可靠性,目前可預見的兩個方面的場景:一方面是大量的離線備份數(shù)據(jù)的備份場景,此類數(shù)據(jù)量大,訪問頻率較低,可以結合備份軟件實現(xiàn)冷數(shù)據(jù)的離線備份、歸檔;另一方面,在實踐中發(fā)現(xiàn),分布式對象存儲相比于傳統(tǒng)NAS存儲來說,更適合于海量小文件的存儲。保險行業(yè)傳統(tǒng)業(yè)務中也會出現(xiàn)大量的電子保單、影像以及雙錄文件等非結構化數(shù)據(jù)。后續(xù)計劃通過系統(tǒng)改造等方式逐步將原傳統(tǒng)業(yè)務的這類非結構化數(shù)據(jù)逐步遷移到分布式對象存儲中。