四年一度的世界杯足球盛宴即將進(jìn)入總決賽,對(duì)于已經(jīng)錯(cuò)過(guò)了小組賽、1/8決賽、1/4決賽,近半個(gè)月以來(lái)夜以繼日奮戰(zhàn)在數(shù)據(jù)中心的運(yùn)維工程師Tony來(lái)說(shuō),此刻最渴望的就是能快速解決這些花樣百出的故障問(wèn)題,回家安安心心趕上世界杯的最后高潮。
對(duì)于任何企業(yè)IT工程師來(lái)說(shuō),服務(wù)器從采購(gòu)到部署再到后期運(yùn)維的每一個(gè)階段都需要投入相應(yīng)的精力來(lái)進(jìn)行管理,任何一個(gè)IT工程師都不愿意看到服務(wù)器在使用的過(guò)程中出現(xiàn)故障,或者管理起來(lái)非常復(fù)雜。而如果IT系統(tǒng)與業(yè)務(wù)的耦合度過(guò)高往往會(huì)使得你很難放棄現(xiàn)有的硬件,只能以不完美的狀態(tài)繼續(xù)運(yùn)行下去,最終成為雞肋。這一切都是因?yàn)槟銢](méi)有能夠?qū)崿F(xiàn)對(duì)服務(wù)器的全生命周期管理。
數(shù)據(jù)中心的痛點(diǎn):復(fù)雜度和成本
隨著機(jī)房中的物理機(jī)乃至虛擬機(jī)的數(shù)量不斷增加,IT系統(tǒng)的整體復(fù)雜性與日俱增。很多服務(wù)器管理員需要進(jìn)行手動(dòng)管理,而任何一個(gè)細(xì)微的錯(cuò)誤都可能導(dǎo)致故障停機(jī),甚至業(yè)務(wù)中斷。管理員缺少一個(gè)統(tǒng)一的平臺(tái)對(duì)服務(wù)器進(jìn)行監(jiān)控與管理,無(wú)法實(shí)現(xiàn)對(duì)服務(wù)器的配置、控制、自動(dòng)運(yùn)行、監(jiān)控以及物理機(jī)和虛擬機(jī)進(jìn)行評(píng)測(cè)的全生命周期的管理。
從成本角度來(lái)看,一旦業(yè)務(wù)中斷將對(duì)企業(yè)造成的直接收入損失,另一方面則存在于管理復(fù)雜度的提升所帶來(lái)的隱性成本增加。如果需要更換新的服務(wù)器,其采購(gòu)成本也會(huì)隨之大幅提高。
對(duì)服務(wù)器全生命周期360度監(jiān)控管理
Forrester有統(tǒng)計(jì)數(shù)據(jù)顯示,服務(wù)器運(yùn)維成本在IT系統(tǒng)TCO中占比高達(dá)70%,因此,從多個(gè)角度來(lái)管理好服務(wù)器硬件的整個(gè)生命周期,是保障數(shù)據(jù)中心TCO整體降低的重要手段,數(shù)據(jù)中心需要一套完整的服務(wù)器全生命周期運(yùn)維方案。
浪潮服務(wù)器全生命周期運(yùn)維方案可支持從單機(jī)運(yùn)維到批量自動(dòng)化,從自動(dòng)上架、批量監(jiān)控到智能運(yùn)維、故障預(yù)測(cè),幫助IT管理員高效地部署、升級(jí)、監(jiān)控和管理IT設(shè)備;無(wú)論是本地或是遠(yuǎn)程環(huán)境、帶內(nèi)或是帶外操作,都可以提供全方位的運(yùn)維方案,可輕松將服務(wù)器納入到已有管理架構(gòu)中,降低TCO維護(hù)成本。
提高交付部署效率——浪潮服務(wù)器自動(dòng)上架系統(tǒng)ISIB
如今大規(guī)模和超大規(guī)模數(shù)據(jù)中心越來(lái)越普及,服務(wù)器交付部署工作也隨之變得復(fù)雜而繁重。浪潮服務(wù)器自動(dòng)上架系統(tǒng)ISIB(Inspur Server Intelligent Boot), 基于PXE技術(shù)的操作系統(tǒng)批量部署,支持Windows Server、Redhat、CentOS、SUSE、Ubuntu等系統(tǒng),解決了用戶設(shè)備剛剛上架后的需要批量安裝操作系統(tǒng)的問(wèn)題;同時(shí)該軟件支持帶內(nèi)模式下的RAID卡批量配置、BIOS批量升級(jí)、BMC批量升級(jí)功能,大幅提高部署效率,保障設(shè)備使用的平滑性。
實(shí)現(xiàn)遠(yuǎn)程輕松管理——浪潮服務(wù)器管理控制單元ISBMC
ISBMC即Inspur Server Baseboard Management Controller (浪潮服務(wù)器管理控制單元),是運(yùn)行嵌入式OS的獨(dú)立微處理器,它獨(dú)立于服務(wù)器及其操作系統(tǒng),嵌入到每一臺(tái)浪潮M5新一代服務(wù)器中,可以通過(guò)帶外方式監(jiān)控服務(wù)器傳感器狀態(tài)、遠(yuǎn)程開(kāi)關(guān)機(jī)和重啟、訪問(wèn)BIOS配置或操作系統(tǒng)控制臺(tái)信息、虛擬KVM等,并將監(jiān)控到的服務(wù)器故障發(fā)送SNMP Trap、Email、Syslog告警等。
管理員可以通過(guò)Web方式進(jìn)行遠(yuǎn)程管理,或通過(guò)IPMI、SNMP、Redfish、Smash CLI方式進(jìn)行通訊。而在最新一代的ISBMC中,還增加了如BMC雙鏡像、RAID配置、BIOS配置、故障診斷、HTML5 KVM等實(shí)用功能,使整個(gè)帶外管理過(guò)程輕松方便,管理員即便不在機(jī)房,也可遠(yuǎn)程進(jìn)行管理,管理員將不需要24小時(shí)待在機(jī)房中飽受機(jī)房噪音的折磨。
解決新設(shè)備的日常監(jiān)管問(wèn)題——浪潮物理基礎(chǔ)設(shè)施管理平臺(tái)ISPIM
浪潮物理基礎(chǔ)設(shè)施管理平臺(tái)ISPIM即Inspur Physical Infrastructure Manager,是根據(jù)市場(chǎng)需要自主研發(fā)的一款高可用、高性能、高可擴(kuò)展、高可維護(hù)的物理基礎(chǔ)設(shè)置管理平臺(tái)。
ISPIM是面向通信、金融、互聯(lián)網(wǎng)、政府和企業(yè)等行業(yè)數(shù)據(jù)中心的整體運(yùn)維管理平臺(tái),具備資源管理、主/被動(dòng)監(jiān)控、實(shí)時(shí)性能監(jiān)控、告警接收/推送、拓?fù)湔故竞腿罩臼占裙δ堋?蓪?shí)現(xiàn)服務(wù)器、存儲(chǔ)、交換機(jī)和防火墻等設(shè)備的統(tǒng)一管理,能有效地幫助企業(yè)提高運(yùn)維效率、降低運(yùn)維成本,保障數(shù)據(jù)中心安全、可靠穩(wěn)定的運(yùn)行。
快速處理單臺(tái)設(shè)備故障——浪潮服務(wù)器單機(jī)管理軟件ISQP
浪潮服務(wù)器單機(jī)管理軟件ISQP即Inspur Server Quick Provisioning,是一款用于浪潮服務(wù)器單機(jī)維護(hù)的工具,提供單機(jī)OS智能安裝、RAID配置、硬件故障診斷、BIOS及BMC固件版本升級(jí)、FRU信息刷新等功能,為用戶提供便利的設(shè)備升級(jí)維護(hù)功能;
ISQP運(yùn)行于獨(dú)立的內(nèi)存操作系統(tǒng)下,軟件載體即插即用,可做到與服務(wù)器OS系統(tǒng)的物理隔離,保證客戶的業(yè)務(wù)和數(shù)據(jù)安全。
批量固件快速升級(jí)——浪潮服務(wù)器帶外批量運(yùn)維工具ISA
浪潮服務(wù)器帶外批量運(yùn)維工具ISA即Inspur Server Automation,用于服務(wù)器的日常維護(hù)任務(wù),目前包含的功能包括BIOS批量配置與升級(jí),BMC批量配置與升級(jí),批量服務(wù)器巡檢,批量日志收集;ISA以任務(wù)的方式進(jìn)行服務(wù)器的批量運(yùn)維管理,同時(shí)支持任務(wù)結(jié)果的導(dǎo)出。
單機(jī)管理無(wú)死角——浪潮服務(wù)器管理驅(qū)動(dòng)ISMD
浪潮服務(wù)器管理驅(qū)動(dòng)ISMD即Inspur Server Management Driver:運(yùn)行于服務(wù)器及操作系統(tǒng)之上,對(duì)上層管理軟件開(kāi)放SNMP、CLI、Redfish等多種管理接口,兼容支持標(biāo)準(zhǔn)協(xié)議的第三方監(jiān)控平臺(tái),且支持與帶外BMC管理系統(tǒng)融合,以提供更完整的服務(wù)器單機(jī)管理能力。ISMD作為帶內(nèi)管理驅(qū)動(dòng),還可以管理BMC無(wú)法訪問(wèn)的操作系統(tǒng)內(nèi)信息,如CPU、內(nèi)存、硬盤(pán)性能狀況、進(jìn)程信息、RAID控制器信息等,做到單機(jī)管理無(wú)死角。
故障快速診斷分析——浪潮云故障診斷系統(tǒng)ISCDS
浪潮云故障診斷系統(tǒng)ISCDS即Inspur Server Cloud Diagnostic System,可實(shí)現(xiàn)服務(wù)器故障的快速定位,系統(tǒng)面向客服、研發(fā)、測(cè)試人員,用于服務(wù)器出現(xiàn)故障時(shí)的日志分析,能夠幫助用戶實(shí)現(xiàn)服務(wù)器故障的精準(zhǔn)定位,使維護(hù)人員快速解決硬件故障。
服務(wù)器作為數(shù)據(jù)中心的核心組件,承載著數(shù)據(jù)中心絕大部分計(jì)算任務(wù),其可靠性、性能穩(wěn)定性以及故障之后問(wèn)題定位的精準(zhǔn)度等特性都直接影響著整個(gè)系統(tǒng)運(yùn)行。一個(gè)高效、功能全面的服務(wù)器管理工具對(duì)于IT系統(tǒng)而言至關(guān)重,一個(gè)覆蓋服務(wù)器全生命周期的運(yùn)維方案,正是數(shù)據(jù)中心IT人員迫切需求的,浪潮服務(wù)器全生命周期運(yùn)維方案已廣泛應(yīng)用于各類(lèi)規(guī)模的企業(yè)級(jí)IT系統(tǒng)中,幫助客戶大幅提升投資回報(bào)率,降低運(yùn)維難度。