日志管理提供對日志信息的集中管理功能,收集內(nèi)外網(wǎng)分布式環(huán)境下各分系統(tǒng)軟硬件日志,對收集到的日志信息根據(jù)嚴(yán)重程度、影響的范圍、事件類型、數(shù)量等進(jìn)行有效的存儲、存取、查詢、檢索和統(tǒng)計(jì),實(shí)現(xiàn)操作溯源和操作審計(jì)功能。
操作溯源,系統(tǒng)保留所有操作痕跡,能夠?qū)γ坎讲僮鲿r間、操作人、狀態(tài)修改、內(nèi)容調(diào)整等信息進(jìn)行回溯,追蹤操作軌跡。并支持進(jìn)行圖形化軌跡展示。易用性操作,在操作列表可快速對操作進(jìn)行溯源。
操作審計(jì),系統(tǒng)自動記錄所有用戶的相關(guān)操作:登錄、操作模塊、退出等操作。并支持進(jìn)行審計(jì)歷史查詢。
本模塊有兩個界面,分別是登陸日志界面和操作日志界面。這兩個界面都提供基本的查詢功能,查詢字段包括操作人名、操作人真實(shí)姓名和操作時間等。日志表格展示字段包括操作人、真實(shí)姓名、操作內(nèi)容、瀏覽器、IP地址、操作時間等信息。
3.2.5.5運(yùn)行維護(hù)
運(yùn)行維護(hù)模塊由數(shù)據(jù)采集、監(jiān)控信息收集轉(zhuǎn)發(fā)、監(jiān)控數(shù)據(jù)存儲和監(jiān)控分析,共計(jì)4個部分組成,支持對各類網(wǎng)絡(luò)設(shè)備、鏈路、服務(wù)及應(yīng)用等資源進(jìn)行管理、狀態(tài)監(jiān)測和維護(hù),具備設(shè)備管理、狀態(tài)監(jiān)測、日志記錄、故障告警、狀態(tài)預(yù)警、升級維護(hù)等功能,將各種復(fù)雜的運(yùn)維管理工作簡易化、便捷化與自動化,有效幫助運(yùn)維人員提高管理效率與水平。
1、數(shù)據(jù)采集
采集器在監(jiān)控目標(biāo)上的一個監(jiān)控代理(Agent),根據(jù)系統(tǒng)配置項(xiàng),通過SNMP、SNMP Trap、Syslog、Telnet/ssh收集全網(wǎng)主機(jī)、網(wǎng)絡(luò)、數(shù)據(jù)庫、系統(tǒng)、應(yīng)用的各類監(jiān)測數(shù)據(jù)、本地資源狀態(tài)和應(yīng)用程序運(yùn)行狀態(tài),并將收集到的數(shù)據(jù)報告給監(jiān)控信息收集轉(zhuǎn)發(fā)模塊或直接報送監(jiān)控數(shù)據(jù)存儲模塊。
2、監(jiān)控信息收集轉(zhuǎn)發(fā)
收集并轉(zhuǎn)發(fā)采集器部分收集的各種性能、可用性等數(shù)據(jù),減輕監(jiān)控數(shù)據(jù)存儲模塊的連接負(fù)載壓力。
3、監(jiān)控數(shù)據(jù)存儲
監(jiān)控數(shù)據(jù)存儲使用一個本地存儲,存儲所有配置信息和收集到的各節(jié)點(diǎn)的運(yùn)行狀態(tài)數(shù)據(jù)、系統(tǒng)名稱、資源類型、IP地址、CPU利用率、內(nèi)存利用率等。
4、監(jiān)控分析
監(jiān)控分析對收集到的系統(tǒng)監(jiān)控數(shù)據(jù)的綜合分析和判斷,包含設(shè)備管理、狀態(tài)監(jiān)測、日志記錄、故障告警、狀態(tài)預(yù)警和升級維護(hù)的功能。
(1)設(shè)備管理
設(shè)備管理主要是系統(tǒng)中服務(wù)器設(shè)備、網(wǎng)絡(luò)設(shè)備、安全設(shè)備、存儲設(shè)備等進(jìn)行統(tǒng)一的登記、管理維護(hù)。設(shè)備管理包括了一個完備的對象型數(shù)據(jù)庫CMDB,使得運(yùn)維人員可以管控其所轄的全部配置項(xiàng)。它通過識別、控制、維護(hù)和驗(yàn)證現(xiàn)有的所有配置項(xiàng)的版本,提供一個IT基礎(chǔ)設(shè)施的邏輯模型。由于CMDB也會記錄配置項(xiàng)之間的關(guān)系,因此運(yùn)維人員可以輕而易舉地分析基礎(chǔ)設(shè)施與服務(wù)之間的依賴關(guān)系。
依據(jù)不同的賬戶劃分,登錄系統(tǒng),進(jìn)行本地資產(chǎn)信息錄入,配置。運(yùn)維中心以管理員身份監(jiān)管資產(chǎn)信息總體情況。系統(tǒng)的資產(chǎn)配置信息采集支持手工錄入和數(shù)據(jù)導(dǎo)入兩種方式。
(2)狀態(tài)監(jiān)測
狀態(tài)監(jiān)測主要是對基礎(chǔ)資源監(jiān)測、網(wǎng)絡(luò)監(jiān)測、應(yīng)用監(jiān)測,查看系統(tǒng)運(yùn)行是否正常進(jìn)行監(jiān)測,發(fā)現(xiàn)問題及時告警或預(yù)警。監(jiān)測內(nèi)容包括資源名稱、系統(tǒng)名稱、資源類型、IP地址、CPU利用率、內(nèi)存利用率、系統(tǒng)可用性、系統(tǒng)健康度等。通過配置監(jiān)測項(xiàng),實(shí)現(xiàn)系統(tǒng)狀態(tài)監(jiān)測,包括對基礎(chǔ)狀態(tài)監(jiān)測、網(wǎng)絡(luò)狀態(tài)監(jiān)測、應(yīng)用狀態(tài)監(jiān)測等功能,可以通過給定的IP地址范圍內(nèi)的設(shè)備(包含服務(wù)器、網(wǎng)絡(luò)設(shè)備、安全設(shè)備等)進(jìn)行掃描,發(fā)現(xiàn)設(shè)備以及設(shè)備上的標(biāo)準(zhǔn)應(yīng)用和開放的端口;通過拓?fù)鋱D實(shí)時監(jiān)控設(shè)備的運(yùn)行狀態(tài)以及設(shè)備上應(yīng)用的運(yùn)行狀態(tài),包括業(yè)務(wù)資源、應(yīng)用的運(yùn)行狀態(tài);通過配置SNMP等各類協(xié)議了解服務(wù)器的運(yùn)行情況,包括服務(wù)器的CPU利用率、內(nèi)存使用率、磁盤I/O情況、網(wǎng)絡(luò)流量情況等信息,并且可以根據(jù)信息畫出跟蹤圖表;支持全網(wǎng)運(yùn)行狀態(tài)總覽,包含設(shè)備運(yùn)行狀態(tài)統(tǒng)計(jì)、設(shè)備廠商統(tǒng)計(jì)、最新告警時間、故障設(shè)備列表、關(guān)鍵設(shè)備CPU歷史曲線等信息,支持對服務(wù)器上Oracle、sqlserver等數(shù)據(jù)庫的實(shí)時監(jiān)控管理,包括數(shù)據(jù)庫名、版本、并行狀態(tài)、基本配置等信息。
(3)日志記錄
日志記錄是記錄軟硬件系統(tǒng)操作及事件反饋的信息,同時監(jiān)視系統(tǒng)中發(fā)生的事件。用戶可以通過它來檢查錯誤發(fā)生的原因,或者尋找受到攻擊時攻擊者留下的痕跡。采用development(開發(fā)環(huán)境)、test(測試環(huán)境)、production(生產(chǎn)環(huán)境)等不同的日志配置,根據(jù)環(huán)境變量自動識別。日志的記錄采用fatal(致命)、error(錯誤)、warn(警告)、info(信息)、debug(調(diào)試)、trace(追蹤)6種日志級別。
(4)故障告警
故障告警是運(yùn)維系統(tǒng)對各種設(shè)備、應(yīng)用及業(yè)務(wù)等資源的運(yùn)行進(jìn)行全盤監(jiān)控,根據(jù)設(shè)定的預(yù)警和告警閾值,建立及時響應(yīng)各項(xiàng)業(yè)務(wù)的預(yù)警和告警機(jī)制。結(jié)合系統(tǒng)的告警敏感度、異常過濾、告警過濾及異常依賴等多種高端技術(shù)手段,能在眾多的告警信息中,屏蔽大量的無用、冗余等不重要的告警信息,從而準(zhǔn)確定位故障根源。建立集中的告警分析及展現(xiàn)模塊來提供靈活、自動化的事件處理能力。告警管理提供事件分析引擎和業(yè)務(wù)影響依賴分析,可對事件進(jìn)行壓縮、歸并和根源分析;多類型告警集中處理,包含IT資源、業(yè)務(wù)系統(tǒng)、安全、機(jī)房環(huán)境等告警,通過短信、郵件多種方式告警通知,用戶可自定義告警策略與內(nèi)容,減少誤報漏報。
(5)狀態(tài)預(yù)警
狀態(tài)預(yù)警是針對運(yùn)維過程中面臨的風(fēng)險,對未發(fā)生的安全事件進(jìn)行預(yù)估,預(yù)判可能發(fā)生的安全事件,從而實(shí)現(xiàn)安全狀態(tài)預(yù)警。針對運(yùn)維過程中,針對面臨的風(fēng)險,預(yù)判可能發(fā)生的安全事件,從而實(shí)現(xiàn)安全狀態(tài)預(yù)警。在風(fēng)險狀態(tài)預(yù)警中,根據(jù)對象的實(shí)際情況及風(fēng)險管理者的經(jīng)驗(yàn),合理劃分風(fēng)險預(yù)警區(qū)間,判斷風(fēng)險量處于正常狀態(tài)、警戒狀態(tài)還是危險狀態(tài)。
(6)升級維護(hù)
升級維護(hù)是對系統(tǒng)運(yùn)維子系統(tǒng)當(dāng)前版本的漏洞進(jìn)行完善,或者對軟件添加新的應(yīng)用功能的更新,使該系統(tǒng)更加完善好用。升級維護(hù)是對系統(tǒng)運(yùn)維子系統(tǒng)當(dāng)前版本的漏洞進(jìn)行完善,或者對軟件添加新的應(yīng)用功能的更新,使該系統(tǒng)更加完善好用,優(yōu)先通過灰度發(fā)布方式實(shí)現(xiàn)系統(tǒng)的升級維護(hù),以保證系統(tǒng)的持續(xù)運(yùn)行。