云計算是一種新的計算方法和商業(yè)模式,通過虛擬化、分布式處理和寬帶網(wǎng)絡等技術,按照“即插即用”的方式,將計算、存儲、網(wǎng)絡等IT基礎設施,以及其上的開發(fā)平臺、軟件等服務,抽象成高效、彈性、可運營、可管理的公共信息處理資源,通過公眾通信網(wǎng)絡,以按需分配的服務形式向用戶提供動態(tài)可擴展信息處理能力和應用服務,用戶按實際使用數(shù)量進行付費。
以云計算服務為核心的數(shù)據(jù)中心運維管理,是一種新型的管理理念,數(shù)據(jù)中心運維管理是數(shù)據(jù)中心生命周期中最后一個也是歷時最長的一個階段,從前期應用架構設計、軟硬件資源配置評估、應用服務性能瓶頸評估到安全防護和系統(tǒng)優(yōu)化等工作,都需運維人員全程參與。
云計算服務的運維管理集中體現(xiàn)在對云計算服務生命周期的管理。服務的生命周期在IT服務的標準ITlLv3中有明確定義,其核心架構是基于服務的生命周期。服務的生命周期以服務戰(zhàn)略為核心,以服務設計、服務轉(zhuǎn)換和服務運營為實施階段,以服務改進來提高和優(yōu)化對服務的定位及相關的進程與項目。
IT運維領域迫切需要對以云計算為核心的下一代數(shù)據(jù)中心提供更好的運維支撐解決方案,將各種先進的運維管理技術進行有效的整合,對新增虛擬網(wǎng)絡、數(shù)據(jù)存儲、虛擬機、宿主機、集群對象采用全新管理方式,從日常監(jiān)控、周期巡檢、服務受理、故障處理、平臺維護、配置管理、安全管理等方面著手,利用自動化運維工具,實現(xiàn)對物理資源、虛擬資源統(tǒng)一管理,提供資源管理、統(tǒng)計、監(jiān)控、調(diào)度、服務管控等端到端的綜合管理能力,從而實現(xiàn)對云數(shù)據(jù)中心統(tǒng)一、便捷、高效、智能的一體化運維管理。
業(yè)務導向放首位
根據(jù)國家標準化管理委員會下發(fā)的文件,運行維護服務是供方依據(jù)需方提出的服務級別要求,采用相關的方法、手段、技術、制度、過程和文檔等,針對運行維護服務對象提供的綜合服務。為確保提供的運行維護服務符合與需方約定的質(zhì)量要求,供方應具備實施運行維護服務的基本條件和能力。
云計算體系下的運維目標首先應該以業(yè)務為導向,如新業(yè)務的快速部署、系統(tǒng)容量的平滑擴容、隨需而變的資源分配等,保證服務達到要求的等級標準,根據(jù)業(yè)務目標形成IT服務的管理目標。其次通過自動化的運維工具完成系統(tǒng)預備、配置管理以及監(jiān)控報警等功能,降低故障發(fā)生率,提升故障發(fā)生后的響應處理效率,實現(xiàn)業(yè)務的快速恢復。最后通過改進運行維護服務能力管理過程中的不足,持續(xù)提升運行維護服務能力。
打造智能化運維管理模式
數(shù)據(jù)中心需要建立集中高效、性能優(yōu)質(zhì)、快速響應的智能一體化運維生產(chǎn)管理模式,對數(shù)據(jù)中心的網(wǎng)絡、系統(tǒng)、設備、設施,實行集中監(jiān)控、集中IT平臺支撐、垂直專業(yè)管理、統(tǒng)一運行調(diào)度。建立合理的運維服務管理制度,包括完善的管理組織結構、明確的崗位職責、人員素質(zhì)能力要求、工作流程和管理制度。建設智能集中監(jiān)控信息化平臺,包含集中動環(huán)監(jiān)控系統(tǒng)、集中網(wǎng)絡監(jiān)控系統(tǒng)、集中電子運維系統(tǒng)、集中IT運營支撐等系統(tǒng),實現(xiàn)可用性、安全性和預警控制。建立降本增效、綠色節(jié)能的效益管理模式。
為保證故障響應、解決問題和交付結果可控,供方應在人員管理和崗位結構以及人員的知識、技能、經(jīng)驗、安全意識等方面滿足所需水平,組建掌握網(wǎng)絡、動力、安全、消防、IT軟硬件等核心專業(yè)技術的運維支撐隊伍。
云計算將為運維體系帶來新的理念,通過一體化、自動化、智能化的IT系統(tǒng),將傳統(tǒng)運維工作中的大量簡單、重復性的手工工作通過軟件實現(xiàn),使運維人員有更多精力、條件,投入到整個服務生命周期當中。IT運維服務企業(yè)需要構建完善、成熟的IT運維服務體系,從制度、流程、人員、技術、資源等方面入手,不斷提高IT運維質(zhì)量,實現(xiàn)高效運維。