【摘要】技術(shù)飛速的發(fā)展讓IT人從一入行開始,就注定了前路變化莫測,IT人的路該何去何從?是否真的要摸黑前行呢?當(dāng)下,運(yùn)維崗位從幕后走到了臺前,各個企業(yè)開始考慮運(yùn)維問題,但信息化運(yùn)維卻仍然面臨很多的問題,對運(yùn)維的需求會越來越高,作為一個合格的運(yùn)維,你準(zhǔn)備好了嗎?作者在此結(jié)合自身經(jīng)歷與大家分享對IT行業(yè)中系統(tǒng)運(yùn)維崗位的看法。
【作者】潘延晟,運(yùn)維工程師,系統(tǒng)架構(gòu)師,曾任吉林通鋼自動化信息技術(shù)有限責(zé)任公司信息科副總工程師。有19年的系統(tǒng)集成與信息化運(yùn)維經(jīng)驗,參與建設(shè)并維護(hù)鋼鐵行業(yè)大型信息化網(wǎng)絡(luò),專注于鋼鐵行業(yè)信息化網(wǎng)絡(luò)建設(shè)與規(guī)劃。曾獲“ 存儲架構(gòu) 之美”軟件定義存儲解決方案擂臺賽優(yōu)秀方案 。擅長領(lǐng)域:系統(tǒng)運(yùn)維, 網(wǎng)絡(luò)安全,數(shù)據(jù)安全,系統(tǒng)架構(gòu)設(shè)計,網(wǎng)絡(luò)架構(gòu)設(shè)計。
前言
英特爾(Intel)創(chuàng)始人之一戈登·摩爾(Gordon Moore)提出摩爾定律:當(dāng)價格不變時,集成電路上可容納的元器件的數(shù)目,約每隔18-24個月便會增加一倍,性能也將提升一倍。這一定律揭示了信息技術(shù)進(jìn)步的速度 。從286開始一路“奔騰”,短短的二三十年間,這個行業(yè)已經(jīng)帶領(lǐng)萬物飛上了“云端”。現(xiàn)在這個定律已經(jīng)越來越難維持了。這種飛速的發(fā)展讓IT人從一入行開始,就注定了前路變化莫測,IT人的路該何去何從?是否真的要摸黑前行呢?作者在此結(jié)合自身經(jīng)歷與大家分享對IT行業(yè)中系統(tǒng)運(yùn)維崗位的看法。
企業(yè)信息化運(yùn)維崗位經(jīng)歷的三個階段
在信息化發(fā)展的初期, 企業(yè)在信息化建設(shè)中主要以購買硬件和基礎(chǔ)網(wǎng)絡(luò)建設(shè)為主 。人們對信息化能干什么還不夠了解,只知道一臺臺的交換機(jī)和服務(wù)器是實實在在擺在那里的。
這個階段,服務(wù)器基本采用豎井式的架構(gòu),交換機(jī)和路由器是網(wǎng)絡(luò)的主力,信息化建設(shè) 往往缺少長遠(yuǎn)規(guī)劃。因為架構(gòu)本身的設(shè)計缺陷和設(shè)備性能等因素影響,常常出現(xiàn)系統(tǒng)宕機(jī)和網(wǎng)絡(luò)堵塞等問題,也因此開始出現(xiàn)了運(yùn)維崗位。但從運(yùn)維崗位出現(xiàn)開始,就面臨了一個尷尬的處境:“系統(tǒng)不出問題時,運(yùn)維好像沒什么用。系統(tǒng)總是出問題時,運(yùn)維好像也沒起什么用”。
到了第二階段,信息化以應(yīng)用系統(tǒng)建設(shè)為主 。經(jīng)過一個階段的信息化發(fā)展建設(shè),大多數(shù)企業(yè)認(rèn)識到了信息化為企業(yè)帶來的價值,并把主要的資源投入到應(yīng)用系統(tǒng)建設(shè)以及相關(guān)的應(yīng)用服務(wù)上。企業(yè)逐漸接受外部咨詢服務(wù),引入外部力量幫助進(jìn)行數(shù)字化、信息化轉(zhuǎn)型。信息化的建設(shè)推動了軟件行業(yè)的發(fā)展,軟件行業(yè)受到了應(yīng)有的尊重。企業(yè)開始看到了智能化的信息系統(tǒng)帶來的實際好處,對各種業(yè)務(wù)應(yīng)用系統(tǒng)的依賴也越來越多,舍得在信息化系統(tǒng)上花錢,對原本看得見摸得著的硬件設(shè)備,反而開始不舍得投入了。信息化發(fā)展的重心從原本的硬件開始又轉(zhuǎn)向了軟件,而忽略了設(shè)備的老化 、架構(gòu)的不合理 、 業(yè)務(wù)不斷擴(kuò)展遇到的各種軟硬件瓶頸,忽略了底層服務(wù)器、網(wǎng)絡(luò)安全、中間件以及數(shù)據(jù)庫的基礎(chǔ)維護(hù),也忽略了運(yùn)維崗位的重要性,覺得系統(tǒng)一旦運(yùn)行就如同機(jī)械一樣穩(wěn)定可靠。
經(jīng)過上述兩個階段,企業(yè)開始意識到信息系統(tǒng)整體的重要性,開始進(jìn)入重視IT治理的全面建設(shè)階段 。在基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)建設(shè)的基礎(chǔ)上,全面關(guān)注信息化整體規(guī)劃 。更多關(guān)注信息化對企業(yè)發(fā)展的戰(zhàn)略支持,把IT作為企業(yè)核心競爭力的一個重要組成部分 。關(guān)注企業(yè)信息化建設(shè)的組織、流程和人力資源等, 開始把信息化建設(shè)作為企業(yè)內(nèi)部一個重要發(fā)展方向看待,而不僅僅是一個項目或者一個階段的事情 。
走到這個階段,很多企業(yè)已經(jīng)開始建立了自己行業(yè)特有的信息化系統(tǒng),如制造行業(yè)的ERP、MES,醫(yī)療行業(yè)的HIS、LIS,辦公用的OA、HR、MAIL等。同時企業(yè)的管理者也開始擔(dān)心這些企業(yè)核心的業(yè)務(wù)系統(tǒng)一旦出現(xiàn)問題時該如何應(yīng)對 。事實上,這個階段,硬件故障,網(wǎng)絡(luò)安全,系統(tǒng)安全,數(shù)據(jù)安全等各種問題已經(jīng)成為信息系統(tǒng)的最大威脅。每一次系統(tǒng)事故都可能造成巨大的經(jīng)濟(jì)損失,甚至影響到國家安全。為了保障信息化系統(tǒng)的可靠運(yùn)行,越來越多的設(shè)備,越來越多的技術(shù)開始涌進(jìn)了數(shù)據(jù)中心并且不斷完善和優(yōu)化。虛擬化、容器、微服務(wù) 、軟件定義 、超融合 、分布式架構(gòu)、雙活、兩地三中心等技術(shù)和架構(gòu)應(yīng)運(yùn)而生。信息化系統(tǒng)的功能越來越強(qiáng)大,結(jié)構(gòu)越來越復(fù)雜,可是這么多的設(shè)備,這么復(fù)雜的架構(gòu)誰來管控?成了很多企業(yè)面臨的問題。
信息化的發(fā)展讓原本在幕后的運(yùn)維開始走到了臺前,成為操控和維護(hù)龐大的智能化系統(tǒng)的主要崗位,運(yùn)維崗位開始承擔(dān)更多重要的工作,但實際的情況卻不容樂觀。
現(xiàn)階段的信息化運(yùn)維幾乎貫穿了整個信息系統(tǒng)的生命周期,對于運(yùn)維崗位,企業(yè)提出了更多的要求??墒乾F(xiàn)在能完全滿足企業(yè)需求的運(yùn)維人員數(shù)量卻遠(yuǎn)遠(yuǎn)低于市場的需求。人們可能會有疑問,幾乎每所大學(xué)里都有計算機(jī)技術(shù)相關(guān)專業(yè),再加上社會上的IT培訓(xùn)機(jī)構(gòu)的輸出人才加在一起,IT人才還會短缺嗎?其實IT行業(yè)技術(shù)人才短缺是一個不容置疑的事實。由于傳統(tǒng)學(xué)歷教育培養(yǎng)出來的大學(xué)生缺乏實戰(zhàn)經(jīng)驗和項目經(jīng)驗,往往在教學(xué)上很難有質(zhì)量保證,導(dǎo)致了每年新培養(yǎng)出的IT技術(shù)人才并不能百分百的完全被企業(yè)接受, 這樣整個IT行業(yè)的人才困境就更加嚴(yán)峻。也正是由于 IT互聯(lián)網(wǎng) ”飛”一樣的發(fā)展速度, 才讓每年新增的技術(shù)人才缺口在百萬之巨。每年培養(yǎng)出來的人才可以說是杯水車薪。
從幕后走到臺前,運(yùn)維崗位面臨更多挑戰(zhàn)
雖然當(dāng)下階段,運(yùn)維崗位從幕后走到了臺前,各個企業(yè)開始考慮運(yùn)維問題,但信息化運(yùn)維卻仍然面臨很多的問題 。
(1)IT運(yùn)維工作瑣碎繁雜,重視程度差.
很多單位由于人員少,分工不明確,運(yùn)維人員幾乎承擔(dān)了從終端到上層業(yè)務(wù)之間的所有工作,每個IT運(yùn)維人就像“救火員一樣忙碌”。即便如此,業(yè)務(wù)人員還是經(jīng)常抱怨“ 關(guān)鍵時刻找不到人”、“ 問題處理 太慢”等等。IT運(yùn)維人員的工作很難得到業(yè)務(wù)部門的認(rèn)可,工作也難以量化。運(yùn)維或信息部門作為服務(wù)部門,在信息系統(tǒng)的戰(zhàn)略規(guī)劃項目立項等工作中話語權(quán)較弱,對于現(xiàn)有系統(tǒng)中的問題只能建議,無法決策 。往往是項目建設(shè)完成之后才介入系統(tǒng)的管理和維護(hù),等發(fā)現(xiàn)問題為時已晚。
(2)IT系統(tǒng)復(fù)雜,維護(hù)難度高,風(fēng)險壓力大。
隨著信息化的不斷投入,硬件設(shè)施、軟件系統(tǒng)不斷增加,IT運(yùn)維的復(fù)雜性 也在不斷增加 ,導(dǎo)致IT運(yùn)維成本居高不下,卻難以見到實際性的收益。對業(yè)務(wù)連續(xù)性要求較高的單位,系統(tǒng)一旦宕機(jī)損失是巨大的,運(yùn)維部門往往要扛著巨大的壓力。有的單位由于缺乏 科學(xué) 的資產(chǎn)管理,運(yùn)維部門很難準(zhǔn)確了解公司到底有多少IT資產(chǎn),公司是否需要購置新機(jī)也缺少數(shù)據(jù)支撐。在年底審計時全團(tuán)隊奮戰(zhàn)多日才能完成單位的IT資產(chǎn)清查工作。更多的時候,運(yùn)維部門成了其他部門眼中的只會花錢的部門。
(3) 技術(shù)人員難培養(yǎng),流動性大。
對于企業(yè)來說, 如此龐大 、復(fù)雜 、重要的系統(tǒng)容不得半點(diǎn)不確定的因素。每一個已經(jīng)開始運(yùn)行的生產(chǎn)系統(tǒng)都不會允許新人隨意的去操作和測試。運(yùn)維人員很難在實際的生產(chǎn)環(huán)境來獲得技術(shù)經(jīng)驗。好不容易成為熟練工了,卻因為看不到職業(yè)前景或感覺不受重視而提出辭職。這些中堅力量的離職,會造成客戶滿意度和運(yùn)維質(zhì)量相當(dāng)長一段時間內(nèi)出現(xiàn)波動。
(4)服務(wù)商難管理,技術(shù)水平參差不齊,服務(wù)不及時,問題不能及時解決。
IT運(yùn)維服務(wù)外包也同樣存在一定風(fēng)險,關(guān)鍵在于對于IT運(yùn)維服務(wù)外包供應(yīng)商的技術(shù)水平和服務(wù)管理不到位。由于IT運(yùn)維具有相當(dāng)強(qiáng)的專業(yè)性,很多時候甲方無法獨(dú)立判斷IT運(yùn)維服務(wù)外包供應(yīng)商的技術(shù)水平 和 服務(wù)能力,造成了雖然購買了服務(wù),卻沒有收到預(yù)想的效果。
(5)企業(yè)對于自身信息化了解不足,盲目的跟風(fēng)上云逃避運(yùn)維問題。
隨著云計算的發(fā)展與普及,越來越多的企業(yè)選擇了業(yè)務(wù)上云,看似解決了運(yùn)維問題。但是實際情況卻并非那么完美,無論選擇 IaaS,Paa S還是 SaaS ,企業(yè)都要對自己使用的系統(tǒng)有足夠的了解。云服務(wù)提供商只能保證你所租用的 服務(wù) 正常運(yùn)行,卻不能代替你來管理自己的業(yè)務(wù),不能百分百保證在非正常狀態(tài)下面臨的勒索病毒,木馬入侵,SQL注入等安全問題,因為誤操作造成的數(shù)據(jù)丟失和數(shù)據(jù)泄漏 ,因為資源不足造成的業(yè)務(wù)宕機(jī)等等問題。簡單的說,當(dāng)企業(yè)對自身的業(yè)務(wù) 系統(tǒng)一無所知時,放在云上和放在本地數(shù)據(jù)中心都存在著同樣的風(fēng)險。
勝任運(yùn)維崗位,應(yīng)該具備哪些技能
運(yùn)維崗位今天所面臨的尷尬局面,不是短時間內(nèi)產(chǎn)生的,但恰恰是這些問題帶來的挑戰(zhàn),才讓IT 運(yùn)維崗位充滿了機(jī)遇。
面對機(jī)遇和挑戰(zhàn),作為一個運(yùn)維人,如何才勝任現(xiàn)代化的運(yùn)維崗位呢,我覺得應(yīng)該具備以下的技能。
1、弱電基礎(chǔ) 。IT運(yùn)維首先就要從機(jī)房環(huán)境開始,空調(diào) 、消防 、UPS 、門禁監(jiān)控以及其他的輔助系統(tǒng),都是運(yùn)維人員需要留意的部分,溫度 、濕 度 、電力供應(yīng) 、防火隱患 等往往會給機(jī)房的設(shè)備造成重大的災(zāi)難。
2、網(wǎng)絡(luò)基礎(chǔ)知識。無論是你軟件運(yùn)維 、系統(tǒng)運(yùn)維 、還是網(wǎng)絡(luò)運(yùn)維,互聯(lián)網(wǎng)基礎(chǔ)知識都是必不可少的 ?,F(xiàn)在幾乎所有的應(yīng)用系統(tǒng)軟件都依賴于網(wǎng)絡(luò),而所有應(yīng)用業(yè)務(wù)正常運(yùn)行的基本條件就是網(wǎng)絡(luò) 暢通 。所以無論ISO 7層模型 、IP地址計算 、Vlan原理、路由協(xié)議這些基礎(chǔ)知識有多么的枯燥,都是一個合格的運(yùn)維人不可缺少的基本技能。
3、服務(wù)器硬件基礎(chǔ)知識。網(wǎng)絡(luò)提供了應(yīng)用系統(tǒng)運(yùn)行的線路,服務(wù)器提供了應(yīng)用系統(tǒng)運(yùn)行的環(huán)境,應(yīng)用系統(tǒng)運(yùn)行時,CPU 、 內(nèi)存 、 存儲 、 甚至系統(tǒng)供電都會 對龐大的系統(tǒng) 產(chǎn)生影響。
4、操作系統(tǒng)知識。掌握主流的操作系統(tǒng),熟悉操作系統(tǒng)的基本工作原理、基本操作以及操作各個系統(tǒng)之間的區(qū)別。
5、存儲及存儲架構(gòu)知識。了解目前主流的存儲類型、架構(gòu)、以及基本的特點(diǎn),除了CPU和內(nèi)存這些性能參數(shù),存儲IO性能也是影響系統(tǒng)運(yùn)行的重要因素。
6、中間件及數(shù)據(jù)庫知識。了解主流的中間件和數(shù)據(jù)庫產(chǎn)品,工作過程以及技術(shù)特點(diǎn),當(dāng)應(yīng)用業(yè)務(wù)發(fā)生問題時候,這些知識可以幫助我們判斷應(yīng)該是找程序開發(fā)還是數(shù)據(jù)庫管理員。
7、簡單的腳本開發(fā) 。信息化系統(tǒng)變得越來越復(fù)雜和龐大,為了簡化運(yùn)維,編寫基本的運(yùn)維腳本也是運(yùn)維崗位必備的技能之一。
8、了解所處行業(yè)特點(diǎn) 。很多行業(yè)諸如醫(yī)療、制造、金融、教育等,都有著鮮明的行業(yè)特點(diǎn),由于這些行業(yè)特點(diǎn), 所產(chǎn)生的信息化系統(tǒng)也有著各自的獨(dú)特性,對各種資源的需求也不盡相同,忽略了行業(yè)特點(diǎn),往往會讓信息化的建設(shè)和運(yùn)維產(chǎn)生很大的偏差。
9、安全知識 。如今信息化系統(tǒng)面臨的最大風(fēng)險,除了設(shè)備故障以外,便是來自各方面的安全風(fēng)險了。病毒、木馬 、DDOS攻擊、垃圾郵件、數(shù)據(jù)泄露等等安全問題對企業(yè)核心的信息化系統(tǒng)帶來的危害越來越大。
10、數(shù)據(jù)備份和容災(zāi)。當(dāng)企業(yè)開始適應(yīng)信息化,并且實現(xiàn)所有業(yè)務(wù)的信息化之后, 生產(chǎn)數(shù)據(jù)就成了企業(yè)的生命線 。人為惡意操作 、勒索病毒 、設(shè)備損壞 、黑客入侵等等問題造成的數(shù)據(jù)丟失和損壞往往會給一個現(xiàn)代化的公司造成致命的打擊。
11、學(xué)習(xí)新知識的能力 。雖然技術(shù)在不斷發(fā)展和創(chuàng)新創(chuàng)新,但技術(shù)的發(fā)展總是遵循著基本的需求規(guī)律,變得速度更快 、運(yùn)行更穩(wěn)定 、操作更簡便。只有不斷的去學(xué)習(xí)新的知識,對比傳統(tǒng)技術(shù)發(fā)生了哪些變化,了解技術(shù)變遷的路線,才能讓自己的知識體系更加全面和宏觀。
結(jié)語
現(xiàn)代的信息化運(yùn)維已經(jīng)不是簡單的安裝操作系統(tǒng),插拔網(wǎng)線,而是對整個信息化系統(tǒng)的全面維護(hù),是銜接業(yè)務(wù)公司與IT系統(tǒng)交流的橋梁,是企業(yè)信息化管理的一部分,是集多IT工種與一身的綜合性崗位。運(yùn)維崗位看似枯燥,辛苦,又經(jīng)常背鍋,但卻是一個難得的鍛煉機(jī)會。作為一個可以接觸到信息化的全流程,全周期的崗位,運(yùn)維人員應(yīng)該能夠從一個全面的角度看到業(yè)務(wù)系統(tǒng)工作的流程,結(jié)合企業(yè)特點(diǎn)可以發(fā)現(xiàn)整個網(wǎng)絡(luò) 、系統(tǒng) 、 應(yīng)用以及安全防護(hù)中的痛點(diǎn)在哪里,能夠站在管理角度俯瞰整個信息化系統(tǒng),知道現(xiàn)問題在哪里,知道未來企業(yè)的信息化要怎樣規(guī)劃。
隨著信息化整合度越來越高,對運(yùn)維的需求不會僅僅停留在技術(shù)層面,要求也會越來越高,那么作為一個合格的運(yùn)維,你準(zhǔn)備好了嗎?