機房設(shè)備搬遷實戰(zhàn)

機房遷移是一項復(fù)雜而細(xì)致的工作,涉及到多部門互相協(xié)調(diào)、配合,在機房搬遷開始前制定周密計劃、軟件和硬件方面的完整準(zhǔn)備是完成此項工作的關(guān)鍵。本文分享了醫(yī)院信息系統(tǒng)機房設(shè)備搬遷的實戰(zhàn)經(jīng)驗。

本文來自twt企業(yè)IT社區(qū),作者/李順海,某醫(yī)院系統(tǒng)架構(gòu)設(shè)計師、信息系統(tǒng)項目管理師,作為核心人員,全程參與醫(yī)院系統(tǒng)設(shè)計、管理開發(fā)、項目協(xié)調(diào)。

引言

隨著醫(yī)院業(yè)務(wù)的不斷發(fā)展,醫(yī)療業(yè)務(wù)系統(tǒng)的不斷完善,通信設(shè)備迅速增加。為了能夠給患者提供更優(yōu)質(zhì)的服務(wù),醫(yī)院需要對信息系統(tǒng)進行新建、擴容和整合,必然存在機房、網(wǎng)絡(luò)和硬件設(shè)備的優(yōu)化。

某院新建南院大樓,配備高標(biāo)準(zhǔn)機房,面臨數(shù)個機房設(shè)備的搬遷歸整工作。搬遷總共涉及到某院3個機房,分別為現(xiàn)有的主機房、次機房和新機房。機房搬遷對IT資源的轉(zhuǎn)移、升級,包括搬遷前現(xiàn)有系統(tǒng)的備份、搬遷過程的安全和搬遷后系統(tǒng)的完整恢復(fù)一系列過程,并且對系統(tǒng)搬遷的時間都有比較嚴(yán)格的要求。

搬遷計劃的制定和實踐的實施是一個周密的過程,該過程的順利實現(xiàn)是對現(xiàn)代化醫(yī)院機房建設(shè)和發(fā)展的深入理解和有效探索。

一、搬遷原則

1.1總體原則

我們在整體搬遷工作的計劃和實施上遵循以下5條基本原則:

(1)注重細(xì)節(jié)、統(tǒng)籌安排。

(2)抱定一次成功的信心并做好最壞的打算。

(3)組織完畢的保障體系和強大的技術(shù)支持體系。

(4)制定完善的應(yīng)急處理方案。

(5)實施標(biāo)準(zhǔn)化、搬運標(biāo)準(zhǔn)化、操作標(biāo)準(zhǔn)化。

1.2機房規(guī)劃準(zhǔn)則

對新建的機房進行合理的規(guī)劃,在規(guī)劃時遵循以下3條原則:

(1)保證網(wǎng)絡(luò)結(jié)構(gòu)的統(tǒng)籌性。新機房的建設(shè)和使用應(yīng)結(jié)合醫(yī)院的總體規(guī)劃,同時還應(yīng)考慮經(jīng)營策略及今后新業(yè)務(wù)的發(fā)展需要。

(2)保證使用效率的最優(yōu)化。新機房要嚴(yán)格按照電信專用房屋建設(shè)規(guī)范設(shè)計,其層高、荷重、機房溫濕度、潔凈度等標(biāo)準(zhǔn)較高,應(yīng)盡量用于通信設(shè)備的安裝。

(3)保證設(shè)備運營的安全性。對于影響設(shè)備正常運行的環(huán)境,必須配備相應(yīng)的設(shè)施給予保證,同時新機房樓內(nèi)的通信電源、專用空調(diào)、進局光電纜等系統(tǒng),可以根據(jù)全樓各機房設(shè)備安裝的具體進度分批進行建設(shè)。

1.3搬遷細(xì)則

在搬遷之前要對搬遷的內(nèi)容做充分的調(diào)研,分析各個系統(tǒng)在整個通信網(wǎng)絡(luò)中的地位,根據(jù)其重要性確定其搬遷方案。

為保證搬遷的平穩(wěn)可靠,經(jīng)過反復(fù)論證討論,確定了“分批搬遷、平穩(wěn)過渡”的總體搬遷方針,制定了詳細(xì)的搬遷方案。

對于搬遷的系統(tǒng),大致可分為2類:

(1)可中斷業(yè)務(wù)的系統(tǒng):如果設(shè)備的搬遷、重新安裝調(diào)試中斷時間能控制在用戶可以接受的范圍內(nèi),在征得主管技術(shù)部門的認(rèn)可后,可考慮將系統(tǒng)中斷后整體搬遷。

(2)不可中斷業(yè)務(wù)的系統(tǒng):對于核心網(wǎng)絡(luò)中的交換系統(tǒng)、傳輸系統(tǒng)等不可中斷業(yè)務(wù)的系統(tǒng),可使用替換設(shè)備來臨時接管業(yè)務(wù),待搬遷結(jié)束后再將系統(tǒng)恢復(fù)到原設(shè)備上。

二、詳細(xì)搬遷計劃及過程

新機房建設(shè)竣工,舊機房設(shè)備搬遷計劃已列入日程,搬遷的設(shè)備內(nèi)容主要為6個大的核心系統(tǒng)的主機、存儲、機柜和若干小型業(yè)務(wù)系統(tǒng)的PC Server服務(wù)器。

鑒于安全性和穩(wěn)定性考慮,所有設(shè)備搬遷計劃分4次完成,并且安排在業(yè)務(wù)相對空閑的時間段,比如周六晚上和周日白天。

機房的搬遷一般都會涉及到服務(wù)器、交換機、路由器、工作站等大量的設(shè)備,許多軟件的問題以及新機房IP的分配問題等。因此如果提前不進行詳細(xì)的規(guī)劃,匆匆上馬進行機房服務(wù)器等設(shè)備的搬遷,勢必會造成工作的混亂。故在搬遷前,一個完整合理的機房搬遷規(guī)劃是必需的。

2.1搬遷前的準(zhǔn)備工作

(1)項目組內(nèi)部討論:成立項目組,討論搬遷計劃,確定搬遷時間、參與人員,確定各項任務(wù)開始的時間和所需的時間等。

(2)制作標(biāo)簽:在機房制作線纜標(biāo)簽和設(shè)備標(biāo)簽,并一一對應(yīng)粘貼到位。

(3)新機房網(wǎng)絡(luò)布線:①檢查電源布線,包含應(yīng)急發(fā)動機、UPS及每個機柜用電是否符合要求;②檢查光纖布線,根據(jù)sanswitch表檢查新機房光纖布線是否符合要求;③檢查空調(diào);④檢查機房環(huán)境,根據(jù)機房環(huán)境標(biāo)準(zhǔn)來檢查機房環(huán)境,如粉塵、清潔度、室內(nèi)光源等條件是否符合要求。

(4)數(shù)據(jù)備份及恢復(fù)測試:為防止搬運過程中由于各種意外情況造成服務(wù)器或存儲器損壞而影響到數(shù)據(jù)的可用性,應(yīng)對某些關(guān)鍵性數(shù)據(jù)進行備份,如程序、數(shù)據(jù)庫、各服務(wù)器的配置參數(shù)等。①PC Server數(shù)據(jù)備份,用ghost等軟件對系統(tǒng)進行備份;②數(shù)據(jù)庫數(shù)據(jù)備份;③其他應(yīng)用備份,利用第三方軟件對其應(yīng)用進行相關(guān)備份;④備份策略的備份,用相關(guān)第三方軟件對備份軟件策略進行備份;⑤對某些操作系統(tǒng)進行備份恢復(fù)測試,根據(jù)測試環(huán)境對備份數(shù)據(jù)進行模擬恢復(fù)測試。

(5)確定搬遷路線:確認(rèn)搬家公司的搬遷計劃,包括行走路線。

(6)準(zhǔn)備應(yīng)急方案:在整個搬遷發(fā)生意外短時間內(nèi)無法恢復(fù)時啟動。

(7)項目組內(nèi)部討論:確定各項任務(wù)開始的具體時間和搬運過程中具體的人員負(fù)責(zé),設(shè)備責(zé)任具體到人。

(8)發(fā)布公告:對外正式發(fā)布停機系統(tǒng)中斷公告,聯(lián)絡(luò)醫(yī)院各相關(guān)部門,做好應(yīng)急預(yù)案,應(yīng)對信息系統(tǒng)服務(wù)停機的情況。

2.2物理搬遷前的技術(shù)工作

(1)所有信息系統(tǒng)的應(yīng)用服務(wù)和數(shù)據(jù)庫停止運行。

(2)各系統(tǒng)關(guān)機,規(guī)定時間內(nèi)將所有機器及網(wǎng)絡(luò)設(shè)備全部關(guān)機。①PC SERVER關(guān)機;②小型機相關(guān)設(shè)備關(guān)機;③其他設(shè)備關(guān)機。

(3)搬運公司人員到場,并準(zhǔn)備好包裝材料和搬運工具。

(4)系統(tǒng)冷機,關(guān)機后等待30 min,確保機器在正常的溫度下打包。

(5)拆除設(shè)備和電纜,由項目組相關(guān)人員拆卸所有服務(wù)器,并和物流人員配合將所有連線全部拆除。由于搬運的設(shè)備,如服務(wù)器、UPS、終端等都是集成度和精密度非常高的設(shè)備,因而在整個過程中,需要注意防止設(shè)備的碰撞。設(shè)備的拆卸主要包括:①PC SERVER設(shè)備拆卸;②小型機相關(guān)設(shè)備拆卸;③其他設(shè)備拆卸。

(6)對打包的設(shè)備進行編號并統(tǒng)計。

2.3物理搬運

(1)設(shè)備包裝:由搬運公司將需要包裝的設(shè)備按照打包運輸相應(yīng)規(guī)范進行打包。

(2)設(shè)備裝車:設(shè)備搬運到車上,并進行固定。

(3)物理運輸:由搬運公司將需要包裝的設(shè)備按照打包運輸相應(yīng)規(guī)范進行運輸。

(4)人員轉(zhuǎn)移:所有技術(shù)及其他相關(guān)人員根據(jù)事先安排前往機房。

(5)機房設(shè)備卸貨:設(shè)備運到后,搬運物流公司根據(jù)機房管理人員安排將設(shè)備運至指定的卸貨平臺。

(6)機房設(shè)備定位:①拆除包裝:按照裝箱單與實物進行逐一核對檢查,確認(rèn)設(shè)備上的各種零件、部件及有關(guān)標(biāo)志正確、清晰、齊全。②設(shè)備定位:確定設(shè)備的放置位置,檢查電源等相關(guān)事宜,將設(shè)備搬運至機房內(nèi)指定位置,按照主機設(shè)備表來進行上架工作,根據(jù)網(wǎng)絡(luò)端口進行尾纖的連接。

(7)設(shè)備交接:根據(jù)設(shè)備編號進行驗貨,并仔細(xì)觀察設(shè)備外觀是否損壞。

2.4安裝及測試

(1)設(shè)備連接:包括機柜固定、設(shè)備上架、線纜連接等。機柜不能直接擺放在靜電地板上,而要進行有效的固定。設(shè)備機架需要和底座或地面進行加固連接。機架加固底座的安裝應(yīng)在設(shè)備到貨后由施工人員具體精確確定安裝位置,同時根據(jù)設(shè)備安裝設(shè)計圖紙進行安裝。其主要包括:①PC Server設(shè)備連接;②小型機相關(guān)設(shè)備連接;③其他設(shè)備連接。

(2)設(shè)備系統(tǒng)上電:各設(shè)備加電開機,啟動所有的服務(wù)、數(shù)據(jù)庫和系統(tǒng)應(yīng)用。

(3)應(yīng)用系統(tǒng)測試:搬遷后應(yīng)用測試驗證,由各系統(tǒng)維護人員進行軟件測試。①服務(wù)器狀態(tài)的恢復(fù),查看是否出現(xiàn)了數(shù)據(jù)丟失或損壞的情況[6]。由于我們之前對系統(tǒng)數(shù)據(jù)作了備份,所以一旦出現(xiàn)了這種數(shù)據(jù)的損壞,就可以把搬遷前的數(shù)據(jù)重新恢復(fù)過來,以保證服務(wù)器的正常運行。②進行相應(yīng)的IP地址、DNS設(shè)置、軟件的調(diào)整和全網(wǎng)設(shè)備連通性的測試。③進行應(yīng)用測試,確保系統(tǒng)的正常運行。④所有的設(shè)備重新啟動,觀察設(shè)備運行的速度和質(zhì)量等指標(biāo)是否達到標(biāo)準(zhǔn)。⑤進行相關(guān)的日志記錄。

搬遷工作流程如圖所示。

1.png

三、搬遷中的問題和解決方案

實踐操作中仍然遇到了一些問題。通過努力,這些問題都得到了較好地解決,現(xiàn)列述如下。

3.1機柜留位

機房中每個機柜的位置在建造之初已經(jīng)固定,支撐物為鏤空的角鋼支架,從防靜電地板下方支撐到高于地板1 cm。由于以APC 42U機柜為標(biāo)準(zhǔn),每個機柜只有60 cm的空間,2個機柜之間沒有空隙。但是需要搬到新機房的數(shù)十個機柜中,有6個IBM的42U機柜尺寸略大,需要65 cm的留位。

3.2供電的穩(wěn)定

搬遷后的新機房有專業(yè)電源控制機柜,包括相應(yīng)的電池模塊和控制模塊,由專門人員負(fù)責(zé)操作維護。PACS搬遷時,IBM機柜到位,所有服務(wù)器上架安裝完畢,系統(tǒng)工程師按標(biāo)準(zhǔn)流程順次啟動小型機和服務(wù)器,測試數(shù)據(jù)庫和應(yīng)用程序是否運行正常,測試時發(fā)現(xiàn)有1臺服務(wù)器的電源燈閃爍(黃色),緊接著在排查供電錯誤時由于誤操作導(dǎo)致整個機柜斷電,小型機和數(shù)據(jù)庫同時非正常強行關(guān)閉。

機房遷移是一項復(fù)雜而細(xì)致的工作,涉及到多部門互相協(xié)調(diào)、配合,在機房搬遷開始前制定周密計劃、軟件和硬件方面的完整準(zhǔn)備工作是完成此項工作的關(guān)鍵。

原題:某醫(yī)院信息系統(tǒng)機房設(shè)備搬遷方案

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論