數(shù)據(jù)中心機(jī)房建設(shè)中的關(guān)鍵問題都有哪些?

數(shù)據(jù)中心運維管理
數(shù)據(jù)中心的Tier等級確定了數(shù)據(jù)中心的冗余要求和電源分配路徑。對于一個Tier2級數(shù)據(jù)中心來說,部署“N+1”架構(gòu)的電源和冷卻設(shè)備的冗余是足夠的。然而,對于一個Tier3級的數(shù)據(jù)中心設(shè)施,通常都會包括“N+1”冷卻設(shè)備冗余,具有雙供電2N電源冗余,以及獨立的雙路配電機(jī)架。因此,了解數(shù)據(jù)中心的等級可以決定需要的冗余設(shè)計。

大家都知道一個全面的數(shù)據(jù)中心機(jī)房建設(shè)工程一般包括:綜合布線、抗靜電地板鋪設(shè)、棚頂墻體裝修、隔斷裝修、UPS、專用恒溫恒濕空調(diào)、機(jī)房環(huán)境監(jiān)控系統(tǒng)、新風(fēng)系統(tǒng)、漏水檢測、地線系統(tǒng)、防雷系統(tǒng)、門禁、監(jiān)控、消防、報警、屏蔽工程等。

數(shù)據(jù)中心機(jī)房設(shè)計建設(shè)關(guān)鍵問題都有哪些,您是否知道?今天和大家一起來共同學(xué)習(xí)一下。

正文:

1、數(shù)據(jù)中心將建在哪里

分析新建的數(shù)據(jù)中心所在地的氣候條件是十分重要。這將有助于確定最合適的冷卻措施,其中包括水冷機(jī)組,機(jī)械制冷空調(diào),自然空氣冷卻、間接空氣冷卻,絕熱冷卻等,這些都是為了數(shù)據(jù)中心設(shè)施實現(xiàn)其更低的PUE目標(biāo)。

2、需要多少個機(jī)架,它們的尺寸是多少

機(jī)架的數(shù)量決定數(shù)據(jù)中心的空間需求。傳統(tǒng)的IT機(jī)架的尺寸為600x1000mm(寬x深),而一個空間為100平方米的機(jī)房可以容納大約50個機(jī)架。當(dāng)然機(jī)架也有其他的尺寸,而知道機(jī)架的尺寸和機(jī)架的數(shù)量,就很容易估測你的數(shù)據(jù)中心所需的空間。

3、需要什么等級的數(shù)據(jù)中心

數(shù)據(jù)中心的Tier等級確定了數(shù)據(jù)中心的冗余要求和電源分配路徑。對于一個Tier2級數(shù)據(jù)中心來說,部署“N+1”架構(gòu)的電源和冷卻設(shè)備的冗余是足夠的。然而,對于一個Tier3級的數(shù)據(jù)中心設(shè)施,通常都會包括“N+1”冷卻設(shè)備冗余,具有雙供電2N電源冗余,以及獨立的雙路配電機(jī)架。因此,了解數(shù)據(jù)中心的等級可以決定需要的冗余設(shè)計。

4、每個機(jī)架平均功率密度是多少

要注意的是,當(dāng)設(shè)計數(shù)據(jù)中心的電源容量時,應(yīng)該根據(jù)平均功率密度,而不是在最大額定電源,這是很重要的。機(jī)架的平均功率密度乘以機(jī)架的數(shù)量才是數(shù)據(jù)中心的最大IT負(fù)載量。然后,再加上數(shù)據(jù)中心的電源系統(tǒng),冷卻系統(tǒng)和交換機(jī)和存儲設(shè)備等設(shè)施的功率。

為了避免產(chǎn)生昂貴的成本,并充分利用電力系統(tǒng),使數(shù)據(jù)中心具有大小合適的電源和空間,采用模塊化策略是明智的,可以降低成本,而不必犧牲未來擴(kuò)展的靈活性。

5、運維人員應(yīng)參加規(guī)劃設(shè)計工作

a.運維參與前期規(guī)劃設(shè)計,可彌補(bǔ)設(shè)計人員對系統(tǒng)運行管理知識的不足,提高設(shè)計質(zhì)量,避免或消除設(shè)計缺欠;

b.運維參與前期規(guī)劃設(shè)計,可將運維階段的需求在規(guī)劃設(shè)計中得到充分考慮;

c.運維參與前期規(guī)劃設(shè)計,可充分了解和掌握所維護(hù)系統(tǒng)的結(jié)構(gòu)、可靠性薄弱環(huán)節(jié)、遺留問題、潛在風(fēng)險,有助于提高運維質(zhì)量、有根據(jù)地制定運維計劃和切實可行的改造計劃。

6、避免受內(nèi)外部因素影響

對于不能正確對待傾向、喜好、限制、約束的區(qū)別,不遵守科學(xué)設(shè)計原則的問題,有一下建議:

a.應(yīng)避免受審批、決策等環(huán)節(jié)個別決策者影響,對一些關(guān)鍵功能按照個別人的意見進(jìn)行刪減調(diào)整,導(dǎo)致最終交付的數(shù)據(jù)中心功能不能滿足運營和維護(hù)需求;

b.應(yīng)避免出于傾向、喜好或利益驅(qū)動。在規(guī)劃設(shè)計階段部分設(shè)備廠商可能會通過夸大設(shè)備性能、混淆概念等手段影響規(guī)劃設(shè)計人員的方案制定和設(shè)備選型。

7、交流機(jī)架或直流機(jī)架需要什么級別的備份電池

服務(wù)器機(jī)架可能需要部署百分之百的直流電源,或百分之百的交流電源,或者是二者的組合。

例如,如果正在為托管目的建設(shè)數(shù)據(jù)中心,可能有配備交流(UPS)供電系統(tǒng)的需求,而如果是要成為一個電信設(shè)施,這可能需要部署直流電源系統(tǒng)。知道這些,就會知道所需要的直流電源或UPS電源系統(tǒng)的大小和規(guī)模。

在部署備份電池時,最好根據(jù)15分鐘備用放電時間進(jìn)行配置。這樣部署備用電池,不會顯著增加資本支出,雖然這將很難自圓其說,但這更符合成本效益。企業(yè)需要提高備用發(fā)電機(jī)組的冗余度,而不是在增加電池數(shù)量浪費更多的資金。

8、避免輕規(guī)劃設(shè)計,重施工建設(shè)

業(yè)內(nèi)存在輕規(guī)劃設(shè)計,重施工建設(shè)的現(xiàn)狀,主要表現(xiàn)在:

a.先建樓體結(jié)構(gòu),后規(guī)劃數(shù)據(jù)中心,為數(shù)據(jù)中心規(guī)劃設(shè)計帶來難以克服的困難;

b.機(jī)房建設(shè)和設(shè)備安裝完畢即開始改造的現(xiàn)象普遍存在;

c.先確定設(shè)備,再確定方案,由于所購設(shè)備功能不滿足方案要求,或場地不滿足安裝條件要求,因而設(shè)備尚未運行就要更換;

d.建設(shè)結(jié)構(gòu)很難滿足數(shù)據(jù)中心場地布局要求,使機(jī)房分區(qū)規(guī)劃不合理;空調(diào)室外機(jī)無法安裝或距離太遠(yuǎn);動力室與主機(jī)房距離太遠(yuǎn),增加傳輸和管理困難,增加成本,降低可靠性。

9、避免忽視對系統(tǒng)可維護(hù)性和可修復(fù)性設(shè)計

系統(tǒng)三分建設(shè)、七分維護(hù),任何設(shè)備都可能發(fā)生故障,可快速修復(fù)已經(jīng)成為提高可用性的關(guān)鍵指標(biāo)。

忽視可維護(hù)性和可修復(fù)性的現(xiàn)象表現(xiàn)在:

a.規(guī)劃設(shè)計階段未考慮后期維護(hù)通道、維護(hù)空間,例如設(shè)備距離墻壁太近,電池靠墻擺放,線纜布局不合理、線纜管路或走線架擋住上方弱電線槽導(dǎo)致后期無法維修、維護(hù)工具難以施展等;

b.故障發(fā)生時,應(yīng)急物資和備件無法快速搬運,故障設(shè)備和器件更換無維修操作空間等問題,延誤了故障處置時限甚至引發(fā)重大事故;

c.未考慮后期發(fā)生故障進(jìn)行設(shè)備維護(hù)時系統(tǒng)的冗余保障能力;

d.未盡可能采用自動化手段,最大程度減少維護(hù)人員手動操作環(huán)節(jié),降低因手動操作存在的不確定性和不可控性。

10、避免可用性設(shè)計缺乏科學(xué)依據(jù)

系統(tǒng)可用性是數(shù)據(jù)中心規(guī)劃設(shè)計的最重要的指標(biāo),但規(guī)劃設(shè)計時缺乏科學(xué)依據(jù),主要表現(xiàn)是:

a.數(shù)據(jù)中心在規(guī)劃設(shè)計時都會進(jìn)行各系統(tǒng)可靠性的推算,但目前各設(shè)計院、不同的設(shè)計人員對可靠性的推算依據(jù)和數(shù)據(jù)來源尚未統(tǒng)一,造成對同一數(shù)據(jù)中心的設(shè)計等級和可靠性存在不同定義和不同的結(jié)果;

b.對可用性存在著先進(jìn)行規(guī)劃設(shè)計、施工,建設(shè)完成后再反推設(shè)計等級的案例,并以反推的等級標(biāo)準(zhǔn)向數(shù)據(jù)中心用戶進(jìn)行推介。此為本末倒置的設(shè)計,往往因為設(shè)計中的某些關(guān)鍵缺陷導(dǎo)致雖然絕大部分設(shè)計滿足等級要求,但因為關(guān)鍵缺陷的存在造成等級下降;

c.只注意設(shè)備或環(huán)節(jié)(子系統(tǒng))的可用性,而忽略在整個系統(tǒng)中各子系統(tǒng)之間的相關(guān)性對可用性的影響。

11、避免在脫離實際需要和可行性情況下,確定高指標(biāo)

在規(guī)劃設(shè)計初期,主觀臆斷確定數(shù)據(jù)中心的功能指標(biāo),不切實際地一味追求規(guī)模大、高可用性等級、高機(jī)架功率密度、低能耗指標(biāo)PUE。

而具體規(guī)劃設(shè)計時,又沒有嚴(yán)格按照規(guī)劃原則和程序做詳細(xì)的論證,具體方案和實際措施與總體規(guī)劃部匹配,其結(jié)果是:

a.由于實際需求不明確,缺乏可行性的必要條件,反復(fù)設(shè)計、修改,不僅造成成本的浪費,還大大延長了建設(shè)周期;

b.已建成并投入使用的機(jī)房得不到充分利用,究其原因或因無預(yù)想的業(yè)務(wù)需求量,或因機(jī)房條件不滿足用戶需求而必須進(jìn)行再優(yōu)化改造才能使用;

c.規(guī)劃設(shè)想的功能不能實現(xiàn),如系統(tǒng)可用性達(dá)不到規(guī)劃等級、制冷方案不支持規(guī)劃的機(jī)架高功率密度、發(fā)電機(jī)不支持系統(tǒng)連續(xù)運行條件、過度規(guī)劃使系統(tǒng)能耗指標(biāo)PUE居高不下等。

12、避免重設(shè)備輕系統(tǒng)的認(rèn)識誤區(qū)

業(yè)內(nèi)特別是規(guī)劃設(shè)計人員普遍存在著重設(shè)備輕系統(tǒng)和重局部忽視大局的現(xiàn)象,主要表現(xiàn)在:

a.先確定設(shè)備規(guī)格型號甚至生產(chǎn)廠家,然后根據(jù)設(shè)備選擇或修改設(shè)計方案;

b.供電系統(tǒng)按最高可用等級2N冗余設(shè)計,但所設(shè)計的結(jié)果是僅僅UPS系統(tǒng)有2N功能,而整個供電系統(tǒng)卻存在單路徑故障點;

c.整個系統(tǒng)按最高等級冗余容錯系統(tǒng)設(shè)計,但是空調(diào)制冷設(shè)備卻是單路徑供電;

d.為系統(tǒng)配置了交流備用能源柴油發(fā)電機(jī),但發(fā)電機(jī)沒有自動啟動功能,因為規(guī)劃設(shè)計者缺乏連續(xù)制冷也是系統(tǒng)連續(xù)運行的重要條件的認(rèn)識。

13、注重統(tǒng)籌設(shè)計

提高系統(tǒng)統(tǒng)籌設(shè)計能力對優(yōu)質(zhì)地完成規(guī)劃設(shè)計任務(wù)是非常重要的。

a.在數(shù)據(jù)中心建設(shè)過程中存在著大量因規(guī)劃設(shè)計對分階段、分專業(yè)實施階段工程,以及不同專業(yè)施工間銜接問題考慮不足造成交付的數(shù)據(jù)中心不滿足業(yè)務(wù)及維護(hù)需求,有些問題甚至需要大筆投資進(jìn)行改造方可完成;

b.不同設(shè)計人員只關(guān)注自身所負(fù)責(zé)內(nèi)容,對于其他專業(yè)的是否完美銜接,是否與其他專業(yè)設(shè)計之間存在矛盾和沖突缺乏全局考慮;

c.規(guī)劃設(shè)計人員對未來業(yè)務(wù)發(fā)展缺乏準(zhǔn)確把握,對后期容量管理、擴(kuò)容等方面考慮不足;

d.規(guī)劃設(shè)計人員對周圍資源環(huán)境和物理環(huán)境不熟悉,所設(shè)計的方案會出現(xiàn)實施可行性差或者為后來運維工作帶來難以克服的困難。

總結(jié)

在新數(shù)據(jù)中心建設(shè)中還有許多其它需考慮的問題,但行業(yè)的經(jīng)驗告訴我們,在數(shù)據(jù)中心建設(shè)和設(shè)計過程中掌握這十三個關(guān)鍵點,有助于確保最終的建設(shè)結(jié)果盡可能接近用戶的真正需求,值得借鑒。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論