可能很多朋友對于如何規(guī)劃數(shù)據(jù)中心都會有很多疑惑,不知如何下手,比如不少人會對下面大問題存有未知:
如何衡量數(shù)據(jù)中心建設(shè)需求(數(shù)據(jù)規(guī)模、帶寬、用戶量等)?
如何把這些需求轉(zhuǎn)換為建設(shè)指標(存儲、計算、網(wǎng)絡(luò)、能耗、冷卻、占地等)?
如何設(shè)計功能(云、分布式、高算、虛擬化)?
頭部企業(yè)的數(shù)據(jù)中心是怎么建設(shè)的,容量多少,性能如何,成本多少(谷歌、阿里、騰訊等)?
那么今天我們就來了解一些關(guān)于數(shù)據(jù)中心的規(guī)劃設(shè)計要點。
1、數(shù)據(jù)中心建在哪里比較好
氣候條件對于新建的數(shù)據(jù)中心具有十分重要的意義。我們可以根據(jù)這個選擇最合適的冷卻措施,比如包括機械制冷空調(diào)、水冷機組、間接空氣冷卻、自然空氣冷卻、絕熱冷卻等,這些可以實現(xiàn)數(shù)據(jù)中心設(shè)施更低的PUE目標。
2、需要多少機甲和尺寸是多少
數(shù)據(jù)中心的空間需求是由機架的數(shù)量決定的。傳統(tǒng)的IT機架尺寸是600*1000mm,一個100平米的機房空間可以容納大約50個機架。機架也有其他尺寸,估測數(shù)據(jù)中心所需的空間,首先必須了解機架的尺寸和數(shù)量。
3、確定數(shù)據(jù)中心的等級需求
數(shù)據(jù)中心的Tier等級確定了數(shù)據(jù)中心的冗余要求和電源分配路徑。部署“N+1”架構(gòu)的電源和冷卻設(shè)備的冗余對于一個Tier2級數(shù)據(jù)中心是足夠的。而對于一個Tier3級的數(shù)據(jù)中心設(shè)施,通常要包括“N+1”冷卻設(shè)備冗余,具有雙供電2N電源冗余,以及獨立的雙路配電機架。所以,冗余設(shè)計之前,必須先了解數(shù)據(jù)中心的等級。
4、各機房的平均功率密度是多少
需要注意的是,當設(shè)計數(shù)據(jù)中心的電源容量時,要根據(jù)平均功率密度,而不是根據(jù)最大額定電源,這個很重要。機架平均功率密度*機架數(shù)量才是數(shù)據(jù)中心的最大IT負載量。最后,再加上數(shù)據(jù)中心的電源系統(tǒng),冷卻系統(tǒng)、交換機和存儲設(shè)備等設(shè)施的功率。
為避免資源浪費、成本過高,達到充分利用電力系統(tǒng),最大優(yōu)化數(shù)據(jù)中心的電源和空間,采用模塊化策略是非常明智的。模塊化策略可以降低成本,不必犧牲未來擴展的靈活性。
5、運維人員也應(yīng)參加規(guī)劃設(shè)計
運維參與前期規(guī)劃設(shè)計,可以彌補設(shè)計人員對系統(tǒng)運行管理知識的欠缺,提高設(shè)計質(zhì)量,避免和消除設(shè)計的缺陷;
運維參與前期規(guī)劃設(shè)計,可充分考慮到規(guī)劃設(shè)計中運維階段的需求;
運維參與前期規(guī)劃設(shè)計,可充分了解和掌握所維護系統(tǒng)的結(jié)構(gòu)、可靠性薄弱環(huán)節(jié)、潛在風(fēng)險和遺留問題,有助于提高運維的效率,有根據(jù)的制定運維計劃和切實可行的改造計劃。
6、遵守科學(xué)設(shè)計原則,避免受內(nèi)外部因素影響
要對數(shù)據(jù)中心進行科學(xué)的設(shè)計,要正確對待傾向、喜好、限制、約束的區(qū)別。
要避免受審批、決策等環(huán)節(jié)個別決策者的影響,對關(guān)鍵功能不能按照個別意見進行主觀性的刪減調(diào)整,導(dǎo)致最終交付的數(shù)據(jù)中心功能不能滿足運營和維護的需求。
避免因傾向、喜好和利益驅(qū)動。在規(guī)劃設(shè)計階段部分設(shè)備廠商可能會通過夸大設(shè)備性能、混淆概念等手段影響規(guī)劃設(shè)計人員的方案制定和設(shè)備選型。
7、直流或交流機架需要什么級別的備份電池
服務(wù)器機架可能需要部署百分之百的交流電源,或直流電源,或二者兼之。
比如,如果正在為托管目的建設(shè)數(shù)據(jù)中心,可能有配備交流(UPS)供電系統(tǒng)的需求,而如果是電信設(shè)備,可能就需要部署直流電源系統(tǒng)。了解這些,就可以知道所需UPS電源系統(tǒng)或直流電源系統(tǒng)的大小、規(guī)模。
在部署備份電池時,最好根據(jù)15分鐘備用放電時間進行配置。如此部署的備用電池,可以稍微減少資本支出。企業(yè)需要提高備用發(fā)電機組的冗余度,而不是在增加電池數(shù)量上浪費成本支出。
8、避免輕規(guī)劃設(shè)計,重施工建設(shè)
很多數(shù)據(jù)中心存在輕規(guī)劃設(shè)計重施工建設(shè)的現(xiàn)象,主要方面有:
先建樓體結(jié)構(gòu),后規(guī)劃數(shù)據(jù)中心,為數(shù)據(jù)中心規(guī)劃設(shè)計才來重重困難;
機房建設(shè)和設(shè)備安裝后不久即開始改造的現(xiàn)象普遍存在;
先確定設(shè)備,再敲定方案,因為購買的設(shè)備不能滿足方案的需求,或場地不滿足安裝條件需求,最后導(dǎo)致設(shè)備還沒開始運行就要被更換;
建設(shè)結(jié)構(gòu)難以滿足數(shù)據(jù)中心的場地布局需求,規(guī)劃不合理使機房區(qū)分不符合實際;空調(diào)室外機距離太遠或無法安裝;由于主機房和動力室距離太遠,從而增加傳輸和管理困難,成本增加,可靠性降低。
9、必須重視對系統(tǒng)的可維護性和可修復(fù)性設(shè)計
數(shù)據(jù)中心的系統(tǒng)三分靠建設(shè),七分靠維護,任何設(shè)備都不可避免的會發(fā)生故障,可快速修復(fù)已經(jīng)成為提高可用性的關(guān)鍵指標。
忽視可維護性和可修復(fù)性的現(xiàn)象普遍存在于:
在規(guī)劃設(shè)計階段中沒有考慮后期維護通道和維護空間,例如電池靠墻陳放、設(shè)備距離靠墻太近、線纜布局不合理、線纜管路或走線架擋住上方電線槽致使后期無法維修和維護工具難以施展等;
故障發(fā)生時,應(yīng)急物資和設(shè)備無法快速搬運,故障設(shè)備和期間更換沒有維修操作空間等,導(dǎo)致延誤故障處置時限,甚至引起重大事故;
沒有充分考慮后期發(fā)生故障維護設(shè)備時的系統(tǒng)冗余保障能力;
沒有盡可能的做到自動化管控,盡可能的減少維護人員手動操作環(huán)節(jié),從而提高因手動操作導(dǎo)致的不確定性和不可控性。
10、要有科學(xué)依據(jù)的進行可用性設(shè)計
系統(tǒng)可用性是數(shù)據(jù)中心規(guī)劃設(shè)計的最重要的指標,規(guī)劃設(shè)計時缺乏科學(xué)依據(jù)主要表現(xiàn)在:
數(shù)據(jù)中心在規(guī)劃設(shè)計師都會進行各系統(tǒng)可靠性的推送,但各家設(shè)計院、設(shè)計師對可靠性的推算依據(jù)和數(shù)據(jù)都會有自己的一套,沒有統(tǒng)一的規(guī)范,這樣就可能會造成同一的數(shù)據(jù)中心的設(shè)計等級和可靠性存在不同的定義和結(jié)果。
對可用性存在著先進行規(guī)劃設(shè)計和施工,建完之后再進行反推設(shè)計等級的操作,并以反推的等級向數(shù)據(jù)中心用戶進行推廣介紹。這種本末倒置的設(shè)計,很多時候會因為設(shè)計中某些關(guān)鍵缺陷,刀子雖然絕大部分設(shè)計滿足等級要求,但因為關(guān)鍵缺陷的存在造成等級下降。
只是關(guān)注設(shè)備或子系統(tǒng)的可用性,但卻忽略了對于整個系統(tǒng)中各子系統(tǒng)之間的相關(guān)性對可用性的影響。
11、確定高指標,要確實符合實際的需求和可行性
在規(guī)劃設(shè)計初期,不切實際的追求規(guī)模大、高可用性等級、高機架功率密度、低能耗指標PUE等,只是單純主觀臆斷確定數(shù)據(jù)中心的功能指標。
在具體規(guī)劃設(shè)計時,又沒有嚴格按照規(guī)劃原則和程序做詳細的論證,具體方案和實際措施與總體規(guī)劃不匹配,從而導(dǎo)致:
由于實際需求不明確,缺乏可行性的必要條件,反復(fù)的設(shè)計修改,這樣不僅會造成成本的浪費,而且會大幅度拖延建設(shè)周期。
由于對預(yù)想的業(yè)務(wù)需求量沒有充分的分析,或因機房條件不能滿足用戶需求,從而導(dǎo)致已建成并投入使用的機房不能得到充分利用,面臨需進行再次優(yōu)化改造才能使用的窘境。
對于規(guī)劃攝像的功能實現(xiàn)不了,如制冷方案不支持規(guī)劃的機架高功率密度、系統(tǒng)可用性達不到規(guī)劃等級、發(fā)電機不支持系統(tǒng)連續(xù)運行條件、過度規(guī)劃使系統(tǒng)能耗指標PUE耗能嚴重等。
12、避免重設(shè)備輕系統(tǒng)的認識誤區(qū)
行業(yè)內(nèi)普遍存在中設(shè)備輕系統(tǒng)或中局部輕大局的現(xiàn)象,主要體現(xiàn)在:
確定好設(shè)備規(guī)格型號或生產(chǎn)廠商后,才依據(jù)設(shè)備的選擇或修改設(shè)計方案的。
忽視整個供電系統(tǒng)致使存在單路徑故障點,比如供電系統(tǒng)是按最高可用等級2N冗余設(shè)計的,但設(shè)計的結(jié)果卻只是UPS系統(tǒng)有2N功能。
整個系統(tǒng)是按最高等級冗余容錯系統(tǒng)設(shè)計的,但空調(diào)制冷設(shè)備卻是單路徑供電的。
因為規(guī)劃設(shè)計者缺乏連續(xù)制冷的認識,導(dǎo)致在為系統(tǒng)配置了交流備用能源柴油發(fā)電機,但發(fā)電機卻沒有自動啟動功能。這也是系統(tǒng)連續(xù)運行的重要條件的認識。
13、重視統(tǒng)籌設(shè)計
優(yōu)質(zhì)地完成規(guī)劃設(shè)計任務(wù)的重要方法是提高系統(tǒng)統(tǒng)籌設(shè)計能力。
在數(shù)據(jù)中心建設(shè)過程中存在著大量因為規(guī)劃設(shè)計對分階段、分專業(yè)實施階段工程,以及不同專業(yè)施工間銜接問題考慮不周造成交付數(shù)據(jù)中心不能滿足業(yè)務(wù)和維護的需要,有些問題可能會導(dǎo)致需要巨量的投入才能改造完成。
不同設(shè)計人員只關(guān)注自己負責(zé)的內(nèi)容,忽視對其他專業(yè)的是否銜接,是否存在矛盾和沖突,缺乏全局的考慮。
規(guī)劃設(shè)計人員對未來業(yè)務(wù)發(fā)展缺乏準確的預(yù)判,對后期容量管理、擴容等方面考慮不足;
規(guī)劃設(shè)計人員對周圍資源環(huán)境和物理環(huán)境不熟悉,設(shè)計出來的方案會出現(xiàn)實施可行性差或為以后的運維工作帶來不必要的困難。