隨著數(shù)據(jù)需求工作負(fù)載滲透到數(shù)據(jù)中心并覆蓋傳統(tǒng)的CPU性能,GPU各供應(yīng)商已經(jīng)為數(shù)據(jù)中心補(bǔ)充了全新的設(shè)備和顯示卡。
最近大數(shù)據(jù)、人工智能以及機(jī)器學(xué)習(xí)的潮流正在企業(yè)服務(wù)器之間形成連鎖反應(yīng)。因?yàn)閭鹘y(tǒng)的微處理器難以有效地處理這些來(lái)自要求苛刻的工作負(fù)載的信息,因此數(shù)據(jù)中心圖形處理器轉(zhuǎn)移至該領(lǐng)域填補(bǔ)相關(guān)的資源空白。
大數(shù)據(jù)
自70年代以來(lái),圖形處理單元最初被用于從中央處理器處理視頻和圖形處理任務(wù)。與典型的CPU相比,這些系統(tǒng)具有不同的底層設(shè)計(jì),GPU是為在單一數(shù)據(jù)流上最大化高速流水線上吞吐量而構(gòu)建的。CPU也被設(shè)計(jì)為支持快速切換,并將信息從一個(gè)地方快速移動(dòng)到另一個(gè)地方,如從主存儲(chǔ)到某一存儲(chǔ)系統(tǒng)。然而GPU具有不同的結(jié)構(gòu):它們可以并行處理并支持多個(gè)高速連接。這些微處理器有多組數(shù)據(jù)路徑進(jìn)行大量的數(shù)據(jù)處理,這與圖形應(yīng)用程序的需求非常吻合。
擴(kuò)展數(shù)據(jù)中心GPU應(yīng)用范圍
GPU在完成少量任務(wù)方面做得很好,但隨著任務(wù)要求逐漸擴(kuò)大,相關(guān)相應(yīng)也逐漸完成擴(kuò)展。Nvidia傾向于把GPU與其他半導(dǎo)體供應(yīng)商區(qū)分開(kāi)來(lái),并為GPU尋找更廣泛的用途。
首先,這些產(chǎn)品開(kāi)始進(jìn)入高性能計(jì)算領(lǐng)域。然而最近,GPU供應(yīng)商專(zhuān)門(mén)為數(shù)據(jù)中心服務(wù)器設(shè)計(jì)了設(shè)備和顯示卡產(chǎn)品。專(zhuān)為服務(wù)器優(yōu)化的GPU使用高帶寬內(nèi)存,并作為模塊集成到專(zhuān)用服務(wù)器設(shè)計(jì)中,或作為外圍組件互連快速(Peripheral Component Interconnect Express)附加卡的方式提供。但是,與游戲顯卡不同,這些顯示卡并未提供圖形化界面。
服務(wù)器各供應(yīng)商將GPU與CPU連接起來(lái),以充分利用CPU的優(yōu)勢(shì)。當(dāng)CPU性能無(wú)法滿(mǎn)足處理數(shù)據(jù)密集型任務(wù)時(shí),會(huì)提高CPU(與GPU的集成)性能(滿(mǎn)足任務(wù)需要)。
大數(shù)據(jù)、機(jī)器學(xué)習(xí)和人工智能應(yīng)用程序具有很高的處理要求,需要處理大量的信息和不同的數(shù)據(jù)類(lèi)型。這些特點(diǎn)與GPU的設(shè)計(jì)初衷非常吻合。
AI和機(jī)器學(xué)習(xí)各供應(yīng)商均使用GPU來(lái)支持處理訓(xùn)練神經(jīng)網(wǎng)絡(luò)所需的大量數(shù)據(jù)。Gartner公司的分析師Alan Priestley表示,在這一領(lǐng)域的市場(chǎng)之中,相比于將程序部署到具有GPU的高性能服務(wù)器之上,擁有GPU的PC設(shè)備可用性可幫助軟件開(kāi)發(fā)人員能夠在臺(tái)式電腦上開(kāi)發(fā)他們的算法。
GPU在數(shù)據(jù)中心領(lǐng)域的應(yīng)用
數(shù)據(jù)中心GPU的應(yīng)用將來(lái)可能會(huì)不斷深入。GPU是任務(wù)關(guān)鍵型工作負(fù)載的重要基礎(chǔ)設(shè)施特性。Priestley說(shuō),IT組織可推行采購(gòu)商品化的GPU,并且借助標(biāo)準(zhǔn)庫(kù)的使用,他們可以很容易地將其納入應(yīng)用程序。
因此,服務(wù)器各供應(yīng)商提供集成GPU模塊的專(zhuān)用服務(wù)器或支持GPU附加卡的產(chǎn)品。據(jù)Gartner公司的調(diào)查,面向服務(wù)器優(yōu)化的GPU顯卡和使用性能最高的處理器的模塊通常的成本在1,000美元到5,000美元之間。
已有相關(guān)產(chǎn)品的供應(yīng)商開(kāi)始將這些附加產(chǎn)品納入其產(chǎn)品線。
戴爾同時(shí)支持AMD公司的FirePro系列GPU以及Nvidia公司的GPU,專(zhuān)為虛擬臺(tái)式基礎(chǔ)設(shè)施和計(jì)算應(yīng)用而設(shè)計(jì),并具有支持高達(dá)1792個(gè)GPU核心的處理能力。Hewlett Packard Enterprise(HPE)ProLiant系統(tǒng)可與Nvidia Tesla,Nvidia GRID和Nvidia Quadro GPU協(xié)同工作。HPE Insight集群管理實(shí)用程序(HPE Insight Cluster Management Utility)將安裝并配置GPU驅(qū)動(dòng)程序,可提供如溫度等GPU運(yùn)行狀況的監(jiān)控。
為了準(zhǔn)備數(shù)據(jù)中心GPU深入使用,管理員需要掌握如何管理這些處理器的專(zhuān)業(yè)知識(shí)。他們應(yīng)該找到熟悉這項(xiàng)技術(shù)的有關(guān)人員,當(dāng)然這絕非易事,因?yàn)榧夹g(shù)不同于傳統(tǒng)的微處理器設(shè)計(jì),而且盡管Nvidia提供了一些培訓(xùn)材料,相關(guān)的課程仍然比較少。