HotChips會(huì)議再提PIM芯片技術(shù),有公司取得進(jìn)展

中國存儲(chǔ)網(wǎng)
高帶寬內(nèi)存(HBM)和混合內(nèi)存多維數(shù)據(jù)集(HMC)試圖通過堆疊特殊的DRAM芯片并運(yùn)行來克服這一瓶頸數(shù)千總線垂直向下到底部的邏輯芯片,可以高速驅(qū)動(dòng)多達(dá)1,024個(gè)I / O引腳。這是一個(gè)幫助,但它仍然比堆棧中任何DRAM芯片的內(nèi)部帶寬慢得多。

國外技術(shù)網(wǎng)站Memory Guy消息,8月31日的HotChips會(huì)議展示了一個(gè)名為“處理內(nèi)存”(PIM)的概念,該概念已經(jīng)存在了很長(zhǎng)時(shí)間,但尚未進(jìn)入主流計(jì)算領(lǐng)域。一位主持人表示,他的公司,一家名為UPMEM的法國公司,希望改變這種狀況。

什么是PIM?這是一種通過利用任何內(nèi)存芯片中可用的非常大的帶寬來提高處理速度的方法。

存儲(chǔ)器芯片內(nèi)部的陣列非常方形:字線選擇大量的位(數(shù)十或數(shù)十萬),它們一次變?yōu)榛顒?dòng)狀態(tài),每個(gè)位都在其自己的位線上。然后這些無數(shù)位慢慢轉(zhuǎn)入I / O引腳。

高帶寬內(nèi)存(HBM)和混合內(nèi)存多維數(shù)據(jù)集(HMC)試圖通過堆疊特殊的DRAM芯片并運(yùn)行來克服這一瓶頸數(shù)千總線垂直向下到底部的邏輯芯片,可以高速驅(qū)動(dòng)多達(dá)1,024個(gè)I / O引腳。這是一個(gè)幫助,但它仍然比堆棧中任何DRAM芯片的內(nèi)部帶寬慢得多。

PIM背后的概念是將處理器直接構(gòu)建到DRAM芯片中,并將它們直接連接到所有內(nèi)部位線,以利用存儲(chǔ)器芯片所提供的驚人內(nèi)部帶寬。這不是一個(gè)新的想法。我在20世紀(jì)80年代首次聽說過這個(gè)概念,當(dāng)時(shí)一位發(fā)明家找到了當(dāng)時(shí)的雇主IDT,希望我們將處理器放入我們的4Kbit SRAM中!即使在那些日子里,PIM架構(gòu)也會(huì)大大加速圖形處理,這是本發(fā)明人的目標(biāo)。

大約8年前,Memory Guy還發(fā)布了一篇關(guān)于一家名為Venray的公司的博客文章,該公司試圖說服各種DRAM廠商建立基于DRAM的PIM芯片。最近與Venray的對(duì)話表明,他們終于在這個(gè)方向上取得了進(jìn)展,很快就會(huì)有一些好消息要分享。

回到UPMEM:該公司的名稱似乎源于微處理器“μP”的簡(jiǎn)寫術(shù)語與“Memory”一詞的縮寫形式的融合,但在“μP”中用“U”代替“μ” ”。一些讀者可能從未見過“μP”這個(gè)術(shù)語,因?yàn)榻鼛资陙硭驯?ldquo;MPU”取代。

我向UPMEM管理層詢問了他們的方法與我上面提到的兩種替代架構(gòu)之間的差異:VenRay的TOMI和Micron最近分拆到一家名為Natural Intelligence Semiconductor的新公司的Automata處理器。(Memory Guy 在大約六年前的2013年也在Automata處理器上發(fā)布了一篇文章。我有沒有提到這個(gè)想法已經(jīng)存在了很長(zhǎng)時(shí)間?)他們解釋說,雖然這三種方法都利用了DRAM芯片巨大的內(nèi)部帶寬,處理器架構(gòu)非常不同,每個(gè)都有不同的目標(biāo):

Automata是一個(gè)可編程的大門,非常強(qiáng)大,但由于這一點(diǎn),編程非常具有挑戰(zhàn)性。它旨在解決極其復(fù)雜的算法,包括NP難問題:最終難度的計(jì)算測(cè)試。

TOMI在DRAM中插入了一個(gè)功能非常強(qiáng)大的處理器,其目標(biāo)是允許用戶通過將大部分工作卸載到TOMI芯片來替換昂貴的服務(wù)器處理器,使用更加適中且成本更低的CPU。

UPMEM將適度的RISC處理器與DRAM相結(jié)合,旨在加速某些非常特定的任務(wù),這些任務(wù)可以卸載到DIMM,以減少服務(wù)器處理器的負(fù)載,同時(shí)減少內(nèi)存通道上的大量流量。

自動(dòng)機(jī)通常插入PCIe附加卡的服務(wù)器中。UPMEM使用標(biāo)準(zhǔn)格式的DIMM(如本文的圖形所示 - 點(diǎn)擊放大),以支持內(nèi)存和服務(wù)器處理器之間更高的帶寬。當(dāng)不使用PIM處理器時(shí),這些DIMM表現(xiàn)為標(biāo)準(zhǔn)DRAM。

所有這三種解決方案目前都可用(自動(dòng)機(jī))或非常接近可用(TOMI和UPMEM),這三種解決方案似乎都是加速數(shù)據(jù)中心特定問題的絕佳方式,同時(shí)顯著降低了總體成本。

這些公司的時(shí)機(jī)是好的:在DRAM短缺期間(就像我們?cè)?018年那樣),主流DRAM制造商不愿意將其生產(chǎn)能力的一小部分用于風(fēng)險(xiǎn)產(chǎn)品,因?yàn)樗麄円呀?jīng)能夠銷售比他們更多的標(biāo)準(zhǔn)DRAM可以生產(chǎn)。在今天的供過于求的情況下,這些公司更愿意嘗試新的東西以充分利用閑置產(chǎn)能。與此同時(shí),超大規(guī)模數(shù)據(jù)中心擁有豐富的現(xiàn)金,并且非常有興趣測(cè)試替代傳統(tǒng)計(jì)算機(jī)架構(gòu)的新概念。這就是人工智能近來如此突出的原因。

那些想要了解更多有關(guān)PIM技術(shù)的人可能想要訪問UPMEM的“用例”頁面,其中包含三篇白皮書,Venray“戰(zhàn)略論文”頁面,其中包含79個(gè)作品的熱門鏈接,或自然智能“研究”頁面,它與研究工作的31個(gè)鏈接是用他們的芯片進(jìn)行的。想要了解將使這些芯片成功或失敗的商業(yè)和經(jīng)濟(jì)因素的讀者應(yīng)聯(lián)系Objective Analysis,了解我們?nèi)绾螏椭瓦@項(xiàng)不斷發(fā)展的技術(shù)做出正確的商業(yè)決策。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論