上周,當全球最大的存儲芯片制造商之一的美光科技(Micron Technology)收購了人工智能硬件和軟件初創(chuàng)公司Fwdnxt時,我做了兩次嘗試。
此舉可能非常有趣。如果能取得成果,Fwdnxt可以使美光科技與英特爾和英偉達等合作伙伴進行直接競爭,因為美光科技認為內存和AI計算正在融合到同一個架構中。
但是,美光負責這個項目的人之一是史蒂夫·帕洛夫斯基(Steve Pawlowski),這是前英特爾芯片架構師,他擁有數十項專利,這絕非偶然。Pawlowski現在是美光公司高級計算解決方案副總裁。
與美光的存儲芯片結合使用時,Fwdnxt(發(fā)音為“forward next”)將使美光能夠探索數據分析所需的深度學習AI解決方案,尤其是物聯網和邊緣計算。也許它將制造基于AI的存儲芯片,或者包括AI的存儲芯片。
美光公司首席執(zhí)行官Sanjay Mehrotra說,基于Boise的美光公司正在從事這項工作,因為“昨天的計算體系結構不適用于明天……從長遠來看,我們認為計算最好在內存中完成。”Micron Insights活動上周在舊金山舉行。
這是我們采訪的剪輯稿。
Steve Pawlowski:2014年離開英特爾時,我來到美光,他們說:“您想做什么?”我說:“我堅信計算和內存的融合對于提高性能和降低延遲至關重要。。你是一家記憶公司。您擁有技術。DRAM將會出現一段時間。我想解決這個問題。”他們說,“好。”
我有一個小組,專注于發(fā)現計算和內存的問題-我們可以開始測試概念,開始將概念引入產品中,但不會增加成本。我在英特爾了解的一件事,就是我永遠不會忘記這個故事-我們曾經擁有數學協(xié)處理器。80287,80387。我們在387上賺了可觀的錢。我們有一個聰明的主意,那就是如果將協(xié)處理器集成到486中,我們可以更快更好地做到。我們做到了,突然之間我們沒有了足夠的足跡。不需要它的人說:“您不需要為此死區(qū)向我收費。”而需要它的人說,“您將與其他人一樣付給我,因為我是一個有利的客戶。”實際上,整個業(yè)務為零。
那里的主要經驗是,您不能增加更多的復雜性和成本,并希望人們立即支付費用。直到有絕大多數人從中獲得真正的價值。我們關注的重點是找到人們今天可以從中獲得價值的關鍵事物,然后看看您是否可以隨著時間的推移擴大泡沫。我將其視為八到十年的旅程。在那些年末,我可能回頭一看,意識到我浪費了他們?;蛘呶铱梢曰仡^說:“哇,我們可能還沒到這里,但是我們做得很好。”
VentureBeat:關于此可能產生的結果,這引發(fā)了很多想象力,但是您是否會暗示某些特定的內容?
Pawlowski:一件事,您已經在這里聽到很多,是邊緣的AI。我們專注于此的原因在于,您沒有在市場上競爭的現有編程模型或現有體系結構??梢赃@么說,每個人都在努力進入同一個攤位。有機會去那里做些事情。人們不會看著你,而是說:“美光科技是一家內存公司。他們看起來像是-我們在FPGA中具有此功能,它具有高性能存儲器和可映射到FPGA的架構。我們會處理所有抽象,因此您不必成為VHDL程序員。您愿意開始解決數據集問題嗎?
有趣的是,我并沒有真正去推動它。我們一直在參加FPGA會議之類的活動。主要是政府機構過來說:“我們在這里遇到了問題。政府的問題是,他們很早就感到興奮,但如果您想做點什么,那將需要很長時間。采購周期長。合同很長,還有其他一切。
我們決定著眼于一般市場。一家汽車公司來了,說:“我們不是5級,但我們肯定可以獲得3級,4級自動駕駛汽車,我們希望能夠使用網絡來告訴我們發(fā)生了什么。這看起來很有趣。您愿意與我們合作嗎?”內部許多人說:“他們?yōu)槭裁磳εc您合作感興趣?”這是因為我不愿意告訴他們他們需要做什么。我說:“這就是我們所擁有的。我們能為您做什么?”他們說:“好的,您愿意聽我們的話。這是我們的問題。”
我在2005年AMD推出Opteron時學到了這一課,信不信由你。我們仍在推動7千兆位處理器,33級流水線,并且沒有人去那里。我們去了華爾街,這是您想要爬進貝殼的那一刻,因為它們確實被照亮了。但是我說:“您能給我們另一個機會嗎?我們可以坐下來了解我們的工作量,與您一起工作,我會把它收回來,以便我們可以開發(fā)出更好的產品嗎?”
我們翻了很多人。瑞銀(UBS),我記得他們寫的一篇文章說:“您可能沒有制造最大的芯片或最好的芯片,但您來了卻明白了我的問題。”真正了解客戶和他們的問題以及您可以做什么。如果您這樣做卻對他們沒有幫助,嘿,您學到了一些東西。
VentureBeat:就縮小范圍而言,它是否帶有一種新的內存,還是要確定處理的位置?
Pawlowski:答案是肯定的。但這是對動態(tài)的真正理解。順便說一下,它取決于模型。我只是在和那里的某人談論某些語言模型如何需要100 GB的參數。當您看到有人說“嘿,我有2 GB,4 GB”時,它適用于大多數型號,但不是全部型號。這些模型確實在發(fā)展。
這也取決于解決方案的延遲。我不知道您是否在那位女士患有乳腺癌的地方看到OHSU視頻。他們需要大量數據,因為他們希望將所有電子顯微鏡圖像放在一起,并建立3D卷積模型,即腫瘤的3D表示。他們沒有足夠的時間進行討論,因為他們希望在一天甚至一個小時內獲得可行的見解。我們與CERN所做的工作,現在需要數據。我們必須在微秒內做出決定。這是有趣的事情還是我們將其放在地板上?
不同的解決方案需要不同類型的內存。我們正在學習的是-我一直很喜歡Intel的一件事,我知道程序中的指令是什么。我知道他們是如何在機器中執(zhí)行的,然后進入系統(tǒng)。當我來到美光時,我唯一看到的就是地址和命令。讀/寫命令和地址。我不了解-這東西是在這里將15種不同的東西復制到不同的元素,還是覆蓋,還是什么?擁有與我們合作的公司并于6月收購了該公司-該體系結構使我們能夠構建,運行這些算法,并了解整個影響如何。
我們的首要目標是,我們可以在內存存儲中做什么以實際縮短解決方案的時間?我們總是可以建立更高的帶寬,但這不一定是要帶您到達那里的方法。有什么可以做的,例如散射張量陣列?如果我們可以建立一個可以引入矩陣的緩沖區(qū),并允許我們一口氣將矩陣移過來,而不是隨便找東西去尋找它,那將有很大的好處。
最終,我們還要研究—其中大多數是乘法和累加架構,非常簡單。它們只是被復制了數千次。實際上,一旦晶體管變得更好一點,您就可以建立一個相當好的乘法并在存儲設備中進行累加。最終,您能否采用該架構,然后將其放入存儲設備本身?這是長遠的愿景。
我想做的是,無論我們做什么,我們都建立一個編程基礎結構和一個范例,這樣人們不必每次進行遷移時都重寫他們的代碼。在我看來,這就是英特爾的巨大成功。當我們執(zhí)行386時,沒有32位軟件。但是它確實可以很好地運行16位代碼。人們?yōu)榇速I了它。您那里有很多平臺,然后人們說:“好,現在我們要優(yōu)化32位。”486在六到八年后問世時,就有軟件可以利用它,并且它變成了一臺永不回頭的機器。
首先從內存開始,然后是存儲,我們在那里可以做什么。然后,我們將了解隨著時間的推移實際可以遷移的內容。答案可能不算什么。答案可能是一切。我認為它在中間。這僅取決于您將針移到哪里。