本文來自微信公眾號“半導(dǎo)體行業(yè)觀察”,作者/L晨光。
近幾十年以來,微電子技術(shù)與電子芯片產(chǎn)業(yè)遵循著摩爾定律不斷發(fā)展,隨著傳統(tǒng)制程工藝逼近極限,電子芯片在進一步提升計算速度和降低功耗方面的技術(shù)突破,面臨難以解決的瓶頸。在后摩爾時代,光芯片這一顛覆性技術(shù)被視為破局的關(guān)鍵。
光芯片,難覓用武之地?
實際上,光芯片很早就有,已經(jīng)很成熟,比如2000年前后的海底光纜,光通訊兩端的收發(fā)模塊都是光子芯片,甚至在上課或開會時用的激光筆,里面也有激光器芯片,也是一種光子芯片。
但這些是不可編程的光學(xué)線性計算單元,所以無法運用于計算領(lǐng)域。要想通過光來提升算力,具有實用價值的計算單元就必須具備可編程性。
而針對光計算的研究也很早就開始了,始于20世紀60年代,但受到當時應(yīng)用范圍有限以及電子計算技術(shù)快速發(fā)展的影響,光計算處理器未能成功邁向商用。
直到最近10年,這種光計算芯片才逐漸取得突破性進展。
尤其是在當前時代,AI應(yīng)用正推動對算力的需求,光芯片作為重要的潛在顛覆性技術(shù)路徑,光計算芯片近年來又重新受到廣泛關(guān)注。
光芯片的核心是用波導(dǎo)來代替電芯片的銅導(dǎo)線,來做芯片和板卡上的信號傳輸,其實就是換了一種介質(zhì)。當光在波導(dǎo)里面?zhèn)鬏數(shù)臅r候,波導(dǎo)和波導(dǎo)之間出現(xiàn)光信號干涉,用這個物理過程來模擬線性計算這一類的計算過程,即通過光在傳播和相互作用之中的信息變化來進行計算。
與最先進的電子神經(jīng)網(wǎng)絡(luò)架構(gòu)及數(shù)字電子系統(tǒng)相比,光子計算架構(gòu)在速度、帶寬和能效上優(yōu)勢突出。因此,光子計算能夠有效突破傳統(tǒng)電子器件的性能瓶頸,滿足高速、低功耗通信和計算的需求。
片上光子計算處理示意圖
(圖源:SEMI半導(dǎo)體研究院)
需要指出的是,光子計算的發(fā)展目標不是要取代傳統(tǒng)計算機,而是要輔助已有計算技術(shù)在基礎(chǔ)物理研究、非線性規(guī)劃、機器學(xué)習(xí)加速和智能信號處理等應(yīng)用場景更高效地實現(xiàn)低延遲、大帶寬和低能耗。
硅光計算芯片通過在單個芯片上集成多種光子器件實現(xiàn)了更高的集成度,還能兼容現(xiàn)有半導(dǎo)體制造工藝,降低成本,解決后摩爾時代AI硬件的性能需求,突破馮·諾依曼架構(gòu)的速度和功耗瓶頸。
綜合來看,光芯片的優(yōu)勢可以總結(jié)為:速度快/低延遲、低能耗、擅長AI矩陣計算等。
速度快/低延遲:光計算芯片最顯著的優(yōu)勢是速度快、延遲低,在芯片尺寸的厘米尺度上,這個延遲時間是納秒級,且這個延遲與矩陣的尺寸幾乎無關(guān),在尺寸較大的情況下,光子矩陣計算的延遲優(yōu)勢非常明顯。
低能耗:鏡片折射本身是不需要能量的,是一個被動過程。在實際應(yīng)用中,由于要對計算系統(tǒng)編程,其中光信號的產(chǎn)生和接收是需要耗能的。在光學(xué)器件和其控制電路被較好地優(yōu)化前提下,基于相對傳統(tǒng)制程的光子計算的能效比,可媲美甚至超越先進制程的數(shù)字芯片。
擅長矩陣運算:光波的頻率、波長、偏振態(tài)和相位等信息可以代表不同數(shù)據(jù),且光路在交叉?zhèn)鬏敃r互不干擾,比如兩束手電筒的光束交叉時,會穿過對方光束形成“X”型,并不會互相干擾。這些特性使光子更擅長做矩陣計算,而AI大模型90%的計算任務(wù)都是矩陣計算。
因此,光計算芯片在AI時代迎來新的用武之地。
光芯片迎來突破性進展
光計算芯片可對神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理過程中的大規(guī)模矩陣運算、神經(jīng)元非線性運算進行加速,還可通過對不同神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)進行硬件結(jié)構(gòu)映射,來提高芯片的通用性和靈活性。
據(jù)了解,在人工神經(jīng)網(wǎng)絡(luò)計算加速方面,基于硅光平臺的神經(jīng)網(wǎng)絡(luò)已取得多項進展。2016年,首個光學(xué)計算系統(tǒng)問世,極大地推動了集成光學(xué)在未來取代傳統(tǒng)電子計算芯片的發(fā)展,開創(chuàng)了光子AI計算領(lǐng)域發(fā)展的先河。
2.1超高速光電計算芯片,算力超3000倍
研究人員創(chuàng)造性地提出了一種“掙脫”摩爾定律的全新計算架構(gòu):光電模擬芯片(ACCEL)。從最本質(zhì)的物理原理出發(fā),結(jié)合了基于電磁波空間傳播的光計算,與基于基爾霍夫定律的純模擬電子計算,“掙脫”傳統(tǒng)芯片架構(gòu)中數(shù)據(jù)轉(zhuǎn)換速度、精度與功耗相互制約的物理瓶頸,在一枚芯片上突破大規(guī)模計算單元集成、高效非線性、高速光電接口三個國際難題。在保證高任務(wù)性能的同時,還實現(xiàn)超高的計算能效和計算速度。
光電計算芯片ACCEL的計算原理和芯片架構(gòu)
(來源:Nature)
實測表現(xiàn)下,ACCEL光電融合芯片的系統(tǒng)級算力較現(xiàn)有的高性能芯片架構(gòu)提升了數(shù)千倍。然而,這還只是這枚芯片諸多優(yōu)勢的其中之一。
其系統(tǒng)級能效是現(xiàn)有高性能芯片的四百萬余倍。形象來說,原本供現(xiàn)有芯片工作一小時的電量,可供它工作五百多年。
此外,在超低功耗下運行的ACCEL有助于大幅度改善發(fā)熱問題,對于芯片的未來設(shè)計帶來全方位突破,并為超高速物理觀測提供算力基礎(chǔ)。
更進一步,該芯片光學(xué)部分的加工最小線寬僅采用百納米級,而電路部分僅采用180nm CMOS工藝,已取得比7nm制程的高性能芯片多個數(shù)量級的性能提升。同時所使用的材料簡單易得,造價僅為后者的幾十分之一。
2.2新型芯片開啟光速AI計算之門
研究人員開發(fā)了一種新型芯片,它使用光而不是電來執(zhí)行訓(xùn)練AI所必需的復(fù)雜數(shù)學(xué)運算。該芯片有可能從根本上加快計算機的處理速度,同時還可降低能源消耗。
該芯片首次將本杰明·富蘭克林獎?wù)芦@得者納德·恩赫塔在納米尺度上操縱材料的開創(chuàng)性研究與硅光子(SiPh)平臺結(jié)合起來。前者涉及利用光進行數(shù)學(xué)計算,后者使用的是硅。
光波與物質(zhì)的相互作用代表著開發(fā)計算機的一種可能途徑,這種方法不受當今芯片局限性的限制。新型芯片的原理本質(zhì)上與20世紀60年代計算革命初期芯片的原理相同。
研究人員解釋說,他們可將硅晶片做得更薄,比如150納米,并且使用高度不均勻的硅晶片,在無需添加任何其他材料的情況下,這些高度的變化提供了一種控制光在芯片中傳播的方法,因為高度的變化可導(dǎo)致光以特定的模式散射,從而允許芯片以光速進行數(shù)學(xué)計算。但這僅限于特定領(lǐng)域。
除了更快的速度和更少的能耗之外,新型芯片還具有隱私優(yōu)勢。由于許多計算可同時進行,因此無需在計算機的工作內(nèi)存中存儲敏感信息,從而使采用此類技術(shù)的未來計算機幾乎無法被入侵。
2.3逆向設(shè)計高集成度光計算芯片
逆向設(shè)計高集成度光子集成器件是近年來的前沿熱點研究方向。
傳統(tǒng)的逆向設(shè)計過程中,光場仿真時間隨器件面積指數(shù)級增長,這限制了器件的設(shè)計面積與矩陣計算維度。
為了解決這個問題,研究人員提出一種壓縮光場仿真時間的方法——p2DEIA,基于光傳播的二維有效折射率近似,能夠大幅縮減逆向設(shè)計仿真時間,突破傳統(tǒng)方法在器件面積上的限制,從而設(shè)計大矩陣維度的光學(xué)向量-矩陣乘法芯片。
此外,由于p2DEIA方法對折射率的約束,該芯片具有無定形透鏡型結(jié)構(gòu),可以避免諧振特征引起的窄帶寬和制造誤差敏感性,這在實現(xiàn)大規(guī)模集成的光計算芯片中發(fā)揮關(guān)鍵作用。
(a):p2DEIA方法示意圖;
(b):無定型透鏡結(jié)構(gòu)示意圖
相關(guān)研究人員利用該方法,突破了仿真成本造成的逆向設(shè)計面積瓶頸,并成功設(shè)計了3種向量-矩陣乘法器芯片,矩陣維度分別是2×2、3×3和10×10,并進行了相關(guān)器件測試。實驗結(jié)果表明,該乘法器的實測性能與仿真性能非常接近,這為實現(xiàn)大規(guī)模集成的光計算芯片提供了新的方法和思路。
向量-矩陣乘法器設(shè)計示意圖
2.4中科院成功研制出光計算芯片
據(jù)報道,中科院李明研究員和祝寧華院士團隊也成功研制出光計算芯片。
目前而言,絕大多數(shù)傳統(tǒng)芯片都是基于馮·諾依曼計算范式的電子芯片。但電子芯片存在的能耗較高、容易發(fā)熱等一些問題始終無法解決,而且在計算時還會出現(xiàn)數(shù)據(jù)潮汐的傳輸問題。當電子數(shù)據(jù)如同海潮一般襲來,數(shù)據(jù)接收和處理端自然會有點“手忙腳亂”,影響其性能。
然而,光計算則不同。
光芯片利用光波作為載體進行信息處理,具有低延時、低功耗、大帶寬等諸多優(yōu)點,這是一種“傳輸即計算,結(jié)構(gòu)即功能”的計算架構(gòu),有望避免馮·諾依曼計算范式中出現(xiàn)的數(shù)據(jù)潮汐傳輸問題。
尤其是在人工智能領(lǐng)域,經(jīng)常需要處理大規(guī)模的數(shù)據(jù)和執(zhí)行龐雜的計算任務(wù),因此需要強大的計算能力和高速的數(shù)據(jù)傳輸能力。
對此,中國科學(xué)院研制出一款超高集成度光學(xué)卷積處理器,成功突破了“光計算”技術(shù)的壁壘。這款芯片的運算速度很快,同時,功耗比傳統(tǒng)的AI芯片功耗要低很多,關(guān)鍵是不需要使用高端光刻機就可以完成生產(chǎn)。
基于這種技術(shù),光芯片性能再次提升,而一旦這種技術(shù)應(yīng)用于AI領(lǐng)域,能實現(xiàn)對現(xiàn)有AI芯片的顛覆,其速度可能不只是快1.5倍-10倍,可能會更快,應(yīng)用空間廣闊。
潛力之下,光芯片挑戰(zhàn)尚在
雖然提到了很多優(yōu)勢,但光芯片作為一項前沿技術(shù),必然有很多挑戰(zhàn)有待克服。
3.1工藝挑戰(zhàn)
由于要用于復(fù)雜計算,光器件的數(shù)量必然會很多,要達到不錯的性能至少需要上萬個,這會帶來更復(fù)雜的結(jié)構(gòu)和更大的尺寸。為了實現(xiàn)可編程,必然要對每個器件進行控制,也會要求高集成度和一些Knowhow積累。這些要求會產(chǎn)生一些工藝上的挑戰(zhàn),同時導(dǎo)致成本很高,以及整體穩(wěn)定性、生產(chǎn)良率都有挑戰(zhàn),所以必須找到一種低成本、高良率的方法,來控制大量光器件的技術(shù)。
3.2溫度難題
因為是模擬計算,當整個環(huán)境溫度對電芯片產(chǎn)生影響的時候,對光信號也會產(chǎn)生擾動,影響計算精度。有一種辦法是把整個芯片放在恒溫環(huán)境下,通過溫控電路來實現(xiàn)。但這反過來會犧牲一些光計算的低能耗優(yōu)勢。此外,對于溫度控制,還包括芯片內(nèi)部發(fā)熱,導(dǎo)致對周邊器件的影響問題。
寫在最后
光子計算提供了一條超越摩爾定律的算力提升路徑。雖然光計算還沒有完全落地,但硅光芯片每個產(chǎn)業(yè)鏈環(huán)節(jié)的全面性,是光計算芯片量產(chǎn)的前提。
這是一個全新的賽道,“超越摩爾定律”也是一個激動人心的口號,但幾乎沒有前路可以借鑒,開拓者們正在披荊斬棘,技術(shù)挑戰(zhàn)與風(fēng)險并存。但唯一可以確定的是,人類社會對提升算力的追求,正比以往任何一個時刻都更加迫切。
參考鏈接
[1]經(jīng)緯創(chuàng)投:英偉達暴漲、ChatGPT浪潮下,一條超越摩爾定律的算力提升路徑——光計算芯片
[2]科技日報:新型芯片開啟光速AI計算之門
[3]與非網(wǎng):突破摩爾定律限制,光子計算是實現(xiàn)超級算力的歸途
[4]DeepTech深科技:清華團隊研發(fā)光電融合芯片,算力是商用GPU的3000余倍,推動構(gòu)建生態(tài)友好的AI計算框架