隨著我國(guó)集成電路產(chǎn)業(yè)進(jìn)入黃金發(fā)展期,在5G、人工智能、自動(dòng)駕駛和邊緣計(jì)算等應(yīng)用的驅(qū)使下,設(shè)計(jì)工具也開(kāi)始走向全新的道路。鑒于IC設(shè)計(jì)與IT產(chǎn)業(yè)密不可分的關(guān)系,在云端時(shí)代提供的諸多便利下,許多芯片設(shè)計(jì)公司紛紛將各自的業(yè)務(wù)遷往云端,這其中就包括EDA。
傳統(tǒng)的EDA IT架構(gòu)往往采用私有數(shù)據(jù)中心的形式,采用遠(yuǎn)程桌面分配給各個(gè)客戶端,并自己部署授權(quán)管理、運(yùn)算節(jié)點(diǎn)和共享文件存儲(chǔ)。但在芯片設(shè)計(jì)變得愈發(fā)復(fù)雜的趨勢(shì)到來(lái)后,算力和存儲(chǔ)這兩塊開(kāi)始出現(xiàn)了瓶頸,芯片設(shè)計(jì)要想沿用自建數(shù)據(jù)中心的方式,不僅成本大增,也很難做到云服務(wù)商那樣的水平。因此不管是EDA軟件商、IC設(shè)計(jì)企業(yè)以及代工廠,都開(kāi)始追求EDA上云,全面交給云服務(wù)商部署托管或是采用混合云等方式。
亞馬遜AWS
AWS為EDA提供的實(shí)例/亞馬遜
為了讓半導(dǎo)體公司及其IP和代工廠伙伴能從AWS受益,亞馬遜提供了一個(gè)非常適合EDA的實(shí)例z1d。z1d實(shí)例具有極高的單線程性能,借助定制的Intel Xeon處理器,內(nèi)核頻率最高可達(dá)4.0GHz,每核提供16GB內(nèi)存和本地NVMe存儲(chǔ),因此無(wú)需擔(dān)心算力和存儲(chǔ)的問(wèn)題。此外,AWS還為EDA的各個(gè)節(jié)點(diǎn)全部提供了加密,保證每個(gè)節(jié)點(diǎn)都能以優(yōu)化安全的形式創(chuàng)建和關(guān)閉。
而這樣安全、高性能且可擴(kuò)展的EDA也為產(chǎn)品設(shè)計(jì)和驗(yàn)證鋪平了道路,EDA流無(wú)論是全面部署還是部分部署都能縮短項(xiàng)目完成的時(shí)間,提高上市和產(chǎn)品革新的周期。不僅如此,計(jì)算環(huán)境的大小可以自行調(diào)整,以此滿足不同應(yīng)用的需求,降低部署成本。
其實(shí)亞馬遜在自己的芯片上就已經(jīng)實(shí)現(xiàn)了EDA上云的轉(zhuǎn)變,在收購(gòu)了以色列芯片制造商Annapurna Labs后,AWS就開(kāi)始不斷擴(kuò)大芯片設(shè)計(jì)上云的版圖,最終實(shí)現(xiàn)了完全基于云端的SoC開(kāi)發(fā),充分利用7nm工藝,而本地的數(shù)據(jù)中心僅僅只是用來(lái)仿真。在亞馬遜自己的Graviton和Inferentia等芯片上,從RTL到GDSII全部實(shí)現(xiàn)云上開(kāi)發(fā)。
就拿Xilinx來(lái)說(shuō),在與AWS合作的過(guò)程中,與混合云與全面上云不同,他們選擇了一種突發(fā)式的云部署方案作為本地?cái)?shù)據(jù)中心的補(bǔ)充。一個(gè)項(xiàng)目或工作流可以共存與云端和本地端,數(shù)據(jù)和許可也可以在云端和本地端共享,工作流或工具也可以在本地端和云端交替運(yùn)行。通過(guò)與臺(tái)積電和Synopsys在AWS上實(shí)現(xiàn)共同協(xié)作,Xilinx也開(kāi)啟了一條更快實(shí)現(xiàn)產(chǎn)品化的道路。
微軟Azure
Azure為芯片設(shè)計(jì)提供的云端環(huán)境/微軟
微軟的Azure也是積極推進(jìn)EDA上云的云服務(wù)商之一,而且擁有相當(dāng)龐大的生態(tài)合作伙伴,既包括SiFive、ARM和Silvaco這樣的IP供應(yīng)商,也有Cadence、Synopsys、Mentor Graphics和ASML等EDA軟件供應(yīng)商,還包括臺(tái)積電和三星的代工廠。AMD與Menor Graphics合作,成功在Azure上驗(yàn)證了臺(tái)積電7nm工藝芯片的設(shè)計(jì),用于其Radeon顯卡和EPYC處理器,實(shí)現(xiàn)了更短的周期和更低的成本。
Mentor Graphics也在K庫(kù)上遇到了挑戰(zhàn),比如大量的SPICE仿真,冗長(zhǎng)的周轉(zhuǎn)時(shí)間和重度運(yùn)算工作下更大的算力資源需求。而Azure提供了專為HPC開(kāi)發(fā)的虛擬機(jī)類型HC44rs,包含44個(gè)核心,每一個(gè)核心配有8GB的內(nèi)存。
Azure利用獨(dú)有的CycleCloud技術(shù),可以動(dòng)態(tài)分配資源以尋求最優(yōu)化的使用方式。利用CycleCloud,客戶可以輕松創(chuàng)建、管理和優(yōu)化Azure上的HPC節(jié)點(diǎn),比如說(shuō)在20分鐘內(nèi)提供5萬(wàn)個(gè)運(yùn)算核心。
臺(tái)積電也運(yùn)用微軟的Azure平臺(tái)打造了OIP VDE,與Cadence合作,提供給臺(tái)積電下游一些IP設(shè)計(jì)的客戶進(jìn)行使用。去年臺(tái)積電舉辦的前瞻布局大賽上,臺(tái)積電還通過(guò)Azure構(gòu)建了參賽學(xué)子專屬的VDE,提供給他們12周的云端學(xué)習(xí)空間。
微軟的EDA本土團(tuán)隊(duì)近兩年來(lái)也開(kāi)始在接觸中國(guó)的本土晶圓廠商、工具廠商以及設(shè)計(jì)廠商,展開(kāi)相應(yīng)的合作,比如華大九天等等,從而服務(wù)與中國(guó)國(guó)內(nèi)的芯片行業(yè)。
阿里云
阿里云提供的EDA機(jī)型配置/阿里巴巴
國(guó)內(nèi)近年來(lái)設(shè)計(jì)上云的動(dòng)作也不算小,阿里巴巴集團(tuán)旗下的平頭哥半導(dǎo)體有限公司就在2019年初逐步開(kāi)展基于設(shè)計(jì)上云的嘗試和轉(zhuǎn)移。平頭哥通過(guò)設(shè)計(jì)上云主要瞄準(zhǔn)三個(gè)目標(biāo),一是通過(guò)云端“無(wú)限”的資源投入到芯片設(shè)計(jì)上,從而實(shí)現(xiàn)快速迭代;二是實(shí)現(xiàn)高質(zhì)量的驗(yàn)證過(guò)程,保證一次投片成功;最后是構(gòu)建云端原生的芯片生態(tài)。
平頭哥借助阿里云選取了全項(xiàng)目上云并結(jié)合服務(wù)器托管的方案,采用了阿里云的神龍裸金屬服務(wù)器、NAS存儲(chǔ)和E-HPC平臺(tái)等。據(jù)實(shí)際測(cè)試得到的結(jié)果表明,設(shè)計(jì)上云實(shí)現(xiàn)了10%到50%的性能提升。
我們上面也提到了存儲(chǔ)也是EDA本地端部署的限制之一,此處的限制不單單是指容量,還有IO。阿里云的高速NAS可以為EDA提供極致的性能,支持1億的IOPS,1TBps的吞吐和100PB的容量。阿里云NAS還支持3-1000的存儲(chǔ)節(jié)點(diǎn)擴(kuò)展,并通過(guò)智能運(yùn)維自動(dòng)增加和縮減節(jié)點(diǎn),自動(dòng)實(shí)現(xiàn)負(fù)載均衡。
小結(jié)
盡管對(duì)于不少中國(guó)企業(yè)來(lái)說(shuō),EDA上云還是近期才興起來(lái)的概念,但隨著高性能芯片需求的提升、新工藝對(duì)算力要求的增長(zhǎng)、上市周期成為決定競(jìng)爭(zhēng)成敗的關(guān)鍵,EDA上云已經(jīng)成為一個(gè)必然的趨勢(shì)。
就EDA軟件來(lái)說(shuō),這種SaaS的服務(wù)模式在國(guó)內(nèi)還屬于生長(zhǎng)初期,需要進(jìn)一步推廣才能發(fā)展壯大。而對(duì)于云服務(wù)廠商來(lái)說(shuō),往往都能和與多個(gè)EDA軟件商、IP供應(yīng)商或代工廠形成合作,這對(duì)更愿意在同一云服務(wù)下使用多種工具和設(shè)計(jì)流程的用戶來(lái)說(shuō)同樣是一件好事。