算力革命時代,EDA如何破局?

在金融服務、智能制造、醫(yī)療保健以及媒體娛樂等行業(yè)的推動下,全球數(shù)據(jù)呈現(xiàn)爆發(fā)態(tài)勢。根據(jù)IDC Global DataSphere的研究顯示,2020年-2025年,全球數(shù)據(jù)總量將從59ZB大幅增長至175ZB。其中,中國增速最快且體量最大,預計到2025年數(shù)據(jù)總量將增至48.6ZB,全球市占比達到27.8%。

本文來自微信公眾號“半導體行業(yè)觀察”。

在金融服務、智能制造、醫(yī)療保健以及媒體娛樂等行業(yè)的推動下,全球數(shù)據(jù)呈現(xiàn)爆發(fā)態(tài)勢。根據(jù)IDC Global DataSphere的研究顯示,2020年-2025年,全球數(shù)據(jù)總量將從59ZB大幅增長至175ZB。其中,中國增速最快且體量最大,預計到2025年數(shù)據(jù)總量將增至48.6ZB,全球市占比達到27.8%。

在海量的數(shù)據(jù)面前,如何更好地處理數(shù)據(jù)并挖掘其背后的意義?數(shù)據(jù)中心被賦予了更高的使命。面對日益激增的數(shù)據(jù)浪潮,傳統(tǒng)的堆硬件式計算服務器模式已經(jīng)不堪負重,與此同時,曾經(jīng)在軍事、科研等高精尖領域發(fā)揮重要價值的HPC,正在開啟一場面向各行各業(yè)的新算力革命。

全球正在進入HPC大周期

那么到底什么是HPC呢?HPC是英文High Performance Computing的縮寫,中文譯為高性能計算。高性能計算主要是通過多臺服務器并行計算的方式,來提升整體的計算能力和容錯能力。在此基礎上,各個節(jié)點可以共同解決一個比任何一個節(jié)點單獨完成的問題大得多的問題,從而達到“1+1>2”的效果。

未來幾年,數(shù)字化轉(zhuǎn)型、云計算和AI等應用將推動高性能計算滲透率加速提升,屆時全球?qū)⒅鸩竭M入高性能計算的大周期。根據(jù)TrendForce的預測顯示,2021年-2027年,全球HPC市場規(guī)模將從368億美元增長至568億美元,年均復合增長率達到7.5%。

HPC的高速發(fā)展對底層芯片提出了新的要求

一個完整的計算機系統(tǒng),通常由硬件系統(tǒng)和軟件系統(tǒng)兩大部分組成,其中硬件是計算機系統(tǒng)運行的基石,而硬件由各種各樣的芯片集合組成。這意味著在高性能計算高速發(fā)展的時代,對CPU、GPU、TPU、NPU、FPGA、ASIC、SoC等高性能計算芯片,以及通信芯片、接口芯片、存儲芯片等的需求量有望持續(xù)上升。

在百億級市場的積極驅(qū)動下,各大主流芯片企業(yè)皆紛紛入局高性能計算市場并加大投入,以期望在市場紅利期分得一塊蛋糕。

對于高性能計算來說,算力是第一要素,通常需要達到每秒萬億次級的計算速度,這對系統(tǒng)的處理器、內(nèi)存帶寬、運算方式、系統(tǒng)I/O、存儲等都提出了更高的要求。如何解決構建下一代超級計算機面臨的性能、延遲、功耗及安全性問題,成為了行業(yè)關注的重點。

系統(tǒng)性的挑戰(zhàn)同樣存在于硬件層面,對于高性能計算芯片來講,面對的計算任務越是復雜,系統(tǒng)對其計算能力、計算速度、數(shù)據(jù)存儲和帶寬等方面的要求就越高。為了能在這場“算力革命”中獲得競爭優(yōu)勢,越來越多的芯片研發(fā)企業(yè)開始采用Chiplet和多die互聯(lián)的技術將模塊化設計的思維引入半導體制造和封裝中,以獲得更高的計算密度、更多的計算接口和更高的芯片良率;同時采用DDR5/HBM2e內(nèi)存處理、PCIe Gen6/CXL2.0/UCIe高速接口,以應對更高的存儲需求;此外,他們還在嘗試盡量縮短自家產(chǎn)品的面世時間,以獲得市場先發(fā)優(yōu)勢。

面對挑戰(zhàn),EDA如何助力大芯片產(chǎn)業(yè)成功破局?

那么,對于這些芯片企業(yè)而言,如何才能實現(xiàn)更大的產(chǎn)品競爭力,加速產(chǎn)品上市呢?正所謂“欲善其事,必先利其器”,因此若想在市場提高競爭力,首先要有更好的EDA工具,其次要有更多、更成熟的芯片設計模塊儲備,最后要有強有力的市場推廣渠道和生態(tài)建設能力。

就EDA工具而言,高性能計算芯片的設計呈現(xiàn)出異構化和系統(tǒng)化趨勢,傳統(tǒng)的EDA工具已經(jīng)不能滿足市場所需。怎么理解呢?

芯片設計異構化

在過去幾年中,新的體系結構和指令集在崛起,異構成為提升算力的重要實現(xiàn)手段,這種趨勢不僅體現(xiàn)在設計中,還體現(xiàn)在制造領域,用不同的工藝、不同的節(jié)點、不同廠家的IP來實現(xiàn)整個SoC芯片。

芯片設計系統(tǒng)化

一方面,在過去三十年中,半導體產(chǎn)業(yè)的設計和制造是分離的,而如今異構的趨勢又在某種程度上將兩者重新統(tǒng)一起來了,因此EDA工具必須在設計階段就考慮好如何滿足chiplet系統(tǒng)的驗證需求,這種上下游的協(xié)同要求EDA從設計階段延伸到系統(tǒng)階段,來覆蓋整個應用創(chuàng)新周期的驗證需求,以及需要有一個統(tǒng)一的流程來實現(xiàn)不同環(huán)節(jié)的互相驗證、互相對比,以達成某種程度上的協(xié)同;另一方面,近年來越來越多的系統(tǒng)廠商為了提升自身的差異化優(yōu)勢,也紛紛開始投入芯片研發(fā),這些廠商會將他們對系統(tǒng)的理解帶到了芯片定義中去,就勢必會牽涉到軟件和硬件的協(xié)同、多顆芯片和多個節(jié)點的協(xié)同等。

針對異構芯片的設計和驗證挑戰(zhàn),Cadence擁有一系列成熟的IP、仿真速度更快、容量更大的EDA工具和智能化的驗證平臺。其中,Cadence Design IP提供了高性能、低延遲的網(wǎng)絡基礎設施和存儲解決方案,包括40G UltraLink D2D PHY、112G-XSR PAM4 IP、UCIe™PHY and Controller、DDR/LPDDR/HBM Phy and Controller等,芯片設計企業(yè)借助這些IP可以減少大芯片設計和迭代的總投入成本,同時縮短產(chǎn)品的上市時間;而Cadence Xcelium MC/ML、Verisium AI、Jasper SPV、Dynamic Duo(Palladium/Protium)等EDA工具則可以加快整體仿真速度,輔助企業(yè)實現(xiàn)快、準、好的硬件加速和原型驗證。

針對芯片設計系統(tǒng)化趨勢,Cadence System Performance Analyzer可以幫助芯片設計企業(yè)識別典型SoC的內(nèi)存子系統(tǒng)、互連和外圍設備中的性能下降原因,同時管理和監(jiān)控系統(tǒng)內(nèi)各種啟動器的相互沖突的性能目標,分析和解決系統(tǒng)性能瓶頸;而Cadence Helium virtual platform可以通過驗證和調(diào)試嵌入式軟件/固件,以及在系統(tǒng)級芯片的純虛擬和混合配置上啟動操作系統(tǒng),從而幫助芯片設計企業(yè)加速系統(tǒng)級芯片的開發(fā),實現(xiàn)由軟件驅(qū)動的軟硬件協(xié)同驗證。

此外,針對邊緣計算的低功耗和熱需求,Cadence還提供了Palladium DPA、Xcelium Powerplay back、Joules+Innovus power analysis and optimization等工具,從而能夠更快、更精確地實現(xiàn)動態(tài)功耗分析、峰值功耗估計等。針對從邊緣到云端的數(shù)據(jù)中心和IoT應用,Cadence SBSA提供了Arm System Ready架構認證解決方案。針對計算密度增加帶來的芯片規(guī)模超出光罩尺寸的問題,Cadence Integrity 3D-IC平臺可以提供更好的3D-IC設計工具,采用Chiplet和2.5D/3D-IC封裝來解決設計尺寸接近或超過光罩尺寸導致的良率問題。

寫在最后

NVIDIA工程師透露:“不久前,處理一個數(shù)十億門級的設計,對之進行編譯并創(chuàng)建一個硬件仿真模型,然后將其導入硬件仿真加速器,整個過程需要48-72小時,在采用Cadence Dynamic Duo(Palladium/Protium)后,完成同樣的過程,只需要花費4小時。”

這是一個典型的例子,而在Cadence完善的EDA和IP解決方案背后,受惠的是整個高性能計算行業(yè)。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論