越是智能化發(fā)展,越需要調(diào)用大量數(shù)據(jù),對(duì)算力的需求也就越大,于是,算力提升成為云、邊、端的共同趨勢。一些觀點(diǎn)認(rèn)為,在云計(jì)算占據(jù)計(jì)算主導(dǎo)地位的當(dāng)下,邊緣計(jì)算會(huì)是云計(jì)算的延伸和補(bǔ)充。但事實(shí)上,無論是延伸還是補(bǔ)充,都不足以反映邊緣計(jì)算的巨大潛力。
在傳統(tǒng)產(chǎn)業(yè)如火如荼進(jìn)行數(shù)字化轉(zhuǎn)型的背后,除了5G、IoT之外,邊緣計(jì)算是一股不容忽視的重要力量。在規(guī)模和增速方面,CB Insights估算,到2023年全球邊緣計(jì)算行業(yè),整體市場容量有望達(dá)到340億美元。Technavio估計(jì),從2018年到2022年,邊緣計(jì)算技術(shù)的應(yīng)用量將以每年近20%的速度增長。Grand View Research更是預(yù)測,2016-2025年期間,亞太區(qū)邊緣計(jì)算市場的復(fù)合增長率將高達(dá)46.7%。
不過,在邊緣計(jì)算受到越來越多關(guān)注的同時(shí),我們看到,終端設(shè)備的算力也在不斷提升,甚至一些可媲美邊緣設(shè)備。端、邊的界限一定程度上是否在變模糊?邊緣計(jì)算的核心能力該如何評(píng)定?對(duì)算力經(jīng)濟(jì)“虎視眈眈”的國產(chǎn)AI芯片er們,對(duì)這一巨大的新興領(lǐng)域,是否準(zhǔn)備好了?
邊緣計(jì)算的“邊界”在哪里?
圖源|salientglobaltech.com
時(shí)擎科技總裁于欣認(rèn)為,云、邊、端更多是從應(yīng)用場景來劃分的,而不僅僅是依據(jù)性能。從這個(gè)意義來說,云、邊、端的場景還是比較明確的。當(dāng)然,從任務(wù)處理的角度,確實(shí)有把更多的推理任務(wù)下放到邊緣和終端的趨勢,也將有更多的云邊端融合協(xié)同的場景。不過,對(duì)于端、邊的設(shè)備來說,會(huì)有更多的成本和功耗限制,提高“算力的效率”是更為關(guān)鍵的指標(biāo),包括單位算力的成本和實(shí)際可達(dá)的應(yīng)用效果。
靈汐科技副總經(jīng)理華寶洪表示,終端側(cè)與邊緣側(cè)從誕生伊始,就各自承擔(dān)著不同的使命。終端作為與用戶直接交互的設(shè)備,以感知作為首要功能,低功耗、低延時(shí)是基本要求,也相應(yīng)地會(huì)在計(jì)算能力上進(jìn)行權(quán)衡。一般來說,端側(cè)設(shè)備的計(jì)算能力弱于邊緣側(cè)的算力水平。他強(qiáng)調(diào),“對(duì)于終端廠商宣稱的算力,需要明確究竟是理論算力還是有效算力。只有終端與邊緣側(cè)的有效算力相媲美時(shí),才是真正達(dá)到邊緣設(shè)備的算力級(jí)別。”
上海雪湖科技有限公司副總裁趙小吾從應(yīng)用場景和未來趨勢方面給出了他的見解。“云邊端的定義,本身就是因?yàn)槭苤朴谛酒懔屯ㄓ崅鬏斈芰Φ木窒蕻a(chǎn)生的邊界。一定程度上,邊、端的界限確實(shí)變模糊,但是針對(duì)不同應(yīng)用場景對(duì)性能的要求,邊界的定義可能不太一樣。對(duì)算力要求不高的場景,終端設(shè)備的性能是足夠的,可能就不需要專門的邊緣計(jì)算設(shè)備;對(duì)算力要求高的場景,比如車路協(xié)同、智慧交通等,終端傳感器設(shè)備是無法滿足需求的,就需要用邊緣計(jì)算設(shè)備來處理攝像頭、激光雷達(dá)和毫米波雷達(dá)的數(shù)據(jù),來實(shí)現(xiàn)全息感知的功能”,他表示,“隨著芯片和通訊傳輸技術(shù)的迭代,相信這樣的邊界會(huì)時(shí)而模糊時(shí)而清晰。”
“核心指標(biāo)”是什么?
圖源|Electronic Design
“算力”是一個(gè)廣義的詞匯,該如何對(duì)算力設(shè)備進(jìn)行評(píng)估?比較重要的有兩個(gè):理論峰值算力和真實(shí)有效算力。理論算力是指通過公式推導(dǎo)出的理論上的算力;而有效算力是指設(shè)備在實(shí)際運(yùn)作過程中能真實(shí)輸出的算力,是設(shè)備實(shí)際算力效能的體現(xiàn)。靈汐科技華寶洪還給出了以下六大評(píng)估指標(biāo):
計(jì)算芯片的峰值算力
理論計(jì)算得出的、理想狀況下的峰值算力。具體通過計(jì)算核的主頻、核數(shù)量、單核運(yùn)算能力等來輸出理論峰值,與實(shí)際場景中的真實(shí)有效處理能力有很大差距。
計(jì)算芯片的有效算力
設(shè)備在實(shí)際運(yùn)作過程中能真實(shí)輸出的算力。比如ResNet50在浮點(diǎn)16位精度下,推理一次的計(jì)算量是7.8Gflops左右,芯片每秒鐘處理的ResNet50的幀率乘以7.8G就是真實(shí)有效的輸出算力。如果推理幀率是400fps,真實(shí)算力是400*7.G=3Tflops。
計(jì)算芯片的有效利用率
代表了芯片真實(shí)輸出的運(yùn)算能力。其計(jì)算方式為:真實(shí)有效的輸出算力/理論算力。計(jì)算結(jié)果值越高,表明該芯片工作越高效。實(shí)際應(yīng)用場景中,多數(shù)傳統(tǒng)架構(gòu)計(jì)算芯片,有效利用率一般在30%左右,而新型架構(gòu)的計(jì)算芯片,芯片有效利用率可以到50%以上。領(lǐng)啟KA200異構(gòu)眾核、存算一體芯片有效利用率可達(dá)60%以上。
計(jì)算芯片對(duì)主流神經(jīng)網(wǎng)絡(luò)的支持程度
下一代人工智能有兩個(gè)不同的發(fā)展線路圖,一個(gè)是以深度學(xué)習(xí)算法為代表的傳統(tǒng)計(jì)算科學(xué),一個(gè)是以生物神經(jīng)網(wǎng)絡(luò)為代表腦科學(xué)。多數(shù)計(jì)算芯片只能支持二者之一。是否能將二者兼并支持,也是衡量計(jì)算芯片的核心指標(biāo)之一,異構(gòu)融合是達(dá)到這一指標(biāo)的重要途徑之一。
芯片能效比
計(jì)算方式為:典型網(wǎng)絡(luò)(如ResNet50)的推理能力/芯片的功耗,單位:推理幀率(fps/w)。
芯片的性價(jià)比
每平方毫米推理的幀率數(shù),計(jì)算方式為:典型網(wǎng)絡(luò)(如ResNet50)的推理能力/芯片的面積。
異構(gòu)“精髓”——有的放矢
圖源|Network World
在邊緣計(jì)算領(lǐng)域,多樣的應(yīng)用催生了多種多樣的計(jì)算需求,往往需要權(quán)衡算力、功耗、體積等問題,出于資源的優(yōu)化考慮,異構(gòu)計(jì)算逐漸成為業(yè)界共識(shí)。在算力需求猛增的第一階段,以CPU、GPU為代表的芯片率先迎來強(qiáng)勁增長。這些由先進(jìn)半導(dǎo)體技術(shù)打造的算力設(shè)備往往具備極強(qiáng)的性能表現(xiàn)以及良好的兼容性,占據(jù)了異構(gòu)計(jì)算領(lǐng)域的主流地位。
時(shí)擎于欣表示,所謂異構(gòu)計(jì)算,實(shí)際上是希望有不同的處理器形態(tài)來針對(duì)不同的算法進(jìn)行更高效的處理。相對(duì)于通用算力來說,“異構(gòu)”的目的應(yīng)該是相對(duì)于某種或某類特定應(yīng)用來定義的,因而需要更有針對(duì)性,更有的放矢。他強(qiáng)調(diào),“為了異構(gòu)而異構(gòu),意義不大。”
從指令集架構(gòu)角度來看,業(yè)界已形成了各自的“勢力范圍”。于欣認(rèn)為,從技術(shù)角度來說并沒有那么絕對(duì),它們之間也會(huì)相互滲透,比如Arm架構(gòu)也有服務(wù)器和PC應(yīng)用,RISC-V也會(huì)越來越多向高性能方向嘗試。未來更多的還是老生常談的“生態(tài)”問題,恰恰因?yàn)榧夹g(shù)角度沒有那么大的差異,生態(tài)就尤為重要,不過,先入為主之后的替代成本和門檻很高,這個(gè)過程會(huì)比較漫長。
Imagination計(jì)算業(yè)務(wù)產(chǎn)品管理總監(jiān)Rob Fisher表示,隨著對(duì)性能的需求日益增加,系統(tǒng)功耗等級(jí)需要不斷降低,這是異構(gòu)架構(gòu)真正體現(xiàn)價(jià)值的地方。
關(guān)于未來異構(gòu)計(jì)算的發(fā)展趨勢,他認(rèn)為,最密集的計(jì)算部分將定位在一個(gè)加速器上,該加速器能夠高效運(yùn)行,提供性能并管理功耗。不過,這只有在加速器能夠擴(kuò)展、滿足應(yīng)用的性能需求時(shí)才能發(fā)揮作用,也就是說,可擴(kuò)展性是未來架構(gòu)的重點(diǎn)。除了在單一維度上進(jìn)行擴(kuò)展之外,復(fù)雜計(jì)算工作負(fù)載還必須在多個(gè)維度上實(shí)現(xiàn)可擴(kuò)展性,從而改變計(jì)算資源組合以適應(yīng)需求。
雪湖科技趙小吾也認(rèn)為,異構(gòu)計(jì)算平臺(tái)主流的發(fā)展方向,一定是能夠更有效地獲取高性能計(jì)算能力架、構(gòu)靈活性高、可擴(kuò)展性好、計(jì)算資源利用率更高。由于不同的計(jì)算架構(gòu)各有優(yōu)勢,場景也在變得更加多元和復(fù)雜,要更深入地分析不同計(jì)算架構(gòu)和不同芯片的優(yōu)勢,設(shè)計(jì)出適合特定應(yīng)用場景下的異構(gòu)計(jì)算方案。
靈汐科技華寶洪則強(qiáng)調(diào)了對(duì)新型計(jì)算架構(gòu)進(jìn)行探索的緊迫性。傳統(tǒng)馮·諾依曼架構(gòu)當(dāng)前正面臨諸多瓶頸,如存儲(chǔ)墻、芯片利用率低,由于半導(dǎo)體工藝發(fā)展帶來的摩爾定律失效,更是給算力芯片的發(fā)展蒙上陰影。
他認(rèn)為,這就催生了新型顛覆性計(jì)算架構(gòu)的發(fā)展,類腦計(jì)算和量子計(jì)算就是兩個(gè)典型代表,這兩個(gè)前沿戰(zhàn)略方向已經(jīng)列入國家十四五規(guī)劃和2035年遠(yuǎn)景規(guī)劃。類腦計(jì)算將計(jì)算機(jī)的剛性和人腦的彈性結(jié)合起來,在取得高算力的同時(shí),也保證了低功耗和低延時(shí)等。
隨著新型架構(gòu)的不斷出現(xiàn),未來的異構(gòu)計(jì)算必定會(huì)出現(xiàn)CPU、GPU和新型計(jì)算架構(gòu)融合的局面,即傳統(tǒng)馮·諾依曼架構(gòu)和非馮·諾依曼架構(gòu)的融合,而不僅是當(dāng)前的CPU和XPU之間的融合。
寫在最后
“邊緣計(jì)算”正在成為千行百業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型、智能升級(jí)的重要底座,它所承載的功能、以及對(duì)行業(yè)的賦能作用越來越關(guān)鍵。AI芯片作為核心的算力提供方之一,也必將在當(dāng)前的技術(shù)革新和未來的商業(yè)化實(shí)踐中,取得長足的發(fā)展。
對(duì)于正處于百花齊放階段的國產(chǎn)AI芯片來說,這是成長的沃土。盡管傳統(tǒng)通用處理器已占據(jù)發(fā)展先機(jī),但是也存在著高功耗、高價(jià)格、低能效等問題。CPU一統(tǒng)天下的計(jì)算時(shí)代一去不復(fù)返,計(jì)算多樣性所催生的“異構(gòu)、靈活、可擴(kuò)展”的架構(gòu)是未來計(jì)算時(shí)代的主旋律。正如幾位受訪人一致認(rèn)同的觀點(diǎn),“提升能效比是計(jì)算架構(gòu)發(fā)展的不懈追求”。