邊緣AI計算在自動駕駛汽車上的潛力

人車路云邊
AI計算需要域來優(yōu)化算法和數(shù)據(jù)流架構,摩爾定律已逼近極限,若沒有正確的算法和架構,僅基于處理技術的驅動性能將無法實現(xiàn)預期的結果。

自動駕駛是邊緣計算的重要應用,自動駕駛需要100-1000TOPS邊緣AI算力,其具有高性能、低功耗特點的邊緣AI(Edge AI)成了行業(yè)壁壘。

2345截圖20210806091512.png

AI計算需要域來優(yōu)化算法和數(shù)據(jù)流架構,摩爾定律已逼近極限,若沒有正確的算法和架構,僅基于處理技術的驅動性能將無法實現(xiàn)預期的結果。

2345截圖20210806091512.png

整體邊緣計算市場規(guī)模高速增長。圖片來源:IDC

未來計算平臺

第一類:馮·諾依曼人工智能架構

哈佛大學推出了參數(shù)化深度學習基準套件ParaDNN,這是一種系統(tǒng)化、科學化的跨平臺基準測試工具,不僅可以比較運行各種不同深度學習模型的各類平臺的性能,還可以支持對跨模型屬性交互作用的深入分析、硬件設計和軟件支持。

TPU(Tensor Processing Unit,即TPU張量處理單元)是谷歌打造的處理器,專為機器學習量身定做的,執(zhí)行每個操作所需的晶體管數(shù)量更少,效率更高。TPU對CNN和DNN的大批量數(shù)據(jù)進行了高度優(yōu)化,具有最高的訓練吞吐量。

GPU表現(xiàn)出與TPU類似的性能,但對于不規(guī)則計算(如小批量和非MatMul計算)具有更好的靈活性和可編程性。

CPU在針對RNN方面實現(xiàn)了最高的FLOPS利用率,并且因其內存容量大而支持最大模型。

2345截圖20210806091512.png

第二類:非馮·諾依曼人工智能架構

內存計算(CIM):基于SRAM、NAND閃存以及新興內存(如ReRAM、CeRAM、MRAM)的CIM陣列被視為神經網(wǎng)絡計算的可重新配置、可重新編程加速器。CIM優(yōu)點:高性能、高密度、低功耗和低延遲。當前的挑戰(zhàn):讀出位線模擬信號傳感和專用RAM處理技術的ADC。

神經形態(tài)計算:神經形態(tài)計算將AI擴展到與人類認知相對應的領域,如解釋和自主適應。下一代人工智能必須能夠處理新的情況和抽象,以自動化普通人類活動。

量子計算:在量子計算中,最小的數(shù)據(jù)單位是基于磁場自旋的量子位?;诹孔蛹m纏,量子計算允許2個以上的狀態(tài),糾纏速度非???比如:Google Sycamore、Quantum Supremay、53個Qbits、速度快1.5萬億倍、在200秒內完成一項需要經典計算機10000年才能完成的任務)。當前的挑戰(zhàn):嘈雜中型量子(NISQ)計算機中的錯誤率和消相干。

量子神經形態(tài)計算:量子神經形態(tài)計算在類腦量子硬件中物理實現(xiàn)神經網(wǎng)絡,以加快計算速度。

2345截圖20210806091512.png

邊緣AI與垂直應用

邊緣人工智能將主導未來的計算,人工智能是一種能實現(xiàn)未來水平和垂直應用的技術。

水平人工智能應用解決了許多不同行業(yè)的廣泛問題(例如計算機視覺和語音識別);垂直人工智能應用是針對特定領域進行高度優(yōu)化的特定行業(yè)(例如高清地圖、自動駕駛定位與導航)。

憑借深厚的領域知識,高效的AI模型和算法可將計算速度提高10-100000倍。這是未來人工智能中最核心、最重要的自動駕駛技術。

所有垂直應用解決方案均需要用于多任務的多級AI模型。

2345截圖20210806091512.png

AI模型與算法

DNN是人工智能的基礎,如今的DNN使用一種稱為反向傳播的學習形式。如今的DNN訓練速度慢,訓練后是靜態(tài)的,有時在實際應用中不能靈活應變。

遷移學習是一種將先前開發(fā)的DNN“回收”作為DNN學習第二項任務起點的方法,有了遷移學習,DNN可用較少的數(shù)據(jù)訓練DNN模型。

持續(xù)(終身)學習是指在保留先前學習經驗的同時,通過適應新知識不斷學習的能力。例如,與環(huán)境交互的自動駕駛需從自己的經驗中學習,且必須能在長時間內逐步獲取、微調和遷移知識。

強化持續(xù)學習(RCL)通過精心設計的強化學習策略,為每個新任務尋找最佳的神經結構。RCL方法不僅在防止災難性遺忘方面具有良好的性能,而且能很好地適應新的任務。

2345截圖20210806091512.png

自動駕駛系統(tǒng)(ADS)–功能框圖。圖片來源:ARM

自主駕駛技術需要突破:

邊緣精確定位和導航–輕量化、基于指紋的精確定位和導航。

關鍵實時響應–20-30毫秒,類似人腦

消除盲區(qū)–V2X、V2I、DSRC、5G

可升級–低功耗和低成本

2345截圖20210806091512.png

圖片來源:ARM

自動駕駛需要在高清地圖、定位和環(huán)境感知中處理大量數(shù)據(jù),邊緣處理的所有數(shù)據(jù)都需要在關鍵的幾毫秒內完成。在感知、定位、導航、強化交互(駕駛策略)方面智能精確地減少數(shù)據(jù),將使自動駕駛系統(tǒng)縮短延遲,并快速響應不斷變化的交通狀況。

強大、高性能的邊緣人工智能(Edge AI)是自動駕駛汽車領域主要壁壘之一。5G連接支持可靠的MIMO連接、低延遲、高帶寬。在5G的加持下,強大的邊緣AI,加之高清地圖、定位和感知方面的創(chuàng)新,將使真正的自動駕駛成為現(xiàn)實。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論