AI芯片百家爭鳴,誰能走到最后?

羅燕珊
有效算力和高性能是AI芯片的關(guān)注焦點,通過提高算力峰值來提高性能是方法之一,但往往需要付出不小的成本。在AI芯片通用時代還未到來之前,針對不同應(yīng)用場景,很大幾率需要不同的AI芯片來支持,各家芯片公司正試圖從不同維度突破更具性價比的“有效算力”。

AI芯片投入大、研發(fā)周期長,創(chuàng)業(yè)公司要博得一席之地并不容易。

算力、算法和數(shù)據(jù)被稱作AI發(fā)展的三要素,其中為算力提供支撐的底層硬件便是AI芯片。過去幾年隨著AI應(yīng)用的發(fā)展,行業(yè)掀起了AI芯片熱潮,一批AI初創(chuàng)芯片公司應(yīng)運而生。對這些公司而言,AI發(fā)展需要專用芯片的加持,當(dāng)下迎來的是重要的歷史性機遇,但同時,芯片行業(yè)又是最現(xiàn)實的行業(yè)之一,投入大、產(chǎn)出慢,更需要能落地并且被市場認可的結(jié)果,而這對很多芯片初創(chuàng)企業(yè)來說,并非易事。

峰值算力不等于有效算力

有效算力和高性能是AI芯片的關(guān)注焦點,通過提高算力峰值來提高性能是方法之一,但往往需要付出不小的成本。在AI芯片通用時代還未到來之前,針對不同應(yīng)用場景,很大幾率需要不同的AI芯片來支持,各家芯片公司正試圖從不同維度突破更具性價比的“有效算力”。

地平線曾提出,不應(yīng)該把傳統(tǒng)芯片常用的TOPS作為衡量AI芯片性能的標(biāo)準(zhǔn)。在地平線看來,能夠全面體現(xiàn)AI芯片真實性能的應(yīng)該是能效、利用率、算法能力的乘積,因此不僅要對芯片和算法進行優(yōu)化,還要對連接兩者的編譯器等中間環(huán)節(jié)進行優(yōu)化,最終達成全面優(yōu)化。

而鯤云科技認為,有可能實現(xiàn)10倍以上突破的下一代AI芯片指標(biāo)是芯片利用率,即芯片實測算力與芯片峰值算力的比值,這需要從計算平臺底層架構(gòu)進行創(chuàng)新。

CAISA 3.0架構(gòu)圖

鯤云科技日前發(fā)布了首款數(shù)據(jù)流AI芯片CAISA,采用自研的定制數(shù)據(jù)流芯片架構(gòu)(Customized AI streaming Accelerator,CAISA)CAISA 3.0。不同于基于馮諾依曼的指令集架構(gòu),數(shù)據(jù)流架構(gòu)依托數(shù)據(jù)流的流動次序控制計算執(zhí)行次序。鯤云科技表示,該芯片已經(jīng)完成量產(chǎn)。

近日鯤云科技創(chuàng)始人兼CEO牛昕宇在接受InfoQ等媒體采訪時表示,超越英偉達的不會是另外一款GPU。

在牛昕宇看來,芯片行業(yè)的馬太效應(yīng)明顯,除了跟隨已有技術(shù)路線之外,選擇另一條技術(shù)路線來開拓也不失為長遠之計。從官方公布的數(shù)據(jù)來看,相比現(xiàn)有的指令集芯片,CAISA可以提供更高的算力性價比,在1/3峰值算力情況下,搭載CAISA芯片的加速卡可實現(xiàn)英偉達旗艦產(chǎn)品最高3.91倍的實測性能,芯片利用率達到95.4%,較同類產(chǎn)品提升最高11.6倍。

“但創(chuàng)新很難,沒有既定的人和路線可以模仿,所有事情都要自己去探索,需要在這個行業(yè)不斷積累和了解,然后繼續(xù)往前走。”牛昕宇坦言,數(shù)據(jù)流這個路線不止鯤云在走,美國有Sambanova、Wave Computing和Groq在做,但都還未推出產(chǎn)品。據(jù)稱,目前鯤云是全球第一家將數(shù)據(jù)流AI芯片落地的廠商,接下來,CAISA數(shù)據(jù)流AI芯片將以加速卡的形態(tài)相繼落地于智能遙感、電力、工業(yè)檢測、智慧城市等領(lǐng)域。

終端芯片市場機遇更大

機器學(xué)習(xí)算法流程又分為訓(xùn)練和推理兩大環(huán)節(jié),不同的環(huán)節(jié)對AI芯片有不同要求。訓(xùn)練主要在云端進行,通常計算量巨大因此對性能要求很高,而推理在云、邊緣和終端均可進行,更側(cè)重芯片的低成本和低功耗。

集邦咨詢分析師姚嘉洋向InfoQ表示,目前訓(xùn)練芯片方面,英偉達居于領(lǐng)先位置;推理芯片方面,投入的企業(yè)非常多,重點是要聚焦哪種應(yīng)用場景,如自動駕駛、物聯(lián)網(wǎng)與智能型手機等,不同的終端應(yīng)用所需要的AI運算也會有所不同,如何進一步聚焦特定應(yīng)用并加以發(fā)展,會是AI推理芯片業(yè)者必須要思考的課題。

“因為公司還處于比較初期的發(fā)展階段,所以一定會專注于推理的芯片市場,但訓(xùn)練也是人工智能一個比較大的市場,我們會不斷探索這個領(lǐng)域的可能性。”被問及會否涉足訓(xùn)練領(lǐng)域時,牛昕宇表示公司現(xiàn)階段還是會專注于推理。

從行業(yè)現(xiàn)狀來看,對于AI芯片企業(yè),尤其是初創(chuàng)企業(yè)而言,終端/邊緣側(cè)的機會多于云端。

耐能(Kneron)也是從一開始就專注終端市場的AI芯片公司。耐能創(chuàng)始人兼CEO劉峻誠日前接受InfoQ采訪時亦指出,云端市場份額很有可能都被大公司拿下,小公司在這個領(lǐng)域沒有太大的機會。但終端市場不同,終端下面又細分了很多子領(lǐng)域,不像云那樣能用一個架構(gòu)“吃掉”,所以耐能選擇了終端方向,切入消費電子領(lǐng)域的AI芯片,比如智能門鎖、智能門鈴、IoT、智慧家居等。

德勤預(yù)測,至2024年,邊緣人工智能芯片(執(zhí)行或加速設(shè)備內(nèi),而非遠程數(shù)據(jù)中心機器學(xué)習(xí)任務(wù)的芯片或芯片部件)銷量預(yù)計將超過15億片,甚至可能遠遠超過這一數(shù)據(jù),年銷量增長率將達到20%,是半導(dǎo)體行業(yè)整體長期預(yù)測的9%復(fù)合年均增長率的兩倍以上。而這些邊緣AI芯片很大可能將流向日益增多的消費級設(shè)備,如高端智能手機、平板電腦、智能音箱及可穿戴設(shè)備等,同時也將應(yīng)用于多個企業(yè)市場——機器人、攝像頭、傳感器及其他物聯(lián)網(wǎng)設(shè)備。

“目前在中國,邊緣計算芯片最主要的市場仍為智慧安防領(lǐng)域,且落地應(yīng)用布局較為成熟。”德勤在報告中稱,未來,隨著技術(shù)進步及5G的全面鋪開,無人駕駛、智慧家居、智能交通、智能制造等領(lǐng)域可能迎來更大的增長空間。但邊緣計算芯片市場也面臨挑戰(zhàn),終端設(shè)備的電池容量有限,AI芯片必須在能效較低的同時具備更卓越的計算性能,才能更好地服務(wù)端側(cè)AI計算需求。

落地與盈利的終極問題

毫無疑問,AI芯片投入大、研發(fā)周期長,要博得一席之地并非易事。尤其對規(guī)模較小的創(chuàng)業(yè)公司來說,若沒有清晰的落地應(yīng)用和商業(yè)模式,就連生存都是問題。即將在科創(chuàng)板上市、有望成為AI芯片第一股的寒武紀(jì)也連年虧損。招股書顯示,2017~2019年間,寒武紀(jì)分別虧損3.81億元、0.41億元和11.79億元,近三年累計虧損額超過16億元。

創(chuàng)業(yè)公司還要面對來自大公司的壓力,像英特爾、英偉達和高通這些芯片巨頭近些年都在AI領(lǐng)域持續(xù)布局,谷歌、亞馬遜、百度等互聯(lián)網(wǎng)公司也紛紛借助自有業(yè)務(wù)來支撐芯片研發(fā)工作和落地。

姚嘉洋認為,AI初創(chuàng)企業(yè)在發(fā)展之初,必須先鎖定某一個AI應(yīng)用痛點,在該應(yīng)用發(fā)展起來后,才有機會跟臺面上的業(yè)者抗衡。

牛昕宇向InfoQ記者表示:“鯤云創(chuàng)立之初就已經(jīng)做了商業(yè)上的思考,像今天我們發(fā)布的(芯片)指標(biāo),其實好幾年前就已經(jīng)在紙上做過計算,大概要達到這樣的峰值算力才能實現(xiàn)這部分性能的領(lǐng)先,才有可能打動客戶,所以我們才要做這樣的一個芯片。”

在落地方面,耐能算是一眾初創(chuàng)企業(yè)里做得比較早和成功的,市面上已經(jīng)有十幾款芯片產(chǎn)品在售并且進入了不少垂直行業(yè)的標(biāo)桿企業(yè),但它也還未實現(xiàn)盈利。劉峻誠告訴InfoQ,今年公司收入應(yīng)該會接近千萬美元,預(yù)計明年才能獲利。

“現(xiàn)在行業(yè)是百家爭鳴,后進者很多,大家融到的錢都很多,所以挑戰(zhàn)也會越來越大。”劉峻誠表示,除了資金,落地速度和擴展性也很重要。

此外,有網(wǎng)友對鯤云芯片評價道:“這不是第一個也不是最后一個聲稱性能超過英偉達的,但實際上,英偉達的壁壘主要在開發(fā)環(huán)境及系統(tǒng)生態(tài)。”對此,鯤云稱公司為用戶提供了簡單易用的編譯工具鏈,可以更快速地部署和遷移算法,進而幫助AI芯片更好地落地。

軟件工具鏈和生態(tài)的打造,一直是專用處理器設(shè)計的巨大挑戰(zhàn)。設(shè)計一個新的專用芯片,做好硬件只是第一步,后續(xù)還需要打造新的軟件工具鏈,包括新的指令集架構(gòu)、編程模型,甚至是新的編程語言。只有提供全棧的軟硬件,才能讓用戶特別是開發(fā)者充分利用新硬件的能力。

在軟件工具和生態(tài)上,英偉達是業(yè)內(nèi)公認的絕對標(biāo)桿,其推出的統(tǒng)一編程框架CUDA已有十幾年的積累,由于完整的配套生態(tài)、良好的易用性和高效的更新迭代速度而廣受機器學(xué)習(xí)應(yīng)用開發(fā)者和框架開發(fā)者歡迎。在這方面,AI初創(chuàng)企業(yè)們還有相當(dāng)長的路要走。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論