十多款芯片問世,多起并購案,這是過去500多天里中國AI芯片的熱度。
始料未及的事件再次點燃了學(xué)界業(yè)界和整個輿論場,在人工智能技術(shù)躋身世界前列的背景之下,我們開始期待它成為中國芯片的“嫁衣”。
人工智能的概念開始伴隨著每片新品一個個拋向大眾視野。
AI芯片指專門針對AI算法的專用集成電路,不同于傳統(tǒng)的CPU、GPU,后者雖然可以用來執(zhí)行AI計算,但速度和性能都影響了商用效果。
一位芯片工程師舉例到,自動駕駛需要識別道路行人紅綠燈等狀況,但如果用當(dāng)前的CPU去算,估計車翻到溝里了還沒發(fā)現(xiàn)前方是河。
而如果是GPU,速度當(dāng)然快得多,但其巨大的功耗和高昂的費用依然不是AI場景理想的選擇。不僅如此,AI芯片還在場景側(cè)分為云端和終端,大量數(shù)據(jù)訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)的場景在云端完成,追求低成本和低功耗地推理則在終端搞定。
真實需求,不缺場景,資金到位,前赴后繼的AI芯片公司紛紛上路,但造芯片可不是趕風(fēng)口,設(shè)計、制造、封測整個鏈條之艱難讓無數(shù)人卻步。而且這還是一個板凳坐得十年冷的體力活。
跌宕起伏又心潮澎湃,棘地荊天又發(fā)奮為雄,這都匯聚成這批AI芯片創(chuàng)業(yè)者們的造“芯”故事。
尋找最優(yōu)解
2013年秋天,張軍是云知聲在深圳唯一的銷售人員,負(fù)責(zé)開拓白電客戶。
他經(jīng)常和前來出差的聯(lián)合創(chuàng)始人李霄寒請教,怎么才能幫助傳統(tǒng)家電企業(yè)提升競爭力?起初,他們在云端提供SaaS服務(wù),給客戶提供語音識別能力,但很快意識到這還不夠。
他們發(fā)現(xiàn)物聯(lián)網(wǎng)設(shè)備和手機不一樣,手機端的語音識別可能不是剛需,但在家居生活和獨立辦公場合,人類最自然的交互方式就會有它的用武之地。
當(dāng)時的深圳辦公室只有12平方米,里面兩張桌子,三把椅子,大家頭腦風(fēng)暴想做一個類似“U盤”的東西,有標(biāo)準(zhǔn)的接口,可以把它插到家電上實現(xiàn)語音交互。
2015年8月,這個后來取名叫做智能語音模塊(IVM)的產(chǎn)品大獲成功,一個硬件版可以標(biāo)準(zhǔn)化的對接不同的客戶,型號A和型號B都可以輕松適配,格力空調(diào)、華帝油煙機順利出貨。
深圳團隊開始搬進了大辦公室,團隊招兵買馬。
不過,短短的幾個月之后,他們又發(fā)現(xiàn)了新的問題,板子帶芯片,各種各樣的東西串起來,每個其實都不貴,但加起來成本太高了,客戶問李霄寒:你這東西如果賣一百塊錢,那只能放在高端產(chǎn)品上,低端產(chǎn)品就賣幾百塊錢,我沒法用。
怎么辦?有人提出自己造芯片,把東西集成到芯片里解決問題,但一算賬發(fā)現(xiàn),如果無法一片片攤薄,總體算下來還是貴。
這個事情經(jīng)過了激烈的討論,甚至有投資人頗有怨言的找到他們說,我們投一筆錢不是特寬裕,你們拿去做芯片,大家都知道芯片高投入周期長,你們?yōu)槭裁匆觯?/p>
也不能怪投資人,被稱為“獨角獸捕手”的金沙江創(chuàng)投董事總經(jīng)理朱嘯虎就有言,“中國VC不是不投芯片,之前我們投了好幾個都血本無歸。”那個時候,所有的投資人都會提到投入成本高、門檻高、周期長、回報率低。
時間到了15年下半年,團隊還是拍板要上,因為他們發(fā)現(xiàn)這里有一個尖銳的矛盾是長期不可調(diào)和的,只有足夠的算力和功能才能支撐起AI應(yīng)用,但成本是主要的限制因素。
一款A(yù)I產(chǎn)品,有了好的底層支撐就需要高出一兩百的成本,但又想出量就必須以更低的售價,這樣還不想降低算力就只能通過芯片本身了,沒有其它解。
他們判斷這是整個IoT方向的問題,云知聲CEO黃偉說“不做芯片就是死路一條”。
對抗短期“情緒”
動手稍快的是時任百度深度學(xué)習(xí)研究院副院長余凱,他于2015年6月1日離開百度,一周之后就開始為新公司造勢“我們要做人工智能時代的英特爾”。
讓他毅然離開并火速創(chuàng)業(yè)的原因,也正是由于篤定AI的變量并不在軟件,而是處理器架構(gòu),底層計算效率和功耗不解決,應(yīng)用層就會多做很多無用功。
因為隨著嵌入式處理器的功能不斷外延,質(zhì)變已然發(fā)生,北京航空航天大學(xué)教授何立民曾談及,自從人工智能進入機器的深度學(xué)習(xí)時代,原有MCU的硬件加速已無法滿足高速海量數(shù)值計算要求,以及大數(shù)據(jù)的云間交互要求。
這樣一來,在嵌入式領(lǐng)域便出現(xiàn)了MCU與AI芯片兩個有本質(zhì)差異的芯片群,前者以控制見長,后者以計算見長。
找準(zhǔn)了方向,緊接著余凱遇到一個好消息一個壞消息。
順利的是創(chuàng)業(yè)團隊的搭建,基本上就是找老朋友老部下,吃幾頓飯挖幾圈一支三五十人的戰(zhàn)斗部隊就拉好了,團隊漲到幾百人之后遇到的管理困擾,那是后話。
壞消息是在有豪華團隊背書之下,輕松完成第一輪融資之后,接下來去哪里找錢。
在那個“人機大戰(zhàn)”還沒有到來的2015年秋天,老百姓特別是投資人根本看不懂這個家伙要做什么?余凱連續(xù)談到六七十家投資機構(gòu),無一出手。
那會兒的風(fēng)口是共享單車和P2P。
以至于那場影響世界人工智能發(fā)展的“人機大戰(zhàn)”到來時,余凱積極參與并出現(xiàn)在網(wǎng)易的直播間,作為技術(shù)嘉賓講解AlphaGo,也通過這樣的機會為自己正在做的事兒正名。
2016年3月9日至15日在韓國首爾進行的圍棋比賽,AlphaGo圍棋以總比分4比1戰(zhàn)勝李世石。余凱信心大增,這意味著大多數(shù)人開始看懂人工智能和AI芯片的開始。
余凱的芯片“部隊”
他從創(chuàng)業(yè)伊始就說要堅持戰(zhàn)略判斷,不為大環(huán)境左右,這付出了不少代價,令他一直感到困惑的是,短期的情緒和競爭所造成的市場影響,在中國是被放大的,這也是為什么很多國外投資人來中國賺不到錢,他們往往低估“局部”的力量。
好在“人機大戰(zhàn)”過去的幾個月之內(nèi),地平線連續(xù)獲得了Yuri Milner、雙湖投資、青云創(chuàng)投和祥峰投資的資金馳援,并在第二年拿到了英特爾領(lǐng)投的超一億美金A+輪。
過冬的糧草終于備足了。
余凱說地平線做的是“反共識”的事情,百度系自動駕駛創(chuàng)業(yè)只有他們采取不同路線,這就導(dǎo)致談的時候處于兩個極端,要么一拍即合,要么無法正常對話,你要做的就是找到想法一致的人。
巨頭種子遇變數(shù)
2015年左右地平線和云知聲開始大量投入兵力,寒武紀(jì)雖創(chuàng)立最晚,但原始積累已早早在中科院計算所完成。
陳云霽、陳天石兄弟
2014年,身在中國科學(xué)院計算技術(shù)研究所的陳云霽、陳天石課題組就提出了深度學(xué)習(xí)處理器指令集DianNaoYu,被計算機體系結(jié)構(gòu)領(lǐng)域頂級國際會議ISCA2016所接收,其評分排名所有近300篇投稿的第一名。
那時的模擬實驗表明,采用DianNaoYu指令集的寒武紀(jì)深度學(xué)習(xí)處理器相對于x86指令集的CPU有兩個數(shù)量級的性能提升。
陳云霽、陳天石兄弟開始嶄露頭角。
陳云霽9歲上中學(xué),14歲進入中科大少年班,24歲取得中科院計算所博士學(xué)位,29歲晉升為研究員,33歲榮獲中國青年科技獎和中科院青年科學(xué)家獎。兄弟二人平步青云,循著同樣的步伐直到再次“交匯”。
2008年,陳云霽兄弟開始聯(lián)手打造AI芯片,利用各自的科研優(yōu)勢攻關(guān),在此之前,陳云霽已經(jīng)跟隨中國“龍芯之父”胡偉武十余年。胡偉武帶領(lǐng)團隊在2016年研制成功的龍芯3A3000處理器已經(jīng)用在了北斗二代衛(wèi)星。
同一年,寒武紀(jì)科技公司成立并順勢推出了首款可商用的深度學(xué)習(xí)處理器寒武紀(jì)1A,這個速度早于業(yè)界。
陳天石曾說,寒武紀(jì)只有小幾百人的團隊,已經(jīng)做了很多事情,全球第一款終端AI處理器落地、全球第一款多核終端AI處理器落地、中國第一顆云端人工智能芯片落地、三代終端IP產(chǎn)品發(fā)布。
他說難以想象AI芯片領(lǐng)域不誕生新巨頭,這顯示著寒武紀(jì)的勃勃野心。但很快他們需要面對的是華為自己做芯片,外界指“拋棄”寒武紀(jì)的質(zhì)疑。
陳天石回應(yīng)華為發(fā)布的峰值性能16T的昇騰310和寒武紀(jì)發(fā)布的MLU100沒有競爭,場景不同,峰值性能也不同,作為一家開放獨立的芯片公司,要具備寬廣的視野。
不知道這是否是他的心里話,但至少在前往巨頭路上的變數(shù)多了起來。
AI芯片是時代機遇,更是技術(shù)所需,在這波崛起潮水之中,最早開始投入研發(fā)的還屬海思,但一直被華為“雪藏”。
早在2004年,華為全資子公司海思半導(dǎo)體逐漸登上歷史舞臺,他們起初主攻基帶芯片、視頻編碼芯片和為自家手機打造麒麟芯片,而和AI芯片扯上關(guān)系要從2017年說起。
2017年9月初,華為在柏林發(fā)布了麒麟970,宣稱這是“全球第一枚手機AI芯片”,其中集成了寒武紀(jì)1A處理器的IP作為其核心AI處理單元。次年8月,麒麟980同樣搭載了寒武紀(jì)1A的優(yōu)化版本。
不過,從2018年10月開始,寒武紀(jì)迎來壞消息,情理之中,意料之外,“客戶”華為推出全棧全場景AI解決方案和昇騰910、昇騰310兩款A(yù)I芯片。
海思成增長率最高的芯片設(shè)計公司
在絕地求生之前,華為創(chuàng)始人任正非就計劃在芯片上投入四億美元和兩萬人,23年以來,海思的舵手何庭波從工程師直至總裁,她歷經(jīng)微米到納米,再到現(xiàn)在的5納米技術(shù)。
這些積淀和努力,都成為海思在AI芯片時代的強力儲備,正在開花結(jié)實,昇騰910、昇騰310、麒麟980的下一代們正在加速度。
創(chuàng)造性和秩序性講道理
寒武紀(jì)有中科院背景,海思有華為這艘巨輪作為背靠,一千多位高級半導(dǎo)體專家參與本身就是超級壁壘。
而團隊的建設(shè)和磨合對于云知聲和地平線這樣的創(chuàng)業(yè)公司來說就沒那么容易了。
從2015年開始決定做AI芯片,直到2016年中才正式步入正軌,云知聲組建芯片團隊經(jīng)歷了漫長而又艱難的磨合期。直到“關(guān)鍵先生”謝冠超2015年11月加入,負(fù)責(zé)整個IoT事業(yè)部,其中最重要的KPI就是造芯片。
從深圳到北京,云知聲的解決方案開始迎來徹底革新。
有了帶頭打仗的人,但作戰(zhàn)部隊還在緩慢的招聘和打磨,令彼時的管理層最為棘手的問題是算法團隊和芯片團隊的“互掐”。這是軟硬件結(jié)合的AI芯片必須經(jīng)歷的陣痛,雙方在底線的邊緣瘋狂相互試探。
如果是通用芯片,成本高企且有比較大的內(nèi)存和存儲空間,但一旦到了AI芯片,特別是邊緣側(cè),多一點點東西都是成本的痛苦,那就希望算法團隊配合裁剪。
這個時候算法團隊就炸毛了,拍桌子瞪眼睛在辦公室是常事,說這個東西我已經(jīng)做到極致了,而且我很忙。雙方爭執(zhí)不下,只能等老大拍板。
在老大眼里,那就是倒推,如果這款芯片成立,就必須滿足資源限制的需求;算法是你給我的資源越多,我給你的性能就越好?,F(xiàn)在要做的就是確認(rèn)性能水平,然后榨干每一個空間,達(dá)成和解。
在AI芯片的研發(fā)過程之中,這是團隊在每一個引擎,每一個模塊,都會遇到的事情。
余凱將這個問題歸結(jié)為理念沖突,招聘時有人問他,你做軟件就做軟件,軟硬件結(jié)合是干嘛?
他認(rèn)為這是打頭陣必須經(jīng)歷的“風(fēng)阻”,地平線芯片團隊也在初期的相當(dāng)長時間內(nèi)協(xié)同工作不融洽,軟件開發(fā)強調(diào)快速迭代,而硬件強調(diào)系統(tǒng)性的程序思維。
一個快一個慢,一個講創(chuàng)造性,一個講秩序,這兩撥人有天然的對抗性。
從2015年10月,地平線第一個芯片工程師入職,第一行芯片代碼敲出,開始做前端開發(fā),經(jīng)歷了寫代碼,測試代碼,畫一層一層的物理實現(xiàn)圖的過程,再到制造樣片,最終在2017年8月16日點亮。同年12月20日,第一代芯片連同基于芯片開發(fā)的多個典型應(yīng)用發(fā)布。
其實,一開始芯片團隊自己都懷疑,“能成嗎?啥啥都沒有??!”。但項目真正跑起來之后,團隊的信心開始愈發(fā)堅定。
在某一個關(guān)鍵的節(jié)點,為了保證芯片研發(fā)進度,據(jù)說地平線算法負(fù)責(zé)人黃暢把自己鎖在小會議室里,噼里啪啦寫了兩個星期的代碼,并在門口掛了張牌子:“封閉開發(fā)中,請勿打擾”。
兩個星期之后,拿著最終版本的算法架構(gòu),黃暢走出小會議室,黑眼圈深重,頂著凌亂的頭發(fā),眼里閃著光,“搞定了!”
磨合成熟的團隊讓地平線的芯片研發(fā)周期縮小到了22個月,不同于互聯(lián)網(wǎng)行業(yè)的快速試錯和迭代,芯片還絕對錯不得。余凱說,一款A(yù)I芯片研發(fā)成本超過5000萬美金,這對創(chuàng)業(yè)公司來講是風(fēng)險極高、壓力極大的事情。
只造武器不打仗
造芯兩年,2018年5月,云知聲交出了第一代芯片“雨燕”,面向智能家居和智能音箱,在更低成本和功耗下提供更高的算力。芯片采用了ARM的架構(gòu)和自主算法,選擇臺聯(lián)電代工和一家中國臺灣企業(yè)完成封測。
沒成想,黎明之前最黑暗,5月16日的芯片發(fā)布會,一度讓云知聲決定取消,因為本來就緒的芯片突然點不亮,大家驚出一身冷汗。
李霄寒迅速組織排查,發(fā)展板子圖有問題,立即改了一版重新驗證,用時一周,有驚無險。
芯片發(fā)布之后的語音功能測試也讓團隊煞費苦心,客戶大多是南方人,有次經(jīng)過幾天幾夜的測試調(diào)整終于過關(guān),但最后一群人灰頭土臉的又被打了回來,因為客戶老板的口音來自另外的更小眾的地方。
黃偉們慶祝芯片第一次點亮
李霄寒把造AI芯片的挑戰(zhàn)歸結(jié)為三個原因,首先是怎樣在整個體系架構(gòu)上做到能耗比的最優(yōu),怎樣突破馮·諾依曼內(nèi)存墻,其次是做好軟硬一體,最后是要理解應(yīng)用場景。
云知聲是物聯(lián)網(wǎng)專用芯片,地平線是圍繞車載的智能駕駛的計算和AIoT場景的專用芯片。
不約而同的是,他們的商業(yè)模式都顯得克制,就像英特爾不會成為聯(lián)想和戴爾一樣。別人都在垂直往上做應(yīng)用的時候,余凱希望能在底層呆著,往上做,等于互相之間競爭。
一個是掙整個產(chǎn)業(yè)鏈的錢,一個是掙平臺的錢,他們選擇后者,大家都知道做芯片只有鋪量才能活下去,盡可能的避免參戰(zhàn),只作為輸送彈藥的角色,是他們的生存之道。
余凱常言只造武器不打仗就是這個道理。
云知聲同樣,在2018年下半年開始交付芯片的時候,他們思考最多的就是交付給客戶的是什么?他們雖然不是芯片和應(yīng)用都包辦,但因為物聯(lián)網(wǎng)領(lǐng)域的不同,他們還是會為客戶準(zhǔn)備好諸多現(xiàn)成的功能應(yīng)用。
團隊調(diào)研發(fā)現(xiàn),物聯(lián)網(wǎng)市場需要的不是一個AI芯片,而是一個應(yīng)用于物聯(lián)網(wǎng)的AI功能,比如你拿出一個智能燈泡的方案,里面有一個芯片不假,但功能才是客戶看重的。
有一次,李霄寒把AI芯片拿到一個賣燈的廠家,老板看了一臉茫然地望著他,你給我這個干嘛?但他又說這個芯片還有哪些功能,芯片和軟件連同后臺服務(wù),并且能實現(xiàn)這樣那樣的功能,老板就把他請進屋坐下來詳談了。
相比于云知聲早半年,2017年底,地平線發(fā)布了征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器。
余凱把芯片架構(gòu)比作人的左腦和右腦,負(fù)責(zé)理性計算還是采用了ARM的架構(gòu),負(fù)責(zé)感性的部分被稱為BPU(Brain Processing Unit)——這是地平線自主設(shè)計的主要用于人工智能計算的部分。
征程1.0和旭日1.0芯片采用了芯片地平線第一代BPU架構(gòu)“高斯”,提出算法來定義芯片,他們贊同計算機先驅(qū)、圖靈獎得主的理念“真正認(rèn)真對待軟件的人應(yīng)該做自己的硬件”。
創(chuàng)業(yè)四年有余,大家對軟件算法的熱情和投入依然令余凱困惑,一直以來他都堅信算法的門檻會越來越低,事實上,我們也可以看到很多純粹的人工智能算法公司正在調(diào)整航向。
熱鬧是他們的
這波AI芯片熱,做智能語音的公司最熱鬧,做計算機視覺的公司最低調(diào)。
此話怎講?資深分析師吳磊的觀點是,無論是機器人還是空調(diào)的語音控制模塊,都是新的東西,這是屬于語音領(lǐng)域的機會,所以他們更愿意嘗試AI芯片。
商湯、云從這類計算機視覺公司的業(yè)務(wù)并沒有創(chuàng)造出新的設(shè)備,網(wǎng)絡(luò)攝像頭或?qū)I(yè)攝像頭都是已經(jīng)在那的,他們目前是要解決數(shù)據(jù)流到服務(wù)器之后,沒有被有效利用的事情。
云從科技就是一家將重心放在計算機視覺的人工智能公司,2017年底工程技術(shù)負(fù)責(zé)人湯麗斌團隊遇到一個困擾,他們此前把算法放在PC端,這個“金貴”的PC設(shè)備又怕冷,又怕濕,又怕臟,還得有人伺候。
他們亟待找到能把算法塞到相機端的方法。
第一步是芯片選型,這個時間大概持續(xù)三個月左右,產(chǎn)品部和算法部進行協(xié)調(diào),把市面上有接觸的所有符合場景需要的芯片一個一個拿到測試。
如果遇到中意的有不合適,還會和芯片供應(yīng)商商量著做定制化,比如有些芯片不是專門為終端設(shè)備做的,為PC設(shè)計就不會周全的考慮緊湊環(huán)境。
而且,除非選的是通用芯片,一般專用芯片的話產(chǎn)品的設(shè)計和芯片的選型會同步進行,稍微滯后一點芯片。以防萬一如果芯片最后搞不定,這個產(chǎn)品都不用設(shè)計。大家會卡著相同的時間點把產(chǎn)品設(shè)計敲定。
湯麗斌還發(fā)現(xiàn),國內(nèi)外的芯片企業(yè)都很優(yōu)秀,但支持速度會有些許差異,國際大廠的支持速度是國內(nèi)同類型公司的三分之一,原因之一在于國際大廠會將技術(shù)需求反饋到國外總部,整體決策流程較長,而國內(nèi)公司可以迅速根據(jù)客戶需求對芯片進行定制化。
2018年3月,云從科技的第一代AI智能相機“炬眼”面市,采用了英特爾的芯片,雙方在算法和硬件的功耗上成立專項做了優(yōu)化,功耗降到了15瓦,順利出貨。
幾個月之后,第二代AI智能相機提上日程,華為海思的芯片成為主要選擇,雖然成熟度還在打磨,但給湯麗斌吃定心丸的是,性能提升明顯。他們可以在產(chǎn)品上市前花更多精力在算法的打磨和場景功能的調(diào)研方面。
從2019年開始,湯麗斌就在不停的走訪客戶,很多銀行和他反復(fù)提及網(wǎng)點投訴率的事情,有時候客戶感到業(yè)務(wù)流程復(fù)雜、等待叫號時間長容易生氣,這個時候安撫是第一位的。
他們在廣東農(nóng)行試點了一個應(yīng)用,后臺可以看到網(wǎng)店有多少人,每個人頭頂會顯示一個狀態(tài),一般的等待時間上限是15分鐘,到時候如果還沒叫號,你就需要去問候一下了,或者倒杯水讓顧客的情緒降檔。
這些直抵客戶的東西,都是作為一家不造芯片的人工智能廠商,算法“就”芯片的工作。所以前期選型一款優(yōu)秀的AI芯片就至關(guān)重要。
對扎十年馬步說No
不過,同屬計算機視覺陣營的依圖還是坐不住了,幾乎在同一時間發(fā)現(xiàn)問題,一家選擇有求于人,一家選擇身體力行。
今年5月,乘著新聞聯(lián)播的預(yù)熱,創(chuàng)始人朱瓏在上海灘發(fā)布“求索”芯片,這是一顆同時兼顧云端和邊緣端場景的SoC級芯片。劍指英偉達(dá)。
依圖展示“求索”芯片性能
他們打算造芯片是在2017年2月,而后投資了AI芯片初創(chuàng)團隊ThinkForce,這家由芯片行業(yè)老兵組成的軍團讓依圖造芯路變得順暢起來。依圖提供視覺算法,ThinkForce承擔(dān)硬件研發(fā)。這印了朱瓏口中“算法即芯片”的理念。
這是一個完整的故事,終端側(cè)有海思在,依圖可能沒那么容易,但云端側(cè)他們自己就有強算力需求。
但芯片行業(yè)浸潤多年的專家,張兵的疑問是,依圖的需求能不能撐起足夠的量,如果不能,依圖既做業(yè)務(wù)又做芯片,處境還是略顯尷尬。相比完全第三方獨立做底層的寒武紀(jì),在芯片方面更有機會。
一位已經(jīng)離職的依圖工程師胡小軍和網(wǎng)易智能《洞見》說道,其實在早期朱瓏經(jīng)常強調(diào)要扎十年馬步,那為什么現(xiàn)在依圖急了?
因為2017年去融資的時候,對于扎馬步這件事,投資人第一個不答應(yīng)。而且現(xiàn)在依圖的營收壓力在陡增。這也許是最好的選擇。
無論怎樣,每一條道都可能通往羅馬,這是他們關(guān)于芯片的故事,也是中國芯崛起的佐證,不管前方是地雷陣還是萬丈深淵,每個人看上去都神采奕奕。
通用芯片終于到頭了。