“中國有多少數(shù)學(xué)家投入到人工智能的基礎(chǔ)算法研究中?”
今年4月底,中國工程院院士徐匡迪等多位院士的發(fā)聲,直擊我國在算法這一核心技術(shù)上的缺失,引發(fā)業(yè)界共鳴,被稱為“徐匡迪之問”。
由此,“依靠開源代碼和算法是否足夠支撐人工智能產(chǎn)業(yè)發(fā)展?”、“為什么要有自己的底層框架和核心算法?”等一系列問題,成為行業(yè)熱議的話題。
事實上,除了核心算法之外,對底層框架的忽視,也成為影響我國人工智能發(fā)展的重要因素,甚至比“缺芯少魂”、“卡脖子”問題更危險!
然而,想要理清其中的緣由,就需要從讀懂機器學(xué)習(xí)開始。
什么是機器學(xué)習(xí)?
眾所周知,AI的根本目的就是讓計算機模擬人類的行為和思維,以實現(xiàn)解放人力,提升效率,降低成本。其中,機器學(xué)習(xí)(Machine Learning)則是AI的智慧源泉。
從學(xué)術(shù)上來說,機器學(xué)習(xí)涉及概率論、統(tǒng)計學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多領(lǐng)域交叉的課題和技術(shù)。
從廣義上來說,機器學(xué)習(xí)就是賦予計算機學(xué)習(xí)能力,并實現(xiàn)模仿人類的一種方法。
從技術(shù)應(yīng)用上來說,機器學(xué)習(xí)是利用大量數(shù)據(jù),訓(xùn)練出專用的算法模型,然后通過該模型實現(xiàn)類似人的預(yù)測、推理,從而獲取決策的方法。
從層級上來說,機器學(xué)習(xí)位于AI的技術(shù)層,與其他技術(shù)的相融合,構(gòu)成了計算機視覺、智能語音、模式識別、數(shù)據(jù)挖掘、統(tǒng)計學(xué)習(xí)等AI核心技術(shù),并在應(yīng)用層得以體現(xiàn)。
從AI發(fā)展來看,幾乎所有核心技術(shù)和應(yīng)用場景的背后,都離不開機器學(xué)習(xí)所賦予的學(xué)習(xí)能力,也就是智能。
總之,機器學(xué)習(xí)既是人工智能的核心,也是計算機獲得學(xué)習(xí)能力和智力的方法或途徑。
而機器學(xué)習(xí)的核心則是算法。
深度學(xué)習(xí)算法與底層框架
作為AI大三元素(數(shù)據(jù)、算力、算法),目前主流的算法主要面向機器學(xué)習(xí)領(lǐng)域。因此,機器學(xué)習(xí)也可以理解為用于訓(xùn)練和推理的算法合集。
目前,機器學(xué)習(xí)算法可以分為傳統(tǒng)算法和深度學(xué)習(xí)(Deep Learning)算法兩大類。
深度學(xué)習(xí)是機器學(xué)習(xí)中一個新興的研究方向,也是一個復(fù)雜的機器學(xué)習(xí)算法。深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究,建立模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),以模仿人腦的機制來解釋數(shù)據(jù),強調(diào)模型結(jié)構(gòu)的深度和明確特征學(xué)習(xí)的重要性。
因此,深度學(xué)習(xí)使計算機實現(xiàn)模仿視聽和思考等人類的活動,解決了大量復(fù)雜的模式識別難題,從而推動計算機視覺、智能語音等復(fù)雜AI基礎(chǔ)技術(shù)的落地。
可以說,深度學(xué)習(xí)算法決定了未來AI的發(fā)展趨勢,乃是兵家必爭之地。
現(xiàn)在,全球AI領(lǐng)域,深度學(xué)習(xí)已經(jīng)超越傳統(tǒng)機器學(xué)習(xí),成為主流算法。但是,機器學(xué)習(xí)仍未被取代,兩者呈現(xiàn)互補的態(tài)勢。隨著深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)算法的結(jié)合,不僅降低了算法訓(xùn)練的門檻,更衍生出大量熱門算法以及相應(yīng)的底層構(gòu)架。
與依賴于芯片的算力不同,算法由于開源代碼、自動化工具等助力,門檻相對降低不少,因而成為初創(chuàng)公司不錯的切入點?,F(xiàn)在,大多AI企業(yè)基本都是圍繞算法及相應(yīng)的應(yīng)用場景做文章,在國內(nèi)尤為普遍。
然而,這些基于開源代碼和自動化工具的算法往往過于通用和初級,僅僅依托國內(nèi)海量數(shù)據(jù)儲備和豐富的應(yīng)用場景的優(yōu)勢,實現(xiàn)最基本的功能而已。真正核心和關(guān)鍵算法仍然掌握在國外大廠手中,核心競爭力明顯不足。
而且,不僅是核心算法,深度學(xué)習(xí)的底層框架也同樣來自于國外廠商。
底層框架,一般被稱作為開源框架或算法訓(xùn)練平臺。通俗來說,就是AI工具包,其作用就是用以訓(xùn)練算法模型的平臺。
如果將算法比作“子彈”的話,底層框架就是“軍工廠”,重要性不言而喻。
僅僅是算法的缺失,可以通過企業(yè)、開發(fā)者及整個行業(yè)的共同努力來彌補,但連工具都被“卡脖子”的話,顯然將大大制約我國深度學(xué)習(xí),乃至整個AI產(chǎn)業(yè)的發(fā)展。
外來的和尚好念經(jīng)
目前,主流的深度學(xué)習(xí)底層框架雖然大多已經(jīng)開源,但基本都來自于美國科技巨頭及大學(xué)相關(guān)實驗室,例如TensorFlow(谷歌)、PyTorch(Facebook)、MXNet(亞馬遜)、CNTK(微軟)、Deeplearning4j(美國AI初創(chuàng)公司Skymind)、Theano(蒙特利爾理工學(xué)院)、Caffe(加州大學(xué)伯克利/賈揚清開發(fā))、Keras(谷歌工程師FrançoisChollet開發(fā))等等。
其中,TensorFlow和PyTorch應(yīng)用最為廣泛,全球AI企業(yè)都將其視為重要的工具包。據(jù)TensorFlow網(wǎng)站顯示,京東、中國移動、美團、搜狗等中國企業(yè)都在使用該框架,用于深度學(xué)習(xí)的應(yīng)用和開發(fā)。
任何企業(yè)和開發(fā)者都可以將數(shù)據(jù)饋入其中,并開始訓(xùn)練自己的算法模型,無需重頭開始自行開發(fā)底層框架和開發(fā)平臺,所謂“站在巨人的肩膀”。
谷歌、Facebook、亞馬遜、微軟也在不遺余力地投入,對這些底層框架進(jìn)行維護(hù)、升級和推廣,以確保其受到全球開發(fā)者的歡迎。根本目的就是建立統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范,進(jìn)而形成完整的生態(tài)。最簡單的例子就是谷歌的安卓操作系統(tǒng),雖為開源,但也形成了技術(shù)壁壘,讓其他廠商難以逾越。
同時,大量企業(yè)和開發(fā)者也在為這些開源構(gòu)架默默地做著貢獻(xiàn),從而推動其不斷壯大。從另一個層面來說,盡管底層框架均為開源、免費,但獲得全球開發(fā)者助力的同時,也省去了建立國際性開發(fā)團隊的巨額成本。
其實,國內(nèi)巨頭已經(jīng)意識到了這個問題。BAT、華為、商湯、曠視、360以及浪潮等廠商都已經(jīng)推出了各自的機器學(xué)習(xí)底層框架。
尤其是百度飛槳(Paddle Paddle)自2016年開源起,一直在不斷升級和推廣,以吸引更多的企業(yè)和開發(fā)者的關(guān)注。2017年,騰訊Angel、360 Xlearning先后宣布開源。2018年年底,阿里x-deeplearning也正式開源。今年8月,華為推出了MindSpore深度學(xué)習(xí)框架,并將在2020年第一季度開源。此外,包括商湯、曠視、浪潮等廠商雖然已經(jīng)擁有自己的底層構(gòu)架,但遺憾的是并沒有開源。
最近,小米宣布語音識別開源工具Kaldi之父DanielPovey將出任語音首席科學(xué)家,很可能會加大相關(guān)底層構(gòu)架的研發(fā)。
盡管中國廠商已經(jīng)擁有了自研底層框架的實力,但在先入為主的國外開源構(gòu)架面前,不僅用戶量不足,而且缺乏貢獻(xiàn)者,更有過于封閉的問題,因此底層構(gòu)架的國產(chǎn)化可謂路漫漫。
如何突圍?
隨著國內(nèi)自研AI芯片成為全新的風(fēng)潮,讓人看到了突破芯片“卡脖子”,實現(xiàn)“彎道超車”的可能。
即便如此,現(xiàn)在中國AI基礎(chǔ)研究和基礎(chǔ)設(shè)施仍然相當(dāng)薄弱,包括硬件在內(nèi)的大量核心技術(shù)掌控在美國手中,更隨時面臨“技術(shù)封鎖”和“斷供”的風(fēng)險。
同樣的情況也發(fā)生在深度學(xué)習(xí)領(lǐng)域,核心算法和底層構(gòu)架的缺失,一旦風(fēng)險爆發(fā),將對中國AI發(fā)展帶來致命影響。
從國外廠商在AI領(lǐng)域的布局來看,無論是云計算、芯片,還是算法和底層框架,均以構(gòu)建自己的生態(tài)為根本目的,從而建立起牢不可破的“護(hù)城河”。
好在,阿里、百度、華為等國內(nèi)巨頭已經(jīng)從各個角度開展布局,阿里平頭哥“含光800”、華為麒麟系列芯片、鴻蒙操作系統(tǒng)以及百度飛槳等都是典型的代表。其中,今年7月,百度宣布飛槳與華為麒麟展開合作,芯片與底層構(gòu)架的聯(lián)手,無疑將共同推動中國深度學(xué)習(xí)和AI產(chǎn)業(yè)的落地和發(fā)展。相信這也是建立中國力量生態(tài)圈最好范例。
此外,建立和推動開源文化,也是擺在中國企業(yè)面前的老生常談的問題。唯有擁抱開放、共享,才能真正推動中國核心技術(shù),尤其是AI技術(shù)的快速進(jìn)步和發(fā)展,從而突破“卡脖子”封鎖。
目前,國內(nèi)深度學(xué)習(xí)廠商主要分為云計算平臺、AI初創(chuàng)企業(yè)、傳統(tǒng)計算廠商以及大數(shù)據(jù)企業(yè)多個陣營。其中,云計算平臺主要是BAT、華為、京東等互聯(lián)網(wǎng)巨頭為首;AI初創(chuàng)企業(yè)主要有第四范式、商湯、曠視、寒武紀(jì)等;浪潮、中科曙光等則發(fā)揮自身計算優(yōu)勢,占有一席之地;星環(huán)科技、美林?jǐn)?shù)據(jù)、九章云極等大數(shù)據(jù)企業(yè)擁有數(shù)據(jù)挖掘的優(yōu)勢,也成為生態(tài)中不可獲取的力量。
由此可知,除了AI本身之外,深度學(xué)習(xí)、機器學(xué)習(xí)與云、計算、數(shù)據(jù)等關(guān)鍵技術(shù)密不可分,這也恰恰證實了國內(nèi)海量數(shù)據(jù)儲備和互聯(lián)網(wǎng)基礎(chǔ)設(shè)施建設(shè)對AI行業(yè)起到的推動作用。然而,正如上文所述,唯有掌控核心算法和底層框架,擁有基礎(chǔ)設(shè)施和核心技術(shù)的自研能力,才能真正主導(dǎo)深度學(xué)習(xí)及機器學(xué)習(xí)行業(yè)。
總之,就連機器學(xué)習(xí)、深度學(xué)習(xí)這樣的AI工具包都一直掌控在美國手中,無疑比芯片、操作系統(tǒng)等核心技術(shù)的“卡脖子”問題更危險!