從AI開放平臺(tái),到工業(yè)大生產(chǎn)基座:重新認(rèn)識(shí)百度大腦5.0

腦極體
時(shí)間推進(jìn)到2019,當(dāng)我們在今天提到AI時(shí),絕大多數(shù)聲音已經(jīng)不再提及下圍棋的神奇,而是關(guān)注AI如何走向千行萬業(yè),為國民經(jīng)濟(jì)提質(zhì)增效。

時(shí)間推進(jìn)到2019,當(dāng)我們在今天提到AI時(shí),絕大多數(shù)聲音已經(jīng)不再提及下圍棋的神奇,而是關(guān)注AI如何走向千行萬業(yè),為國民經(jīng)濟(jì)提質(zhì)增效。

根據(jù)麥卡錫早些時(shí)候的報(bào)告,未來AI技術(shù)90%的價(jià)值將發(fā)生在與各行業(yè)的結(jié)合,并且到2030年將創(chuàng)造超過中國與印度GDP總和的產(chǎn)業(yè)價(jià)值。毫無疑問,今天每一雙眼睛都在緊盯著AI,好奇地審視著這一切到底會(huì)不會(huì)發(fā)生、如何發(fā)生。

顯然,當(dāng)眾多觀眾、媒體與AI開發(fā)者一起來到百度AI開發(fā)者大會(huì)的時(shí)候,大家都希望看到一些關(guān)于產(chǎn)業(yè)智能化的新思考與新答案。畢竟百度是中國AI技術(shù)的名片,一個(gè)AI領(lǐng)域的新推動(dòng)從百度開始,似乎已經(jīng)被認(rèn)為是合情合理的。

而百度也確實(shí)接住了這些期待。在百度AI開發(fā)者大會(huì)2019的主論壇上,百度CTO王海峰宣布百度大腦升級(jí)為5.0版本。而對(duì)這一次升級(jí),王海峰將其表述為“百度大腦5.0全面升級(jí)成為軟硬一體的AI大生產(chǎn)平臺(tái),希望能夠深度賦能產(chǎn)業(yè)開發(fā)者,加速產(chǎn)業(yè)智能化進(jìn)程”。

可能各位的問題已經(jīng)隨之而來,從AI開放平臺(tái)到AI大生產(chǎn)平臺(tái),到底是什么樣的變化支撐起了百度大腦的角色變化?讓AI邁入產(chǎn)業(yè)世界,實(shí)現(xiàn)AI與工業(yè)大生產(chǎn)的融合,究竟需要達(dá)成哪些條件與基礎(chǔ)?

AI技術(shù)與產(chǎn)業(yè)融合,從案例級(jí)別的“可以”,到千行和萬業(yè)真實(shí)觸發(fā)的“可以”。產(chǎn)業(yè)智能包含兩個(gè)層面的含義,一是智能技術(shù)來到了產(chǎn)業(yè)化周期中,可以用更符合社會(huì)化大生產(chǎn)的方式向市場提供技術(shù)與解決方案支持;二是產(chǎn)業(yè)需求可以廣泛應(yīng)用AI技術(shù),在其過程中成本可控、難度可接受。

換句話說,AI必須以工業(yè)的方式,進(jìn)入工業(yè)世界。那么我們想要認(rèn)識(shí)百度大腦5.0的全新定位與價(jià)值時(shí),似乎要先回到更遠(yuǎn)一點(diǎn)的記憶中,回到工業(yè)大生產(chǎn)的肇始。

1769年,老約翰的工業(yè)之心

18世紀(jì)中葉的倫敦,舉世聞名的大霧還沒有來到它的峰值。

老約翰是一位老式織坊的主人,他正在籌劃將數(shù)十年的積蓄拿出來,開一間已經(jīng)在這座城市流行起來的紡織工廠。

但是嚴(yán)謹(jǐn)?shù)睦吓平逃蛯W(xué)者作風(fēng),讓這位未來的工廠主在投資之前,把開工廠這件事拆分成了很多個(gè)環(huán)節(jié),從頭開始審視自己的事業(yè)從小作坊邁入工業(yè)時(shí)代的所需前提。

經(jīng)過大量走訪和調(diào)查,老約翰把工廠能夠成功的基礎(chǔ)條件歸納成了三點(diǎn):

1、技術(shù)達(dá)標(biāo):機(jī)器要能夠滿足生產(chǎn)差異化產(chǎn)品的需要,而不是論文與博覽館中的玩物。

2、充沛供給的能源和原料:煤炭和羊毛要能源源不斷運(yùn)送到自己的工廠里,否則工業(yè)生產(chǎn)很快將無以為繼。

3、完整的產(chǎn)業(yè)鏈:技術(shù)工人、技術(shù)專利、半成品、市場客戶,這些產(chǎn)業(yè)條件必須都能在倫敦附近找到,否則任何一個(gè)地方的缺失,都將讓自己的工廠化為泡影。

在確認(rèn)了泰晤士河沿岸可以滿足這些需求后,老約翰開始了行動(dòng)。當(dāng)時(shí)的他并不知道自己參與了被后世稱為改變?nèi)祟悮v史的大事件。但這些樸素的認(rèn)知,構(gòu)成了一顆最基本的“工業(yè)之心”。

然后讓我們將時(shí)間向后撥動(dòng)250年,AI技術(shù)已經(jīng)擁有這顆“工業(yè)之心”了嗎?

能夠觸發(fā)想象力的技術(shù)體系

跳回21世紀(jì)的此時(shí)此刻,我們不難發(fā)現(xiàn),一個(gè)技術(shù)是否能達(dá)成“工業(yè)化生產(chǎn)”的標(biāo)準(zhǔn),一方面取決于其價(jià)值與通用性,一方面也取決于其本身發(fā)展是否能夠滿足老約翰得出的三個(gè)工業(yè)結(jié)論:技術(shù)達(dá)標(biāo)、能源穩(wěn)定,與產(chǎn)業(yè)鏈完善。

回到百度大腦5.0的升級(jí),我們可以看到龐大的升級(jí)事項(xiàng)背后,其實(shí)正一一對(duì)應(yīng)著工業(yè)化大生產(chǎn)這三大基本條件。

首先來看AI的技術(shù)標(biāo)準(zhǔn)問題。到今天,差不多每個(gè)人都能夠說出幾種AI技術(shù),比如人臉識(shí)別、語音交互等等。但是對(duì)于復(fù)雜的工業(yè)場景來說,單一的語音或者機(jī)器視覺技術(shù)確實(shí)能夠解決特定問題,但顯然無法滿足復(fù)雜產(chǎn)業(yè)情景與定制化形態(tài)的綜合工業(yè)需求。

比如說在今天的AI開發(fā)者大會(huì)上,王海峰現(xiàn)場演示了與機(jī)器人茶博士的互動(dòng)。在多個(gè)AI技術(shù)的加持下,機(jī)器人茶博士能夠聽、看、理解并執(zhí)行復(fù)雜命令。其顯然具備了復(fù)雜工業(yè)應(yīng)用的可能,但卻是今天一般企業(yè)難以獨(dú)自研發(fā)和應(yīng)用的。

或許我們可以將AI技術(shù)走入復(fù)雜工業(yè)場景這件事中,畫上一條AI技術(shù)的產(chǎn)業(yè)應(yīng)用標(biāo)準(zhǔn)線:標(biāo)準(zhǔn)線以下,企業(yè)只能應(yīng)用到單一的AI技術(shù),要在自身產(chǎn)業(yè)縫隙中尋找這種技術(shù)應(yīng)用到何處;產(chǎn)業(yè)標(biāo)準(zhǔn)線以上,企業(yè)將獲得大量前沿技術(shù)組成的技術(shù)條件,在此基礎(chǔ)上發(fā)揮創(chuàng)造力甚至想象力。

這條標(biāo)準(zhǔn)線并不容易突破,去年百度大腦3.0中升級(jí)的多模態(tài)深度語義理解技術(shù),已經(jīng)讓我們看到了技術(shù)突圍的序曲。而在百度大腦5.0的技術(shù)升級(jí)中,眾多超越我們對(duì)AI傳統(tǒng)認(rèn)知的技術(shù)紛至沓來。

百度大腦5.0,在語音、視覺、語言和知識(shí)這幾大核心AI技術(shù)領(lǐng)域,發(fā)布6項(xiàng)技術(shù)突破:

語音方面,發(fā)布了流式多級(jí)截?cái)嘧⒁饬δP停⊿MLTA),使語音識(shí)別速度和識(shí)確度大幅提升,可解決中英文混合語音的識(shí)別;風(fēng)格遷移的語音合成技術(shù),僅需20句話就可以制作一個(gè)人的專屬聲音。

而在視覺方面,百度大腦發(fā)布了全球首個(gè)基于視頻流數(shù)據(jù)實(shí)時(shí)生成虛擬形象的“實(shí)時(shí)虛擬形象”技術(shù)方案,可以將一個(gè)人的形象和舉動(dòng),實(shí)時(shí)流暢轉(zhuǎn)換為另一個(gè)人的形象、話語、動(dòng)作、表情等。

語言層面,百度大腦升級(jí)了基于知識(shí)圖譜的視頻語義理解能力。而知識(shí)增強(qiáng)的語義理解框架ERNIE已經(jīng)累計(jì)學(xué)習(xí)10億以上的知識(shí),全面刷新了中英文雙語自然語言處理任務(wù)效果。

這些每個(gè)都值得單獨(dú)成文技術(shù)帶領(lǐng)下,百度大腦形成了適應(yīng)產(chǎn)業(yè)需求的全新形態(tài):

1、技術(shù)種類足夠豐富,AI開放能力達(dá)到210個(gè),能滿足各行業(yè)不同垂直需求。

2、技術(shù)深度達(dá)成突破,前沿技術(shù)能夠重新激發(fā)行業(yè)想象力,與行業(yè)深度結(jié)合。

3、技術(shù)體系的模塊化與融合能力,在百度大腦5.0版本中,已經(jīng)有大量技術(shù)呈現(xiàn)出多種技術(shù)融合的特征。而多模態(tài)與模塊融合,又是產(chǎn)業(yè)智能向深處發(fā)展的必要條件。

平心而論,雖然今天到處都在討論AI,但AI技術(shù)在核心算法上的突破我們卻聽到的極少??钢畲筇魬?zhàn)向前走的百度大腦,正在用底層技術(shù)換取產(chǎn)業(yè)AI的核心生存空間。

牢靠的計(jì)算底座

我們知道,AI三要素是算力、算法和數(shù)據(jù)。如果說算法的突破是生存技術(shù)與生產(chǎn)工具,數(shù)據(jù)是行業(yè)生產(chǎn)原材料,那么算力就是AI走入工業(yè)化生產(chǎn)時(shí)的能源。

百度大腦在算力基礎(chǔ)的進(jìn)展,可以看作對(duì)AI產(chǎn)業(yè)化應(yīng)用中,關(guān)于“工業(yè)能源”問題的解決方案。

在升級(jí)百度大腦5.0版本時(shí),王海峰同時(shí)宣布百度大腦構(gòu)建了一套端到端適配的AI計(jì)算系統(tǒng),通過芯片連接系統(tǒng)和調(diào)度的協(xié)同設(shè)計(jì)和技術(shù)創(chuàng)新,為開發(fā)者提供百萬TOPS的算力。

我們知道,今天的AI計(jì)算領(lǐng)域正在收獲廣泛的關(guān)注和研發(fā)投入。但從芯片層到開發(fā)、應(yīng)用層之間的計(jì)算架構(gòu)問題,是產(chǎn)業(yè)內(nèi)普遍處于缺失狀態(tài)的環(huán)節(jié)。因?yàn)橛?jì)算架構(gòu)不僅需要對(duì)芯片和底層算力的理解,同時(shí)需要對(duì)算法開發(fā)和模型訓(xùn)練具備深度理解,從而保證兩側(cè)之間的調(diào)度協(xié)同既不浪費(fèi)算力,又能充沛保證AI加速需求。

這個(gè)層面的進(jìn)化,可以說是百度大腦將自芯片到應(yīng)用層所有環(huán)節(jié)都進(jìn)行了創(chuàng)新補(bǔ)完。新的計(jì)算系統(tǒng)還可以緊密結(jié)合飛槳的訓(xùn)練架構(gòu),提供面向算法優(yōu)化的集聚效率。

結(jié)合去年發(fā)布的自研云端全功能AI芯片“昆侖”,以及剛剛發(fā)布的專為遠(yuǎn)場語音交互打造的芯片“鴻鵠”,圍繞百度大腦,已經(jīng)形成了通用AI加速芯片、專用AI加速芯片、端到端AI計(jì)算系統(tǒng)組成的“算力鐵三角”,穩(wěn)固了AI走向產(chǎn)業(yè)化所需要的能源供給。

AI操作系統(tǒng)的通衢

回到工業(yè)革命時(shí)的產(chǎn)業(yè)標(biāo)準(zhǔn),我們會(huì)發(fā)現(xiàn)還有一個(gè)問題是產(chǎn)業(yè)鏈搭建。或許大家會(huì)奇怪,百度大腦作為一個(gè)平臺(tái),如何滿足產(chǎn)業(yè)鏈的需求?

答案在于飛槳。被定義為AI時(shí)代操作系統(tǒng)的飛槳,其本身價(jià)值即是產(chǎn)業(yè)鏈的集成。在底層工具之外,飛槳還將扮演產(chǎn)業(yè)鏈中樞的角色,為開發(fā)者和產(chǎn)業(yè)應(yīng)用者提供產(chǎn)業(yè)向工具、定制化服務(wù),以及產(chǎn)業(yè)生態(tài)和新的市場觸達(dá)可能。

某種程度上來說,飛槳所處的AI操作系統(tǒng)層,恰好是處在算力層與應(yīng)用層的中間地帶。這個(gè)層面的平臺(tái),既保證了高可用性和生態(tài)活躍,同時(shí)也具備模塊化、標(biāo)準(zhǔn)化、自動(dòng)化的產(chǎn)業(yè)基礎(chǔ)平臺(tái)性質(zhì)。所以飛槳很可能成為產(chǎn)業(yè)AI時(shí)代的中樞,保證技術(shù)縱向與產(chǎn)業(yè)橫向的完整和高度開放。

飛槳的關(guān)鍵在于“通”,這件事在不久前的首屆百度深度學(xué)習(xí)開發(fā)者峰會(huì)上已經(jīng)得到了展示,飛槳的全面圖景容納了產(chǎn)業(yè)智能化的種種需求。不同領(lǐng)域、不同技術(shù)基礎(chǔ)、不同任務(wù)環(huán)節(jié)的AI開發(fā)者都可以在其中獲取幫助。

而在百度大腦5.0升級(jí)中,百度大腦與華為麒麟又聯(lián)合宣布了一個(gè)重磅的“通”。王海峰與華為消費(fèi)者BG軟件總裁王成錄博士聯(lián)合宣布,百度飛槳將與華為麒麟芯片進(jìn)行深度對(duì)接,用全球領(lǐng)先的端側(cè)AI芯片和中國自己的“AI時(shí)代操作系統(tǒng)”為端側(cè)AI提供最強(qiáng)勁算力、打造最好的深度學(xué)習(xí)運(yùn)行效率。

這條新的通衢,具有兩方面的產(chǎn)業(yè)意義。一來百度飛槳生態(tài)中的深度學(xué)習(xí)開發(fā)者,將可能獲得通向移動(dòng)AI時(shí)代與產(chǎn)業(yè)紀(jì)元的船票,觸發(fā)全新的市場機(jī)遇;二來華為HiAI開發(fā)生態(tài)將獲得更高效的開發(fā)效率與開發(fā)深度,真正借助百度的深度學(xué)習(xí)技術(shù)積累,將移動(dòng)AI推向更廣泛的發(fā)展空間。

AI操作系統(tǒng)+端側(cè)AI芯片,這個(gè)組合今天確實(shí)僅在中國才有。中國的產(chǎn)業(yè)智能時(shí)代,就孕育在這些技術(shù)差異化到產(chǎn)業(yè)差異化的機(jī)遇與變革里。

2019年,百度大腦的產(chǎn)業(yè)AI集結(jié)號(hào)

蒸汽機(jī)和煤炭代表的工業(yè)革命250年后,人類經(jīng)歷了電氣革命、信息革命,終于抵達(dá)了智能革命的門前。

但是智能革命的大門怎么敲,卻是一個(gè)正在探索進(jìn)行時(shí)的問題。而在AI走入產(chǎn)業(yè)智能化階段,有一個(gè)核心問題其實(shí)很少被大眾關(guān)注:量變。

我們都知道,AI在理論和邏輯上可以與產(chǎn)業(yè)結(jié)合,順著數(shù)據(jù)與邏輯推理,產(chǎn)業(yè)智能可以帶來難以想象的經(jīng)濟(jì)價(jià)值。然而拋開量變談事件發(fā)生的必然性,基本等于耍流氓。如果AI算力始終不夠、AI算法始終無法滿足復(fù)雜工業(yè)需求、AI產(chǎn)業(yè)在實(shí)踐中總是缺乏產(chǎn)業(yè)對(duì)接效率,最終的智能革命會(huì)發(fā)生嗎?

顯然,第四次工業(yè)革命不會(huì)孕育自空想。只有一點(diǎn)點(diǎn)技術(shù)突破積累,產(chǎn)業(yè)基礎(chǔ)逐漸完善,生態(tài)真正建立,最終恢弘的產(chǎn)業(yè)AI時(shí)代才能拉開大幕。

王海峰認(rèn)為,自2010年左右百度開始積累AI技術(shù),百度大腦其實(shí)就已經(jīng)進(jìn)入了0.0時(shí)代。百度大腦近十年一步步地走來,就是那個(gè)中國AI醞釀量變的過程。

百度大腦5.0的升級(jí)發(fā)布,對(duì)于AI行內(nèi)人來看有點(diǎn)像特效滿滿的好萊塢大片。每一項(xiàng)技術(shù)升級(jí)都足夠震撼,完全值得單獨(dú)拿出來舉辦一場發(fā)布會(huì)。但是百度大腦一次性拿出來了“一群”帶著足夠震顫感的創(chuàng)新升級(jí)。這或許能在一個(gè)側(cè)面表明,量變到質(zhì)變的時(shí)刻確實(shí)臨近了。

回顧過去,我們會(huì)發(fā)現(xiàn)百度大腦的每次升級(jí),都著重強(qiáng)調(diào)技術(shù)怎樣,而不是目標(biāo)怎樣。直到5.0,各層級(jí)的突破疊加后,百度大腦開始表露清晰的目標(biāo)——各環(huán)節(jié)達(dá)標(biāo),各條件被滿足之后,接下來百度大腦將作為AI時(shí)代的工業(yè)化大生產(chǎn)平臺(tái)。

至5.0時(shí)代,百度大腦的特質(zhì)已經(jīng)呈現(xiàn)為一個(gè)“三全平臺(tái)”:

1、全周期軟硬件一體化平臺(tái):從芯片、開發(fā)框架、應(yīng)用層,到硬件系統(tǒng)的全面貫穿,滿足工業(yè)級(jí)應(yīng)用和大規(guī)模部署所需的并發(fā)性、兼容性與穩(wěn)定性。

2、全應(yīng)用流程調(diào)用:從深度學(xué)習(xí)基礎(chǔ)技術(shù),到通用AI能力、應(yīng)用技術(shù)方案,再到定制化模型,以及最終的部署與集成,一個(gè)平臺(tái)打通AI產(chǎn)業(yè)應(yīng)用的全部流程,滿足產(chǎn)業(yè)落地需求。

3、全AI底層技術(shù)容納與融合:在語音、視覺、自然語言處理、知識(shí)圖譜領(lǐng)域具有廣泛多元的技術(shù)部署與技術(shù)領(lǐng)先性,滿足不同行業(yè)、不同企業(yè),不同應(yīng)用周期的需求。

“三全”的百度大腦5.0,接下來的任務(wù)是適應(yīng)更多行業(yè)的需求,讓更多企業(yè)加入塑造案例,搭建產(chǎn)業(yè)鏈,并且驗(yàn)證產(chǎn)業(yè)智能化的實(shí)際價(jià)值模型、各AI技術(shù)的不同行業(yè)適配度、總結(jié)產(chǎn)業(yè)智能化方法論,最終證明證明everyone can AI。

現(xiàn)代智人有七萬年的歷史,而人類6000年前才進(jìn)入青銅時(shí)代,250年前進(jìn)入了工業(yè)時(shí)代。某種意義上來說,人類生產(chǎn)文明的發(fā)展,就是一場不斷超越自身紀(jì)錄的加速跑。

兩個(gè)半世紀(jì)之后,第四次工業(yè)革命也好,首次智能革命也罷,我們能目測到一場改變確實(shí)正在發(fā)生。既然工業(yè)革命的步伐始終都在加快,那么為什么不能發(fā)生在今天,發(fā)生在中國,發(fā)生在百度大腦生態(tài)里,發(fā)生在你我身邊?

恰逢風(fēng)云,堪稱快哉。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論