通義聽(tīng)悟誕生背后,AI大模型打響應(yīng)用第一槍

劉曠公眾號(hào)
從AI大模型涉及的層面來(lái)看,主要可以分為應(yīng)用層、模型層、框架層和芯片層等四個(gè)層次,而目前市面上大部分公司都還在模型層,深一點(diǎn)的涉及到框架層和芯片層的研究,前端應(yīng)用目前業(yè)內(nèi)還沒(méi)有。作為業(yè)內(nèi)首個(gè)公測(cè)的大模型應(yīng)用產(chǎn)品,通義聽(tīng)悟的示范作用極為明顯。

360截圖16251112669372.png

配圖來(lái)自Canva可畫(huà)

本文來(lái)自微信公眾號(hào)“劉曠”,文/劉曠公眾號(hào)。

2023年伊始,ChatGPT的爆火出圈,迅速引發(fā)了業(yè)界對(duì)于生成式AI應(yīng)用的關(guān)注,AI大模型的競(jìng)爭(zhēng)更是愈演愈烈。

作為參與其中的重要玩家,阿里云先是在4月11日舉行的阿里云峰會(huì)上,推出了通義千問(wèn)大模型。緊接著6月1日,阿里云宣布通義大模型進(jìn)展,聚焦音視頻內(nèi)容的AI新品“通義聽(tīng)悟”正式上線(xiàn),成為國(guó)內(nèi)首個(gè)開(kāi)放公測(cè)的大模型應(yīng)用產(chǎn)品,這意味著阿里云大語(yǔ)言模型,又向前端應(yīng)用邁進(jìn)了一大步。同時(shí)其基于AI大模型應(yīng)用的發(fā)布,也相當(dāng)于給當(dāng)前紛爭(zhēng)正勁的“大模型混戰(zhàn)”,擲下了一枚重磅炸彈。

千模大戰(zhàn)一觸即發(fā)

近幾個(gè)月,隨著微軟、谷歌、亞馬遜等硅谷大廠,紛紛公布大模型及AIGC進(jìn)展,通過(guò)AI搜索引擎、AI辦公軟件等一系列應(yīng)用打響AI競(jìng)賽,國(guó)內(nèi)互聯(lián)網(wǎng)云大廠也陸續(xù)全軍出擊了。不只是大廠就連很多初創(chuàng)企業(yè),VC/PE機(jī)構(gòu)、各行各業(yè)巨頭,都涌入了AI大模型賽道,試圖從中分一杯羹。據(jù)不完全統(tǒng)計(jì),目前公布推出AI大模型計(jì)劃的大企業(yè),不下于50多家,其他參與者更是不計(jì)其數(shù)。

從格局上來(lái)看,以“BATH”等為代表的互聯(lián)網(wǎng)科技公司,憑借場(chǎng)景、算力、全棧技術(shù)能力等綜合實(shí)力,穩(wěn)居行業(yè)第一梯隊(duì);而處于二線(xiàn)的重要行業(yè)企業(yè),如商湯科技、中國(guó)電信、京東、360等,則借助其在相關(guān)領(lǐng)域的影響力,位列行業(yè)第二梯隊(duì);緊隨各行業(yè)巨頭之后的是,包括美團(tuán)聯(lián)合創(chuàng)始人王慧文、前搜狗CEO王小川等在內(nèi)的各路知名創(chuàng)業(yè)者,他們有認(rèn)知、有機(jī)構(gòu)加持和相關(guān)背景,但由于還處于初始階段,因此在AI大模型混戰(zhàn)中暫居第三梯隊(duì)。

從分類(lèi)上來(lái)看,圍繞通用大模型以及專(zhuān)用大模型,各個(gè)企業(yè)都有自己的定位和分工。根據(jù)業(yè)內(nèi)人士介紹,目前國(guó)內(nèi)大模型主要可以分為兩類(lèi):一類(lèi)是對(duì)標(biāo)GPT的通用大模型,聚焦基礎(chǔ)層的公司,如阿里、百度等公司;另一類(lèi)是在開(kāi)源大模型基礎(chǔ)之上訓(xùn)練垂類(lèi)大模型,聚焦垂直行業(yè)的企業(yè),如應(yīng)用于金融、醫(yī)療、交通等領(lǐng)域的垂類(lèi)大模型。由于前者的技術(shù)要求高、成本大,因此當(dāng)前很多行業(yè)已經(jīng)開(kāi)始基于自身的情況,紛紛采取與通用大模型企業(yè)合作的方式,來(lái)訓(xùn)練適合自己行業(yè)的垂類(lèi)大模型了。

從產(chǎn)業(yè)鏈上來(lái)看,算力廠商、云服務(wù)廠商、前端應(yīng)用廠商都有參與,體系完整、聯(lián)系緊密且范圍寬廣。目前包括算力廠商英偉達(dá)、云服務(wù)廠商阿里云,前端應(yīng)用廠商如金山辦公、用友網(wǎng)絡(luò)、云從科技等,都在積極參與AI大模型的技術(shù)研發(fā)和場(chǎng)景落地??傊?dāng)前圍繞AI大模型的混戰(zhàn)正在陡然升溫。

通義聽(tīng)悟打響大模型應(yīng)用第一槍

而從AI大模型涉及的層面來(lái)看,主要可以分為應(yīng)用層、模型層、框架層和芯片層等四個(gè)層次,而目前市面上大部分公司都還在模型層,深一點(diǎn)的涉及到框架層和芯片層的研究,前端應(yīng)用目前業(yè)內(nèi)還沒(méi)有。作為業(yè)內(nèi)首個(gè)公測(cè)的大模型應(yīng)用產(chǎn)品,通義聽(tīng)悟的示范作用極為明顯。

一方面,相比底層技術(shù),靠近應(yīng)用前端的技術(shù)價(jià)值將更具想象空間??v觀所有的技術(shù)演變歷史不難發(fā)現(xiàn),技術(shù)的價(jià)值核心在于應(yīng)用普及程度,以及對(duì)用戶(hù)問(wèn)題解決的程度。正因?yàn)槿绱?,承?dān)這一職責(zé)和使命的前端應(yīng)用,往往具備更大的想象空間。

以6月1日阿里云推出的通義聽(tīng)悟?yàn)槔?,它通過(guò)接入阿里的通義大模型,其作用已經(jīng)不僅僅是簡(jiǎn)單的具備音視頻轉(zhuǎn)寫(xiě)的工具了,而是已經(jīng)成為幫助人們?cè)谝粢曨l場(chǎng)景之下的高效AI助手了。它為人們提供自動(dòng)做筆記、整理訪談、提取PPT等多種辦公服務(wù),而且能夠?qū)崿F(xiàn)音視頻轉(zhuǎn)化成圖文內(nèi)容、分章節(jié)摘要和總結(jié)全文觀點(diǎn)等能力,具備了“類(lèi)人”的高效檢索分類(lèi)能力。

360截圖16251112669372.png

此外,在細(xì)分場(chǎng)景中,它還具備不少“寶藏”功能,比如可以打開(kāi)Chrome插件,外語(yǔ)學(xué)習(xí)者和聽(tīng)障人士,可以借助雙語(yǔ)懸浮字幕條隨時(shí)隨地看無(wú)字幕視頻,日程沖突時(shí),聽(tīng)悟還可成為職場(chǎng)人士的“開(kāi)會(huì)替身”,在靜音情況下入會(huì)AI可代為記錄會(huì)議、整理要點(diǎn);轉(zhuǎn)寫(xiě)結(jié)果可下載為字幕文件,方便新媒體從業(yè)者視頻后期制作;聽(tīng)悟梳理的問(wèn)答回顧可以讓記者、分析師、律師、HR等群體整理訪談更高效??傊诮鉀Q具體場(chǎng)景問(wèn)題的能力上,它已經(jīng)超出了現(xiàn)有音視頻應(yīng)用的能力范疇,也刷新了以往用戶(hù)體驗(yàn)的上限,必將在業(yè)內(nèi)掀起不小的風(fēng)浪。

另一方面,從阿里云自身來(lái)說(shuō),通義千問(wèn)大模型剛剛對(duì)外推出不久,就能夠迅速推出基于AI大模型的技術(shù)應(yīng)用,說(shuō)明阿里云AI大模型的確已經(jīng)比較成熟,具備了衍生AI應(yīng)用的能力。

從模型層到應(yīng)用層,從AI大模型到大模型應(yīng)用的誕生,看似簡(jiǎn)單實(shí)則實(shí)現(xiàn)起來(lái)并不容易。通常來(lái)說(shuō),垂類(lèi)應(yīng)用是依托于通用大模型這個(gè)技術(shù)底座來(lái)實(shí)現(xiàn)的,撇開(kāi)通用大模型的話(huà),這些通常無(wú)法實(shí)現(xiàn),而這要求其所依托的通用大模型本身是足夠成熟的,否則其很難推出相對(duì)好用且超出現(xiàn)有產(chǎn)品能力的應(yīng)用。拿通義聽(tīng)悟來(lái)說(shuō),其所呈現(xiàn)的技術(shù)實(shí)力,在業(yè)內(nèi)并不是所有玩家都有的。

全體系A(chǔ)I基礎(chǔ)設(shè)施成決勝關(guān)鍵

從AI大模型本身所需要的動(dòng)軋千億的參數(shù)訓(xùn)練要求來(lái)說(shuō),其推進(jìn)的難度和復(fù)雜性可能遠(yuǎn)超外界想象。長(zhǎng)遠(yuǎn)來(lái)看,具備全棧AI大模型技術(shù)能力和基礎(chǔ)設(shè)施能力的企業(yè),才能夠走得更遠(yuǎn)。

一來(lái),由于生成式AI的發(fā)展速度遠(yuǎn)超外界預(yù)期,任何單一環(huán)節(jié)的進(jìn)步對(duì)整體的大模型訓(xùn)練促進(jìn)作用有限。據(jù)OpenAI測(cè)算,自2012年以來(lái),全球頭部的AI模型訓(xùn)練算力需求,3-4個(gè)月翻一番,每年增長(zhǎng)幅度高達(dá)10倍。但根據(jù)摩爾定律,芯片計(jì)算性能每隔18-24個(gè)月才能翻一番,也就說(shuō)是芯片性能遠(yuǎn)遠(yuǎn)跟不上AI大模型的發(fā)展要求。具體到相關(guān)領(lǐng)域來(lái)說(shuō),基于CPU的計(jì)算體系,難以滿(mǎn)足大模型訓(xùn)練之下,高帶寬、低時(shí)延的網(wǎng)絡(luò)傳輸要求,這些問(wèn)題的解決,依靠單一的“堆砌算力”很難短期內(nèi)見(jiàn)效,并且可能并不經(jīng)濟(jì),必須借助來(lái)自算法、算力、框架等多層次的整體系統(tǒng)支持,才能更好地應(yīng)對(duì)這種變化。

二來(lái),由于發(fā)展通用大模型所需要的算力需求大、推理訓(xùn)練成本高、數(shù)據(jù)量要求高,導(dǎo)致其本身的門(mén)檻非常高,不具備全棧大模型研發(fā)、場(chǎng)景落地能力、生態(tài)開(kāi)放能力的公司,很難保持較快的更迭速度,很容易被淘汰出局。據(jù)業(yè)內(nèi)人士分析,要做成一個(gè)成功的可對(duì)外商業(yè)化輸出的通用大模型,需要廠商擁有全棧大模型訓(xùn)練與研發(fā)能力,業(yè)務(wù)場(chǎng)景落地經(jīng)驗(yàn)、AI安全治理舉措,以及生態(tài)開(kāi)放性等核心優(yōu)勢(shì),而一般的企業(yè)很難完全具備這些能力。

而阿里云作為亞洲第一、全球第三的云計(jì)算服務(wù)商,其擁有國(guó)內(nèi)最強(qiáng)的算力支撐體系。比如,阿里云飛天云操作系統(tǒng),可實(shí)現(xiàn)單集群10萬(wàn)臺(tái)規(guī)模、千億文件數(shù)運(yùn)算能力,其飛天智算平臺(tái)可實(shí)現(xiàn)千卡并行效率達(dá)到90%,自研網(wǎng)絡(luò)架構(gòu)可對(duì)萬(wàn)卡規(guī)模的AI集群,提供無(wú)擁堵、高性能的集群通訊能力,阿里云自有的深度學(xué)習(xí)平臺(tái)PAI,可以將計(jì)算資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍,推理效率提升6倍。另外,阿里云還牽頭建立了國(guó)內(nèi)最大規(guī)模的AI模型服務(wù)社區(qū)“魔搭”,降低大模型開(kāi)發(fā)成本、助力AI普惠;算法方面,阿里在語(yǔ)言以及多模態(tài)能力、超大模型、通用統(tǒng)一模型等多個(gè)技術(shù)維度,處于國(guó)內(nèi)第一梯隊(duì),這都是阿里通義大模型能夠迅速“出圈”的核心原因。

三來(lái),從商業(yè)可能性來(lái)看,擁有全體系A(chǔ)I基礎(chǔ)設(shè)施能力的公司,在MaaS(模型即服務(wù))到來(lái)之后擁有更大的商業(yè)價(jià)值,在市場(chǎng)競(jìng)爭(zhēng)方面會(huì)有更大的“回旋余地”。以阿里云為例,其后期既可以通過(guò)提供通用大模型服務(wù),獲取平臺(tái)服務(wù)費(fèi);也可以出租算力和推訓(xùn)平臺(tái),賺取租金,變現(xiàn)路徑相對(duì)更多,在市場(chǎng)競(jìng)爭(zhēng)中可以根據(jù)情況靈活調(diào)整產(chǎn)品定價(jià),以應(yīng)對(duì)經(jīng)營(yíng)挑戰(zhàn)。

360截圖16251112669372.png

產(chǎn)業(yè)迎來(lái)AI惠普時(shí)代

隨著AI大模型應(yīng)用的誕生,以深度AI普惠為特征的全新時(shí)代,也在逐漸拉開(kāi)帷幕,AI深度嵌入產(chǎn)業(yè)實(shí)體,將成為不可逆轉(zhuǎn)的行業(yè)趨勢(shì)。

一方面,通用大模型的高門(mén)檻和廣泛的垂類(lèi)領(lǐng)域差異化需求,決定了基于通用大模型的專(zhuān)屬大模型和產(chǎn)業(yè)應(yīng)用,會(huì)成為未來(lái)主流的應(yīng)用方向,推動(dòng)AI加速進(jìn)入千行百業(yè)。正如前文所述,通用大模型的高門(mén)檻,決定了國(guó)內(nèi)外能夠做成通用大模型的公司只是少數(shù),而且隨著AI模型變大,AI產(chǎn)業(yè)正從“手工作坊”組成的輕工業(yè)走向集約化生產(chǎn),需要高性能、低成本的體系化基礎(chǔ)設(shè)施,才能完成工業(yè)化生產(chǎn)。

這種能力不僅很多中小企業(yè)沒(méi)有,即便是對(duì)于各行業(yè)頭部企業(yè),從0到1優(yōu)化大模型訓(xùn)練,本身也并不經(jīng)濟(jì),各行各業(yè)都需要成本足夠低的AI基礎(chǔ)設(shè)施。而且對(duì)于現(xiàn)有的廠商而言,繼續(xù)加入這個(gè)領(lǐng)域“重復(fù)造輪子”并無(wú)多大必要。相比之下,垂類(lèi)大模型本身的訓(xùn)練成本相對(duì)較低,而且一些專(zhuān)業(yè)領(lǐng)域擁有豐富數(shù)據(jù)場(chǎng)景的公司,做垂直大模型條件更好、數(shù)據(jù)質(zhì)量更優(yōu),推出的產(chǎn)品更能夠適應(yīng)垂類(lèi)行業(yè)需求,因此未來(lái)各類(lèi)垂類(lèi)行業(yè)GPT,或?qū)⒊蔀橹髁鞔竽P蛻?yīng)用,推進(jìn)AI迅速滲入產(chǎn)業(yè)。

另一方面,發(fā)展AI大模型的短期瓶頸是算力,長(zhǎng)期來(lái)看是數(shù)據(jù),因此高質(zhì)量的前端應(yīng)用有助于加速企業(yè)積累充分的數(shù)據(jù)資產(chǎn),增強(qiáng)自身長(zhǎng)期競(jìng)爭(zhēng)力,加速產(chǎn)業(yè)應(yīng)用普惠進(jìn)程。當(dāng)前來(lái)看,大模型的迅速迭代和進(jìn)化,迫使所有的參與玩家不斷累積算力資源,從芯片、云服務(wù)等各方面來(lái)優(yōu)化配置,保證大模型訓(xùn)練所需要的算力支持。不過(guò),從更長(zhǎng)遠(yuǎn)來(lái)看,訓(xùn)練AI大模型的算法還在不斷優(yōu)化調(diào)整之中,未來(lái)隨著算法的突破,算力可能不再是瓶頸,而高質(zhì)量的數(shù)據(jù)資源將成為一種稀缺的資源,會(huì)受到更多關(guān)注。

作為業(yè)內(nèi)首個(gè)基于AI大模型的應(yīng)用,通義聽(tīng)悟的面世,有利于阿里加速積累優(yōu)質(zhì)數(shù)據(jù)資源,加速產(chǎn)業(yè)普惠進(jìn)程,為更長(zhǎng)期的發(fā)展奠定良好基礎(chǔ)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶(hù)觀點(diǎn))

更多
暫無(wú)評(píng)論