本文來自微信公眾號(hào)“電子發(fā)燒友網(wǎng)”,作者/李彎彎。
近段時(shí)間,由OpenAI推出的ChatGPT火遍全球,它幾乎可以生成任何形式的文本,從寫文章、編寫代碼,到回答復(fù)雜的數(shù)學(xué)問題。上線近兩個(gè)月,ChatGPT的注冊(cè)用戶就達(dá)到1億,成為史上用戶破億速度最快的軟件之一。
ChatGPT的爆火給生成式AI的應(yīng)用帶來更多可能性,AI語(yǔ)言處理大模型也隨之進(jìn)入全球角逐的新階段。在國(guó)內(nèi),百度、阿里等頭部互聯(lián)網(wǎng)企業(yè)都已經(jīng)宣布有相關(guān)的研究。那么,國(guó)內(nèi)在發(fā)展AI語(yǔ)言處理大模型方面是否具備相應(yīng)的條件,國(guó)產(chǎn)廠商可以如何把握這個(gè)機(jī)會(huì)?
在AIGC大模型發(fā)展上,國(guó)內(nèi)具備哪些條件
從目前的情況來看,國(guó)內(nèi)在發(fā)展這類大模型上可以說已經(jīng)具備一定的條件。比如在算法層面,國(guó)內(nèi)的互聯(lián)網(wǎng)公司以及一些研究院,已經(jīng)具備研究語(yǔ)言大模型的基礎(chǔ);在算力層面,國(guó)內(nèi)的AI大算力芯片,以及在算力集群方面,也已經(jīng)取得長(zhǎng)足進(jìn)步;在部署和服務(wù)方面,國(guó)內(nèi)的云服務(wù)廠商可以提供各種服務(wù)渠道,讓基礎(chǔ)設(shè)施能夠便捷實(shí)用,使算法在大算力平臺(tái)上很好的部署。
不足之處在于,第一,ChatGPT能夠達(dá)到現(xiàn)在的水平,是因?yàn)樗吣觊L(zhǎng)時(shí)間的產(chǎn)品迭代,從GPT-1到GPT-2再到ChatGPT期間有大量的用戶使用,在數(shù)據(jù)集的標(biāo)注、分揀、精煉上,也有很多創(chuàng)新的工程化步驟。對(duì)于中文大模型來說,差距在于如何獲得更多、更有意義,更有價(jià)值的語(yǔ)義語(yǔ)料,如何在算法迭代、大量的用戶使用之后,使能更大規(guī)模模型的推進(jìn)。
第二,大模型的訓(xùn)練離不開大算力,燧原科技創(chuàng)始人兼COO張亞林在接受電子發(fā)燒友采訪的時(shí)候表示,目前國(guó)際廠商的高算力芯片在中國(guó)仍然具有標(biāo)桿效應(yīng)。
第三,在生態(tài)建設(shè)上,無(wú)論是現(xiàn)在很火的ChatGPT,還是之前備受關(guān)注的生成式AI公司Stability、Runway,他們?cè)诨A(chǔ)模型、大模型的模型開發(fā)庫(kù),用戶大量的應(yīng)用上,都已經(jīng)形成了可以觸達(dá)終端用戶的商業(yè)模式。而在國(guó)內(nèi),目前還沒樹立起這樣全棧的生態(tài)和商業(yè)模式。
不過,雖然國(guó)內(nèi)在發(fā)展這類大模型方面存在不足,整體而言這對(duì)于國(guó)內(nèi)廠商來是個(gè)很好的機(jī)會(huì)。從算力方面來看,人工智能技術(shù)的發(fā)展和應(yīng)用本身對(duì)算力的需求極大,目前全球大模型訓(xùn)練的算力基本以英偉達(dá)為主。
隨著ChatGPT的爆火,國(guó)內(nèi)各類生成式AI大模型的訓(xùn)練和部署將會(huì)加速,這對(duì)國(guó)內(nèi)人工智能算力廠商來說無(wú)疑是個(gè)機(jī)會(huì),國(guó)內(nèi)廠商需要思考如何通過自身的算力發(fā)展,來持續(xù)推動(dòng)中國(guó)本土大模型的進(jìn)步。
ChatGPT爆火,算力廠商如何把握機(jī)會(huì)
那么AIGC大模型的訓(xùn)練和推理,對(duì)算力供應(yīng)商有怎樣的要求呢?對(duì)此,張亞林談到了幾點(diǎn):首先是芯片,包括芯片的有效算力、架構(gòu)的創(chuàng)新性、以及芯片的性價(jià)比等,這些將會(huì)決定算力集群是否具備足夠的市場(chǎng)競(jìng)爭(zhēng)力。
其次是集群系統(tǒng),一個(gè)超大規(guī)模的集群系統(tǒng),由幾千張加速卡、幾千顆芯片組成,還包括互聯(lián)和存儲(chǔ)。除了加速卡的性能之外,還要看整個(gè)系統(tǒng)的穩(wěn)定性、集群的互聯(lián)效率、存儲(chǔ)的效率、以及分布式系統(tǒng)運(yùn)行的穩(wěn)定性。
第三是軟件生態(tài),它是否能夠支持整個(gè)大模型的調(diào)試和開發(fā)。這要求企業(yè)不僅要能提供基礎(chǔ)的軟件棧,還要能夠提供大模型能跑的分布式框架,讓調(diào)試者和開發(fā)者能夠更好的調(diào)試和開發(fā)這些大模型,就是說還需要具備一個(gè)整套的軟件棧。
張亞林認(rèn)為,從芯片設(shè)計(jì),集群的穩(wěn)定性,到整個(gè)軟件棧的完備性,這對(duì)于初創(chuàng)公司來說還有一段很長(zhǎng)的路要走,需要持續(xù)的產(chǎn)品迭代。
那么國(guó)內(nèi)在AI大算力芯片或者GPGPU賽道的廠商,如何能夠抓住ChatGPT這波浪潮帶來的機(jī)會(huì)呢?首先,它需要做出高性價(jià)比的算力,現(xiàn)在來說這樣的算力還太貴,以致于并不是所有人都能夠玩得起這場(chǎng)游戲,企業(yè)需要能夠推出高性價(jià)比的集群,讓整個(gè)ChatGPT類大模型的開發(fā)更經(jīng)濟(jì)。
第二,最終呈現(xiàn)在用戶側(cè)的是整個(gè)的集群系統(tǒng),就如上文所言,其中包括幾千張加速卡,幾千顆芯片,大量的互聯(lián)和存儲(chǔ),很多服務(wù)器。因此,國(guó)內(nèi)的AI大芯片廠商需要能夠站到系統(tǒng)的角度去看問題,包括整個(gè)系統(tǒng)的設(shè)計(jì)、調(diào)動(dòng)能力、讓用戶易用,這些跟芯片本身的設(shè)計(jì)和開發(fā)能力會(huì)不太一樣。
第三,如何讓用戶在開發(fā)過程中做到高效和易用。訓(xùn)練本身是一個(gè)很復(fù)雜、很廣闊的生態(tài)。今天的大模型,其實(shí)是把很廣闊的需求濃縮到了一些比較確定的大模型上,這讓整個(gè)訓(xùn)練從很廣闊的發(fā)散狀態(tài),變成了有可能聚焦在某一些維度上就能夠很好的支撐和優(yōu)化的狀態(tài)。
這給國(guó)內(nèi)很多AI廠商提供了很好的思路,企業(yè)可以聚焦在比如大模型集群化的領(lǐng)域。國(guó)內(nèi)廠商可以由此切入,誰(shuí)能夠在這樣一個(gè)大規(guī)模AI生成領(lǐng)域,把訓(xùn)練和推理整套集群系統(tǒng),做得更優(yōu)化、更完整、更易用,誰(shuí)就能夠在這場(chǎng)游戲中拔得先機(jī)。
在人工智能算力領(lǐng)域,燧原科技已經(jīng)有了很深的積累。目前燧原科技已經(jīng)迭代了兩代訓(xùn)練和推理產(chǎn)品,第三代也已經(jīng)在研發(fā)中。此外,燧原科技已經(jīng)在科研領(lǐng)域和智慧城市的應(yīng)用中落地了訓(xùn)練和推理的超千卡算力集群。張亞林表示,類似ChatGPT這樣的AIGC生成式模型,對(duì)于燧原科技而言是個(gè)機(jī)遇,公司可以把已經(jīng)積累的系統(tǒng)集群的經(jīng)驗(yàn)推廣到更多的客戶賽道上,幫助客戶使能更多大模型的生成。
同時(shí),面對(duì)生成式AI大模型帶來的發(fā)展機(jī)會(huì),燧原科技將從多個(gè)方面去做深度布局。第一是持續(xù)推進(jìn)和迭代集群化產(chǎn)品和軟件生態(tài)棧,與更多戰(zhàn)略用戶一起優(yōu)化集群系統(tǒng),提高性價(jià)比和能效比;第二是與國(guó)內(nèi)云服務(wù)商進(jìn)行深度合作,通過他們的云服務(wù)平臺(tái),觸達(dá)更多To B和To C用戶;第三是與國(guó)家相關(guān)機(jī)構(gòu)合作制定更多關(guān)于AIGC標(biāo)準(zhǔn)和白皮書,探討未來發(fā)展方向,與國(guó)家政策和標(biāo)準(zhǔn)融合;第四是與更多大模型廠商、云平臺(tái)廠商等一起共創(chuàng)生態(tài)。
小結(jié)
整體而言,雖然目前ChatGPT仍然還存在一些問題,不過它的強(qiáng)大功能卻是有目共睹。對(duì)于人們的生產(chǎn)生活來說,ChatGPT等大模型的發(fā)展將會(huì)帶來勞動(dòng)力的釋放。
未來隨著模型的進(jìn)一步擴(kuò)大,數(shù)據(jù)集進(jìn)一步加強(qiáng),AIGC這類巨大模型將會(huì)愈發(fā)智能,它也將會(huì)更加逼近人們所說的通用人工智能(AGI),而這個(gè)過程必然給相關(guān)產(chǎn)業(yè)帶來機(jī)會(huì),包括算力,而對(duì)于用戶來說,廠商如何提供更高能效比、性價(jià)比的算力是關(guān)鍵。