本文來自微信公眾號“云數(shù)智觀察”,作者/濤哥。
前不久,OpenAI宣布,安卓版ChatGPT已正式上線。在連續(xù)幾個月ChatGPT的網(wǎng)站與移動客戶端的全球流量(PV)環(huán)比持續(xù)下降的情況下,安卓版ChatGPT的推出能否讓OpenAI再度引爆市場?
ChatGPT只是露出海平面的冰山一角,實際上由生成式AI、大模型等激發(fā)的新一輪AI應(yīng)用熱潮一直在持續(xù)升溫,且影響極其深遠。從2022年底ChatGPT的爆火開始,人們對大模型本身的關(guān)注度不斷高漲,國內(nèi)形形色色的大模型也不斷涌現(xiàn)。如今半年多過去了,人們對于大模型已經(jīng)見怪不怪,反而對大模型如何與行業(yè)場景相結(jié)合并加速落地傾注了極大的熱情。
中國科學(xué)技術(shù)信息研究所發(fā)布的《中國人工智能大模型地圖研究報告》顯示,截至2023年5月28日,國內(nèi)10億級參數(shù)規(guī)模以上的基礎(chǔ)大模型至少已有79個。所謂的“百模大戰(zhàn)”已經(jīng)箭在弦上。迎接數(shù)智化時代的到來,通用模型與垂類模型會相互傾軋還是各領(lǐng)風(fēng)騷?算力、數(shù)據(jù)與基礎(chǔ)軟件三大要素的同頻共振,將是決定大模型落地的關(guān)鍵?回答這些問題,從AI企業(yè)到行業(yè)用戶,將刷新大模型世界觀。
“壟斷派”與“擴散派”之間的博弈
大模型真的“大”到高不可攀嗎?實際上,業(yè)界關(guān)于大模型的研究早已有之,只不過ChatGPT是最先產(chǎn)品化并實現(xiàn)商業(yè)落地的?;仡櫄v史,在擁有絕對技術(shù)代差的情況下,Google搜索引擎確實具有一枝獨秀的資本。另一個例子,曾經(jīng)名噪一時的Netscape瀏覽器,在推出后差不多一年半的時間內(nèi)幾乎壟斷了整個市場,但最終還是不敵IE瀏覽器,黯然退出了歷史舞臺。由此可見,如果在技術(shù)上沒有絕對的代差,那么由產(chǎn)品飛輪帶來的紅利能夠維持多久,需要打上一個大大的問號。說回到ChatGPT,OpenAI利用產(chǎn)品飛輪拉開的差距,或許還不足以成就其市場壟斷地位。換句話說,在沒有絕對技術(shù)代差的情況下,僅依靠產(chǎn)品飛輪帶來的暫時領(lǐng)先,是有其脆弱性的。國內(nèi)大模型廠商的迅速崛起與產(chǎn)品上的持續(xù)迭代也證明了這一點,國內(nèi)外在大模型研發(fā)上的差距正逐漸縮小。
大模型市場上漸漸形成了兩大陣營——一方是以O(shè)penAI為代表的“壟斷派”,它們擁有核心技術(shù),以自有大模型為殺手锏;另一方可以稱作“技術(shù)擴散派”,包括芯片廠商、云算力廠商和數(shù)據(jù)基礎(chǔ)軟件廠商等,它們是AI生態(tài)中的一份子,致力于為大模型的落地、AI應(yīng)用的普及提供必要的支撐。
大模型的出現(xiàn)是AI技術(shù)上的一次突破,是眾多技術(shù)中的一個里程碑。以此為契機,每個企業(yè)都可以擁有或建立屬于自己的大模型,從而更好地達成自己的商業(yè)目標(biāo)。九章云極DataCanvas董事長方磊指出,相比曾經(jīng)的搜索引擎市場的博弈,大模型的壟斷派和技術(shù)擴散派之間的博弈很可能是一個更加長期、復(fù)雜、激烈的過程,在此過程中,給每個企業(yè)和組織帶來的影響也會更加深遠和深刻。有足夠技術(shù)能力的企業(yè)可以開發(fā)自己的大模型,而不具備單打獨斗能力的,則可以借助開源社區(qū)的力量達成目標(biāo)。從長遠來看,大模型終究會成為業(yè)務(wù)創(chuàng)新的剛需,但是獲取的途徑可以是多樣化的,同樣用戶的選擇也是多元化的。
ChatGPT、大模型積極的意義在于,它讓我們真實感受到,原來一些不敢想、不敢做的事情,現(xiàn)在已經(jīng)有技術(shù)可以勝任。特別值得一提的是,大模型對算力、云和基礎(chǔ)軟件帶來了顛覆性的影響。在云計算的上半場,主力是移動互聯(lián)網(wǎng),支持的主要是帶寬密集型應(yīng)用,比如網(wǎng)站、APP等,其最突出的需求是彈性擴容能力。在這個階段,公有云是重帶寬而輕算力的。但是進入云計算的下半場,隨著AI浪潮的又一次興起,整個市場的驅(qū)動力變成了算力,人們追求的是更高的效率和更低的成本。比如,完成一次大模型的訓(xùn)練是400萬元還是500萬元,這才是人們關(guān)注的焦點。“云計算邁入‘深水區(qū)’,算力和PaaS的銷售比例將越來越高。”方磊表示,“‘算力即是國力’。在‘東數(shù)西算’剛提出來時,有人可能會質(zhì)疑,真的需要這么多的算力嗎?但是在進入以AI為驅(qū)動的算力密集型應(yīng)用時代,人們不禁會感慨,‘東數(shù)西算’這一釋放算力需求的舉措真的是高瞻遠矚。由AI驅(qū)動的中國算力建設(shè)會掀起一次真正的‘狂飆’。”
對于大模型的落地而言,基礎(chǔ)軟件是重要的前提。這也是為什么越來越多的軟件廠商在大數(shù)據(jù)平臺、向量數(shù)據(jù)庫、湖倉一體等方面加大投入力度的重要原因。以前,基礎(chǔ)軟件存在較大的性能與成本上的差異化。因此,軟件、模型與硬件的統(tǒng)一優(yōu)化空間巨大。“強大而靈活的基礎(chǔ)軟件、開放彈性的白盒模型,再加上精通業(yè)務(wù)的專業(yè)人才,將加速實現(xiàn)大模型落地‘最后一公里’的跨越。”方磊表示,“為此,我們重磅推出了AIFS(AI Foundation Software)人工智能基礎(chǔ)軟件&DataPilot數(shù)據(jù)領(lǐng)航員產(chǎn)品體系,為AI應(yīng)用的落地夯實基礎(chǔ)設(shè)施平臺。”
通用模型、垂類模型相輔相成
2023年3月,彭博社發(fā)布了專為金融領(lǐng)域打造的大型語言模型(LLM)BloombergGPT。它基于彭博社的金融數(shù)據(jù)源,以開源的GPT-3框架為基礎(chǔ),構(gòu)建了一個3630億個標(biāo)簽的數(shù)據(jù)集,能夠更好地處理金融領(lǐng)域的數(shù)據(jù)和任務(wù)。通用大模型與面向行業(yè)和企業(yè)的垂類大模型,誰能在商業(yè)市場上最先叫響?
“有券商曾經(jīng)向我們咨詢,能否一起開發(fā)一個類似BloombergGPT的證券行業(yè)大模型?”有一段時間,方磊一直被客戶類似的詢問所包圍。從需求方來看,確實有一些大型央企以及金融行業(yè)頭部企業(yè)對大模型非常感興趣。一方面,出于業(yè)務(wù)創(chuàng)新的考慮;另一方面,也是因為“數(shù)據(jù)邊界”問題,由于與業(yè)務(wù)密切相關(guān)的私域數(shù)據(jù)不能“走出”公司,因而無法直接采用通用大模型,所以希望構(gòu)建屬于自己的垂類大模型。
從供給方來看,比如云算力廠商,就非常希望與九章云極DataCanvas這樣的基礎(chǔ)軟件廠商合作,推出打包的整體解決方案,讓大模型的訓(xùn)練更具效率且成本更優(yōu)。而這也正好契合了九章云極DataCanvas自身的定位,即“云中云”,為云算力廠商帶來基礎(chǔ)軟件方面的增值,便于行業(yè)用戶訓(xùn)練自己的垂類模型。
Databricks于2023年4月12日發(fā)布了Dolly 2.0。據(jù)稱這是業(yè)內(nèi)第一個開源的、遵循指令的LLM,用戶可在透明且免費提供的數(shù)據(jù)集上進行微調(diào),從而構(gòu)建自己的商業(yè)應(yīng)用程序。這也給了同類AI基礎(chǔ)軟件廠商很大的啟示和信心,通過構(gòu)建和優(yōu)化AI基礎(chǔ)設(shè)施、數(shù)據(jù)平臺和提供參考大模型,就能讓行業(yè)客戶更簡單、快捷地打造屬于自己的垂類大模型。
在大模型狂飆了半年多以后,人們對于通用大模型與垂類大模型的構(gòu)建、部署和應(yīng)用有了更深刻的認知,慢慢形成了一種共識:通用大模型會漸漸收斂,就像公有云那樣大浪淘沙,最終市場上只剩下最強的幾個;而市場上更多的則是面向行業(yè)和企業(yè)的垂類大模型。從未來發(fā)展趨勢看,在開源的以及通用可參考的大模型之上,融入更多行業(yè)知識和企業(yè)經(jīng)驗的垂類大模型將層出不窮。行業(yè)龍頭企業(yè)研發(fā)大模型,而中小企業(yè)在其上直接開發(fā)應(yīng)用,或許將成為一種定式。
一種更切合實際的作法是像九章云極DataCanvas那樣,“大小均涉及”。作為一款行業(yè)領(lǐng)先的人工智能應(yīng)用構(gòu)建基礎(chǔ)設(shè)施平臺,AIFS覆蓋了大模型的訓(xùn)練、精調(diào)、壓縮、部署、推理和監(jiān)控,以及小模型的全生命周期過程,為數(shù)據(jù)科學(xué)家、應(yīng)用程序開發(fā)人員和業(yè)務(wù)專家提供了一套工具,使不同角色的人員能夠相互協(xié)作,輕松處理數(shù)據(jù)并使用這些數(shù)據(jù)來開發(fā)、訓(xùn)練和部署任何規(guī)模的模型。一句話,AIFS旨在為用戶自主構(gòu)建全生命周期的“大+小”模型提供一站式支持。方磊表示:“我們致力于打造人工智能基礎(chǔ)設(shè)施,既要為企業(yè)構(gòu)建個性化、自主的大模型賦能,又可以將大模型與以往積淀的小模型相融合,應(yīng)用于業(yè)務(wù)。”
大模型確實威力巨大,但它是否可以放之四海皆準(zhǔn),解決一切問題呢?從目前來看,一些巨大的場景、尖端的應(yīng)用,還是要采用專用系統(tǒng),而碎片化的場景或者解決一些長尾的to C方面的問題,則更適合采用通用大模型。說到底,專與精是兩類不同的需求。一些行業(yè)的細分需求,寄希望于通過對通用大模型進行微調(diào)就能解決問題,實際上并不可行。一方面,通用大模型并不一定具備特定行業(yè)所需的能力;另一方面,即使你想對大模型進行微調(diào),可能也會因為大模型本身過于“沉重”,而力不從心。從這個角度說,垂類大模型是有其存在和發(fā)展的必要性。
AI普惠化 任重道遠
眾所周知,微軟已經(jīng)在Azure、Microsoft 365以及多款開發(fā)者工具中融入了人工智能功能。近日,微軟首席財務(wù)官Amy Hood在一次分析師電話會議上表示,公司未來還將進一步增加數(shù)據(jù)中心建設(shè)成本,以便更好地支撐人工智能服務(wù)。不僅是微軟,也不僅僅是美國華爾街,而是全世界都在熱切期待,生成式AI能夠為企業(yè)帶來真正的收益和增值。
今天,越來越多類ChatGPT的大模型正在不斷推出或在孕育之中,展現(xiàn)出巨大的技術(shù)和商業(yè)潛力,但欠缺的是足夠豐富的應(yīng)用場景,以及開放的、安全可靠、高效的人工智能基礎(chǔ)設(shè)施。“現(xiàn)階段,大模型的應(yīng)用還是由創(chuàng)新驅(qū)動的,并非完全由業(yè)務(wù)驅(qū)動。”方磊表示,“大模型的普惠化是當(dāng)務(wù)之急。”
國內(nèi)外主流的云廠商不僅推出了自有的大模型,更為大模型的落地提供了完善的支撐,既有產(chǎn)品和服務(wù)層面的,也有生態(tài)、渠道方面的。比如,亞馬遜云科技在近日舉行的紐約峰會上宣布,推出7項生成式AI創(chuàng)新,包括Amazon Bedrock新增基礎(chǔ)模型供應(yīng)商Cohere和全新基礎(chǔ)模型,Amazon EC2 P5實例正式可用,Amazon OpenSearch Serverless支持全新向量引擎,編程助手Amazon CodeWhisperer與Amazon Glue實現(xiàn)集成等。
IDC發(fā)布的《IDC中國AI公有云服務(wù)市場份額,2022》報告顯示:2022年中國AI公有云服務(wù)市場呈現(xiàn)出80.6%的正增長,整體市場規(guī)模達79.7億元。生成式AI、大模型等新的能力在公有云上將實現(xiàn)更快的更新迭代。
“大模型時代需要完整基礎(chǔ)設(shè)施升級,而不是依靠單個大模型解決所有問題;大模型的落地將解決更困難的問題,引起更深遠的影響,而它并不比小模型更容易。”方磊如是說。
大模型帶來的顛覆性并不只體現(xiàn)在大模型本身,而是將引發(fā)算力、數(shù)據(jù)、基礎(chǔ)軟件的一次最深刻的變革。未來,不管大模型如何演進迭代,高性能的基礎(chǔ)軟件與數(shù)據(jù)架構(gòu)都是不可或缺的“底座”,在AI惠普化的進程中發(fā)揮基礎(chǔ)與核心的作用。包括九章云極DataCanvas在內(nèi)的眾多致力于AI普惠化的廠商,將軟件工具和解決方案作為賦能廣大行業(yè)用戶的抓手,持續(xù)融入前沿AI創(chuàng)新技術(shù),助力其在大模型時代加速實現(xiàn)自主的數(shù)智化升級和AI規(guī)?;瘧?yīng)用。
毋庸置疑,大模型應(yīng)用終將走向普惠化。但在獲得技術(shù)紅利的過程中,人們也不得不在安全、監(jiān)管、合規(guī)等方面投入更多精力。負責(zé)任地使用AI,將規(guī)范、引導(dǎo)大模型又快又好地落地。