大模型混戰(zhàn)背后:科技“食物鏈”頂端是否會出現(xiàn)新霸主?

志剛
從谷歌的阿爾法狗到Open AI的ChatGPT,人工智能掀起了一波新的狂歡,國內(nèi)的互聯(lián)網(wǎng)科技圈的“顛覆”暗潮也在不斷涌動。新誕生的AI大模型越來越多,“參戰(zhàn)”AI大模型的玩家也有些數(shù)不過來。

360截圖16251112669372.png

圖片來源@視覺中國

本文來自鈦媒體,文|互聯(lián)網(wǎng)江湖,作者|志剛。

如果說,現(xiàn)在的我們正處于一個巨大的軟件互聯(lián)網(wǎng)生態(tài)系統(tǒng)中。那么,未來我們或許會進(jìn)入一個巨大的人工智能互聯(lián)網(wǎng)生態(tài)系統(tǒng)。

從谷歌的阿爾法狗到Open AI的ChatGPT,人工智能掀起了一波新的狂歡,國內(nèi)的互聯(lián)網(wǎng)科技圈的“顛覆”暗潮也在不斷涌動。新誕生的AI大模型越來越多,“參戰(zhàn)”AI大模型的玩家也有些數(shù)不過來。

據(jù)天眼查APP顯示,截至目前,人工智能相關(guān)企業(yè)近267.4萬余家,其中,2023年一季度新增注冊企業(yè)17萬余家,與2022年同期相比,上漲6.8%。

企業(yè)以雷霆之勢迅速入局,競爭烈度已經(jīng)到了以“天”為時間單位的地步。這一奇景背后,行業(yè)已經(jīng)展露出初步的崢嶸頭角,對當(dāng)下“諸神之戰(zhàn)”判斷和洞察就顯得尤為重要。

AI大模型:雛形初顯,格局崢嶸

實(shí)際上,人工智能已經(jīng)經(jīng)歷了多次風(fēng)口以及寒冬的“輪回”。

在人工智能元年1956年,出現(xiàn)了機(jī)器定理證明、跳棋程序等一批令人矚目的研究成果;1970年,出現(xiàn)了能夠分析語義、理解語言的人機(jī)對話系統(tǒng)SHRDLU;1997年,深藍(lán)DeepBlue戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫;2016年,谷歌阿爾法狗與世界圍棋冠軍李世石“人機(jī)大戰(zhàn)”,被寫入歷史......

每一次人工智能的高潮,都在推動人工智能崛起的到來,但往往不久后,又會陷入一段時間的冷寂之中。

不可否認(rèn)的是,在多次周期之后,人工智能已經(jīng)開始實(shí)現(xiàn)從技術(shù)研發(fā)向成果轉(zhuǎn)化的目標(biāo),從不能用突破到不好用,再從不好用突破到可以用,我們似乎離人工智能的終點(diǎn)只有一步之遙。

本質(zhì)上來說,此次大模型“諸神之戰(zhàn)”中的各位玩家,也是在瘋狂預(yù)判人工智能這場馬拉松的下一個突破節(jié)點(diǎn)。盡管爆發(fā)時間尚短,但可以發(fā)現(xiàn),目前國內(nèi)的大模型格局雛形已經(jīng)初步顯露。如果按目前發(fā)展趨勢,國內(nèi)大模型玩家大致可以劃分為這么幾派:

首先是以百度、阿里為代表的的“巨頭派”,巨頭入場,但不再是“清場”。

被稱為中國版ChatGPT的百度“文心一言”早已極速發(fā)布。百度展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個使用場景中的綜合能力。

阿里云旗下大模型產(chǎn)品通義千問也已面世。據(jù)介紹,通義千問的功能包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持等。張勇表示,面向AI時代,所有產(chǎn)品都值得用大模型重做一次。

騰訊面向大模型訓(xùn)練,發(fā)布“超強(qiáng)算力集群”,要助力企業(yè)云上訓(xùn)練AI大模型,解決中小企業(yè)和創(chuàng)業(yè)公司的算力壓力。

作為顛覆者,身處寶座之上,往往更害怕被顛覆。作為當(dāng)今互聯(lián)網(wǎng)巨頭,實(shí)際上每一步都更加心驚膽戰(zhàn),唯恐一步不慎,當(dāng)下榮耀化為昔日榮光。而大模型就是一個這樣危險的因素,巨頭很難允許大模型被掌握在其他人手中。

其次是商湯、云從、科大訊飛等“堅守派”。在人們看來,人工智能似乎已有“新”、“舊”之分,但這些企業(yè)無論風(fēng)口與低谷,始終堅守在AI戰(zhàn)線。

3月30日,云從科技披露定增預(yù)案,擬向不超過35名發(fā)行對象發(fā)行股份不超過2.22億股,募集資金不超過36.35億元,擬全部用于云從“行業(yè)精靈”大模型研發(fā)項(xiàng)目。

商湯也推出了商湯日日新大模型體系。據(jù)悉,日日新大模型體系主要包括自然語言生成、文生圖、感知模型標(biāo)注、以及模型研發(fā)功能,即“商量(中文語言模型)”、“秒畫(文生圖)”、“如影(數(shù)字人視頻生成)”、“瓊宇(場景生成)”,“格物(物體生成)”。

5月6日,科大訊飛召開了名為“訊飛星火認(rèn)知大模型”的成果發(fā)布會,同步發(fā)布了訊飛AI學(xué)習(xí)機(jī)、訊飛聽見、訊飛智能辦公本、訊飛智能座艙和訊飛開放平臺等5項(xiàng)應(yīng)用成果??拼笥嶏w董事長劉慶峰表示,根據(jù)現(xiàn)在測試結(jié)果,星火在國內(nèi)可測的現(xiàn)有系統(tǒng)中遙遙領(lǐng)先。

“臥榻之側(cè)”,豈容被他人顛覆。在自己的人工智能主場,原有的人工智能玩家更不能輕易被外來者跨維度打敗。

另外,還有小米、360、知乎等“互聯(lián)網(wǎng)科技派”。即便未躋身互聯(lián)網(wǎng)頭部,但終究不甘于平庸。

360集團(tuán)創(chuàng)始人周鴻祎對外展示了360版的GPT大語言模型,公布了基于這一大模型開發(fā)的人工智能產(chǎn)品矩陣“360智腦”,落地搜索場景并面向企業(yè)用戶開放內(nèi)測。

知乎創(chuàng)始人、董事長兼CEO周源在“2023知乎發(fā)現(xiàn)大會”上宣布,知乎聯(lián)合面壁智能發(fā)布中文大模型“知海圖AI”。知乎方面表示,在特定場景中,把“知海圖AI”大模型的效果與GPT-4進(jìn)行了比較,兩個模型幾乎是持平的。

據(jù)澎湃新聞報道,小米集團(tuán)發(fā)布內(nèi)部郵件,任命欒劍擔(dān)任技術(shù)委員會AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人,向技術(shù)委員會副主席、AI實(shí)驗(yàn)室主任王斌匯報。

曾經(jīng)輝煌過以及正追求互聯(lián)網(wǎng)高光的玩家們,終于撞上當(dāng)下愈發(fā)稀缺的“翻盤”機(jī)遇,他們或許會對大模型會寄予更高的期望。

最后,是王小川、王慧文、李開復(fù)等“互聯(lián)網(wǎng)藍(lán)血派”?;ヂ?lián)網(wǎng)大佬們也已隨之沸騰。

王慧文在社交平臺發(fā)文宣布進(jìn)入AI領(lǐng)域再創(chuàng)業(yè)并高調(diào)招攬AI人才,其創(chuàng)辦的光年之外已正式開張,近期已啟動第二輪融資,投前估值約10億美元。

李開復(fù)宣布籌辦的新公司Project AI 2.0目前已正式開啟團(tuán)隊(duì)組建。李開復(fù)在朋友圈表示:“我正在親自籌組的Project AI 2.0,是一個致力打造AI 2.0全新平臺和AI-first生產(chǎn)力應(yīng)用的全球化公司。

王小川正式宣布入局中國大模型創(chuàng)業(yè),和前搜狗COO茹立云聯(lián)合創(chuàng)立人工智能公司。王小川在公開信中表示,新公司名為“百川智能”,目前已初步組建了50人的團(tuán)隊(duì),獲5000萬美元啟動資金。

互聯(lián)網(wǎng)藍(lán)血們往往已經(jīng)實(shí)現(xiàn)了財富自由,人身同樣自由,出錢又出人,不求其他,只為假設(shè)一切、打翻一切,只求干一票前無古人的大事。

從大模型玩家各自出身來看,大致如此。但即便相同“派別”的玩家,也未必會抱有相同的發(fā)展目標(biāo),玩家們在大模型的發(fā)展邏輯上也各有不同。

真正有實(shí)力的玩家,往往是奔著大模型“底層路線”去探索。真正坐在人工智能牌桌前,參與這場歷史賭局。

科大訊飛內(nèi)部人士對互聯(lián)網(wǎng)江湖表示,大模型技術(shù)背后最核心的是認(rèn)知智能,科大訊飛在認(rèn)知智能上已有近10年布局,取得多項(xiàng)成果。在ChatGPT推出后,公司迅速進(jìn)行技術(shù)和研發(fā)體系的驗(yàn)證,并在去年12月迅速啟動大模型的專項(xiàng)攻關(guān)。

而剩下的玩家,大都走的是“應(yīng)用層路線”。大模型未來潛力絕不止于此,只要能夠在大模型產(chǎn)業(yè)鏈發(fā)展過程中分一杯羹,就有可能給企業(yè)帶來極大發(fā)展空間。

百家云在這些企業(yè)中較為典型,百家云對互聯(lián)網(wǎng)江湖表示,目前大模型在應(yīng)用層主要面臨兩大問題:

一個是市場培育問題。當(dāng)下大模型仍然處于一個教育市場、教育客戶的階段,作為一項(xiàng)新技術(shù),需求方對于大模型的能力邊界認(rèn)知還不夠清晰,客戶對于大模型的技術(shù)實(shí)現(xiàn)程度、具體細(xì)分場景落地能力都還不太了解,這需要大模型企業(yè)和客戶共同進(jìn)步。

百家云舉了個例子,此前大模型技術(shù)主要被運(yùn)用于機(jī)器翻譯上,大概能達(dá)到80%的準(zhǔn)確率,再加上簡單的人力完善才可使用?,F(xiàn)在AI人臉識別已經(jīng)較為成熟,在銀行廣泛使用,百家云在做的工廠工序檢測場景下的大模型也沒有問題。而手勢識別場景下的技術(shù),離落地還有一段距離。

另一個是成本問題。不同細(xì)分場景落地的AI所需要的訓(xùn)練語料是不一樣的,想要得到一個足夠有效且好用的大模型,需要投入足夠多且針對性的語料。為此,百家云專門開發(fā)了一套自動化開發(fā)平臺,讓客戶自主選擇語料以及成本的投入量,從而實(shí)現(xiàn)應(yīng)用層大模型的成本降低。

當(dāng)然,其中也不乏一些“渾水摸魚”者,并沒有真正入局大模型,而是想要借這場狂歡,謀得更多短期利益。越來越多的上市公司加入大模型概念股的大軍,想要借助大模型概念提升企業(yè)估值。

科技產(chǎn)業(yè)“食物鏈”,迎來新霸主?

在互聯(lián)網(wǎng)江湖看來,互聯(lián)網(wǎng)科技產(chǎn)業(yè),本身就存在一條科技“食物鏈”:軟件吞噬世界,平臺吞噬軟件,云吞噬平臺。而這條科技“食物鏈”正迎來一位新的霸主,大模型正在吞噬云。

互聯(lián)網(wǎng)企業(yè)本質(zhì)上是軟件企業(yè),通過軟件搬運(yùn)信息,改變世界?,F(xiàn)如今,軟件已經(jīng)吞噬了許多被廣泛認(rèn)為存在于物理世界行業(yè)的價值鏈,比如今天的汽車,軟件開始操縱引擎與方向盤,引導(dǎo)駕駛員向目的地行駛。實(shí)體零售巨頭沃爾瑪,利用軟件提升自身后勤和配送能力,提升企業(yè)運(yùn)轉(zhuǎn)效率。航空公司憑借票務(wù)系統(tǒng)協(xié)調(diào)機(jī)票、準(zhǔn)確定價等等。

而平臺模式的本質(zhì)是構(gòu)建多主體共享的商業(yè)生態(tài)系統(tǒng),實(shí)現(xiàn)互聯(lián)網(wǎng)中多主體共贏的一種策略。平臺早已不是最初我們簡單理解的第三方中介或者渠道,而是一個完善且不斷進(jìn)化的生態(tài)圈。

以電商行業(yè)為例,淘寶京東等電商平臺成長的同時,更多的垂直性電商消失于歷史長河,淘寶京東也并沒有拘泥于自身電商平臺屬性,而是不斷擴(kuò)展平臺邊界,買菜、醫(yī)藥、短視頻......變得更加龐大。

平臺發(fā)展的同時,也受到了云計算的吞噬,讓平臺巨頭不得不切入云計算領(lǐng)域。透視互聯(lián)網(wǎng)的底層,本質(zhì)上還是大量的數(shù)據(jù),以及對數(shù)據(jù)的計算。而云的誕生本身就是為了解決分布式計算和存儲的,因此,隨著平臺的發(fā)展壯大,云計算終歸會慢慢成為平臺的基礎(chǔ)核心。

比如亞馬遜,云業(yè)務(wù)早已成為亞馬遜主要的增長貢獻(xiàn)來源,亞馬遜2022全年442億美元的規(guī)模增長中,40.5%是由亞馬遜云科技(AWS)實(shí)現(xiàn)。隨著國內(nèi)產(chǎn)業(yè)互聯(lián)網(wǎng)如火如荼的發(fā)展,云計算也成為了國內(nèi)平臺巨頭們的重要戰(zhàn)場。

為何說大模型的發(fā)展有可能會“吞噬”云計算?

首先大模型的進(jìn)化必然離不開云計算,且有吞噬云計算的趨勢。

大模型需要大量的算力供給,需要云計算提對底層大規(guī)模算力統(tǒng)一編排調(diào)度,創(chuàng)造一個性能超強(qiáng)的計算環(huán)境并提供海量存儲空間。阿里的通義千問背后離不開阿里云的支撐,百度想要發(fā)展文心一言,也不得不開始重視自家的百度云。

其次,大模型的進(jìn)化過程,或許也將會對傳統(tǒng)云計算架構(gòu)開始新一輪的改造。

如果人工智能的智慧程度達(dá)到超越人類的程度,那必然依賴一個能夠超越人腦的“硅腦”,而云計算目前正扮演這樣一個角色。需要注意的是,當(dāng)下云計算僅僅具備IaaS、PaaS、SaaS三層架構(gòu),這對于當(dāng)下大模型的進(jìn)化顯然不夠的。

比如ChatGPT,有兩個最引人矚目的創(chuàng)新,是運(yùn)用了云計算以后工程化的創(chuàng)新:一是情景學(xué)習(xí)模式以及多模態(tài)(文本、代碼、圖片等多維度信息)輸入;二是人類反饋強(qiáng)化學(xué)習(xí)(RLHF)的微調(diào)訓(xùn)練機(jī)制和提示導(dǎo)引模式。

當(dāng)下,大模型已經(jīng)證明了自身強(qiáng)大的能力。人們出于對大模型所實(shí)現(xiàn)的突破充滿狂熱,認(rèn)為大模型如同最初的互聯(lián)網(wǎng)一般,甚至已經(jīng)超越了互聯(lián)網(wǎng)所帶來的改變,將會帶來新一輪的生產(chǎn)力改造,因此也給予大模型相關(guān)企業(yè)很高的期待。然而在短期內(nèi),大模型還未真正實(shí)現(xiàn)落地,對企業(yè)的業(yè)績拉動作用也并未凸顯。

互聯(lián)網(wǎng)江湖認(rèn)為,大模型的能力及其危險程度呈正相關(guān)關(guān)系,而安全能力將是大模型市場爆發(fā)的最基礎(chǔ)條件。

技術(shù)層面,大模型仍是一項(xiàng)黑盒技術(shù),為什么大模型能夠壓縮知識,我們不了解其中的細(xì)節(jié)參數(shù),不具備可解釋性。

盡管現(xiàn)在的大模型的錯誤還很明顯,但我們目前已經(jīng)能體會到大模型的強(qiáng)大之處,當(dāng)大模型回答的正確度越來越高,而我們還沒有形成完善的謊言的識別能力,其危險程度將隨著落地而陡然上升。

政策方面,國內(nèi)管控環(huán)境和國外管控環(huán)境不同,國內(nèi)政策監(jiān)管或許會更加嚴(yán)格。此前有K12的例子,一紙禁令,行業(yè)“熄火”。如果大模型的安全性無法解決的話,在能力達(dá)到一定臨界線或者在場景落地并出現(xiàn)行業(yè)陣痛之際,也有可能重蹈在線教育的覆轍。

商業(yè)層面,不同于國外的OPEN AI,國內(nèi)大模型企業(yè)未做到利益與控制權(quán)分離。從OpenAI的股權(quán)設(shè)置來看,雖然OpenAI“賣身”給微軟49%的收益權(quán),但并未讓微軟獲得其沒有控制權(quán),這保證了大模型技術(shù)不會因?yàn)樯虡I(yè)利益而被濫用。

而對于國內(nèi)的大模型企業(yè)來說,不存在這點(diǎn)限制,保證技術(shù)的發(fā)展速度以及商業(yè)化速度是首要考慮的因素,而先保證安全等于“先掏罰金”。

在互聯(lián)網(wǎng)江湖看來,未來大模型技術(shù)需要至少三層防火墻:

首先,對于底層的大模型企業(yè)來說,需要建立底層安全防護(hù)理念,保證未來接入其他各類接口的安全性。其次,隨著產(chǎn)業(yè)協(xié)作的完善,底層、中間層、平臺層、應(yīng)用層等產(chǎn)業(yè)各個環(huán)節(jié)會逐漸成熟,這時候需要在各個環(huán)節(jié)建立行業(yè)統(tǒng)一的安全標(biāo)準(zhǔn)。最后,如果大模型部署在公有云上,可以將安全解決方案整體交給專業(yè)的云計算企業(yè)實(shí)施,從而實(shí)現(xiàn)大模型系統(tǒng)的整體安全管控。

縱觀人類歷史,從公元元年到18世紀(jì),人類經(jīng)濟(jì)增長曲線幾乎是平的,也只有在近三百年才出現(xiàn)工業(yè)革命,實(shí)現(xiàn)技術(shù)巨大飛躍,帶來經(jīng)濟(jì)高速增長,這在人類已知的歷史中不過是短短一瞬。可見技術(shù)進(jìn)步的速度和加速度不見得是一致的,接下來的人工智能或許也到了這“最后一瞬”的時候,能否抓住這個機(jī)遇就成了當(dāng)下企業(yè)面臨的考驗(yàn)。

科技樹可以有很多條分支,但終歸只有一條是通向成功。在這之前,很少有人能夠預(yù)測到未來人工智能的走向,此前連谷歌也押錯了注。而此次大模型就一定走在成功的分支上嗎?仍需時間來驗(yàn)證。(本文首發(fā)鈦媒體APP)

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論