配圖來自Canva可畫
本文來自微信公眾號“劉曠”,文/劉曠公眾號,ID:liukuang110。
在被譽為“科技企業(yè)營銷圣經(jīng)”的《跨越鴻溝》一書中,杰弗里·摩爾寫道:“高科技產(chǎn)品面世過程中,最危險、最關(guān)鍵的一點,就是由少數(shù)有遠見者所主宰的早期市場,向?qū)嵱弥髁x者占支配地位的主流市場過渡。”此刻,狂飆突進已半年有余的國內(nèi)生成式人工智能(AIGC)市場,正面臨著這個關(guān)鍵的過渡。
截至8月底,首批8家AI大模型企業(yè)通過備案。與上半年“甚囂塵上”的行業(yè)境況不同,具備實力且具備滿腔“產(chǎn)業(yè)抱負”的實力型玩家,總是姍姍來遲,但卻總是能夠一鳴驚人,為產(chǎn)業(yè)的大規(guī)模應用創(chuàng)造機會。目前來看,隨著未來不斷有新的企業(yè)通過備案,“大模型+”的應用拐點正在到來。
“大模型+”應用拐點加速到來
8月份剛剛過去,9月初百度就迫不及待地對外公布了文心一言大模型開源。與此同時,“姍姍來遲”的騰訊混元大模型,一亮相便“秀”起了“肌肉”,科大訊飛與華為合作發(fā)布“星火一體機”,進一步把大模型端側(cè)應用擺在了臺面上。一波接一波的行業(yè)浪潮席卷而來,正推動整個“大模型+”應用時代加速到來。
首先,大模型從C端應用逐漸轉(zhuǎn)向B端應用領域,以“實用”為導向的大模型日漸成為行業(yè)趨勢。自從去年12月ChatGPT,在短短一個月之內(nèi)實現(xiàn)月活破億之后,圍繞整個C端市場的AI大模型玩家如百度等,就開始大規(guī)模地涌入該領域,一時之間C端大模型應用迎來了外界的一致關(guān)注。但進入下半年以后,市面上越來越多的“面向B端”的應用開始出現(xiàn),更加“實用”的行業(yè)大模型也在成群結(jié)隊地出現(xiàn),大大加速了生成式AI產(chǎn)業(yè)化的進程。比如,京東發(fā)布了言犀大模型、京醫(yī)千詢大模型,攜程發(fā)布了攜程問道大模型,網(wǎng)易有道發(fā)布了基于教育的子曰大模型,用友發(fā)布了用友GPT大模型等等。
相比通用大模型廠商而言,垂直大模型廠商在相關(guān)行業(yè)深耕已久,因而在尋找產(chǎn)業(yè)機會方面往往走得更加深入。以網(wǎng)易有道、京東兩家為例,網(wǎng)易有道在教育領域深耕已久,它在長期深耕行業(yè)的過程中,不僅積累了龐大的用戶和教育行業(yè)數(shù)據(jù),還積累了相對應的高質(zhì)量數(shù)據(jù),這使其在做教育大模型過程中,擁有更多比較優(yōu)勢。無獨有偶,京東在零售、大健康領域廣有布局,這使其在構(gòu)建產(chǎn)業(yè)大模型和京醫(yī)大模型方面,擁有堅實根基;而攜程則在文旅行業(yè)深耕已久,積累了廣泛的文旅產(chǎn)業(yè)鏈數(shù)據(jù)和資源。
顯然,相比通用大模型廠商而言,圍繞垂直領域的行業(yè)大模型,不僅可以依靠專業(yè)數(shù)據(jù)讓大模型更加“實用”,還可以在特定領域發(fā)揮獨特作用,幫助行業(yè)盡快完成數(shù)字化轉(zhuǎn)型。
其次,具備通用能力的大型云服務企業(yè),正在加速與各路行業(yè)大模型企業(yè)展開合作,新的大模型生產(chǎn)機制正在成型。目前業(yè)內(nèi)包括百度、騰訊、阿里、華為等主要云廠商,都紛紛依托自身的技術(shù)優(yōu)勢、團隊優(yōu)勢和資金支持,在通用大模型領域?qū)崿F(xiàn)搶跑。除此之外,各主要廠商還聯(lián)合行業(yè)頭部企業(yè),推出行業(yè)大模型解決方案。
比如,騰訊云聯(lián)合行業(yè)頭部企業(yè),已為文旅、政務、金融等10余個行業(yè),提供了50多個大模型行業(yè)解決方案。華為旗下盤古大模型,更是可以提供5個基礎大模型+N個行業(yè)大模型+X個場景模型的三層解耦架構(gòu),目前已經(jīng)應用到了鐵路、礦山、能源、氣象、政務等諸多領域。阿里云更是對外開放了“通義千問”的全部能力,幫助企業(yè)結(jié)合自身的行業(yè)知識和應用場景,訓練自己的企業(yè)大模型;加上目前已經(jīng)開源的文心一言,由大的云平臺提供包括云服務、算力、通用大模型工具支持等基礎設施,各行業(yè)頭部企業(yè)提供專業(yè)經(jīng)驗和數(shù)據(jù)訓練的大模型生產(chǎn)機制已經(jīng)基本成型。
志在必得的騰訊
對于大模型的發(fā)展,騰訊高層顯然很早之前就已經(jīng)定下了調(diào)子,但其推出的時間卻在一眾巨頭中最晚。在上半年如火如荼的大模型混戰(zhàn)中,騰訊的大模型在業(yè)內(nèi)一直是“只聞其聲、不見其名”的存在。但從9月其正式面世之后的外界反應來看,此前“默默無聞”的騰訊大模型,更多是在“厚積薄發(fā)”。
9月7日騰訊正式對外發(fā)布了騰訊混元大模型,據(jù)了解該模型擁有超千億參數(shù)規(guī)模,預訓練語料超過2萬億Tokens,并已接入騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔等50多個騰訊業(yè)務。而且在國家公布的首批大模型廠商中,騰訊混元大模型赫然在列。同時,騰訊混元大模型還宣布對外開放,千行百業(yè)的人都可以通過API調(diào)用混元,或者將其作為產(chǎn)業(yè)底座,為不同產(chǎn)業(yè)場景構(gòu)建大模型應用,不難看出騰訊對大模型的“志在必得”。
首先,騰訊構(gòu)建了“更強”的“探真”技術(shù)方法,這使其具備更強的信息可信度,極大增強了大模型自身的實用性?;谌W(wǎng)的數(shù)據(jù)檢索和生成,是大模型的核心能力之一。值得一提的是,無論是基于GPT-3.5還是國內(nèi)其他大模型,源于錯誤信息帶來的錯誤答案,依然不可避免。但騰訊混元大模型卻基于自身的技術(shù)能力,保證正確答案的輸出。
與業(yè)界消除“幻覺”的通用做法不同,混元大模型并沒有為大模型增加搜索或者知識圖譜等外掛,而是從源頭上解決問題。具體來說,混元大模型從第一行代碼開始,就采用了預訓練階段優(yōu)化目標函數(shù)的“探真”技術(shù)方法。據(jù)業(yè)內(nèi)專業(yè)人士介紹,該方法與常見的開源大模型相比,能有效降低幻覺30%到50%。
除了“探真”能力優(yōu)秀之外,騰訊混元的另一大超強能力在于其支持超長文本輸出。盡管目前多模態(tài)正在成為主流大模型演進方向,但在文本輸出方面,包括GPT-3.5和GPT-4在內(nèi)的大模型,都很難支持1000字以上的文本輸出,但騰訊混元通過位置編碼優(yōu)化提高了超長文的處理效果和性能,已經(jīng)具備輸出4000多字的完整答案的能力。
其次,騰訊構(gòu)建了從軟到硬的全流程基礎設施,這讓騰訊具備了更強的“全局優(yōu)化”能力。從自研的星星海服務器,到新一代HCC高性能計算集群,再到自研的星脈高速網(wǎng)絡,騰訊已經(jīng)為自己打造了一整套面向AIGC的高性能智算網(wǎng)絡。據(jù)騰訊內(nèi)部負責人介紹,目前騰訊云已經(jīng)可支持超過10萬張卡并行計算的大規(guī)模訓練集群,萬億參數(shù)大模型可以在四天之內(nèi)完成。
目前,騰訊云已經(jīng)建立起了圍繞大模型的全套能力,包括高性能算力集群、云原生數(shù)據(jù)湖倉和向量數(shù)據(jù)庫等數(shù)據(jù)處理引擎,以及模型安全、支持模型訓練和精調(diào)的工具鏈等,企業(yè)和開發(fā)者都可以根據(jù)自己的需求,靈活選擇產(chǎn)品,降低大模型的訓練成本。
不甘落后的科大訊飛
除了騰訊大模型之外,在大模型上已經(jīng)先行一步的科大訊飛也是不甘落后,不僅積極參與通用大模型的建設,還持續(xù)發(fā)力行業(yè)大模型的建設。目前科大訊飛的大模型已經(jīng)具備7大能力,分別為:文本生成、語言理解、知識問答、邏輯推理、數(shù)學和多模態(tài)能力,并且這種能力還在不斷提升。而基于大模型開發(fā)所需的巨大投入量,科大訊飛也做了多方面的準備。
一方面,科大訊飛積極展開與業(yè)內(nèi)巨頭的合作,強化星火大模型的技術(shù)實力。早在今年8月中旬,科大訊飛就與華為共同發(fā)布星火一體機,讓所有企業(yè)都可以在國產(chǎn)自主創(chuàng)新平臺上私有化部署大模型。一來,星火一體機基于星火認知大模型,針對污語料和幻覺問題,形成了“立體化”的內(nèi)容安全機制。二來,星火一體機基于昇騰AI硬件、昇思AI開源框架,提供業(yè)界領先的大模型訓練、推理能力,為大模型全流程創(chuàng)新提供堅實的自主創(chuàng)新算力底座。
具體來說,訊飛星火認知大模型基于訓練推理一體化設計,實現(xiàn)大模型稀疏化、低精度量化的技術(shù)突破,能高效適配昇騰AI,加速大模型的行業(yè)落地應用和迭代;與此同時,以昇騰AI為核心,軟硬件協(xié)同優(yōu)化,構(gòu)建算力集中、協(xié)同優(yōu)化、供給穩(wěn)定、數(shù)據(jù)安全的大模型訓練集群,這些都可以強化星火大模型的自身實力。
另一方面,科大訊飛積極推動與自身業(yè)務場景的整合,加速大模型的場景落地。除了不斷強化自己核心能力之外,科大訊飛還結(jié)合自身的業(yè)務場景,推動大模型在辦公、政務、電力、教育、醫(yī)療、工業(yè)、司法、金融等行業(yè)的場景落地。星火一體機內(nèi)已涵蓋辦公、代碼、運維、客服、營銷、采購等10多個場景包,支持對話開發(fā)、任務編排、插件執(zhí)行、知識接入、提示工程等5種定制優(yōu)化模式,并將持續(xù)拓展更多專業(yè)場景和模式優(yōu)化,為客戶快速定制企業(yè)專屬大模型。
總的來看,科大訊飛在大模型上,外部合作和內(nèi)部場景落地相結(jié)合的方式,很好地保證了其大模型產(chǎn)業(yè)化的加速落地。
大模型大洗牌正在加速到來
在眾多頭部巨頭和行業(yè)巨頭的共同努力之下,“百模大戰(zhàn)”甚至“千模大戰(zhàn)”的局面正在加速形成。而在這種的形勢之下,圍繞大模型的“行業(yè)大洗牌”或?qū)⑻崆暗絹怼?/p>
首先,產(chǎn)品能力的比拼已經(jīng)初見分曉。據(jù)知名廠商IDC依據(jù)算法模型、通用能力、創(chuàng)新能力、平臺能力和安全可解釋等五方面的要求,評估出了目前市面上在大模型方面綜合評分最高的三家廠商,分別是百度、阿里巴巴、科大訊飛。不過由于這個數(shù)據(jù)排出的時間較早,未考慮到騰訊和華為的產(chǎn)品能力,所謂真實的綜合技術(shù)實力方面,排名靠前的依舊會是BATH這些行業(yè)巨頭。
但各家的能力并不相同,也各有側(cè)重。具體來說,百度的能力在于其具有“芯片—框架—模型—應用”四層技術(shù)棧完整布局的獨特優(yōu)勢:芯片層—昆侖芯、框架層—飛漿、模型層—文心大模型,以及各種AI的落地應用。阿里的能力也相近,其強大之處在于圍繞云搭建起了一整個的大模型基礎設施;華為的能力在于強大的基礎技術(shù)能力,以及廣泛的終端生態(tài)應用和B端應用能力。在BATH之外,其他大模型廠商依然排在第二梯隊、第三梯隊,產(chǎn)品層面的分化已經(jīng)出現(xiàn)。
其次,是大模型生態(tài)服務能力的比拼已然拉開序幕。以阿里為例,阿里不僅推出了通義千問大模型,還推出了魔搭大模型社區(qū),還有眾多的生態(tài)合作伙伴;百度在這方面也不遑多讓,不僅有基于大模型的技術(shù)能力,還有廣泛的生態(tài)伙伴,推理能力和速度伴隨著大模型的版本更新,也在日新月異;作為同級別大廠,華為、騰訊等廠商自然也具備類似能力。不難預見,未來各路廠商圍繞預訓練、邏輯推理等相關(guān)方面的技術(shù)服務,將成為行業(yè)競爭的常態(tài)。
當然,無論是產(chǎn)品維度還是服務能力,最終都要落地到產(chǎn)業(yè)實踐上。從行業(yè)覆蓋來看,從文心大模型出發(fā),百度已經(jīng)在能源、汽車、政務、交通、金融等重點領域布局11個行業(yè)大模型,將大模型融入到垂直領域,真正做到產(chǎn)業(yè)實踐和商業(yè)落地。阿里、騰訊、華為等也覆蓋電商零售、物流、社交、礦業(yè)等諸多行業(yè),產(chǎn)業(yè)化落地也在快速提升。
而隨著各大平臺的大模型,在產(chǎn)品、生態(tài)服務和產(chǎn)業(yè)實踐上的全面展開,大模型的大洗牌正在加速到來。
文/劉曠公眾號,ID:liukuang110