圖片來源:視覺中國
本文來自鈦媒體,作者|蔡鵬程。
行業(yè)進(jìn)展轟轟烈烈,但真實(shí)情況可能并非如此樂觀。
“今年3、4月份,中國科技企業(yè)都經(jīng)過了一段焦慮期。最怕睡覺,因?yàn)橐黄鸫簿桶l(fā)現(xiàn)又有一個(gè)新的論文和新的產(chǎn)品要研究。”螞蟻集團(tuán)副總裁、金融大模型負(fù)責(zé)人王曉航向鈦媒體App回憶。
每當(dāng)AI浪潮涌起,作為數(shù)據(jù)密集型產(chǎn)業(yè)典型代表的金融業(yè),總是會(huì)被推上時(shí)代潮頭。最新的案例無疑是大語言模型(LLM),自ChatGPT異軍突起,國內(nèi)外科技企業(yè)迅速涌入。
今年3月,彭博首度針對(duì)金融業(yè)推出大型語言模型BloombergGPT,引發(fā)市場對(duì)金融垂直領(lǐng)域大模型的關(guān)注;6月,哥倫比亞大學(xué)聯(lián)合上海紐約大學(xué)推出FinGPT。在國內(nèi),7月,華為全新發(fā)布盤古大模型,金融行業(yè)大模型正是其中數(shù)個(gè)行業(yè)通用大模型之一;9月,螞蟻集團(tuán)正式發(fā)布自研“螞蟻基礎(chǔ)大模型”,以及在此基礎(chǔ)上進(jìn)行定制的“螞蟻金融大模型”。
此外,度小滿發(fā)布金融大模型“軒轅”,奇富科技發(fā)布“奇富GPT”,恒生電子發(fā)布“LightGPT”,“百模大戰(zhàn)”顯露硝煙。
事實(shí)上,金融行業(yè)對(duì)“模型”并不陌生。在營銷、風(fēng)控、投研、客服等領(lǐng)域,基于機(jī)器學(xué)習(xí)驅(qū)動(dòng)的建模能力已經(jīng)構(gòu)成金融機(jī)構(gòu)數(shù)智化轉(zhuǎn)型的基礎(chǔ)。但是,ChatGPT憑借其背后的大模型——本質(zhì)是一個(gè)海量參數(shù)的深度學(xué)習(xí)算法,展現(xiàn)出的媲美人類水平的內(nèi)容生成能力、理解能力和快速迭代能力,讓大家似乎窺見了未來AI“無所不能”的時(shí)刻。
行業(yè)進(jìn)展轟轟烈烈,但真實(shí)情況可能并非如此樂觀。
大模型潮涌
伴隨著科技公司爭相入局,金融機(jī)構(gòu)跟進(jìn)迅速。
郵儲(chǔ)銀行、興業(yè)銀行、中信銀行、江蘇銀行等已與百度展開合作;杭州銀行、臺(tái)州銀行等選擇阿里;一些國有大行與華為展開合作。比如,工行正通過盤古大模型來打造工行自己的金融大模型;建行、交行與華為當(dāng)前的合作聚焦在代碼輔助、知識(shí)檢索等場景,已經(jīng)完成百億大模型部署。
剛剛過去的財(cái)報(bào)季中,工商銀行、農(nóng)業(yè)銀行、中國銀行、交通銀行、招商銀行、中信銀行、興業(yè)銀行、華夏銀行、浙商銀行等9家銀行,都在半年報(bào)中明確提出正在探索大模型應(yīng)用。比如,交通銀行明確提出已經(jīng)“組建GPT大模型專項(xiàng)研究團(tuán)隊(duì)”。
騰訊云副總裁胡利明向鈦媒體App表示,“對(duì)于大模型,不同金融機(jī)構(gòu)大方向是有共識(shí)的,即不管是短期還是長期,基于大模型的金融領(lǐng)域應(yīng)用一定要積極去擁抱,如果不去擁抱一定會(huì)被淘汰。”
從目前落地的情況看,與文本內(nèi)容相關(guān)的營銷、宣傳、投研投顧是目前已經(jīng)落地的主要領(lǐng)域。
比如,招行信用卡基于ChatGPT撰寫宣傳稿件,寫出了“生命的舞臺(tái)上,我們都是基因的載體”等詩意十足的文案。
投研方面,業(yè)內(nèi)首份采用ChatGPT撰寫的行業(yè)研究完成度頗高,這份研報(bào)介紹了當(dāng)下輕醫(yī)美的崛起、中國醫(yī)美市場現(xiàn)狀及相關(guān)法律法規(guī)、合規(guī)要求,盤點(diǎn)了全球醫(yī)美行業(yè)主要參與者,甚至對(duì)疫情后中國和全球醫(yī)美市場進(jìn)行了預(yù)測(cè)。
智能客服是另一大被看好的領(lǐng)域。比如,美國互聯(lián)網(wǎng)保險(xiǎn)公司Lemonade推出了基于GPT-3技術(shù)面向用戶的銷售機(jī)器人瑪雅(AI.MAYA)。當(dāng)客戶有購買保險(xiǎn)的意圖時(shí),只需與瑪雅約兩分鐘的簡單聊天便能識(shí)別與處理客戶信息,推薦適配的保險(xiǎn)產(chǎn)品及報(bào)價(jià),促成交易達(dá)成。
螞蟻集團(tuán)發(fā)布的支小寶2.0和支小助兩款大模型落地產(chǎn)品同樣聚焦在客服及投研領(lǐng)域——前者面向投資者,可以提供行情分析、持倉診斷、資產(chǎn)配置和投教陪伴等專業(yè)服務(wù);后者為從業(yè)人員在投研分析、信息提取、專業(yè)創(chuàng)作、商機(jī)洞察、金融工具使用等環(huán)節(jié)提供服務(wù)。
奇富科技則向鈦媒體App表示,經(jīng)過大模型陪練機(jī)器人的幫助,奇富的電銷系統(tǒng)通話時(shí)長提升了15.1%。通話時(shí)長的拉升,意味著用戶的對(duì)話體驗(yàn)有了改善。
順著這一邏輯再往上游走一步,一些金融機(jī)構(gòu)已經(jīng)在嘗試?yán)么竽P蛶椭M(jìn)行產(chǎn)品設(shè)計(jì)。
以保險(xiǎn)產(chǎn)品設(shè)計(jì)為例,某些險(xiǎn)企正在嘗試?yán)么竽P蛢?yōu)化風(fēng)險(xiǎn)因素識(shí)別,幫助分析健康險(xiǎn)相關(guān)數(shù)據(jù),包括歷史賠付數(shù)據(jù)、人口統(tǒng)計(jì)和醫(yī)療資料等,從中識(shí)別出潛在的風(fēng)險(xiǎn)因素,產(chǎn)品精算人員可以更好地理解不同客戶的風(fēng)險(xiǎn)特征,并制定相應(yīng)保險(xiǎn)策略。
再往長遠(yuǎn)觀察,大模型背后所蘊(yùn)含的由AI驅(qū)動(dòng)的自動(dòng)化投資框架,未來可能會(huì)對(duì)投資行業(yè)產(chǎn)生較大影響和變革。比如,投資決策轉(zhuǎn)向數(shù)據(jù)與AI驅(qū)動(dòng),投資者將更多依賴于數(shù)據(jù)和模型,而非主觀判斷,這將改變投資行業(yè)的決策模式。
難以克服的“幻覺”
AI“無所不能”的時(shí)刻似乎近在咫尺,但真實(shí)情況并非如此樂觀。
在一級(jí)市場,Atom Capital通過梳理海外大語言模型+金融領(lǐng)域的創(chuàng)業(yè)公司之后指出,大語言模型在金融垂直場景的落地應(yīng)用出現(xiàn)了“青黃不接”的局面:1,當(dāng)前創(chuàng)業(yè)公司融資金額普遍較小,以100萬美金以下的種子輪居多;2,下注投資的大機(jī)構(gòu)非常少;3,尚無能吸引市場注意的“明星項(xiàng)目”。
在廣受關(guān)注的智能客服場景,一家頭部城商行客服部門負(fù)責(zé)人向鈦媒體App表示,“銀行客服強(qiáng)調(diào)規(guī)范化、制式化,目前來看大模型對(duì)于客服的提升效果有限。同時(shí)我們眼下預(yù)算有限,并不打算投入在錦上添花的事情上。”
在投研投顧場景,騰訊云副總裁胡利明則向鈦媒體App透露,“目前投研投顧的大部分嘗試還沒有出現(xiàn)明確的效果”。他提到,目前金融機(jī)構(gòu)明確出效果的場景主要是客服助手和代碼助手——即提高代碼編寫效率。
“幻覺問題”是大模型在落地金融應(yīng)用時(shí)被討論的最多的一個(gè)問題。
所謂“幻覺”,即大模型表現(xiàn)出的似乎具有理解和推理能力的現(xiàn)象,但實(shí)際上它們只是通過對(duì)大量數(shù)據(jù)進(jìn)行模式匹配來實(shí)現(xiàn)預(yù)測(cè)。這種現(xiàn)象可能會(huì)給人一種錯(cuò)覺,認(rèn)為模型具有智能和理解的能力,而實(shí)際上它們只是通過統(tǒng)計(jì)和概率來進(jìn)行預(yù)測(cè)。
上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任,復(fù)旦大學(xué)教授肖仰華將“幻覺”現(xiàn)象視作生成式大模型的“根本難題”。
“創(chuàng)造性是生成式大模型帶來的獨(dú)特價(jià)值,而創(chuàng)造性和追求事實(shí)之間往往存在矛盾。生成式大模型僅靠自身很難解決這一問題”。肖仰華向鈦媒體App表示。
肖仰華還提到了與“幻覺”現(xiàn)象密切關(guān)聯(lián)的缺乏忠誠度的問題,“行業(yè)中希望大模型按照我們給的規(guī)范、制度、文檔回答問題,而不是你從通用領(lǐng)域習(xí)得的知識(shí)回答問題(Closed QA而非Open QA),大模型因?yàn)樯瞄L發(fā)揮創(chuàng)造,它很有可能跳出你給定的內(nèi)容去胡編亂造。”
Atom Capital則認(rèn)為,“幻覺問題”反映的是大語言模型與金融業(yè)存在著內(nèi)生性矛盾——大語言模型能得到最快速應(yīng)用的場景,是幻覺能作為“Feature”(優(yōu)勢(shì))而不是“Bug“(缺點(diǎn))的領(lǐng)域。但金融業(yè)的本質(zhì)之一是對(duì)風(fēng)險(xiǎn)的精準(zhǔn)定價(jià)與管理,基于此為客戶提供相應(yīng)的產(chǎn)品與服務(wù),以確保資產(chǎn)安全,保障投資者利益。
除了“幻覺問題”以外,大語言模型落地金融業(yè)還需要滿足其他需求。
比如,隱私需求——保護(hù)客戶賬戶信息、交易信息數(shù)據(jù)安全是機(jī)構(gòu)的生命線;性能需求——大模型推理速度偏慢,但金融業(yè)常常要求實(shí)時(shí)決策;場景需求——金融領(lǐng)域有諸多特殊場景、特殊流程,特殊數(shù)據(jù)結(jié)構(gòu),或是特殊風(fēng)險(xiǎn)控制邏輯,一般的通用模型顯然無法直接適應(yīng)這些場景;成本需求——通用大模型非常“燒錢”,僅僅是GPT-3的訓(xùn)練所需算力成本就達(dá)到了1200萬美元。
逐鹿行業(yè)大模型
一個(gè)基本的判斷是:單單利用現(xiàn)在的通用大模型不足以解決以上諸多問題。
肖仰華教授建議,“當(dāng)下我們要發(fā)展面向垂域的大模型,要發(fā)展通用大模型的外圍插件,要采取大模型和知識(shí)圖譜、傳統(tǒng)知識(shí)庫相結(jié)合的策略。”
與美國同業(yè)相比,中國確實(shí)普遍將目光聚焦在了針對(duì)垂域的行業(yè)大模型。騰訊、華為、螞蟻集團(tuán)等都在自研通用大模型基礎(chǔ)上推出了金融行業(yè)大模型,度小滿、奇富科技、恒生電子等則密集發(fā)布金融行業(yè)大模型。
通用大模型過于燒錢,行業(yè)大模型則可以顯著降低成本。
AI大模型公司智譜CEO張鵬表示,“如果現(xiàn)在從頭買顯卡做大模型研發(fā),假設(shè)需要一萬張顯卡,一張顯卡十幾萬元,一次性就需要十幾億資金。并且現(xiàn)在這一賽道非常熱,有錢一時(shí)半會(huì)也買不到。”
而據(jù)鈦媒體App了解,目前金融機(jī)構(gòu)與第三方公司合作私有化部署行業(yè)大模型的價(jià)格約在數(shù)千萬元級(jí)別。而金融機(jī)構(gòu)如果選擇MaaS(Model as a Service)模式,開發(fā)者可以通過API調(diào)用來使用第三方公司的行業(yè)大模型功能,而不需要自己構(gòu)建和訓(xùn)練模型,成本將更加顯著下降。
胡利明提到,金融機(jī)構(gòu)在與騰訊大模型合作時(shí),騰訊可以基于已有行業(yè)大模型,以熱啟動(dòng)的形式部署在金融機(jī)構(gòu)內(nèi)部,再疊加向量數(shù)據(jù)庫、導(dǎo)入金融行業(yè)專業(yè)數(shù)據(jù),整體訓(xùn)練成本將降低到訓(xùn)練大模型成本的幾十分之一甚至幾百分之一。
行業(yè)大模型顯然也更加理解行業(yè)。中金公司在研報(bào)中形容,大模型的迭代是一場“暴力”填數(shù)據(jù)、拔規(guī)模而造就的“美學(xué)盛宴”。而小模型的訓(xùn)練數(shù)據(jù)量與參數(shù)量較少,其優(yōu)勢(shì)在于“專精”,貼近真實(shí)場景(具備行業(yè)know-how),可滿足特定任務(wù)需求。
但是,行業(yè)大模型并無法改善“幻覺”現(xiàn)象。
對(duì)此,肖仰華教授提到,要“尤其注重大模型和相關(guān)技術(shù),比如知識(shí)圖譜技術(shù)的協(xié)同”。他表示,知識(shí)圖譜技術(shù)往往擅長表達(dá)的是專業(yè)知識(shí)、私密知識(shí),和可理解、可控的符號(hào)知識(shí),其和大模型所表達(dá)的參數(shù)化的,不可理解的知識(shí)是一種緊密的互補(bǔ)關(guān)系,而不是對(duì)立關(guān)系。
對(duì)此,業(yè)內(nèi)也已有所實(shí)踐。王曉航向鈦媒體App表示,螞蟻金融大模型采用了“知識(shí)圖譜與大模型相結(jié)合的雙驅(qū)動(dòng)方式”。“在需要嚴(yán)謹(jǐn)程度更高的場景,通過已積累的金融領(lǐng)域知識(shí)圖譜來確保專業(yè)和嚴(yán)謹(jǐn)性。在投教或客服場景,會(huì)適當(dāng)更放開一些,交給大模型參數(shù)知識(shí)。”王曉航表示。
同時(shí),行業(yè)大模型往往需要處理敏感的行業(yè)數(shù)據(jù),對(duì)數(shù)據(jù)隱私和安全提出更高的要求,這一點(diǎn)在金融行業(yè)體現(xiàn)尤甚。
關(guān)于這一點(diǎn),胡利明向鈦媒體App表示,數(shù)據(jù)同質(zhì)化以及數(shù)據(jù)孤島問題的依然存在,依然在影響著模型訓(xùn)練效果。“比如投研投顧方面,各家機(jī)構(gòu)的數(shù)據(jù)比較同質(zhì)化,與以前應(yīng)用的數(shù)據(jù)源也比較類似,現(xiàn)在很難找到獨(dú)特的數(shù)據(jù)源來明顯提升模型訓(xùn)練效果。”胡利明提到,期待國家層面出臺(tái)相關(guān)的具體標(biāo)準(zhǔn)和規(guī)范,使得行業(yè)和機(jī)構(gòu)獲得更加明確的指引。
商業(yè)化為時(shí)尚早
技術(shù)門檻相對(duì)較低,商業(yè)化潛力更高,是行業(yè)大模型受到追捧的重要原因。
誠然,開源大大降低了數(shù)據(jù)處理與技術(shù)開發(fā)的門檻?;诖笸ㄓ媚P偷拈_源,只需要使用特定行業(yè)的數(shù)據(jù)進(jìn)行微調(diào),即可產(chǎn)生“行業(yè)大模型”,而行業(yè)大模型的出現(xiàn)似乎為各個(gè)垂直領(lǐng)域帶來了巨大的機(jī)會(huì)。
國內(nèi)金融機(jī)構(gòu)對(duì)于大模型的早期探索正是主要基于彭博BloombergGPT與開源的金融大模型FinGPT,金融機(jī)構(gòu)得以基于已有的開源框架進(jìn)行指令微調(diào),快速實(shí)現(xiàn)任務(wù)部署。
但目前情況正在出現(xiàn)某些變化。隨著《生成式人工智能服務(wù)管理暫行辦法》8月正式落地,傳統(tǒng)金融機(jī)構(gòu)對(duì)境外開源大模型的使用愈發(fā)謹(jǐn)慎,逐步轉(zhuǎn)向基于境內(nèi)開源大模型應(yīng)用,為國內(nèi)的金融行業(yè)大模型打開了更廣闊的市場空間。
但也有市場觀點(diǎn)認(rèn)為,目前國內(nèi)大量涌現(xiàn)的行業(yè)大模型可商用性比較低,并不具備真正的競爭壁壘。“技術(shù)上,因?yàn)樗鼈兇蠖嗷谙嗨频拈_源技術(shù)和通用大模型進(jìn)行微調(diào),很少有真正的技術(shù)創(chuàng)新。數(shù)據(jù)上,盡管行業(yè)數(shù)據(jù)是關(guān)鍵,但許多企業(yè)并沒有真正挖掘、整合和利用這些數(shù)據(jù)的能力,使得其微調(diào)的效果并不理想。”
恒生研究院院長、恒生電子首席科學(xué)家白碩則充分肯定了行業(yè)大模型的商用意義所在,“真正的專業(yè)能力和專業(yè)資源掌握在行業(yè)手中。當(dāng)大模型的語言能力幾近封頂時(shí),比拼的必然是專業(yè)資源和專業(yè)能力。”
在他看來,行業(yè)大模型商用的關(guān)鍵是大模型與行業(yè)的“對(duì)接”,“行業(yè)大模型不是要把這些資源和能力復(fù)制或者嵌入到大模型里,而是要把大模型的語言能力與行業(yè)的專業(yè)資源和專業(yè)能力相對(duì)接。行業(yè)的專業(yè)資源和專業(yè)能力,才是行業(yè)自然語言的真正grounding(語義落地的根基)。”
綜合在國內(nèi)金融大模型的應(yīng)用接入情況,進(jìn)展仍比較初步。度小滿開源的“軒轅”金融大模型宣稱已有上百家金融機(jī)構(gòu)申請(qǐng)?jiān)囉?;恒生電子宣布已面?0家金融機(jī)構(gòu)開啟金融大模型“LightGPT”內(nèi)測(cè);螞蟻集團(tuán)“支小助”正與螞蟻平臺(tái)合作機(jī)構(gòu)內(nèi)測(cè)共建。
螞蟻集團(tuán)首席技術(shù)官何征宇認(rèn)為,AI大模型現(xiàn)在還處于非常早期的階段,尚不足以明確的去談?wù)撋虡I(yè)化。同時(shí),AI大模型的不精確性是阻礙其商業(yè)化的一大問題,“商業(yè)需要的是準(zhǔn)確性,需要準(zhǔn)確地衡量或者反饋價(jià)值,但AI大模型在某種意義上犧牲了精確性,而獲得了泛化能力,這需要未來探索出一個(gè)新的商業(yè)模式。”
“當(dāng)前是一個(gè)技術(shù)的嬰兒期,你沒有辦法確定明天是當(dāng)醫(yī)生還是當(dāng)警察。”何征宇向鈦媒體App表示。
(本文首發(fā)于鈦媒體App)