本文來自微信公眾號“腦極體”,作者/風(fēng)辭遠。
金融大模型,被認為AI大模型產(chǎn)業(yè)化落地的第一站。
金融行業(yè)有著結(jié)構(gòu)化數(shù)據(jù)充沛、應(yīng)用場景豐富、數(shù)字化基礎(chǔ)設(shè)施良好等一系列特點,這些都是融合AI技術(shù)的利好因素。所以當(dāng)AI大模型開始爆火之后,各界會不約而同認為金融是AI大模型的天然良港。
從2023年至今,中國金融大模型市場的發(fā)展也確實印證了這一判斷。根據(jù)相關(guān)數(shù)據(jù),目前中國市場已經(jīng)有近20個金融大模型落地應(yīng)用,頭部金融機構(gòu)要么已經(jīng)應(yīng)用AI大模型,要么展示了對AI大模型的研發(fā)與應(yīng)用計劃。
要知道,在降本增效的大背景下,金融機構(gòu)目前還需要兼顧移動金融、數(shù)字系統(tǒng)自主替代等多項數(shù)字化投資目標(biāo),能夠分給AI大模型的資源并不豐富,而AI帶給金融機構(gòu)的投資回報比還非常有限。高效上馬大模型,對金融行業(yè)來說真的值得嗎?
記得2023年我在參加一個金融科技峰會時,與一位銀行代表進行溝通。他提出金融機構(gòu)做AI大模型,最根本的動力是擔(dān)憂。在移動互聯(lián)網(wǎng)時代來臨前,全球金融行業(yè)普遍低估了新技術(shù)帶來的沖擊力。隨后被Apple Pay、支付寶、微信等移動互聯(lián)網(wǎng)平臺分潤了時代紅利。不讓類似境況重演,是驅(qū)動金融機構(gòu)加碼AI大模型的底層動機。
如果是這樣的話,金融行業(yè)僅僅快步走向大模型并不夠,同時還需要聽見遠方的風(fēng),要能夠從長期目標(biāo)來回溯中短期的行動規(guī)劃。
今天,我們就從這個觀點出發(fā),聊聊快速用上了大模型之后的金融行業(yè),接下來走向何方?
金融大模型
從高速覆蓋1.0
走向價值最優(yōu)2.0
從全球到中國市場,生成式AI帶來的大模型之變,都在一年多的時間里掀起了金融行業(yè)的科技革新浪潮。
在國際上,OpenAI將金融行業(yè)視為GPT技術(shù)落地的首站,比如其與摩根士丹利合作,推出了基于GPT-4的投資顧問機器人。
而在中國金融行業(yè),AI大模型可謂以前所未有的態(tài)勢得到了高速覆蓋。在短短一年多的時間里,處于頭部地位的銀行、券商以及保險機構(gòu)紛紛完成了金融大模型的落地應(yīng)用。
比如說,工商銀行就宣布建成了同業(yè)首個全棧自主可控的千億級AI大模型技術(shù)體系,并在多個金融業(yè)務(wù)領(lǐng)域?qū)崿F(xiàn)了創(chuàng)新應(yīng)用。例如在網(wǎng)點運營上,推出了基于大模型的網(wǎng)點員工智能助手。農(nóng)業(yè)銀行AI推出了類ChatGPT的AI大模型應(yīng)用ChatABC,并在科技問答場景進行了內(nèi)部試點。郵儲銀行通過接入百度“文心一言”,從而在智能風(fēng)控、智能運營、智能投研、智能營銷等場景進行大語言模型應(yīng)用。
在民營銀行層面,網(wǎng)商銀行將大模型技術(shù)應(yīng)用于產(chǎn)業(yè)金融層面,從而識別小微企業(yè)的信用畫像。在保險行業(yè),眾安保險搭建了“眾有靈犀”系統(tǒng),將大模型帶入智能客服、到期提醒、智能運營等業(yè)務(wù)場景中。
而從技術(shù)與解決方案供應(yīng)商的層面看,目前中國市場已經(jīng)呈現(xiàn)出多樣化的金融大模型技術(shù)供應(yīng)渠道。騰訊云、螞蟻金服都推出了金融大模型解決方案。面向金融行業(yè)既需要大模型落地,同時也需要基礎(chǔ)設(shè)施更新的需求。華為在2023年依托盤古大模型,推出了金融級PaaS解決方案,發(fā)布了包括AI for Data、AI for Business、AI for IT三大類10個場景的金融大模型方案。
而在開源大模型層面,度小滿開源了軒轅大模型,其在1760億參數(shù)的Bloom大模型基礎(chǔ)上訓(xùn)練而來,已經(jīng)應(yīng)用在度小滿各個業(yè)務(wù)場景,覆蓋了從營銷、客服、風(fēng)控、辦公到研發(fā)等場景,并在一系列大模型評測中取得了領(lǐng)先地位。
可以看到,金融大模型已經(jīng)快速走過了以高速覆蓋為特征的1.0時代。在第一階段,金融大模型相關(guān)技術(shù)與解決方案快速出爐,頭部金融機構(gòu)競相試用,為中國金融大模型的發(fā)展打下了良好的基礎(chǔ)。
金融大模型第一階段的發(fā)現(xiàn)成果顯而易見,比如說,技術(shù)發(fā)展速度快,用戶積極性高。同時金融大模型的業(yè)態(tài)覆蓋非常完整,從銀行到保險、證券等領(lǐng)域兼顧,此外相關(guān)的技術(shù)能力供應(yīng)鏈已經(jīng)完善。閉源模型與開源模型兼顧,多種部署方式完備,與金融大模型相配套的軟硬件基礎(chǔ)設(shè)施已經(jīng)較為齊全。
但在接下來,金融大模型需要從具有探索性質(zhì)的1.0階段,走向必須要求回報率,要體現(xiàn)長期發(fā)展價值的2.0階段。
這一階段,金融大模型需要面臨的挑戰(zhàn)更加復(fù)雜,同時戰(zhàn)略方法論的問題也將浮出水面。
已經(jīng)暴露出的挑戰(zhàn)
統(tǒng)觀金融大模型的落地進程,會發(fā)現(xiàn)其中表現(xiàn)出的優(yōu)劣勢邏輯,與此前AI技術(shù)落地金融業(yè)如出一轍。第一階段,行業(yè)會直觀感到AI很好用。但接下來,AI能否帶來充足的投資回報,能否深入業(yè)務(wù)核心,才是更大的挑戰(zhàn)。
目前,金融大模型也遇到了類似問題。首當(dāng)其沖,大模型所帶來的智能幻覺、數(shù)據(jù)污染等問題,與金融行業(yè)對專業(yè)性、安全性的極高需求是難以匹配的。
其次,由于金融行業(yè)極高的涉密等級與安全合規(guī)要求,往往需要私有化進行大模型部署,同時禁止模型學(xué)習(xí)大量數(shù)據(jù),禁止數(shù)據(jù)過分流動。這又催生了兩個問題,一個是私有化部署給金融機構(gòu)帶來了極大的研發(fā)與運維成本壓力。另一個是高安全等級與限制數(shù)據(jù)使用,帶來了金融大模型效果不佳等問題。
對于金融機構(gòu)來說,不僅是研發(fā)、訓(xùn)練大模型的成本過高,將模型進行場景化部署的成本壓力也很大。由于目前金融大模型還處在探索階段,難以帶來實際的商業(yè)回饋,因此其部署往往是在機構(gòu)內(nèi)部,或者邊緣業(yè)務(wù)中。這就導(dǎo)致部署成本不斷放大,但商業(yè)化價值卻遲遲無法釋放。
最后,也正是處于金融行業(yè)高安全,與大模型技術(shù)不夠成熟二者間的差距。金融大模型普遍無法在金融核心業(yè)務(wù)中進行部署。比如大模型加持的智能客服,不僅無法代替客服人員,還可能出現(xiàn)需要頻繁喚醒人工客服,且需要客服重新理解用戶需求的現(xiàn)象。而在風(fēng)控等產(chǎn)業(yè)應(yīng)用側(cè),大模型雖然表現(xiàn)出了巨大的潛力,但還無法真正處理較為復(fù)雜的風(fēng)險異常。
這種情況下,金融大模型很可能在運行一段時間,熱度相對褪去之后,又和許多金融科技一樣流于邊緣化。
如何才能突破技術(shù)與產(chǎn)業(yè)之間的長期壁壘?這可能需要金融大模型聽到一些來自遠方的風(fēng)。
從未來,回看現(xiàn)在
布萊特·金在著名的《銀行4.0》中,第一章就在討論第一性原理的回歸。即我們需要回歸問題的本源,回歸設(shè)計的本質(zhì)。放在金融場景,就是我們首先需要理解銀行被設(shè)計出來是為了什么,繼而在討論銀行應(yīng)該如何發(fā)展。
想要打破金融大模型可能面對的壁壘,我們也必須有這樣一個意識:去思考,去判斷,甚至去假設(shè)未來大模型究竟能給金融帶來什么,再從未來倒推現(xiàn)在。
哪怕這個未來相對遙遠,至少遠方的風(fēng)不會帶我們走進死胡同。
那么,AI大模型到底能為金融帶來什么?
這個問題可以分為兩個維度去理解,一個是技術(shù)維度,一個是應(yīng)用維度。
從技術(shù)上看,大語言模型的技術(shù)升級路徑已經(jīng)相對確定,業(yè)界對其技術(shù)發(fā)展范式以及工程化實踐已經(jīng)有了明確的共識。
比如說,最近我們讀了由度小滿金融技術(shù)委員會執(zhí)行主席、數(shù)據(jù)智能應(yīng)用部總經(jīng)理楊青所撰寫的《大語言模型:原理與工程實踐》。書中除了明確提出了大語言模型的多項關(guān)鍵技術(shù)之外,還指出了其在涌現(xiàn)能力、推理能力上的特點,以及廣受關(guān)注的大語言模型縮放定律。隨著模型訓(xùn)推能力的提升,大語言模型將持續(xù)出現(xiàn)智能涌現(xiàn)效果。這一技術(shù)錨點是金融行業(yè)所追尋的長期價值,也是度小滿等金融科技供應(yīng)商探索大語言模型的價值關(guān)切。
而從應(yīng)用維度看,目前金融大模型的應(yīng)用場景繁多,但歸根結(jié)底可以總結(jié)成三個方面:
1.面向大眾用戶的智能客服-智能顧問。
2.面向產(chǎn)業(yè)用戶的智能信貸識別-信用體系構(gòu)建。
3.面向金融機構(gòu)內(nèi)部的職員能力提升。
這三種能力的極致化,就是金融大模型可能帶來的長期價值。比如在未來,以大語言模型驅(qū)動的智能客服,可能會變成智能顧問、一對一的金融服務(wù)專家。不僅可以完成業(yè)務(wù)對接,信息告知等基礎(chǔ)功能,還可以結(jié)合用戶需求給出定制化的金融方案,實現(xiàn)金融訂制能力從大額用戶、企業(yè)用戶向普惠用戶的轉(zhuǎn)變。
將技術(shù)維度與應(yīng)用維度進行綜合,我們可以將金融大模型的未來錨定在三個方面:
1.企業(yè)與個人信用服務(wù)的智能泛在化。
2.金融客服的少人化甚至無人化。
3.金融機構(gòu)綜合智能能力的極致化。
如果說,移動金融是把銀行、券商直接開到了用戶手里,是讓金融距離用戶更近,那么AI大模型金融,則是讓用戶走得更遠,讓用戶的一切訴求與資產(chǎn)都可以與金融服務(wù)建立聯(lián)接。
用遠方的風(fēng)
丈量現(xiàn)在的路
一段時間以來,金融大模型領(lǐng)域存在著務(wù)虛與務(wù)實的爭論。
所謂務(wù)虛,是指金融機構(gòu)應(yīng)該更關(guān)注算法本身,關(guān)注模型性能,先上馬大模型,拿著大模型的錘子找金融業(yè)務(wù)的釘子。
而務(wù)實則是要求從金融行業(yè)的應(yīng)用場景出發(fā),優(yōu)先考慮金融應(yīng)用智能化的安全合規(guī)與成本可控,在此基礎(chǔ)上再去適配裁剪大模型的能力,讓大模型為金融服務(wù)。
某種程度上來說,二者都有正確的因素,但或許也都可以補充新的思路。因為二者都更加關(guān)注短期抉擇,忽略了金融大模型的出發(fā)點是行業(yè)的跨時代升級,是尋求像移動金融一樣,甚至更加深刻的長期變革。
金融大模型需要補充的思路,就是務(wù)實務(wù)虛之外,需要務(wù)未來,需要從最終可能實現(xiàn)的理想化目標(biāo),來一步步推導(dǎo)現(xiàn)在的工作。讓遠方的風(fēng),吹動現(xiàn)下的腳步。
從這個角度看,金融機構(gòu)就需要兼顧上馬大模型的效率,同時兼顧未來可能隨時出現(xiàn)的更多AI技術(shù)創(chuàng)新。讓自身的數(shù)字化架構(gòu)與軟硬件基礎(chǔ)設(shè)施,適配隨時會到來的AI技術(shù)迭代。具體來看,“務(wù)未來”的金融大模型,可能包含以下三層行動:
1.打好金融大模型基座。其中包括自身的研發(fā)體系,也包括與技術(shù)供應(yīng)商之間開放有效的合作關(guān)系,避免因過度保守而遭遇技術(shù)擱淺。
2.兼顧金融大模型的工程力與想象力。面向大語言模型的長期發(fā)展,金融行業(yè)不能局限于有大模型,更需要錘煉對大模型的工程化掌控力,隨時可以將大模型錘煉成符合自身需求的狀態(tài),同時積極開啟創(chuàng)造性的大模型探索。既在內(nèi)部醞釀變革,也不放過外部機遇。
3.構(gòu)建長期且清晰的智能化目標(biāo)。對于金融大模型,我們要正視其短期的局限性,以及長期的可能性。在戰(zhàn)略上回歸大模型最本身的第一優(yōu)先性原理,然后以此為目標(biāo)倒推每一步的進展。
當(dāng)大模型出現(xiàn)在金融業(yè)面前時,我們的第一感受都是驚喜與遐思。但在實際應(yīng)用大模型時,往往會過于聚焦眼前,比如是否使用了大模型,覆蓋的業(yè)務(wù)場景,以及帶來的投資回報率。這時,浮現(xiàn)出的挑戰(zhàn)以及不那么清晰的價值往往會滋生矛盾,讓金融機構(gòu)進退維谷。只要讓遠方的風(fēng)吹進來,讓金融智能化的長期主義映照現(xiàn)在,絕大部分問題都會找到解法。