本文來自微信公眾號“twt企業(yè)IT社區(qū)”,作者/龍海,某股份制銀行研發(fā)中心NLP項目組產品經理、算法工程師。擁有4年金融行業(yè)算法研究及應用經驗,熟悉大數據、人工智能領域技術及其應用場景,在金融AI領域發(fā)表多篇發(fā)明專利。緊密跟蹤大模型技術,擁有大模型微調訓練經驗,曾在天池競賽、kaggle競賽等比賽中獲得獎項。
一、引言
隨著業(yè)務和政策的不斷發(fā)展,商業(yè)銀行的業(yè)務和管理變得越來越復雜。為降本增效,利用工具輔助復雜場景,人工智能技術在商業(yè)銀行領域的應用也日益廣泛。其中,大語言模型的應用一直是業(yè)界關注的重點。例如2018年谷歌提出的BERT和OpenAI提出的GPT-1是初代大語言模型的代表作,帶動了自然語言處理技術在銀行業(yè)應用的熱潮。而去年11月30日,ChatGPT橫空出世后,迅速引起了全球的關注。
本文將圍繞類ChatGPT模型的特點,介紹并適當探討銀行業(yè)對AI場景應用的現狀和發(fā)展趨勢。
二、商業(yè)銀行AI技術
(一)現階段銀行業(yè)人工智能技術應用方式
近幾年來,跟著國家數字化轉型的浪潮,銀行業(yè)其實一直在探索AI應用場景。現階段主要在下面幾個場景中應用人工智能技術:
(1)風險管理
銀行利用AI技術來預測借貸違約風險,并基于這些預測來制定相應的風險管理策略。例如,銀行可以使用外部合法的客戶風險信息,結合自身的客戶信息和行為交易數據,通過數據分析建模的方法來評估客戶的信用評級、財務狀況和還款能力,并根據這些數據來決定是否批準貸款申請、或者增加降低其信用額度。
針對黑產中介團伙技術強、手段多、后果惡劣的形勢,銀行還利用AI技術來檢測預防黑產欺詐行為。例如,銀行可以使用機器學習算法來分析客戶的交易歷史和行為模式,建立針對賬戶管理和交易管理的風控模型,更實時地、最大程度地識別可疑的交易。
(2)客戶營銷
在銀行向零售銀行戰(zhàn)略轉變的形勢下,如何解決長尾客戶服務薄弱的問題,智能營銷就是大勢所趨。這需要重塑數字化營銷的方法和系統支撐,形成一套有效的、整體的智能模型體系,用于客戶智能化全生命周期管理,在客戶的各個階段都能形成精準匹配的營銷方案和客戶范圍。另外,挖掘客戶的自然信息和生活場景類數據,持續(xù)完善客戶畫像和智能推薦系統,據此提供全方位、精準的“千人千面”的金融服務和生活服務的推薦。
(3)客戶服務
銀行利用AI技術來提高客戶服務質量。例如,銀行可以使用自然語言處理技術來分析客戶的問題和反饋,從而更快速、準確地提供響應和解決方案;利用自然語言處理技術來建設機器人客服,極大地減少客戶等待服務的時間。
(4)內管提效
在各類智能化技術提高辦公自動化程度的帶動下,銀行業(yè)利用AI技術來提高內部員工的辦公效率。例如審批流程中通過OCR技術輔助審批員確認材料中的關鍵指標;又亦如通過NLP技術識別簡歷中的關鍵標簽,以此來加快HR們的審批速度等。
(二)現階段銀行業(yè)人工智能技術應用方式存在的問題
盡管現階段AI已經被廣泛應用在了銀行業(yè),但其使用和推廣依然存在較多困難:
(1)缺乏靈活性
傳統的AI應用通常是基于預設規(guī)則和特定數據集進行操作,訓練出來的模型僅僅可以處理特定的業(yè)務場景,如業(yè)務提出需改變業(yè)務規(guī)則,往往又需要投入大量人力制造數據重新訓練模型。
(2)缺乏可復用性
由于數據集和規(guī)則的定制化,同一類技術往往也無法快速復制到另一個類似場景中。比如都是使用文本分類技術,信用卡業(yè)務應用文本分類技術實現客戶留言的快速分類和分發(fā)場景的模型就無法直接應用在零售條線。需要業(yè)務們重新針對零售業(yè)務的客戶留言打標后重新訓練模型才可以使用,這無形中增加了技術應用成本。
(3)缺乏傳播能力
由于傳統AI技術的定制化、非可視化、弱交互性等特性,導致AI技術在銀行業(yè)缺乏傳播能力。懂業(yè)務的人不了解技術,了解技術的人卻不了解業(yè)務,天然的知識壁壘,使得如何更好地擴展AI應用場景是銀行業(yè)普遍存在的難題。
三、后ChatGPT時代商業(yè)銀行AI應用趨勢
(一)什么是ChatGPT?
經業(yè)界研究,語言模型的表現往往與其模型大小呈直接關系,即模型越大,效果往往更加優(yōu)異。而ChatGPT則是由OpenAI開發(fā)的一種基于Transformer的大語言模型(LLM),其參數量雖未公開,但業(yè)界普遍都認為在1750億以上,是現階段最大的語言模型之一。它采用了自監(jiān)督學習方法,結合強化學習技術,通過大規(guī)模的語料庫訓練,可以生成接近人類的自然語言文本。經測試,ChatGPT在傳統NLP任務、自由對話場景表現優(yōu)異。該產品發(fā)布以來,僅僅2個月就突破了1億用戶,打破了全球最快破億產品記錄且遙遙領先,其現象級別的傳播速度正是用戶對該產品(模型)效果認可的表現。
圖1 ChatGPT訓練圖
(二)ChatGPT較傳統模型的優(yōu)勢
上一章節(jié)提到傳統AI模型應用的缺點,相比之下,ChatGPT作為一種新興的生成式大語言模型,完全克服了這些缺點,并具備以下優(yōu)勢:
(1)更高的靈活性
ChatGPT可以理解并產生自然語言,而不僅僅是基于事先設定的規(guī)則進行操作,這使得其可以更好地理解和處理用戶的語言和需求。同時由于該模型的交互范式(對話形式)非常貼近人類,也使得用戶可以更好地理解和接受這項新技術。
(2)更廣泛的數據應用
由于ChatGPT是基于大量的語言數據進行訓練的,因此它可以適用于各種不同的金融領域和應用場景,而不僅僅是基于特定的數據集進行操作,天然具備可復制性。
(三)ChatGPT在商業(yè)銀行應用方向分析
關注到ChatGPT的優(yōu)異表現,各行各業(yè)都在積極擁抱和加大投入到該項技術,如百度的文心一言、360公司的新搜索、阿里的通意千言等大模型都如雨后春筍般涌現。而金融行業(yè)也對此抱有極大的熱情,今年3月份,農行已經推出了行業(yè)內首個類ChatGPT模型ChatABC,而其他商業(yè)銀行也在研發(fā)或關注類似技術。
普遍而言,業(yè)界人士認為此類通用大語言模型技術在商業(yè)銀行的應用場景主要體現在以下幾個方面:
(1)知識庫:
金融銀行業(yè)都有大量的行業(yè)知識和各種管理和技術文檔,如法律規(guī)章、內部管理辦法、制度規(guī)范,以及各類業(yè)務文檔及技術文檔。由于缺乏集中管理的知識庫系統,不同機構、條線、層級的員工想查閱某個文檔,往往需要經過大量溝通和查找。通過集中對接內部文檔和數據,讓大語言模型可以學習到這些公司內部知識,從而形成公司內部的大型知識庫。結合大語言模型的信息綜合和分析總結能力,建立其這類知識庫和智能問答的范式,將極大降低員工溝通獲取信息的成本。
(2)數字秘書:
人在職場,不管職位高低,做什么崗位,少不了要編寫各類總結、周報月報。另外,銀行從業(yè)人員還需要寫各類專業(yè)的報告或方案,案頭工作負擔不輕。通過使用大預言模型強大的語言運用和表達能力,往往能夠對輸入文稿閱讀理解后,完成內容擴寫、行文風格、文字潤色、重點摘要等不同文案任務,并且整體效果不錯。把大語言模型當作秘書,這樣就能大大降低從業(yè)人員在文字編寫方面的投入。
(3)營銷助手
面對越來越激烈的銀行同業(yè)競爭,銀行從業(yè)人員需要更好的客戶管理和營銷方法來實現營銷業(yè)績目標,不管是零售、信用卡還是對公條線,都需要頻繁地發(fā)起營銷活動,進行客戶拉新、促活和挽回流失。在策劃營銷活動時,也需要花費大量精力進行文案編寫,創(chuàng)作文字、收集圖片、繪制海報等等。借助大語言模型的創(chuàng)作能力,可以用其清晰精煉的語言能力向目標營銷客戶傳達信息,還可以幫你編寫商業(yè)計劃書、市場調研報告、營銷策略、商業(yè)簡報、銷售信件等。
(4)客戶輔助服務:
考慮到ChatGPT仍然存在生產不可控的問題,業(yè)界普遍認為ChatGPT無法直接對客,但其可以作為一個工具來輔助人工客服。如通過實時ASR+ChatGPT結合的技術,可以讓大語言模型學習金牌客服的說話方式,從而針對客戶提出的每一個問題,都可以給出可行的回答,供人工客服參考。
(5)風險管理:
大語言模型技術可以幫助商業(yè)銀行識別和預測風險,提高風控能力。商業(yè)銀行可以使用大語言模型分析海量的數據,識別異常交易、信用風險等,從而降低風險損失。通過整合多源數據,讓大語言模型學習多類型、多模態(tài)的海量數據,借助其海量級別的參數數量形成的能力,讓其扮演數據分析專家,從而改變現有人工分析的范式,提高風控場景的適用范圍和分析精準率。
四、大語言模型應用面臨的問題及解決思路
盡管ChatGPT這類大語言模型存在眾多優(yōu)勢,但由于其消耗資源過大,要想在銀行內應用還是需要解決諸多問題。
(1)ChatGPT答復可靠性問題
ChatGPT雖然已超越舊有NLP模型鸚鵡學舌的能力,具備綜合分析的語言能力和些許的邏輯推理能力,但大多數的大語言模型在處理特定有準確性要求的任務時能力有限,因為模型并不是真正地理解語言的含義,不具備完整的事理判斷和價值倫理能力,有時候輸出的回復會包含錯誤的內容。在銀行的專業(yè)領域,如智能客服與客戶的對話話術、信貸領域智能問答、資產投資顧問等場景,不準確的輸出很容易引起客戶投訴或資產損失。為了確保模型具備很強的準確性和可靠性,需要針對大語言模型重新訓練“能力子模型”,或者借助微調的方式進行提升。
(2)顯存資源分配問題
現在大語言模型往往達到百億/千億級參數規(guī)模,其模型容量非常大,對GPU內存和算力都有很高要求。對百億左右的模型,單部署推理往往就需要約100G內存的GPU資源。如需要微調訓練,則需要數百G以上的顯存和算力消耗,這種級別的模型微調往往不是幾張A100顯卡就可以解決的。OpenAI在訓練GPT模型時就投入1萬張GPU顯卡和超過28.5萬個處理器內核。即使是訓練百億級的大語言模型,也需要數十張GPU卡,搭建成vGPU資源池,硬件費用達千萬人民幣以上。如何建設一套GPU資源池,并有完善計算資源優(yōu)化和調度系統是中小型商業(yè)銀行訓練及應用大語言模型不得不面對的問題。
(2)完整的開發(fā)部署工具
在銀行的AI應用中,不可避免的要考慮如何將模型部署到生產環(huán)境,如何確保模型部署后的可用性和可靠性,以及如何監(jiān)控和維護模型的性能等。這些挑戰(zhàn)需要企業(yè)擁有一套完整的AI應用開發(fā)流程,并配備相應的工具和資源。
這些問題,往往出現在模型訓練完成后,將模型部署到生產環(huán)境的過程。模型部署的工具鏈相對較長,而且上下游工具的兼容性問題層出不窮,企業(yè)大量使用開源工具又容易引發(fā)安全問題等。這些零散的問題極大的制約了目前企業(yè)開發(fā)AI應用的生產力。以往模型較小,這類返工還不至于限制模型部署上限,而ChatGPT這類大語言模型,即使參數量沒有那么大,一次訓練也需要好幾天。
(3)解決思路
解決上述問題,往往需要集成一套完整的平臺,既有底層vGPU資源池實現算力資源自由調配,也需要有一套通用的模型開發(fā)工具支持主流深度學習、遷移學習算法編程。最后疊加一個服務層為平臺使用者提供即插即用的成熟算法服務。如英偉達近期推出的NVIDIA AI Enterprise 3.1產品,就包括4個層級,可滿足銀行業(yè)對大語言模型的使用、訓練、發(fā)布需求(見下圖)
圖2 NVAIE3.1架構圖
從圖里我們可以看到平臺在4個層級的關鍵特性:
(1)囊括了上層工作流、框架和預訓練模型層:在應用場景的level上,定義清晰的輸入輸出,并預置預訓練模型,快速完成典型應用場景的AI應用開發(fā)。
(2)支持模型開發(fā)和部署:應用開發(fā)的工具閉環(huán),完成機器學習模型從開發(fā)到部署的完整生命周期,包括低代碼遷移學習工具TAO、主流深度學習框架TF/Pytorch、推理加速TensorRT框架、推理服務引擎等。
(3)云原生的架構支持混合云部署:GPU、DPU在k8s內的集成,MLOps工具等。
(4)大量的基礎設施優(yōu)化:包括GPU虛擬化、基于RDMA的存儲訪問加速、底層CUDA優(yōu)化等。
商業(yè)銀行的大語言模型開發(fā)應用道路,少不了這類一體式平臺的加持。
五、結論
本文通過對ChatGPT技術介紹,探討了商業(yè)銀行現階段AI技術應用的問題及后續(xù)可能的趨勢變革。通過分析,可以發(fā)現:ChatGPT技術在商業(yè)銀行中的應用潛力巨大,可以幫助企業(yè)搭建內部知識庫、創(chuàng)新風控營銷、提高客戶服務質量。同時銀行要想利用好大語言模型,也需要解決GPU資源池建設以及一站式開發(fā)部署平臺的問題。
總之,商業(yè)銀行應該積極探索和應用類ChatGPT技術,以適應人工智能趨勢變革的需求,提高企業(yè)核心競爭力和應對未來挑戰(zhàn)的能力。