保險(xiǎn)業(yè)大語(yǔ)言模型的應(yīng)用場(chǎng)景分析與規(guī)劃

在人工智能領(lǐng)域,數(shù)據(jù)通常被表示為高維空間中的向量。這些向量通過(guò)模型參數(shù)的向量計(jì)算,實(shí)現(xiàn)了從原始數(shù)據(jù)到預(yù)測(cè)結(jié)果的轉(zhuǎn)換。

本文來(lái)自微信公眾號(hào)“twt企業(yè)IT社區(qū)”,作者/陳萍春。

一、大模型的技術(shù)原理

LLM,即大語(yǔ)言模型,指的是通過(guò)大規(guī)模文本數(shù)據(jù)訓(xùn)練后,能夠理解和生成自然語(yǔ)言的模型。盡管對(duì)大部分人來(lái)說(shuō),大模型像是一個(gè)黑盒,但為了更有效利用這些技術(shù),理解其背后的技術(shù)原理至關(guān)重要。下文將結(jié)合個(gè)人的理解,對(duì)一些技術(shù)原理進(jìn)行簡(jiǎn)要解讀。

向量與向量計(jì)算:在人工智能領(lǐng)域,數(shù)據(jù)通常被表示為高維空間中的向量。這些向量通過(guò)模型參數(shù)的向量計(jì)算,實(shí)現(xiàn)了從原始數(shù)據(jù)到預(yù)測(cè)結(jié)果的轉(zhuǎn)換。

Transformer架構(gòu):Transformer架構(gòu)是一種基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu)。自注意力機(jī)制使得模型能理解不同位置的短語(yǔ)之間的依賴(lài)關(guān)系,同時(shí)能更好地支持并行計(jì)算,提升大規(guī)模數(shù)據(jù)處理效率。因此,Transformer架構(gòu)已成為構(gòu)建大型模型的事實(shí)標(biāo)準(zhǔn)。

大模型訓(xùn)練過(guò)程:訓(xùn)練過(guò)程主要包括前向傳播、損失計(jì)算、反向傳播和參數(shù)優(yōu)化四個(gè)步驟,前向傳播根據(jù)現(xiàn)有模型參數(shù)計(jì)算預(yù)測(cè)結(jié)果;損失計(jì)算衡量預(yù)測(cè)結(jié)果與真實(shí)值之間的差距;反向傳播則利用這個(gè)差距值,通過(guò)梯度下降算法進(jìn)行反向計(jì)算,確定如何調(diào)整模型參數(shù)以更接近真實(shí)值;參數(shù)優(yōu)化基于梯度的方法修改模型參數(shù)值。不斷迭代四個(gè)訓(xùn)練步驟,逐步縮小預(yù)測(cè)結(jié)果與真實(shí)值之間的差距,從而完成大模型的訓(xùn)練。

大模型推理過(guò)程:相比之下,推理過(guò)程相對(duì)簡(jiǎn)單。輸入數(shù)據(jù)經(jīng)過(guò)模型計(jì)算后產(chǎn)生輸出結(jié)果,輸出結(jié)果隨后作為新的輸入繼續(xù)迭代,使推理結(jié)果逐漸收斂。因此,在使用類(lèi)似ChatGPT的應(yīng)用時(shí),我們通常會(huì)看到逐詞流式輸出的現(xiàn)象。

利用判別模型優(yōu)化基座模型:根據(jù)特定的評(píng)價(jià)標(biāo)準(zhǔn),對(duì)大模型模型的回答進(jìn)行排序,再用這些排序數(shù)據(jù)去訓(xùn)練出一個(gè)獨(dú)立的判別模型。利用判別模型去評(píng)估基座模型的表現(xiàn),進(jìn)而幫助大模型模型更新模型參數(shù),生成更高質(zhì)量的回答。

策略精調(diào)(Fine Tuning):對(duì)于中小企業(yè)來(lái)說(shuō),不具備訓(xùn)練基座大模型的算力、數(shù)據(jù)等資源。為降低訓(xùn)練成本,往往在基座大模型基礎(chǔ)上,采用精調(diào)方法來(lái)增強(qiáng)特定領(lǐng)域的專(zhuān)業(yè)能力。為提升模型生成內(nèi)容的準(zhǔn)確性,需要使用一定規(guī)模的高質(zhì)量人工標(biāo)注數(shù)據(jù)集(格式為<指令,答案>),確保指令覆蓋各種實(shí)際場(chǎng)景和應(yīng)用領(lǐng)域。

二、大模型的能力分析

自ChatGPT問(wèn)世以來(lái),資本市場(chǎng)熱情高漲,眾多企業(yè)紛紛涉足大模型應(yīng)用。然而對(duì)于企業(yè)端的應(yīng)用,技術(shù)人員應(yīng)更務(wù)實(shí),更關(guān)注實(shí)用性,明確新技術(shù)的局限性,并警惕技術(shù)泡沫。

語(yǔ)言理解能力

大模型經(jīng)過(guò)超大規(guī)模文本數(shù)據(jù)的訓(xùn)練,因此能夠理解絕大多數(shù)的詞匯、語(yǔ)境和語(yǔ)義。然而,其局限性在于:語(yǔ)言是不斷發(fā)展的,一些新名詞、專(zhuān)業(yè)詞匯可能并不被大模型完全理解;語(yǔ)言理解需要結(jié)合具體的語(yǔ)境或上下文,否則很容易產(chǎn)生誤解。為避免語(yǔ)言理解出現(xiàn)偏差,一方面,大模型需要不斷更新和進(jìn)化,吸收新知識(shí);另一方面,對(duì)于特定領(lǐng)域,大模型需要針對(duì)該領(lǐng)域的知識(shí)進(jìn)行強(qiáng)化學(xué)習(xí)。此外,記憶多輪對(duì)話作為語(yǔ)義理解的上下文,以及引入反饋確認(rèn)過(guò)程,也是避免誤解的有效手段。

內(nèi)容生成能力

大模型能夠高效地生成高質(zhì)量的文本內(nèi)容,涵蓋文章、故事、詩(shī)歌、代碼等。盡管大模型展現(xiàn)了多樣性和創(chuàng)新性的內(nèi)容生成能力,但其生成內(nèi)容的質(zhì)量和準(zhǔn)確性在某些領(lǐng)域,特別是那些不擅長(zhǎng)的領(lǐng)域,仍有待提高。此外,生成的內(nèi)容也可能受到訓(xùn)練數(shù)據(jù)的影響,涉及版權(quán)、知識(shí)產(chǎn)權(quán)和隱私保護(hù)等問(wèn)題。因此,在專(zhuān)業(yè)領(lǐng)域應(yīng)用大模型時(shí),也應(yīng)審慎看待其生成的內(nèi)容,做好審核與驗(yàn)證工作,避免出現(xiàn)嚴(yán)重錯(cuò)誤。

推理能力

推理能力是大模型智能水平的重要體現(xiàn),它使大模型能夠理解復(fù)雜指令,將復(fù)雜問(wèn)題分解為簡(jiǎn)單步驟,實(shí)現(xiàn)多步驟推理。然而,目前大模型的推理能力尚不完善,其內(nèi)部推理過(guò)程缺乏解釋性。因此,在應(yīng)用過(guò)程中需要人工介入,并注重添加前置引導(dǎo)、推理審核、結(jié)果修正等環(huán)節(jié),不能完全依賴(lài)大模型的自動(dòng)化執(zhí)行。

工具協(xié)同能力

大模型能夠與現(xiàn)有工具和平臺(tái)協(xié)同工作,共同提高工作效率。通過(guò)提供API等接口,大模型可以與其他工具進(jìn)行交互;同時(shí),大模型也可以通過(guò)訓(xùn)練或Agent增強(qiáng)的方式,調(diào)用其他工具和平臺(tái)的接口。工具協(xié)同被視為大模型應(yīng)用的一個(gè)重要研究方向,但在這一過(guò)程中,數(shù)據(jù)安全與隱私保護(hù)應(yīng)成為重點(diǎn)考慮的因素。

多模態(tài)能力

大模型不僅限于處理文本,還能理解和生成圖像、視頻等多媒體內(nèi)容,這被稱(chēng)為多模態(tài)能力。然而,多模態(tài)技術(shù)更具挑戰(zhàn)性,且可能放大大模型在內(nèi)容理解和生成方面的缺陷。

三、保險(xiǎn)業(yè)應(yīng)用場(chǎng)景分析

盡管現(xiàn)有大模型的能力仍有待完善,但其快速的進(jìn)化迭代預(yù)示著其巨大的應(yīng)用潛力。對(duì)于保險(xiǎn)業(yè)而言,深入分析和挖掘應(yīng)用場(chǎng)景,對(duì)于推動(dòng)業(yè)務(wù)創(chuàng)新與智能化轉(zhuǎn)型具有重要意義。

用戶(hù)分析

對(duì)企業(yè)內(nèi)部員工,大模型可扮演工作助理的角色。根據(jù)員工的角色、需求和權(quán)限,為其提供定制化的服務(wù)功能;對(duì)保險(xiǎn)客戶(hù),通過(guò)在業(yè)務(wù)系統(tǒng)內(nèi)嵌大模型接口服務(wù),進(jìn)一步提升保險(xiǎn)服務(wù)水平,優(yōu)化客戶(hù)體驗(yàn)。

獨(dú)立應(yīng)用場(chǎng)景

該場(chǎng)景對(duì)應(yīng)于在企業(yè)內(nèi)部構(gòu)建基于大模型的類(lèi)ChatGPT人機(jī)對(duì)話系統(tǒng)。相較于個(gè)人使用,企業(yè)端應(yīng)用更注重特定業(yè)務(wù)領(lǐng)域、私有數(shù)據(jù)與應(yīng)用定制化。針對(duì)特殊業(yè)務(wù)領(lǐng)域和私有數(shù)據(jù)的特點(diǎn),可采用RAG(檢索增強(qiáng)生成)方案,整合內(nèi)部知識(shí)庫(kù)、互聯(lián)網(wǎng)等信息源,為大模型提供更為準(zhǔn)確和全面的信息支持;針對(duì)應(yīng)用定制化的特點(diǎn),借助Prompt工程定制符合企業(yè)需求的AI Agent,確保大模型能夠與企業(yè)業(yè)務(wù)無(wú)縫對(duì)接。

在獨(dú)立應(yīng)用場(chǎng)景中,大模型可為企業(yè)提供多種類(lèi)型的AI助手,如營(yíng)銷(xiāo)助手、文本分析助手、文檔編寫(xiě)助手等,助力企業(yè)員工高效完成各項(xiàng)工作任務(wù)。

工具協(xié)同場(chǎng)景

此場(chǎng)景主要關(guān)注大模型與企業(yè)現(xiàn)有工具和平臺(tái)的協(xié)同工作。通過(guò)用戶(hù)驅(qū)動(dòng),實(shí)現(xiàn)工具間的協(xié)同,進(jìn)而達(dá)到更高維度的自動(dòng)化。協(xié)同方式主要包括大模型調(diào)用其他系統(tǒng)API、其他系統(tǒng)調(diào)用大模型API以及與大模型結(jié)合實(shí)現(xiàn)RPA自動(dòng)化。大多數(shù)系統(tǒng)有開(kāi)放API,特殊系統(tǒng)則通過(guò)RPA方式,最終實(shí)現(xiàn)各類(lèi)型系統(tǒng)間的協(xié)同。

基于用戶(hù)權(quán)限實(shí)現(xiàn)通用級(jí)與專(zhuān)用級(jí)兩類(lèi)工具鏈服務(wù),通用級(jí)工具鏈服務(wù)與員工辦公系統(tǒng)相結(jié)合,如OA、財(cái)務(wù)報(bào)銷(xiāo)、視頻會(huì)議、員工培訓(xùn)等,提升員工工作效率;專(zhuān)業(yè)級(jí)工具鏈服務(wù)與保險(xiǎn)業(yè)務(wù)系統(tǒng)深度結(jié)合,實(shí)現(xiàn)更個(gè)性化的智能問(wèn)答、應(yīng)用導(dǎo)航等功能。同時(shí),在業(yè)務(wù)系統(tǒng)中內(nèi)嵌大模型服務(wù),使客服、財(cái)務(wù)、資管、風(fēng)控、產(chǎn)品等部門(mén)能夠更便捷地完成數(shù)據(jù)處理分析工作。

在這種工具鏈服務(wù)場(chǎng)景中,由于涉及多個(gè)工具和平臺(tái)的協(xié)同工作,因此風(fēng)險(xiǎn)相對(duì)較高。為確保穩(wěn)定運(yùn)行,需考慮用戶(hù)角色訪問(wèn)控制、輸出標(biāo)準(zhǔn)化、用戶(hù)確認(rèn)與反饋環(huán)節(jié)、全過(guò)程監(jiān)控、回溯與回退、禁止特殊操作等功能。這些措施將有助于降低誤解和輸出不穩(wěn)定性的風(fēng)險(xiǎn),確保應(yīng)用場(chǎng)景的順利實(shí)施。

應(yīng)用風(fēng)險(xiǎn)與防范

對(duì)于保險(xiǎn)業(yè)而言,大模型技術(shù)的應(yīng)用既帶來(lái)了機(jī)遇,也伴隨著風(fēng)險(xiǎn)和挑戰(zhàn)。

首先是隱私安全風(fēng)險(xiǎn),對(duì)于金融行業(yè)來(lái)說(shuō),無(wú)論是算力、模型還是數(shù)據(jù),都期望是獨(dú)享的,但也需要平衡風(fēng)險(xiǎn)與收益,做好權(quán)衡與取舍。因此,保險(xiǎn)業(yè)應(yīng)根據(jù)應(yīng)用場(chǎng)景做分類(lèi),并結(jié)合技術(shù)和管理手段進(jìn)一步降低安全風(fēng)險(xiǎn)。

其次是可能存在投入大、價(jià)值小的風(fēng)險(xiǎn),大模型的應(yīng)用落地對(duì)算力、算法和數(shù)據(jù)都提出了較高的要求,大多數(shù)中小保險(xiǎn)公司往往需要從零開(kāi)始建設(shè),但技術(shù)應(yīng)用本身還尚未成熟,技術(shù)如何賦能公司業(yè)務(wù)是難題。因此,保險(xiǎn)業(yè)要重點(diǎn)做好賦能業(yè)務(wù)價(jià)值的評(píng)估,明確高價(jià)值的大模型應(yīng)用場(chǎng)景。

最后是技術(shù)風(fēng)險(xiǎn)高,大模型不僅需要投入大量資源,大多數(shù)企業(yè)缺乏自研基座大模型能力,技術(shù)門(mén)檻高,相關(guān)技術(shù)也還在加速迭代。因此,保險(xiǎn)公司要優(yōu)先在一些難度低、價(jià)值高的場(chǎng)景下做試點(diǎn)應(yīng)用,做好人才儲(chǔ)備與培養(yǎng)。

四、選型與規(guī)劃

近年來(lái),隨著國(guó)內(nèi)經(jīng)濟(jì)的放緩和長(zhǎng)期利率的下降趨勢(shì),保險(xiǎn)業(yè)面臨著日益加劇的經(jīng)營(yíng)壓力。新形勢(shì)下,保險(xiǎn)公司堅(jiān)守穩(wěn)健經(jīng)營(yíng)的原則,注重價(jià)值創(chuàng)造,并致力于走高質(zhì)量發(fā)展的道路。在技術(shù)層面,保險(xiǎn)公司需要更加敏銳地關(guān)注新技術(shù)的迭代,并加強(qiáng)新技術(shù)在業(yè)務(wù)賦能方面的價(jià)值評(píng)估。

在新技術(shù)規(guī)劃落地的實(shí)踐中,通常有兩種方式可供選擇:“小步快跑”和“長(zhǎng)遠(yuǎn)布局”。對(duì)于大模型的落地,更推薦“小步快跑”,即先以小成本進(jìn)行試點(diǎn)應(yīng)用,再根據(jù)實(shí)際效果逐步推廣。這主要是因?yàn)镚PU算力成本高昂,模型算法需要不斷迭代,而企業(yè)在經(jīng)驗(yàn)和高質(zhì)量標(biāo)注數(shù)據(jù)方面相對(duì)不足。此外,大模型在企業(yè)端的應(yīng)用尚未形成規(guī)模,缺乏成熟的應(yīng)用案例,應(yīng)用場(chǎng)景與其價(jià)值也尚未完全明確。

大模型根據(jù)應(yīng)用場(chǎng)景和訓(xùn)練數(shù)據(jù)的不同,可分為通用大模型和垂直領(lǐng)域大模型;根據(jù)部署方式的不同,又可分為在線大模型和私有部署大模型。每種類(lèi)型的大模型都有其獨(dú)特的優(yōu)缺點(diǎn),因此,企業(yè)應(yīng)根據(jù)自身的需求、資源和目標(biāo)來(lái)制定具體的方案規(guī)劃。

640 (1).png

表1大模型方案的比較

對(duì)于保險(xiǎn)業(yè)而言,專(zhuān)業(yè)領(lǐng)域大模型的需求迫切,但目前尚缺乏合適的定制方案。同時(shí),由于隱私安全的要求,保險(xiǎn)業(yè)需要考慮私有部署的方式,但在線大模型在技術(shù)領(lǐng)先方面尚具有明顯的優(yōu)勢(shì)。因此,大規(guī)模私有化部署的時(shí)機(jī)可能尚不成熟。

綜上所述,我們建議現(xiàn)階段以在線調(diào)用LLM API為主、私有部署為輔的通用大模型方案。在應(yīng)用場(chǎng)景的選擇上,應(yīng)重點(diǎn)關(guān)注實(shí)現(xiàn)難度低、價(jià)值較大的場(chǎng)景進(jìn)行試點(diǎn)應(yīng)用,如智慧辦公、智能客服、代碼生成和企業(yè)知識(shí)庫(kù)等:

1)智慧辦公,在企業(yè)日常辦公軟件中嵌入AI助理,如OA、郵件、視頻會(huì)議、聊天軟件、Office等,讓員工更高效地完成工作溝通、會(huì)議紀(jì)要、文檔編寫(xiě)等工作;

2)智能客服,相比于其他智能模型,大模型能提供更個(gè)性化的定制服務(wù);

3)代碼生成,企業(yè)IT團(tuán)隊(duì)采用類(lèi)GitHub copilot這樣的代碼生成工具,大大提升編程、測(cè)試效率;

4)企業(yè)知識(shí)庫(kù),引入RAG(檢索增強(qiáng)生成)技術(shù),集成企業(yè)現(xiàn)有的文檔數(shù)據(jù),構(gòu)建企業(yè)知識(shí)庫(kù)。

為降低成本,私有部署方面,初期可以考慮租賃算力;而在大模型的選型方面,可以參考SuperCLUE的中文大模型基準(zhǔn)報(bào)告。該報(bào)告采用多維度、多視角的綜合性測(cè)評(píng)方案,對(duì)國(guó)內(nèi)外的大模型進(jìn)行了全面的評(píng)估。從2024年2月的測(cè)評(píng)結(jié)果來(lái)看,雖然國(guó)內(nèi)外存在一定差距,但國(guó)內(nèi)的大模型如文心一言4.0、GLM-4和通義千問(wèn)2.1等也取得了較高的分?jǐn)?shù)。因此,在選型時(shí),企業(yè)可以綜合考慮部署方式、大模型的特點(diǎn)和優(yōu)勢(shì),針對(duì)實(shí)際業(yè)務(wù)需求進(jìn)行模型選型。

640 (1).png

圖2國(guó)內(nèi)外大模型SuperCLUE基準(zhǔn)得分(來(lái)源:SuperCLUE,2024年2月報(bào)告)

五、總結(jié)與展望

短期來(lái)看,保險(xiǎn)公司應(yīng)更多聚焦在文本理解和內(nèi)容生成等通用場(chǎng)景的應(yīng)用,并逐步在保險(xiǎn)銷(xiāo)售與客戶(hù)服務(wù)場(chǎng)景中試點(diǎn)應(yīng)用;長(zhǎng)期來(lái)看,隨著技術(shù)的持續(xù)進(jìn)步和應(yīng)用場(chǎng)景的日益拓展,大模型會(huì)與保險(xiǎn)業(yè)務(wù)深度融合,有望為保險(xiǎn)業(yè)帶來(lái)更大的業(yè)務(wù)效率提升和服務(wù)質(zhì)量改善,成為企業(yè)重要的IT基礎(chǔ)設(shè)施之一。同時(shí),保險(xiǎn)行業(yè)也應(yīng)密切關(guān)注技術(shù)發(fā)展動(dòng)態(tài),制定合理的應(yīng)用策略,并注重風(fēng)險(xiǎn)防控和合規(guī)性管理,以確保大模型技術(shù)的健康、可持續(xù)發(fā)展。

THEEND

最新評(píng)論(評(píng)論僅代表用戶(hù)觀點(diǎn))

更多
暫無(wú)評(píng)論