大數(shù)據(jù)技術(shù)在金融行業(yè)中的典型應(yīng)用

中國石化雜志
陳誠
近年來,大數(shù)據(jù)技術(shù)結(jié)合云計(jì)算、區(qū)塊鏈、人工智能等新技術(shù)向金融領(lǐng)域滲透融合,釋放出裂變式的創(chuàng)新活力和應(yīng)用潛能,為金融行業(yè)包括財(cái)務(wù)公司帶來巨大的機(jī)遇。 近年來,我國金融科技快速發(fā)展,在多個(gè)領(lǐng)域已經(jīng)走在世...

近年來,大數(shù)據(jù)技術(shù)結(jié)合云計(jì)算、區(qū)塊鏈、人工智能等新技術(shù)向金融領(lǐng)域滲透融合,釋放出裂變式的創(chuàng)新活力和應(yīng)用潛能,為金融行業(yè)包括財(cái)務(wù)公司帶來巨大的機(jī)遇。

近年來,我國金融科技快速發(fā)展,在多個(gè)領(lǐng)域已經(jīng)走在世界前列。大數(shù)據(jù)、人工智能、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)等技術(shù)與金融業(yè)務(wù)深度融合,大大推動(dòng)了我國金融業(yè)轉(zhuǎn)型升級(jí),助力金融更好地服務(wù)實(shí)體經(jīng)濟(jì),有效促進(jìn)了金融業(yè)整體發(fā)展。在這一發(fā)展過程中,又以大數(shù)據(jù)技術(shù)發(fā)展最為成熟、應(yīng)用最為廣泛。從發(fā)展特點(diǎn)和趨勢來看,“金融云”快速建設(shè)落地奠定了金融大數(shù)據(jù)的應(yīng)用基礎(chǔ),金融數(shù)據(jù)與其他跨領(lǐng)域數(shù)據(jù)的融合應(yīng)用不斷強(qiáng)化,人工智能正在成為金融大數(shù)據(jù)應(yīng)用的新方向,金融行業(yè)數(shù)據(jù)的整合、共享和開放正在成為趨勢,給金融行業(yè)帶來了新的發(fā)展機(jī)遇和巨大的發(fā)展動(dòng)力。

大數(shù)據(jù)涉及的行業(yè)過于廣泛,除金融外,還包括政治、教育、傳媒、醫(yī)學(xué)、商業(yè)、工農(nóng)業(yè)、互聯(lián)網(wǎng)等多個(gè)方面,各行業(yè)對大數(shù)據(jù)的定義目前尚未統(tǒng)一。大數(shù)據(jù)的特點(diǎn)可歸納為“4V”。第一,數(shù)據(jù)體量大(Volume),海量性也許是與大數(shù)據(jù)最相關(guān)的特征。第二,數(shù)據(jù)類型繁多(Variety),大數(shù)據(jù)既包括以事務(wù)為代表的傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù),還包括以網(wǎng)頁為代表的半結(jié)構(gòu)化數(shù)據(jù)和以視頻、語音信息為代表的非結(jié)構(gòu)化數(shù)據(jù)。第三,價(jià)值密度低(Value),大數(shù)據(jù)的體量巨大,但數(shù)據(jù)中的價(jià)值密度卻很低。比如幾個(gè)小時(shí)甚至幾天的監(jiān)控視頻中,有價(jià)值的線索或許只有幾秒鐘。第四,處理速度快(Velocity),大數(shù)據(jù)要求快速處理,時(shí)效性強(qiáng),要進(jìn)行實(shí)時(shí)或準(zhǔn)實(shí)時(shí)的處理。

金融行業(yè)一直較為重視大數(shù)據(jù)技術(shù)的發(fā)展。相比常規(guī)商業(yè)分析手段,大數(shù)據(jù)可以使業(yè)務(wù)決策具有前瞻性,讓企業(yè)戰(zhàn)略的制定過程更加理性化,實(shí)現(xiàn)生產(chǎn)資源優(yōu)化分配,依據(jù)市場變化迅速調(diào)整業(yè)務(wù)策略,提高用戶體驗(yàn)以及資金周轉(zhuǎn)率,降低庫存積壓的風(fēng)險(xiǎn),從而獲取更高的利潤。

當(dāng)前,大數(shù)據(jù)在金融行業(yè)典型的應(yīng)用場景有以下幾個(gè)方面:

在銀行業(yè)的應(yīng)用主要表現(xiàn)在兩個(gè)方面:一是信貸風(fēng)險(xiǎn)評估。以往銀行對企業(yè)客戶的違約風(fēng)險(xiǎn)評估多基于過往的信貸數(shù)據(jù)和交易數(shù)據(jù)等靜態(tài)數(shù)據(jù),內(nèi)外部數(shù)據(jù)資源整合后的大數(shù)據(jù)可提供前瞻性預(yù)測。二是供應(yīng)鏈金融。利用大數(shù)據(jù)技術(shù),銀行可以根據(jù)企業(yè)之間的投資、控股、借貸、擔(dān)保及股東和法人之間的關(guān)系,形成企業(yè)之間的關(guān)系圖譜,利于企業(yè)分析及風(fēng)險(xiǎn)控制。

在證券行業(yè)的應(yīng)用主要表現(xiàn)為:一是股市行情預(yù)測。大數(shù)據(jù)可以有效拓寬證券企業(yè)量化投資數(shù)據(jù)維度,幫助企業(yè)更精準(zhǔn)地了解市場行情,通過構(gòu)建更多元的量化因子,投研模型會(huì)更加完善。二是股價(jià)預(yù)測。大數(shù)據(jù)技術(shù)通過收集并分析社交網(wǎng)絡(luò)如微博、朋友圈、專業(yè)論壇等渠道上的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),形成市場主觀判斷因素和投資者情緒打分,從而量化股價(jià)中人為因素的變化預(yù)期。三是智能投資顧問。智能投資顧問業(yè)務(wù)提供線上投資顧問服務(wù),其基于客戶的風(fēng)險(xiǎn)偏好、交易行為等個(gè)性化數(shù)據(jù),依靠大數(shù)據(jù)量化模型,為客戶提供低門檻、低費(fèi)率的個(gè)性化財(cái)富管理方案。

在互聯(lián)網(wǎng)金融行業(yè)的應(yīng)用,一是精準(zhǔn)營銷。大數(shù)據(jù)通過用戶多維度畫像,對客戶偏好進(jìn)行分類篩選,從而達(dá)到精準(zhǔn)營銷的目的。二是消費(fèi)信貸?;诖髷?shù)據(jù)的自動(dòng)評分模型、自動(dòng)審批系統(tǒng)和催收系統(tǒng)可降低消費(fèi)信貸業(yè)務(wù)違約風(fēng)險(xiǎn)。

金融大數(shù)據(jù)的典型案例分析

為實(shí)時(shí)接收電子渠道交易數(shù)據(jù),整合銀行內(nèi)系統(tǒng)業(yè)務(wù)數(shù)據(jù)。中國交通銀行通過規(guī)則欲實(shí)現(xiàn)快速建模、實(shí)時(shí)告警與在線智能監(jiān)控報(bào)表等功能,以達(dá)到實(shí)時(shí)接收官網(wǎng)業(yè)務(wù)數(shù)據(jù),整合客戶信息、設(shè)備畫像、位置信息、官網(wǎng)交易日志、瀏覽記錄等數(shù)據(jù)的目的。

該系統(tǒng)通過為交通銀行卡中心構(gòu)建反作弊模型、實(shí)時(shí)計(jì)算、實(shí)時(shí)決策系統(tǒng),幫助擁有海量歷史數(shù)據(jù),日均增長超過兩千萬條日志流水的銀行卡中心,形成電子渠道實(shí)時(shí)反欺詐交易監(jiān)控能力。利用分布式實(shí)時(shí)數(shù)據(jù)采集技術(shù)和實(shí)時(shí)決策引擎,幫助信用卡中心高效整合多系統(tǒng)業(yè)務(wù)數(shù)據(jù),處理海量高并發(fā)線上行為數(shù)據(jù),識(shí)別惡意用戶和欺詐行為,并實(shí)時(shí)預(yù)警和處置;通過引入機(jī)器學(xué)習(xí)框架,對少量數(shù)據(jù)進(jìn)行分析、挖掘構(gòu)建并周期性更新反欺詐規(guī)則和反欺詐模型。

系統(tǒng)上線后,該銀行迅速監(jiān)控電子渠道產(chǎn)生的虛假賬號(hào)、偽裝賬號(hào)、異常登錄、頻繁登錄等新型風(fēng)險(xiǎn)和欺詐行為;系統(tǒng)穩(wěn)定運(yùn)行,日均處理逾兩千萬條日志流水、實(shí)時(shí)識(shí)別出近萬筆風(fēng)險(xiǎn)行為并進(jìn)行預(yù)警。數(shù)據(jù)接入、計(jì)算報(bào)警、案件調(diào)查的整體處理時(shí)間從數(shù)小時(shí)降低至秒級(jí),監(jiān)測時(shí)效提升近3000倍,上線3個(gè)月已幫助卡中心挽回?cái)?shù)百萬元的風(fēng)險(xiǎn)損失。

百度的搜索技術(shù)正在全面注入百度金融。百度金融使用的梯度增強(qiáng)決策樹算法可以分析大數(shù)據(jù)高維特點(diǎn),在知識(shí)分析、匯總、聚合、提煉等多個(gè)方面有其獨(dú)到之處,其深度學(xué)習(xí)能力利用數(shù)據(jù)挖掘算法能夠較好地解決大數(shù)據(jù)價(jià)值密度低等問題。百度“磐石”系統(tǒng)基于每日100億次搜索行為,通過200多個(gè)維度為8.6億賬號(hào)精確畫像,高效劃分人群,能夠?yàn)殂y行、互聯(lián)網(wǎng)金融機(jī)構(gòu)提供身份識(shí)別、反欺詐、信息檢驗(yàn)、信用分級(jí)等服務(wù)。該系統(tǒng)累計(jì)為百度內(nèi)部信貸業(yè)務(wù)攔截?cái)?shù)十萬欺詐用戶,攔截?cái)?shù)十億不良資產(chǎn)、減少數(shù)百萬人力成本,累計(jì)合作近500家社會(huì)金融機(jī)構(gòu),幫助其提升了整體風(fēng)險(xiǎn)防控水平。

金融大數(shù)據(jù)應(yīng)用面臨的挑戰(zhàn)及對策

大數(shù)據(jù)技術(shù)為金融行業(yè)帶來了裂變式的創(chuàng)新活力,其應(yīng)用潛力有目共睹,但在數(shù)據(jù)應(yīng)用管理、業(yè)務(wù)場景融合、標(biāo)準(zhǔn)統(tǒng)一、頂層設(shè)計(jì)等方面存在的瓶頸也有待突破。

一是數(shù)據(jù)資產(chǎn)管理水平仍待提高。主要體現(xiàn)在數(shù)據(jù)質(zhì)量不高、獲取方式單一、數(shù)據(jù)系統(tǒng)分散等方面。

二是應(yīng)用技術(shù)和業(yè)務(wù)探索仍需突破。主要體現(xiàn)在金融機(jī)構(gòu)原有的數(shù)據(jù)系統(tǒng)架構(gòu)相對復(fù)雜,涉及的系統(tǒng)平臺(tái)和供應(yīng)商較多,實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用的技術(shù)改造難度很大。同時(shí),金融行業(yè)的大數(shù)據(jù)分析應(yīng)用模型仍處于起步階段,成熟案例和解決方案仍相對較少,需要投入大量的時(shí)間和成本進(jìn)行調(diào)研和試錯(cuò)。系統(tǒng)誤判率相對較高。

三是行業(yè)標(biāo)準(zhǔn)和安全規(guī)范仍待完善。金融大數(shù)據(jù)缺乏統(tǒng)一的存儲(chǔ)管理標(biāo)準(zhǔn)和互通共享平臺(tái),對個(gè)人隱私的保護(hù)上還未形成可信的安全機(jī)制。

四是頂層設(shè)計(jì)和扶持政策還需強(qiáng)化。體現(xiàn)在金融機(jī)構(gòu)間的數(shù)據(jù)壁壘較為明顯,各自為戰(zhàn)問題突出,缺乏有效的整合協(xié)同。同時(shí),行業(yè)應(yīng)用缺乏整體性規(guī)劃,分散、臨時(shí)、應(yīng)激等特點(diǎn)突出,信息價(jià)值開發(fā)仍有較大潛力。

以上問題,一方面需要國家出臺(tái)促進(jìn)金融大數(shù)據(jù)發(fā)展的產(chǎn)業(yè)規(guī)劃和扶持政策,同時(shí),也需要行業(yè)分階段推動(dòng)金融數(shù)據(jù)開放、共享和統(tǒng)一平臺(tái)建設(shè),強(qiáng)化行業(yè)標(biāo)準(zhǔn)和安全規(guī)范。只有這樣,大數(shù)據(jù)技術(shù)才能在金融行業(yè)中穩(wěn)步應(yīng)用發(fā)展,不斷推動(dòng)金融行業(yè)的發(fā)展提升。

THEEND