隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,它應(yīng)用的領(lǐng)域越來(lái)越廣泛,幾乎已經(jīng)涵蓋了各個(gè)行業(yè),然而在眾多領(lǐng)域中金融業(yè)無(wú)疑是大數(shù)據(jù)最重要的應(yīng)用領(lǐng)域之一。大數(shù)據(jù)在金融行業(yè)中的應(yīng)用不僅可以使業(yè)務(wù)決策更具有前瞻性,還能讓企業(yè)戰(zhàn)略的制定過(guò)程更加理性化。
1
概述
近年來(lái),隨著大數(shù)據(jù)、云計(jì)算、區(qū)塊鏈、人工智能等新技術(shù)的快速發(fā)展,這些新技術(shù)與金融業(yè)務(wù)深度融合,釋放出了金融創(chuàng)新活力和應(yīng)用潛能,這大大推動(dòng)了我國(guó)金融業(yè)轉(zhuǎn)型升級(jí),助力金融更好地服務(wù)實(shí)體經(jīng)濟(jì),有效促進(jìn)了金融業(yè)整體發(fā)展。在這一發(fā)展過(guò)程中,又以大數(shù)據(jù)技術(shù)發(fā)展最為成熟、應(yīng)用最為廣泛。從發(fā)展特點(diǎn)和趨勢(shì)來(lái)看,“金融云”快速建設(shè)落地奠定了金融大數(shù)據(jù)的應(yīng)用基礎(chǔ),金融數(shù)據(jù)與其他跨領(lǐng)域數(shù)據(jù)的融合應(yīng)用不斷強(qiáng)化,人工智能正在成為金融大數(shù)據(jù)應(yīng)用的新方向,金融行業(yè)數(shù)據(jù)的整合、共享和開(kāi)放正在成為趨勢(shì),給金融行業(yè)帶來(lái)了新的發(fā)展機(jī)遇和巨大的發(fā)展動(dòng)力。
大數(shù)據(jù)涉及的行業(yè)過(guò)于廣泛,除金融外,還包括政治、教育、傳媒、醫(yī)學(xué)、商業(yè)、工業(yè)、農(nóng)業(yè)、互聯(lián)網(wǎng)等多個(gè)方面。根據(jù)國(guó)際知名咨詢公司麥肯錫的報(bào)告顯示:在大數(shù)據(jù)應(yīng)用綜合價(jià)值潛力方面,信息技術(shù)、金融保險(xiǎn)、政府及批發(fā)貿(mào)易四大行業(yè)潛力最高高。具體到行業(yè)內(nèi)每家公司的數(shù)據(jù)量來(lái)看,信息、金融保險(xiǎn)、計(jì)算機(jī)及電子設(shè)備、公用事業(yè)四類的數(shù)據(jù)量最大??梢钥闯?,無(wú)論是投資規(guī)模和應(yīng)用潛力,信息行業(yè)(互聯(lián)網(wǎng)和電信)和金融行業(yè)都是大數(shù)據(jù)應(yīng)用的重點(diǎn)行業(yè)。
大數(shù)據(jù)的特點(diǎn)可歸納為“4V”。
數(shù)據(jù)量(Volume), 海量性也許是與大數(shù)據(jù)最相關(guān)的特征。
多樣性(Variety),大數(shù)據(jù)既包括以事務(wù)為代表的傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù),還包括以網(wǎng)頁(yè)為代表的半結(jié)構(gòu)化數(shù)據(jù)和以視頻、語(yǔ)音信息為代表的非結(jié)構(gòu)化數(shù)據(jù)。
數(shù)據(jù)價(jià)值(Value),大數(shù)據(jù)的體量巨大,但數(shù)據(jù)中的價(jià)值密度卻很低。比如幾個(gè)小時(shí)甚至幾天的監(jiān)控視頻中,有價(jià)值的線索或許只有幾秒鐘。
動(dòng)態(tài)性(Velocity),大數(shù)據(jù)要求能夠快速處理數(shù)據(jù),時(shí)效性強(qiáng),要進(jìn)行實(shí)時(shí)或準(zhǔn)實(shí)時(shí)的處理。
金融行業(yè)一直較為重視大數(shù)據(jù)技術(shù)的發(fā)展。相比常規(guī)商業(yè)分析手段,大數(shù)據(jù)可以使業(yè)務(wù)決策具有前瞻性, 讓企業(yè)戰(zhàn)略的制定過(guò)程更加理性化,實(shí)現(xiàn)生產(chǎn)資源優(yōu)化分配,依據(jù)市場(chǎng)變化迅速調(diào)整業(yè)務(wù)策略,提高用戶體驗(yàn)以及資金周轉(zhuǎn)率,降低庫(kù)存積壓的風(fēng)險(xiǎn),從而獲取更高的價(jià)值和利潤(rùn)。
2
大數(shù)據(jù)技術(shù)在金融行業(yè)中的典型應(yīng)用
大數(shù)據(jù)技術(shù)在金融行業(yè)中有著廣泛的應(yīng)用, 下面將介紹大數(shù)據(jù)技術(shù)在銀行、證券、保險(xiǎn)等金融細(xì)分領(lǐng)域中的應(yīng)用。
2.1 銀行大數(shù)據(jù)應(yīng)用
國(guó)內(nèi)不少銀行已經(jīng)開(kāi)始嘗試通過(guò)大數(shù)據(jù)來(lái)驅(qū)動(dòng)業(yè)務(wù)運(yùn)營(yíng),如中信銀行信用卡中心使用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)了實(shí)時(shí)營(yíng)銷,光大銀行建立了社交網(wǎng)絡(luò)信息數(shù)據(jù)庫(kù),招商銀行則利用大數(shù)據(jù)發(fā)展小微貸款??偟膩?lái)看銀行大數(shù)據(jù)應(yīng)用可以分為四大方面。
2.1.1 客戶畫(huà)像
客戶畫(huà)像應(yīng)用主要分為個(gè)人客戶畫(huà)像和企業(yè)客戶畫(huà)像。個(gè)人客戶畫(huà)像包括人口統(tǒng)計(jì)學(xué)特征、消費(fèi)能力數(shù)據(jù)、興趣數(shù)據(jù)、風(fēng)險(xiǎn)偏好等;企業(yè)客戶畫(huà)像包括企業(yè)的生產(chǎn)、流通、運(yùn)營(yíng)、財(cái)務(wù)、銷售和客戶數(shù)據(jù)、相關(guān)產(chǎn)業(yè)鏈上下游等數(shù)據(jù)。值得注意的是,銀行擁有的客戶信息并不全面,基于銀行自身?yè)碛械臄?shù)據(jù)有時(shí)候難以得出理想的結(jié)果甚至可能得出錯(cuò)誤的結(jié)論。比如,如果某位信用卡客戶月均刷卡8次,平均每次刷卡金額800元,平均每年打4次客服電話,從未有過(guò)投訴,按照傳統(tǒng)的數(shù)據(jù)分析,該客戶是一位滿意度較高流失風(fēng)險(xiǎn)較低的客戶。但如果看到該客戶的微博,得到的真實(shí)情況是:工資卡和信用卡不在同一家銀行,還款不方便,好幾次打客服電話沒(méi)接通,客戶多次在微博上抱怨,該客戶流失風(fēng)險(xiǎn)較高。所以銀行不僅僅要考慮銀行自身業(yè)務(wù)所采集到的數(shù)據(jù),更應(yīng)考慮整合外部更多的數(shù)據(jù),以擴(kuò)展對(duì)客戶的了解。包括:
(1)客戶在社交媒體上的行為數(shù)據(jù)(如光大銀行建立了社交網(wǎng)絡(luò)信息數(shù)據(jù)庫(kù))。通過(guò)打通銀行內(nèi)部數(shù)據(jù)和外部社會(huì)化的數(shù)據(jù)可以獲得更為完整的客戶拼圖,從而進(jìn)行更為精準(zhǔn)的營(yíng)銷和管理;
(2)客戶在電商網(wǎng)站的交易數(shù)據(jù),如建設(shè)銀行則將自己的電子商務(wù)平臺(tái)和信貸業(yè)務(wù)結(jié)合起來(lái),阿里金融為阿里巴巴用戶提供無(wú)抵押貸款,用戶只需要憑借過(guò)去的信用即可;
(3)企業(yè)客戶的產(chǎn)業(yè)鏈上下游數(shù)據(jù)。如果銀行掌握了企業(yè)所在的產(chǎn)業(yè)鏈上下游的數(shù)據(jù),可以更好掌握企業(yè)的外部環(huán)境發(fā)展情況,從而可以預(yù)測(cè)企業(yè)未來(lái)的狀況;
(4)其他有利于擴(kuò)展銀行對(duì)客戶興趣愛(ài)好的數(shù)據(jù),如網(wǎng)絡(luò)廣告界目前正在興起的DMP數(shù)據(jù)平臺(tái)的互聯(lián)網(wǎng)用戶行為數(shù)據(jù)。
2.1.2 精準(zhǔn)營(yíng)銷
在客戶畫(huà)像的基礎(chǔ)上銀行可以有效的開(kāi)展精準(zhǔn)營(yíng)銷,包括:
(1)實(shí)時(shí)營(yíng)銷。實(shí)時(shí)營(yíng)銷是根據(jù)客戶的實(shí)時(shí)狀態(tài)來(lái)進(jìn)行營(yíng)銷,比如客戶當(dāng)時(shí)的所在地、客戶最近一次消費(fèi)等信息來(lái)有針對(duì)地進(jìn)行營(yíng)銷(某客戶采用信用卡采購(gòu)孕婦用品,可以通過(guò)建模推測(cè)懷孕的概率并推薦孕婦類喜歡的業(yè)務(wù));或者將改變生活狀態(tài)的事件(換工作、改變婚姻狀況、置居等)視為營(yíng)銷機(jī)會(huì);
(2)交叉營(yíng)銷。即不同業(yè)務(wù)或產(chǎn)品的交叉推薦,如招商銀行可以根據(jù)客戶交易記錄分析,有效地識(shí)別小微企業(yè)客戶,然后用遠(yuǎn)程銀行來(lái)實(shí)施交叉銷售;
(3)個(gè)性化推薦。銀行可以根據(jù)客戶的喜歡進(jìn)行服務(wù)或者銀行產(chǎn)品的個(gè)性化推薦,如根據(jù)客戶的年齡、資產(chǎn)規(guī)模、理財(cái)偏好等,對(duì)客戶群進(jìn)行精準(zhǔn)定位,分析出其潛在金融服務(wù)需求,進(jìn)而有針對(duì)性的營(yíng)銷推廣;
(4)客戶生命周期管理??蛻羯芷诠芾戆ㄐ驴蛻臬@取、客戶防流失和客戶贏回等。如招商銀行通過(guò)構(gòu)建客戶流失預(yù)警模型,對(duì)流失率等級(jí)前20%的客戶發(fā)售高收益理財(cái)產(chǎn)品予以挽留,使得金卡和金葵花卡客戶流失率分別降低了15個(gè)和7個(gè)百分點(diǎn)。
2.1.3 風(fēng)險(xiǎn)管理與風(fēng)險(xiǎn)控制
在風(fēng)險(xiǎn)管理和控制方面包括中小企業(yè)貸款風(fēng)險(xiǎn)評(píng)估和欺詐交易識(shí)別等手段。
(1)中小企業(yè)貸款風(fēng)險(xiǎn)評(píng)估。銀行可通過(guò)企業(yè)的產(chǎn)、流通、銷售、財(cái)務(wù)等相關(guān)信息結(jié)合大數(shù)據(jù)挖掘方法進(jìn)行貸款風(fēng)險(xiǎn)分析,量化企業(yè)的信用額度,更有效的開(kāi)展中小企業(yè)貸款。
(2)實(shí)時(shí)欺詐交易識(shí)別和反洗錢分析。銀行可以利用持卡人基本信息、卡基本信息、交易歷史、客戶歷史行為模式、正在發(fā)生行為模式(如轉(zhuǎn)賬)等,結(jié)合智能規(guī)則引擎(如從一個(gè)不經(jīng)常出現(xiàn)的國(guó)家為一個(gè)特有用戶轉(zhuǎn)賬或從一個(gè)不熟悉的位置進(jìn)行在線交易)進(jìn)行實(shí)時(shí)的交易反欺詐分析。如IBM金融犯罪管理解決方案幫助銀行利用大數(shù)據(jù)有效地預(yù)防與管理金融犯罪,摩根大通銀行則利用大數(shù)據(jù)技術(shù)追蹤盜取客戶賬號(hào)或侵入自動(dòng)柜員機(jī)(ATM)系統(tǒng)的罪犯。
2.1.4 運(yùn)營(yíng)優(yōu)化
(1)市場(chǎng)和渠道分析優(yōu)化。通過(guò)大數(shù)據(jù),銀行可以監(jiān)控不同市場(chǎng)推廣渠道尤其是網(wǎng)絡(luò)渠道推廣的質(zhì)量,從而進(jìn)行合作渠道的調(diào)整和優(yōu)化。同時(shí),也可以分析哪些渠道更適合推廣哪類銀行產(chǎn)品或者服務(wù),從而進(jìn)行渠道推廣策略的優(yōu)化。
(2)產(chǎn)品和服務(wù)優(yōu)化:銀行可以將客戶行為轉(zhuǎn)化為信息流,并從中分析客戶的個(gè)性特征和風(fēng)險(xiǎn)偏好,更深層次地理解客戶的習(xí)慣,智能化分析和預(yù)測(cè)客戶需求,從而進(jìn)行產(chǎn)品創(chuàng)新和服務(wù)優(yōu)化。如興業(yè)銀行目前對(duì)大數(shù)據(jù)進(jìn)行初步分析,通過(guò)對(duì)還款數(shù)據(jù)挖掘比較區(qū)分優(yōu)質(zhì)客戶,根據(jù)客戶還款數(shù)額的差別,提供差異化的金融產(chǎn)品和服務(wù)方式。
(3)輿情分析:銀行可以通過(guò)爬蟲(chóng)技術(shù),抓取社區(qū)、論壇和微博上關(guān)于銀行以及銀行產(chǎn)品和服務(wù)的相關(guān)信息,并通過(guò)自然語(yǔ)言處理技術(shù)進(jìn)行正負(fù)面判斷,尤其是及時(shí)掌握銀行以及銀行產(chǎn)品和服務(wù)的負(fù)面信息,及時(shí)發(fā)現(xiàn)和處理問(wèn)題;對(duì)于正面信息,可以加以總結(jié)并繼續(xù)強(qiáng)化。同時(shí),銀行也可以抓取同行業(yè)的銀行正負(fù)面信息,及時(shí)了解同行做的好的方面,以作為自身業(yè)務(wù)優(yōu)化的借鑒。
2.2 保險(xiǎn)行業(yè)大數(shù)據(jù)應(yīng)用
過(guò)去,由于保險(xiǎn)行業(yè)的代理人的特點(diǎn),所以在傳統(tǒng)的個(gè)人代理渠道,代理人的素質(zhì)及人際關(guān)系網(wǎng)是業(yè)務(wù)開(kāi)拓的最為關(guān)鍵因素,而大數(shù)據(jù)在在新客戶開(kāi)發(fā)和維系中的作用就沒(méi)那么突出。但隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)以及大數(shù)據(jù)的發(fā)展,網(wǎng)絡(luò)營(yíng)銷、移動(dòng)營(yíng)銷和個(gè)性化的電話銷售的作用將會(huì)日趨顯現(xiàn),越來(lái)越多的保險(xiǎn)公司注意到大數(shù)據(jù)在保險(xiǎn)行業(yè)中的作用??偟膩?lái)說(shuō),保險(xiǎn)行業(yè)的大數(shù)據(jù)應(yīng)用可以分為三大方面:客戶細(xì)分及精細(xì)化營(yíng)銷、欺詐行為分析和精細(xì)化運(yùn)營(yíng)。
2.2.1 客戶細(xì)分和精細(xì)化營(yíng)銷
(1)客戶細(xì)分和差異化服務(wù)。風(fēng)險(xiǎn)偏好是確定保險(xiǎn)需求的關(guān)鍵。風(fēng)險(xiǎn)喜好者、風(fēng)險(xiǎn)中立者和風(fēng)險(xiǎn)厭惡者對(duì)于保險(xiǎn)需求有不同的態(tài)度。一般來(lái)講,風(fēng)險(xiǎn)厭惡者有更大的保險(xiǎn)需求。在客戶細(xì)分的時(shí)候,除了風(fēng)險(xiǎn)偏好數(shù)據(jù)外,要結(jié)合客戶職業(yè)、愛(ài)好、習(xí)慣、家庭結(jié)構(gòu)、消費(fèi)方式偏好數(shù)據(jù),利用機(jī)器學(xué)習(xí)算法來(lái)對(duì)客戶進(jìn)行分類,并針對(duì)分類后的客戶提供不同的產(chǎn)品和服務(wù)策略。
(2)潛在客戶挖掘及流失用戶預(yù)測(cè)。保險(xiǎn)公司可通過(guò)大數(shù)據(jù)整合客戶線上和線下的相關(guān)行為,通過(guò)數(shù)據(jù)挖掘手段對(duì)潛在客戶進(jìn)行分類,細(xì)化銷售重點(diǎn)。通過(guò)大數(shù)據(jù)進(jìn)行挖掘,綜合考慮客戶的信息、險(xiǎn)種信息、既往出險(xiǎn)情況、銷售人員信息等,篩選出影響客戶退?;蚶m(xù)期的關(guān)鍵因素,并通過(guò)這些因素和建立的模型,對(duì)客戶的退保概率或續(xù)期概率進(jìn)行估計(jì),找出高風(fēng)險(xiǎn)流失客戶,及時(shí)預(yù)警,制定挽留策略,提高保單續(xù)保率。
(3)客戶關(guān)聯(lián)銷售。保險(xiǎn)公司可以關(guān)聯(lián)規(guī)則找出最佳險(xiǎn)種銷售組合、利用時(shí)序規(guī)則找出顧客生命周期中購(gòu)買保險(xiǎn)的時(shí)間順序,從而把握保戶提高保額的時(shí)機(jī)、建立既有保戶再銷售清單與規(guī)則,從而促進(jìn)保單的銷售。除了這些做法以外,借助大數(shù)據(jù),保險(xiǎn)業(yè)可以直接鎖定客戶需求。以淘寶運(yùn)費(fèi)退貨險(xiǎn)為例。據(jù)統(tǒng)計(jì),淘寶用戶運(yùn)費(fèi)險(xiǎn)索賠率在50%以上,該產(chǎn)品對(duì)保險(xiǎn)公司帶來(lái)的利潤(rùn)只有5%左右,但是有很多保險(xiǎn)公司都有意愿去提供這種保險(xiǎn)。因?yàn)榭蛻糍?gòu)買運(yùn)費(fèi)險(xiǎn)后保險(xiǎn)公司就可以獲得該客戶的個(gè)人基本信息,包括手機(jī)號(hào)和銀行賬戶信息等,并能夠了解該客戶購(gòu)買的產(chǎn)品信息,從而實(shí)現(xiàn)精準(zhǔn)推送。假設(shè)該客戶購(gòu)買并退貨的是嬰兒奶粉,我們就可以估計(jì)該客戶家里有小孩,可以向其推薦關(guān)于兒童疾病險(xiǎn)、教育險(xiǎn)等利潤(rùn)率更高的產(chǎn)品。
(4)客戶精準(zhǔn)營(yíng)銷。在網(wǎng)絡(luò)營(yíng)銷領(lǐng)域,保險(xiǎn)公司可以通過(guò)收集互聯(lián)網(wǎng)用戶的各類數(shù)據(jù),如地域分布等屬性數(shù)據(jù),搜索關(guān)鍵詞等即時(shí)數(shù)據(jù),購(gòu)物行為、瀏覽行為等行為數(shù)據(jù),以及興趣愛(ài)好、人脈關(guān)系等社交數(shù)據(jù),可以在廣告推送中實(shí)現(xiàn)地域定向、需求定向、偏好定向、關(guān)系定向等定向方式,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷。
2.2.2 欺詐行為分析
基于企業(yè)內(nèi)外部交易和歷史數(shù)據(jù),實(shí)時(shí)或準(zhǔn)實(shí)時(shí)預(yù)測(cè)和分析欺詐等非法行為,包括醫(yī)療保險(xiǎn)欺詐與濫用分析以及車險(xiǎn)欺詐分析等。
(1)醫(yī)療保險(xiǎn)欺詐與濫用分析。醫(yī)療保險(xiǎn)欺詐與濫用通??煞譃閮煞N,一是非法騙取保險(xiǎn)金,即保險(xiǎn)欺詐;另一類則是在保額限度內(nèi)重復(fù)就醫(yī)、浮報(bào)理賠金額等,即醫(yī)療保險(xiǎn)濫用。保險(xiǎn)公司能夠利用過(guò)去數(shù)據(jù),尋找影響保險(xiǎn)欺詐最為顯著的因素及這些因素的取值區(qū)間,建立預(yù)測(cè)模型,并通過(guò)自動(dòng)化計(jì)分功能,快速將理賠案件依照濫用欺詐可能性進(jìn)行分類處理。
(2)車險(xiǎn)欺詐分析。保險(xiǎn)公司夠利用過(guò)去的欺詐事件建立預(yù)測(cè)模型,將理賠申請(qǐng)分級(jí)處理,可以很大程度上解決車險(xiǎn)欺詐問(wèn)題,包括車險(xiǎn)理賠申請(qǐng)欺詐偵測(cè)、業(yè)務(wù)員及修車廠勾結(jié)欺詐偵測(cè)等。
2.2.3 精細(xì)化運(yùn)營(yíng)
(1)產(chǎn)品優(yōu)化,保單個(gè)性化。過(guò)去在沒(méi)有精細(xì)化的數(shù)據(jù)分析和挖掘的情況下,保險(xiǎn)公司把很多人都放在同一風(fēng)險(xiǎn)水平之上,客戶的保單并沒(méi)有完全解決客戶的各種風(fēng)險(xiǎn)問(wèn)題。但是,保險(xiǎn)公司可以通過(guò)自有數(shù)據(jù)以及客戶在社交網(wǎng)絡(luò)的數(shù)據(jù),解決現(xiàn)有的風(fēng)險(xiǎn)控制問(wèn)題,為客戶制定個(gè)性化的保單,獲得更準(zhǔn)確以及更高利潤(rùn)率的保單模型,給每一位顧客提供個(gè)性化的解決方案。
(2)運(yùn)營(yíng)分析。基于企業(yè)內(nèi)外部運(yùn)營(yíng)、管理和交互數(shù)據(jù)分析,借助大數(shù)據(jù)臺(tái),全方位統(tǒng)計(jì)和預(yù)測(cè)企業(yè)經(jīng)營(yíng)和管理績(jī)效?;诒kU(xiǎn)保單和客戶交互數(shù)據(jù)進(jìn)行建模,借助大數(shù)據(jù)平臺(tái)快速分析和預(yù)測(cè)再次發(fā)生或者新的市場(chǎng)風(fēng)險(xiǎn)、操作風(fēng)險(xiǎn)等。
(3)代理人(保險(xiǎn)銷售人員)甄選。根據(jù)代理人員(保險(xiǎn)銷售人員)業(yè)績(jī)數(shù)據(jù)、性別、年齡、入司前工作年限、其它保險(xiǎn)公司經(jīng)驗(yàn)和代理人人員思維性向測(cè)試等,找出銷售業(yè)績(jī)相對(duì)最好的銷售人員的特征,優(yōu)選高潛力銷售人員。
2.3 證券行業(yè)大數(shù)據(jù)應(yīng)用
大數(shù)據(jù)時(shí)代,大多數(shù)券商們已意識(shí)到大數(shù)據(jù)的重要性,券商對(duì)于大數(shù)據(jù)的研究與應(yīng)用正在處于起步階段,相對(duì)于銀行和保險(xiǎn)業(yè),證券行業(yè)的大數(shù)據(jù)應(yīng)用起步相對(duì)較晚。目前國(guó)內(nèi)外證券行業(yè)的大數(shù)據(jù)應(yīng)用大致有以下三個(gè)方向:
2.3.1 股價(jià)預(yù)測(cè)
2011年5月英國(guó)對(duì)沖基金Derwent Capital Markets建立了規(guī)模為4000 萬(wàn)美金的對(duì)沖基金,該基金是首家基于社交網(wǎng)絡(luò)的對(duì)沖基金,該基金通過(guò)分析Twitter 的數(shù)據(jù)內(nèi)容來(lái)感知市場(chǎng)情緒,從而指導(dǎo)進(jìn)行投資。利用 Twitter 的對(duì)沖基金 Derwent Capital Markets 在首月的交易中確實(shí)盈利了,其以1.85%的收益率,讓平均數(shù)只有0.76%的其他對(duì)沖基金相形見(jiàn)絀。
麻省理工學(xué)院的學(xué)者,根據(jù)情緒詞將twitter內(nèi)容標(biāo)定為正面或負(fù)面情緒。結(jié)果發(fā)現(xiàn),無(wú)論是如“希望”的正面情緒,或是“害怕”、“擔(dān)心”的負(fù)面情緒,其占總twitter內(nèi)容數(shù)的比例,都預(yù)示著道瓊斯指數(shù)、標(biāo)準(zhǔn)普爾500指數(shù)、納斯達(dá)克指數(shù)的下跌;美國(guó)佩斯大學(xué)的一位博士則采用了另外一種思路,他追蹤了星巴克、可口可樂(lè)和耐克三家公司在社交媒體上的受歡迎程度,同時(shí)比較它們的股價(jià)。他們發(fā)現(xiàn),F(xiàn)acebook上的粉絲數(shù)、Twitter 上的聽(tīng)眾數(shù)和 Youtude 上的觀看人數(shù)都和股價(jià)密切相關(guān)。另外,品牌的受歡迎程度,還能預(yù)測(cè)股價(jià)在10天、30天之后的上漲情況。但是,Twitter 情緒指標(biāo),仍然不可能預(yù)測(cè)出會(huì)沖擊金融市場(chǎng)的突發(fā)事件。例如,在2008年10月13號(hào),美國(guó)聯(lián)邦儲(chǔ)備委員會(huì)突然啟動(dòng)一項(xiàng)銀行紓困計(jì)劃,令道瓊斯指數(shù)反彈,而3天前的Twitter相關(guān)情緒指數(shù)毫無(wú)征兆。而且,研究者自己也意識(shí)到,Twitter 用戶與股市投資者并不完全重合,這樣的樣本代表性有待商榷,但仍無(wú)法阻止投資者對(duì)于新興的社交網(wǎng)絡(luò)傾注更多的熱情。
2.3.2 客戶關(guān)系管理
(1)客戶細(xì)分。通過(guò)分析客戶的賬戶狀態(tài)(類型、生命周期、投資時(shí)間)、賬戶價(jià)值(資產(chǎn)峰值、資產(chǎn)均值、交易量、傭金貢獻(xiàn)和成本等)、交易習(xí)慣(周轉(zhuǎn)率、市場(chǎng)關(guān)注度、倉(cāng)位、平均持股市值、平均持股時(shí)間、單筆交易均值和日均成交量等)、投資偏好(偏好品種、下單渠道和是否申購(gòu))以及投資收益(本期相對(duì)和絕對(duì)收益、今年相對(duì)和絕對(duì)收益和投資能力等),來(lái)進(jìn)行客戶聚類和細(xì)分,從而發(fā)現(xiàn)客戶交易模式類型,找出最有價(jià)值和盈利潛力的客戶群, 以及他們最需要的服務(wù), 更好地配置資源和政策, 改進(jìn)服務(wù),抓住最有價(jià)值的客戶。
(2)流失客戶預(yù)測(cè)。券商可根據(jù)客戶歷史交易行為和流失情況來(lái)建模從而預(yù)測(cè)客戶流失的概率。如2012年海通證券自主開(kāi)發(fā)的“給予數(shù)據(jù)挖掘算法的證券客戶行為特征分析技術(shù)”主要應(yīng)用在客戶深度畫(huà)像以及基于畫(huà)像的用戶流失概率預(yù)測(cè)。通過(guò)對(duì)海通100多萬(wàn)樣本客戶、半年交易記錄的海量信息分析,建立了客戶分類、客戶偏好、客戶流失概率的模型。該項(xiàng)技術(shù)最大初衷是希望通過(guò)客戶行為的量化分析,來(lái)測(cè)算客戶將來(lái)可能流失的概率。
2.3.3 智能投資顧問(wèn)
智能投資顧問(wèn)業(yè)務(wù)提供線上投資顧問(wèn)服務(wù),其基于客戶的風(fēng)險(xiǎn)偏好、交易行為等個(gè)性化數(shù)據(jù),依靠大數(shù)據(jù)量化模型,為客戶提供低門檻、低費(fèi)率的個(gè)性化財(cái)富管理方案。
2.3.4 投資景氣指數(shù)
2012年,國(guó)泰君安推出了“個(gè)人投資者投資景氣指數(shù)”(簡(jiǎn)稱3I指數(shù)),通過(guò)一個(gè)獨(dú)特的視角傳遞個(gè)人投資者對(duì)市場(chǎng)的預(yù)期、當(dāng)期的風(fēng)險(xiǎn)偏好等信息。國(guó)泰君安研究所對(duì)海量個(gè)人投資者樣本進(jìn)行持續(xù)性跟蹤監(jiān)測(cè),對(duì)賬本投資收益率、持倉(cāng)率、資金流動(dòng)情況等一系列指標(biāo)進(jìn)行統(tǒng)計(jì)、加權(quán)匯總后得到的綜合性投資景氣指數(shù)。
3I指數(shù)通過(guò)對(duì)海量個(gè)人投資者真實(shí)投資交易信息的深入挖掘分析,了解交易個(gè)人投資者交易行為的變化、投資信心的狀態(tài)與發(fā)展趨勢(shì)、對(duì)市場(chǎng)的預(yù)期以及當(dāng)前的風(fēng)險(xiǎn)偏好等信息。在樣本選擇上,選擇資金100萬(wàn)元以下、投資年限5年以上的中小投資者,樣本規(guī)模高達(dá)10萬(wàn),覆蓋全國(guó)不同地區(qū),所以,這個(gè)指數(shù)較為有代表性。在參數(shù)方面,主要根據(jù)中小投資者持倉(cāng)率的高低、是否追加資金、是否盈利這幾個(gè)指標(biāo),來(lái)看投資者對(duì)市場(chǎng)是樂(lè)觀還是悲觀。“3I指數(shù)”每月發(fā)布一次,以100為中間值,100—120屬于正常區(qū)間,120以上表示趨熱,100以下則是趨冷。從實(shí)驗(yàn)數(shù)據(jù)看,從2007年至今,“3I指數(shù)”的漲跌波動(dòng)與上證指數(shù)走勢(shì)擬合度相當(dāng)高。
3
金融大數(shù)據(jù)應(yīng)用面臨的挑戰(zhàn)及對(duì)策
大數(shù)據(jù)技術(shù)為金融行業(yè)帶來(lái)了裂變式的創(chuàng)新活力,其應(yīng)用潛力有目共睹,但在數(shù)據(jù)應(yīng)用管理、業(yè)務(wù)場(chǎng)景融合、標(biāo)準(zhǔn)統(tǒng)一、頂層設(shè)計(jì)等方面存在的瓶頸也有待突破。
數(shù)據(jù)資產(chǎn)管理水平仍待提高。主要體現(xiàn)在數(shù)據(jù)質(zhì)量不高、獲取方式單一、數(shù)據(jù)系統(tǒng)分散等方面。
應(yīng)用技術(shù)和業(yè)務(wù)探索仍需突破。主要體現(xiàn)在金融機(jī)構(gòu)原有的數(shù)據(jù)系統(tǒng)架構(gòu)相對(duì)復(fù)雜,涉及的系統(tǒng)平臺(tái)和供應(yīng)商較多,實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用的技術(shù)改造難度很大。同時(shí),金融行業(yè)的大數(shù)據(jù)分析應(yīng)用模型仍處于起步階段,成熟案例和解決方案仍相對(duì)較少,需要投入大量的時(shí)間和成本進(jìn)行調(diào)研和試錯(cuò)。系統(tǒng)誤判率相對(duì)較高。
行業(yè)標(biāo)準(zhǔn)和安全規(guī)范仍待完善。金融大數(shù)據(jù)缺乏統(tǒng)一的存儲(chǔ)管理標(biāo)準(zhǔn)和互通共享平臺(tái),對(duì)個(gè)人隱私的保護(hù)上還未形成可信的安全機(jī)制。
頂層設(shè)計(jì)和扶持政策還需強(qiáng)化。體現(xiàn)在金融機(jī)構(gòu)間的數(shù)據(jù)壁壘較為明顯,各自為戰(zhàn)問(wèn)題突出,缺乏有效的整合協(xié)同。同時(shí),行業(yè)應(yīng)用缺乏整體性規(guī)劃,分散、臨時(shí)、應(yīng)激等特點(diǎn)突出,信息價(jià)值開(kāi)發(fā)仍有較大潛力。
總的來(lái)看,大數(shù)據(jù)在金融行業(yè)的應(yīng)用起步比互聯(lián)網(wǎng)行業(yè)稍晚,其應(yīng)用深度和廣度還有很大的擴(kuò)展空間。金融行業(yè)的大數(shù)據(jù)應(yīng)用依然有很多的問(wèn)題需要克服,同時(shí)需要國(guó)家出臺(tái)促進(jìn)金融大數(shù)據(jù)發(fā)展的產(chǎn)業(yè)規(guī)劃和扶持政策,也需要行業(yè)分階段推動(dòng)金融數(shù)據(jù)開(kāi)放、共享和統(tǒng)一平臺(tái)建設(shè),強(qiáng)化行業(yè)標(biāo)準(zhǔn)和安全規(guī)范。只有這樣,大數(shù)據(jù)技術(shù)才能在金融行業(yè)中穩(wěn)步應(yīng)用發(fā)展,不斷推動(dòng)金融行業(yè)的發(fā)展提升。
(原標(biāo)題:大數(shù)據(jù)技術(shù)在金融行業(yè)中的應(yīng)用)