在互聯(lián)網(wǎng)金融行業(yè),現(xiàn)在人們?cè)絹?lái)越重視大數(shù)據(jù)風(fēng)控,主要原因是大數(shù)據(jù)風(fēng)控能有效的控制壞賬率,從而讓企業(yè)盈利。
在大數(shù)據(jù)風(fēng)控企業(yè)中流傳著這樣一句話(huà),數(shù)據(jù)決定了數(shù)據(jù)分析的上線(xiàn),而大數(shù)據(jù)模型就是無(wú)限接近這個(gè)上線(xiàn),因此大數(shù)據(jù)模型中構(gòu)建一個(gè)完善的指標(biāo)體系是一件極其重要的事情。
從分類(lèi)上看,大數(shù)據(jù)風(fēng)控的模型主要有下面這幾類(lèi)指標(biāo):
用戶(hù)申請(qǐng)信息:類(lèi)似于性別、年齡、工作地址、主要聯(lián)系人等等
用戶(hù)使用過(guò)程中的信息:類(lèi)似于IP定位、用戶(hù)的資料修改的頻率
用戶(hù)第三方數(shù)據(jù):類(lèi)似于電商交易信息、社交網(wǎng)絡(luò)平臺(tái)等等數(shù)據(jù)類(lèi)型
在了解這些指標(biāo)之后,我們主要來(lái)說(shuō)一下大數(shù)據(jù)風(fēng)控模型的基本流程,數(shù)據(jù)收集、數(shù)據(jù)建模、構(gòu)建數(shù)據(jù)畫(huà)像和風(fēng)險(xiǎn)定價(jià)。
數(shù)據(jù)收集主要就是收集上述我們所說(shuō)的這些指標(biāo),通過(guò)這些指標(biāo),我們就可以進(jìn)行建模,常用的模型有:
聚類(lèi):主要是把相似的文本聚起來(lái),進(jìn)行統(tǒng)一的處理
分類(lèi):根據(jù)已經(jīng)識(shí)別到的風(fēng)險(xiǎn)行為或者無(wú)風(fēng)險(xiǎn)的行為,去預(yù)測(cè)正在發(fā)生的事情。
離群點(diǎn)檢測(cè):主要是查看IP地址,如IP登錄中存在著大量失敗,這種行為可能是暴力破解,但是如果全部成功,也有可能是機(jī)器導(dǎo)致的
建立大數(shù)據(jù)風(fēng)控模型之后,就需要構(gòu)建用戶(hù)的畫(huà)像,用戶(hù)畫(huà)像最底層的是機(jī)器學(xué)習(xí),因此需要對(duì)用戶(hù)的數(shù)據(jù)打標(biāo)簽,好的特征標(biāo)簽?zāi)軌蜃層脩?hù)畫(huà)像變得豐富,也能幫助提升機(jī)器學(xué)習(xí)算法的效果。
最后我們要做的就是風(fēng)險(xiǎn)定價(jià),現(xiàn)在的互聯(lián)網(wǎng)金融平臺(tái),大多采用多維度定價(jià)模式和定制化風(fēng)險(xiǎn)定價(jià)系統(tǒng)。
雖然目前來(lái)看使用多維度風(fēng)險(xiǎn)定價(jià)系統(tǒng)定價(jià)的平臺(tái)還是大多數(shù),但是隨著更加智能化的發(fā)展,不同人的風(fēng)控模型不同,定制化的風(fēng)險(xiǎn)定價(jià)系統(tǒng)會(huì)成為趨勢(shì)。
相較于傳統(tǒng)的風(fēng)控,大數(shù)據(jù)風(fēng)險(xiǎn)對(duì)片段式和零散的數(shù)據(jù)具有很好的整合能力,這一點(diǎn)讓大數(shù)據(jù)特別適用于征信行業(yè),因?yàn)樗梢运鸭鼘?duì)的數(shù)據(jù)維度,實(shí)現(xiàn)征信信息的有效補(bǔ)充。
當(dāng)前互聯(lián)網(wǎng)金融平臺(tái)最關(guān)注的是信用風(fēng)險(xiǎn)和詐欺風(fēng)險(xiǎn),大數(shù)據(jù)風(fēng)險(xiǎn)模型就能很好的幫助企業(yè)去辨別信用和詐欺風(fēng)險(xiǎn),幫助企業(yè)減少損失。