大數據,才是構建精準用戶畫像的絕招

怎么推
參考金融企業(yè)的數據類型和業(yè)務需求,可以將金融企業(yè)用戶畫像工作進行細化?;旧蠌臄祿械綌祿幚恚瑥膹娤嚓P數據到定性分類數據,從引入外部數據到依據業(yè)務場景進行篩選目標用戶。

用戶畫像(User Profile),作為大數據的根基,它完美地抽象出一個用戶的信息全貌,為進一步精準、快速地分析用戶行為習慣、消費習慣等重要信息,提供了足夠的數據基礎,奠定了大數據時代的基石。

什么是用戶畫像?

用戶畫像,即用戶信息標簽化,就是企業(yè)通過收集與分析消費者社會屬性、生活習慣、消費行為等主要信息的數據之后,完美地抽象出一個用戶的商業(yè)全貌作是企業(yè)應用大數據技術的基本方式。用戶畫像為企業(yè)提供了足夠的信息基礎,能夠幫助企業(yè)快速找到精準用戶群體以及用戶需求等更為廣泛的反饋信息。

用戶畫像的四階段

用戶畫像的焦點工作就是為用戶打“標簽”,而一個標簽通常是人為規(guī)定的高度精煉的特征標識,如年齡、性別、地域、用戶偏好等,最后將用戶的所有標簽綜合來看,就可以勾勒出該用戶的立體“畫像”了。

具體來講,當為用戶畫像時,需要以下四個階段:

用戶畫像的意義

用戶畫像的構建是有難度的。主要表現(xiàn)為以下四個方面:

為了精準地描述用戶特征,可以參考下面的思路,從用戶微觀畫像的建立→用戶畫像的標簽建模→用戶畫像的數據架構,我們由微觀到宏觀,逐層分析。

首先我們從微觀來看,如何給用戶的微觀畫像進行分級呢?如下圖所示

總原則:基于一級分類上述分類逐級進行細分。

第一分類:人口屬性、資產特征、營銷特性、興趣愛好、購物愛好、需求特征

第二分類…

第三分類……….

完成了對客戶微觀畫像分析后,就可以考慮為用戶畫像的標簽建模了。

從原始數據進行統(tǒng)計分析,得到事實標簽,再進行建模分析,得到模型標簽,再進行模型預測,得到預測標簽。

最后從宏觀層面總結,就是得到用戶畫像的數據架構。

LotuseeData蓮子數據在具體設備分析的統(tǒng)計基礎上,提供了更強大的自定義時間,用戶分組,渠道活動轉化追蹤等新功能,并累計了大量的設備和用戶標簽,為進一步的用戶畫像提供了堅實的基礎。

用戶畫像數據建模方法

伴隨著大數據應用的討論、創(chuàng)新,個性化技術成為了一個重要落地點。相比傳統(tǒng)的線下會員管理、問卷調查、購物籃分析,大數據第一次使得企業(yè)能夠通過互聯(lián)網便利地獲取用戶更為廣泛的反饋信息,為進一步精準、快速地分析用戶行為習慣、消費習慣等重要商業(yè)信息,提供了足夠的數據基礎。

伴隨著對人的了解逐步深入,一個概念悄然而生:用戶畫像(UserProfile),完美地抽象出一個用戶的信息全貌,可以看作企業(yè)應用大數據的根基。

一、什么是用戶畫像?

男,31歲,已婚,收入1萬以上,愛美食,團購達人,喜歡紅酒配香煙。

這樣一串描述即為用戶畫像的典型案例。如果用一句話來描述,即:用戶信息標簽化。

二、為什么需要用戶畫像

用戶畫像的核心工作是為用戶打標簽,打標簽的重要目的之一是為了讓人能夠理解并且方便計算機處理,如,可以做分類統(tǒng)計:喜歡紅酒的用戶有多少?喜歡紅酒的人群中,男、女比例是多少?

也可以做數據挖掘工作:利用關聯(lián)規(guī)則計算,喜歡紅酒的人通常喜歡什么運動品牌?利用聚類算法分析,喜歡紅酒的人年齡段分布情況?

大數據處理,離不開計算機的運算,標簽提供了一種便捷的方式,使得計算機能夠程序化處理與人相關的信息,甚至通過算法、模型能夠“理解” 人。當計算機具備這樣的能力后,無論是搜索引擎、推薦引擎、廣告投放等各種應用領域,都將能進一步提升精準度,提高信息獲取的效率。

三、如何構建用戶畫像

一個標簽通常是人為規(guī)定的高度精煉的特征標識,如年齡段標簽:25~35歲,地域標簽:北京,標簽呈現(xiàn)出兩個重要特征:語義化,人能很方便地理解每個標簽含義。這也使得用戶畫像模型具備實際意義。能夠較好的滿足業(yè)務需求。如,判斷用戶偏好。

短文本,每個標簽通常只表示一種含義,標簽本身無需再做過多文本分析等預處理工作,這為利用機器提取標準化信息提供了便利。

人制定標簽規(guī)則,并能夠通過標簽快速讀出其中的信息,機器方便做標簽提取、聚合分析。所以,用戶畫像,即:用戶標簽,向我們展示了一種樸素、簡潔的方法用于描述用戶信息。

3.1 數據源分析

構建用戶畫像是為了還原用戶信息,因此數據來源于:所有用戶相關的數據。

對于用戶相關數據的分類,引入一種重要的分類思想:封閉性的分類方式。如,世界上分為兩種人,一種是學英語的人,一種是不學英語的人;客戶分三類,高價值客戶,中價值客戶,低價值客戶;產品生命周期分為,投入期、成長期、成熟期、衰退期…所有的子分類將構成了類目空間的全部集合。

這樣的分類方式,有助于后續(xù)不斷枚舉并迭代補充遺漏的信息維度。不必擔心架構上對每一層分類沒有考慮完整,造成維度遺漏留下擴展性隱患。另外,不同的分類方式根據應用場景,業(yè)務需求的不同,也許各有道理,按需劃分即可。

本文將用戶數據劃分為靜態(tài)信息數據、動態(tài)信息數據兩大類。

靜態(tài)信息數據

用戶相對穩(wěn)定的信息,如圖所示,主要包括人口屬性、商業(yè)屬性等方面數據。這類信息,自成標簽,如果企業(yè)有真實信息則無需過多建模預測,更多的是數據清洗工作,因此這方面信息的數據建模不是本篇文章重點。

動態(tài)信息數據

用戶不斷變化的行為信息,如果存在上帝,每一個人的行為都在時刻被上帝那雙無形的眼睛監(jiān)控著,廣義上講,一個用戶打開網頁,買了一個杯子;與該用戶傍晚溜了趟狗,白天取了一次錢,打了一個哈欠等等一樣都是上帝眼中的用戶行為。當行為集中到互聯(lián)網,乃至電商,用戶行為就會聚焦很多,如上圖所示:瀏覽凡客首頁、瀏覽休閑鞋單品頁、搜索帆布鞋、發(fā)表關于鞋品質的微博、贊“雙十一大促給力”的微博消息。等等均可看作互聯(lián)網用戶行為。

本篇文章以互聯(lián)網電商用戶,為主要分析對象,暫不考慮線下用戶行為數據(分析方法雷同,只是數據獲取途徑,用戶識別方式有些差異)。

在互聯(lián)網上,用戶行為,可以看作用戶動態(tài)信息的唯一數據來源。如何對用戶行為數據構建數據模型,分析出用戶標簽,將是本文著重介紹的內容。

3.2 目標分析

用戶畫像的目標是通過分析用戶行為,最終為每個用戶打上標簽,以及該標簽的權重。如,紅酒 0.8、李寧 0.6。

標簽,表征了內容,用戶對該內容有興趣、偏好、需求等等。

權重,表征了指數,用戶的興趣、偏好指數,也可能表征用戶的需求度,可以簡單的理解為可信度,概率。

3.3 數據建模方法

下面內容將詳細介紹,如何根據用戶行為,構建模型產出標簽、權重。一個事件模型包括:時間、地點、人物三個要素。每一次用戶行為本質上是一次隨機事件,可以詳細描述為:什么用戶,在什么時間,什么地點,做了什么事。

什么用戶:關鍵在于對用戶的標識,用戶標識的目的是為了區(qū)分用戶、單點定位。

以上列舉了互聯(lián)網主要的用戶標識方法,獲取方式由易到難。視企業(yè)的用戶粘性,可以獲取的標識信息有所差異。

什么時間:時間包括兩個重要信息,時間戳+時間長度。時間戳,為了標識用戶行為的時間點,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的時間戳即可。因為微秒的時間戳精度并不可靠。瀏覽器時間精度,準確度最多也只能到毫秒。時間長度,為了標識用戶在某一頁面的停留時間。

什么地點:用戶接觸點,Touch Point。對于每個用戶接觸點。潛在包含了兩層信息:網址 + 內容。網址:每一個url鏈接(頁面/屏幕),即定位了一個互聯(lián)網頁面地址,或者某個產品的特定頁面??梢允荘C上某電商網站的頁面url,也可以是手機上的微博,微信等應用某個功能頁面,某款產品應用的特定畫面。如,長城紅酒單品頁,微信訂閱號頁面,某游戲的過關頁。

內容:每個url網址(頁面/屏幕)中的內容??梢允菃纹返南嚓P信息:類別、品牌、描述、屬性、網站信息等等。如,紅酒,長城,干紅,對于每個互聯(lián)網接觸點,其中網址決定了權重;內容決定了標簽。

注:接觸點可以是網址,也可以是某個產品的特定功能界面。如,同樣一瓶礦泉水,超市賣1元,火車上賣3元,景區(qū)賣5元。商品的售賣價值,不在于成本,更在于售賣地點。標簽均是礦泉水,但接觸點的不同體現(xiàn)出了權重差異。這里的權重可以理解為用戶對于礦泉水的需求程度不同。即,愿意支付的價值不同。

標簽 權重

礦泉水 1 // 超市

礦泉水 3 // 火車

礦泉水 5 // 景區(qū)

類似的,用戶在京東商城瀏覽紅酒信息,與在品尚紅酒網瀏覽紅酒信息,表現(xiàn)出對紅酒喜好度也是有差異的。這里的關注點是不同的網址,存在權重差異,權重模型的構建,需要根據各自的業(yè)務需求構建。

所以,網址本身表征了用戶的標簽偏好權重。網址對應的內容體現(xiàn)了標簽信息。

什么事:用戶行為類型,對于電商有如下典型行為:瀏覽、添加購物車、搜索、評論、購買、點擊贊、收藏 等等。

不同的行為類型,對于接觸點的內容產生的標簽信息,具有不同的權重。如,購買權重計為5,瀏覽計為1

紅酒 1 // 瀏覽紅酒

紅酒 5 // 購買紅酒

綜合上述分析,用戶畫像的數據模型,可以概括為下面的公式:用戶標識 + 時間 + 行為類型 + 接觸點(網址+內容),某用戶因為在什么時間、地點、做了什么事。所以會打上**標簽。

用戶標簽的權重可能隨時間的增加而衰減,因此定義時間為衰減因子r,行為類型、網址決定了權重,內容決定了標簽,進一步轉換為公式:

標簽權重=衰減因子×行為權重×網址子權重

如:用戶A,昨天在品尚紅酒網瀏覽一瓶價值238元的長城干紅葡萄酒信息。

標簽:紅酒,長城時間:因為是昨天的行為,假設衰減因子為:r=0.95行為類型:瀏覽行為記為權重1地點:品尚紅酒單品頁的網址子權重記為 0.9(相比京東紅酒單品頁的0.7)

假設用戶對紅酒出于真的喜歡,才會去專業(yè)的紅酒網選購,而不再綜合商城選購。

則用戶偏好標簽是:紅酒,權重是0.95*0.7 * 1=0.665,即,用戶A:紅酒 0.665、長城 0.665。

上述模型權重值的選取只是舉例參考,具體的權重值需要根據業(yè)務需求二次建模,這里強調的是如何從整體思考,去構建用戶畫像模型,進而能夠逐步細化模型。

四、總結:

本文并未涉及具體算法,更多的是闡述了一種分析思想,在計劃構建用戶畫像時,能夠給您提供一個系統(tǒng)性、框架性的思維指導。

核心在于對用戶接觸點的理解,接觸點內容直接決定了標簽信息。內容地址、行為類型、時間衰減,決定了權重模型是關鍵,權重值本身的二次建模則是水到渠成的進階。模型舉例偏重電商,但其實,可以根據產品的不同,重新定義接觸點。

比如影視產品,我看了一部電影《英雄本色》,可能產生的標簽是:周潤發(fā) 0.6、槍戰(zhàn) 0.5、港臺 0.3。

最后,接觸點本身并不一定有內容,也可以泛化理解為某種閾值,某個行為超過多少次,達到多長時間等。

比如游戲產品,典型接觸點可能會是,關鍵任務,關鍵指數(分數)等等。如,積分超過1萬分,則標記為鉆石級用戶。鉆石用戶 1.0。

百分點現(xiàn)已全面應用用戶畫像技術于推薦引擎中,在對某電商客戶,針對活動頁新訪客的應用中,依靠用戶畫像產生的個性化效果,對比熱銷榜,推薦效果有顯著提升:推薦欄點擊率提升27%, 訂單轉化率提升34%。

新浪微博的用戶畫像是怎樣構建的?

1.概述

從上一篇《認識每一個“你”:微博中的用戶模型》里面對用戶模型維度的劃分可以看出,屬性和興趣維度的用戶模型都可以歸入用戶畫像(User Profile)的范疇。而所謂用戶畫像,簡單來說就是對用戶的信息進行標簽化。如圖1所示。一方面,標簽化是對用戶信息進行結構化,方便計算機的識別和處理;另一方面,標簽本身也具有準確性和非二義性,也有利于人工的整理、分析和統(tǒng)計。

用戶屬性指相對靜態(tài)和穩(wěn)定的人口屬性,例如:性別、年齡區(qū)間、地域、受教育程度、學校、公司……這些信息的收集和建立主要依靠產品本身的引導、調查、第三方提供等。微博本身就有比較完整的用戶注冊引導、用戶信息完善任務、認證用戶審核、以及大量的合作對象等,在收集和清洗用戶屬性的過程中,需要注意的主要是標簽的規(guī)范化以及不同來源信息的交叉驗證。

用戶興趣則是更加動態(tài)和易變化的特征,首先興趣受到人群、環(huán)境、熱點事件、行業(yè)……等方面的影響,一旦這些因素發(fā)生變化,用戶的興趣容易產生遷移;其次,用戶的行為(特指在互聯(lián)網上的行為)多樣且碎片化,不同行為反映出來的興趣差異較大。接下來主要介紹一下微博畫像中興趣維度的構建方法。

2.微博用戶興趣分析

1標簽來源

用戶自標簽、達人或認證標簽、公司、學校、微群標簽、星座、微博關鍵詞……這些來源都可能成為用戶的標簽。而針對每個特定的用戶收集標簽除了其自身以外,他關注用戶的標簽也會傳遞到該用戶身上。如圖2所示(藍色實線代表關注關系,橙色虛線代表興趣標簽來源)。

2權重計算

在收集到一個用戶可能存在的標簽后,還需要給標簽賦一定的權重,用來區(qū)分不同標簽對于該用戶的重要程度。不同標簽的來源用戶質量,標簽的傳遞路徑,轉發(fā)關系,標簽的本身,以及標簽與用戶之間的共現(xiàn)關系都會考慮在內。

不同質量的用戶自身產生的標簽權重不一樣,質量越高,認為該標簽的可信度越高,無論是將該標簽賦給自己還是傳遞出去的時候其權重值越高。

標簽的傳遞路徑主要是針對基于關注關系的標簽傳遞,親密度比較高的關注用戶傳遞過來的標簽權重值會比較高。

標簽是來自于用戶的原創(chuàng)還是其轉發(fā)的微博,權重值會有區(qū)別,一般來說原創(chuàng)的權重會高于轉發(fā)權重。

如果標簽本身是一個非常常見的詞,那么它用于刻畫用戶的興趣的區(qū)分性是比較差的,相反如果是一個長尾詞,則區(qū)分性較強。出于這樣的考慮,越是長尾詞,標簽的權重值會越高。

標簽與用戶的共現(xiàn)關系是指用戶和該標簽是否經常共同出現(xiàn),評價的是兩者的關聯(lián)性。關聯(lián)性越高,則標簽的權重值越高。

綜合上述的因素,一個標簽對于特定用戶的權重值可以大致表示為:標簽權重 = (來源因子 + 親密度因子 + 轉發(fā)因子 + 長尾因子) × 共現(xiàn)因子。

3時效性

隨著時間的變化,用戶的興趣會發(fā)生轉移,時間越久遠,標簽的權重應該相應的下降,距離當前時間越近的興趣標簽應該得到適當突出。出于這樣的考慮,一般會在標簽權重值上疊加一個時間衰減函數,這個時間衰減函數被設計成如圖3所示的指數衰減的形式,通過定義衰減幅度和半衰期,調節(jié)衰減的程度,體現(xiàn)不同的時效性。

此外,針對用戶的興趣,還會設定一個較小的時間窗口來獲取用戶的短期興趣。通過用戶在短時間內的原創(chuàng)、轉發(fā)和關注行為收集興趣標簽,并計算標簽的權重。短期興趣更新周期會較長期興趣更短,興趣更集中,但是能夠比較及時地反應用戶興趣的變化。

4從興趣到能力

然而,用戶具有某方面的興趣,只代表了他愿意接受這方面的信息,并不能代表他具有產生相關內容的能力。因此,在挖掘了用戶興趣標簽的基礎上,還需要發(fā)掘哪些用戶能夠針對特定的標簽具有一定的內容生產能力。

微博中的關注關系可以認為是一種認證,具有相同興趣的用戶之間的關注則有可能是興趣相投(當然也可能不是,但畢竟有一定的指導性),那么將具有相同興趣標簽的用戶提出來,通過關注關系構成一個圖,被認證得最多的用戶(被關注邊指向得最多)被認為在這個興趣標簽上具有最強能力。

大數據用戶畫像在金融行業(yè)實踐

一. 用戶畫像背后的原因

金融消費行為的改變, 企業(yè)無法接觸到客戶

80后、90后總計共有3.4億人口,并日益成為金融企業(yè)主要的消費者,但是他們的金融消費習慣正在改變,他們不愿意到金融網點辦理業(yè)務,不喜歡被動接受金融產品和服務。年輕人將主要的時間都消費在移動互聯(lián)網,消費在智能手機上。平均每個人,每天使用智能手機的時間超過了3小時,年輕人可能會超過4個小時。瀏覽手機已經成為工作和睡覺之后的,人類第三大生活習慣,移動APP也成為所有金融企業(yè)的客戶入口、服務入口、消費入口、數據入口。

金融企業(yè)越來越難面對面接觸到年輕人,無法像過去一樣,從對話中了解年輕人的想法,了解年輕人金融產品的需求。

消費者需求出現(xiàn)分化,需要尋找目標客戶

客戶消費習慣的改變,企業(yè)無法接觸到客戶,無法了解客戶需求;

客戶需求的分化,企業(yè)需要細分客戶,為目標客戶開發(fā)設計產品。

金融企業(yè)需要借助于戶畫像,來了解客戶,找到目標客戶,觸達客戶。

二. 用戶畫像的目的

用戶畫像是在解客戶需求和消費能力,以及客戶信用額度的基礎上,尋找潛在產品的目標客戶,并利用畫像信息為客戶開發(fā)產品。

提到用戶畫像,很多廠商都會提到360度用戶畫像,其實經常360度客戶畫像是一個廣告宣傳用語,根本不存數據可以全面描述客戶,透徹了解客戶。人是非常復雜的動物,信息緯度非常復雜,僅僅依靠外部信息來刻畫客戶內心需要根本不可能。

用戶畫像一詞具有很重的場景因素,不同企業(yè)對于用戶畫像有著不同對理解和需求。舉個例子,金融行業(yè)和汽車行業(yè)對于用戶畫像需求的信息完全不一樣,信息緯度也不同,對畫像結果要求也不同。每個行業(yè)都有一套適合自己行業(yè)的用戶畫像方法,但是其核心都是為客戶服務,為業(yè)務場景服務。

用戶畫像本質就是從業(yè)務角度出發(fā)對用戶進行分析,了解用戶需求,尋找目標客戶。另外一個方面就是,金融企業(yè)利用統(tǒng)計的信息,開發(fā)出適合目標客戶的產品。

從商業(yè)角度出發(fā)的用戶畫像對企業(yè)具有很大的價值,用戶畫像目的有兩個。

一個是業(yè)務場景出發(fā),尋找目標客戶。另外一個就是,參考用戶畫像的信息,為用戶設計產品或開展營銷活動。

三. 用戶畫像工作堅持的原則

市場上用戶畫像的方法很多,許多企業(yè)也提供用戶畫像服務,將用戶畫像提升到很有逼格一件事。金融企業(yè)是最早開始用戶畫像的行業(yè),由于擁有豐富的數據,金融企業(yè)在進行用戶畫像時,對眾多緯度的數據無從下手,總是認為用戶畫像數據緯度越多越好,畫像數據越豐富越好,某些輸入的數據還設定了權重甚至建立了模型,搞的用戶畫像是一個巨大而復雜的工程。但是費力很大力氣進行了畫像之后,卻發(fā)現(xiàn)只剩下了用戶畫像,和業(yè)務相聚甚遠,沒有辦法直接支持業(yè)務運營,投入精力巨大但是回報微小,可以說是得不償失,無法向領導交代。

事實上,用戶畫像涉及數據的緯度需要業(yè)務場景結合,既要簡單干練又要和業(yè)務強相關,既要篩選便捷又要方便進一步操作。用戶畫像需要堅持三個原則,分別是人口屬性和信用信息為主,強相關信息為主,定性數據為主。下面就分別展開進行解釋和分析。

3.1信用信息和人口屬性為主

描述一個用戶的信息很多,信用信息是用戶畫像中重要的信息,信用信息是描述一個人在社會中的消費能力信息。任何企業(yè)進行用戶畫像的目的是尋找目標客戶,其必須是具有潛在消費能力的用戶。信用信息可以直接證明客戶的消費能力,是用戶畫像中最重要和基礎的信息。一句戲言,所有的信息都是信用信息就是這個道理。其包含消費者工作、收入、學歷、財產等信息。

定位完目標客戶之后,金融企業(yè)需要觸達客戶,人口屬性信息就是起到觸達客戶的作用,人口屬性信息包含姓名、性別,電話號碼,郵件地址,家庭住址等信息。這些信息可以幫助金融企業(yè)聯(lián)系客戶,將產品和服務推銷給客戶。

3.2采用強相關信息,忽略弱相關信息

我們需要介紹一下強相關信息和弱相關信息。強相關信息就是同場景需求直接相關的信息,其可以是因果信息,也可以是相關程度很高的信息。

如果定義采用0到1作為相關系數取值范圍的化,0.6以上的相關系數就應該定義為強相關信息。例如在其他條件相同的前提下,35歲左右人的平均工資高于平均年齡為30歲的人,計算機專業(yè)畢業(yè)的學生平均工資高于哲學專業(yè)學生,從事金融行業(yè)工作的平均工資高于從事紡織行業(yè)的平均工資,上海的平均工資超過海南省平均工資。從這些信息可以看出來人的年齡、學歷、職業(yè)、地點對收入的影響較大,同收入高低是強相關關系。簡單的將,對信用信息影響較大的信息就是強相關信息,反之則是弱相關信息。

用戶其他的信息,例如用戶的身高、體重、姓名、星座等信息,很難從概率上分析出其對消費能力的影響,這些弱相關信息,這些信息就不應該放到用戶畫像中進行分析,對用戶的信用消費能力影響很小,不具有較大的商業(yè)價值。

用戶畫像和用戶分析時,需要考慮強相關信息,不要考慮弱相關信息,這是用戶畫像的一個原則。

3.3將定量的信息歸類為定性的信息

用戶畫像的目的是為產品篩選出目標客戶,定量的信息不利于對客戶進行篩選,需要將定量信息轉化為定性信息,通過信息類別來篩選人群。

例如可以將年齡段對客戶進行劃分,18歲-25歲定義為年輕人,25歲-35歲定義為中青年,36-45定義為中年人等??梢詤⒖紓€人收入信息,將人群定義為高收入人群,中等收入人群,低收入人群。參考資產信息也可以將客戶定義為高、中、低級別。定性信息的類別和方式方法,金融可以從自身業(yè)務出發(fā),沒有固定的模式。

將金融企業(yè)各類定量信息,集中在一起,對定性信息進行分類,并進行定性化,有利與對用戶進行篩選,快速定位目標客戶,是用戶畫像的另外一個原則。

用戶畫像的方法介紹,不要太復雜

金融企業(yè)需要結合業(yè)務需求進行用戶畫像,從實用角度出發(fā),我們可以將用戶畫像信息分成五類信息。分別是人口屬性,信用屬性,消費特征,興趣愛好,社交屬性。它們基本覆蓋了業(yè)務需求所需要的強相關信息,結合外部場景數據將會產生巨大的商業(yè)價值。我們先了解下用戶畫像的五大類信息的作用,以及涉及的強相關信息。特別復雜的用戶畫像緯度例如八個緯度,十個緯度信息都不利于商業(yè)應用,不建議金融企業(yè)進行采用,其他具有價值的信息,基本上都可以歸納到這五個緯度。金融企業(yè)達到其商業(yè)需求,從這五個緯度信息進行應用就可以了,不需要過于復雜用戶畫像這個工作,同時商業(yè)意義也不太大。

4.1人口屬性

用于描述一個人基本特征的信息,主要作用是幫助金融企業(yè)知道客戶是誰,如何觸達用戶。姓名,性別,年齡,電話號碼,郵箱,家庭住址都屬于人口屬性信息。

4.2信用屬性

用于描述用戶收入潛力和收入情況,支付能力。幫助企業(yè)了解客戶資產情況和信用情況,有利于定位目標客戶??蛻袈殬I(yè)、收入、資產、負債、學歷、信用評分等都屬于信用信息。

4.3消費特征

用于描述客戶主要消費習慣和消費偏好,用于尋找高頻和高價值客戶。幫助企業(yè)依據客戶消費特點推薦相關金融產品和服務,轉化率將非常高。為了便于篩選客戶,可以參考客戶的消費記錄將客戶直接定性為某些消費特征人群,例如差旅人群,境外游人群,旅游人群,餐飲用戶,汽車用戶,母嬰用戶,理財人群等。

4.4興趣愛好

用于描述客戶具有哪方面的興趣愛好,在這些興趣方面可能消費偏好比較高。幫助企業(yè)了解客戶興趣和消費傾向,定向進行活動營銷。興趣愛好的信息可能會和消費特征中部分信息有重復,區(qū)別在于數據來源不同。消費特征來源于已有的消費記錄,但是購買的物品和服務不一定是自己享用,但是興趣愛好代表本人的真實興趣。例如戶外運動愛好者,旅游愛好者,電影愛好者,科技發(fā)燒友,健身愛好者,奢侈品愛好者等。興趣愛好的信息可能來源于社交信息和客戶位置信息。

4.5社交信息

用于描述用戶在社交媒體的評論,這些信息往往代表用戶內心的想法和需求,具有實時性高,轉化率高的特點。例如客戶詢問上海哪里好玩?澳大利亞墨爾本的交通?房屋貸款哪家優(yōu)惠多?那個理財產品好?這些社交信息都是代表客戶多需求,如果企業(yè)可以及時了解到,將會有助于產品推廣。

這些用戶畫像信息歸類基本覆蓋了業(yè)務需求和產品開發(fā)所需要的信息,需要對這些信息進行進行整理和處理。根據業(yè)務場景,將定量的數據轉化為定性的數據,并將強相關數據進行整理。(36大數據)

5 金融企業(yè)用戶畫像的基本步驟

參考金融企業(yè)的數據類型和業(yè)務需求,可以將金融企業(yè)用戶畫像工作進行細化。基本上從數據集中到數據處理,從強相關數據到定性分類數據,從引入外部數據到依據業(yè)務場景進行篩選目標用戶。

5.1畫像相關數據的整理和集中

金融企業(yè)內部的信息分布在不同的系統(tǒng)中,一般情況下,人口屬性信息主要集中在客戶關系管理系統(tǒng),信用信息主要集中在交易系統(tǒng)和產品系統(tǒng)之中,也集中在客戶關系管理系統(tǒng)中,消費特征主要集中在渠道和產品系統(tǒng)中。

興趣愛好和社交信息需要從外部引入,例如客戶的行為軌跡可以代表其興趣愛好和品牌愛好,移動設備到位置信息可以提供較為準確的興趣愛好信息。社交信息,可以借助于金融行業(yè)自身的文本挖掘能力進行采集和分析,也是可以借助于廠商的技術能力在社交網站上直接獲得。社交信息往往是實時信息,商業(yè)價值較高,轉化率也較高,是大數據預測方面的主要信息來源。例如用戶在社交網站上提出羅馬哪里好玩的問題,就代表用戶未來可能有出國旅游的需求;如果客戶在對比兩款汽車的優(yōu)良,客戶購買汽車的可能性就較大。金融企業(yè)可以及時介入,為客戶提供金融服務。

客戶畫像數據主要分為五類,人口屬性、信用信息、消費特征、興趣愛好、社交信息。這些數據都分布在不同的信息系統(tǒng),金融企業(yè)都上線了數據倉庫(DW),所有畫像相關的強相關信息都可以從數據倉庫里面整理和集中,并且依據畫像商業(yè)需求,利用跑批作業(yè),加工數據,生成用戶畫像的原始數據。

數據倉庫成為用戶畫像數據的主要處理工具,依據業(yè)務場景和畫像需求將原始數據進行分類、篩選、歸納、加工等,生成用戶畫像需要的原始數據。

用戶畫像的緯度信息不是越多越好,只需要找到這五大類畫像信息強相關信息,同業(yè)務場景強相關信息,同產品和目標客戶強相關信息即可。根本不存在360度的用戶畫像信息,也不存在豐富的信息可以完全了解客戶,另外數據的實效性也要重點考慮。

5.2找到同業(yè)務場景強相關數據

依據用戶畫像的原則,所有畫像信息應該是五大分類的強相關信息。強相關信息是指同業(yè)務場景強相關信息,可以幫助金融行業(yè)定位目標客戶,了解客戶潛在需求,開發(fā)需求產品。

只有強相關信息才能幫助金融企業(yè)有效結合業(yè)務需求,創(chuàng)造商業(yè)價值。例如姓名、手機號、家庭地址就是能夠觸達客戶的強人口屬性信息,收入、學歷、職業(yè)、資產就是客戶信用信息的強相關信息。差旅人群、境外游人群、汽車用戶、旅游人群、母嬰人群就是消費特征的強相關信息。攝影愛好者、游戲愛好者、健身愛好者、電影人群、戶外愛好者就是客戶興趣愛好的強相關信息。社交媒體上發(fā)表的旅游需求,旅游攻略,理財咨詢,汽車需求,房產需求等信息代表了用戶的內心需求,是社交信息場景應用的強相關信息。

金融企業(yè)內部信息較多,在用戶畫像階段不需要對所有信息都采用,只需要采用同業(yè)務場景和目標客戶強相關的信息即可,這樣有助于提高產品轉化率,降低投資回報率(ROI),有利于簡單找到業(yè)務應用場景,在數據變現(xiàn)過程中也容易實現(xiàn)。

千萬不要將用戶畫像工作搞的過于復雜,同業(yè)務場景關系不大,這樣就讓很多金融企業(yè)特別是領導失去用戶畫像的興趣,看不到用戶畫像的商業(yè),不愿意在大數據領域投資。為企業(yè)帶來商業(yè)價值才是用戶畫像工作的主要動力和主要目的。

5.3對數據進行分類和標簽化(定量to定性)

金融企業(yè)集中了所有信息之后,依據業(yè)務需求,對信息進行加工整理,需要對定量的信息進行定性,方便信息分類和篩選。這部分工作建議在數據倉庫進行,不建議在大數據管理平臺(DMP)里進行加工。

定性信息進行定量分類是用戶畫像的一個重要工作環(huán)節(jié),具有較高的業(yè)務場景要求,考驗用戶畫像商業(yè)需求的轉化。其主要目的是幫助企業(yè)將復雜數據簡單化,將交易數據定性進行歸類,并且融入商業(yè)分析的要求,對數據進行商業(yè)加工。例如可以將客戶按照年齡區(qū)間分為學生,青年,中青年,中年,中老年,老年等人生階段。源于各人生階段的金融服務需求不同,在尋找目標客戶時,可以通過人生階段進行目標客戶定位。企業(yè)可以利用客戶的收入、學歷、資產等情況將客戶分為低、中、高端客戶,并依據其金融服務需求,提供不同的金融服務。可以參考其金融消費記錄和資產信息,以及交易產品,購買的產品,將客戶消費特征進行定性描述,區(qū)分出電商客戶,理財客戶,保險客戶,穩(wěn)健投資客戶,激進投資客戶,餐飲客戶,旅游客戶,高端客戶,公務員客戶等。利用外部的數據可以將定性客戶的興趣愛好,例如戶外愛好者,奢侈品愛好者,科技產品發(fā)燒友,攝影愛好者,高端汽車需求者等信息。

將定量信息歸納為定性信息,并依據業(yè)務需求進行標簽化,有助于金融企業(yè)找到目標客戶,并且了解客戶的潛在需求,為金融行業(yè)的產品找到目標客戶,進行精準營銷,降低營銷成本,提高產品轉化率。另外金融企業(yè)還可以依據客戶的消費特征、興趣愛好、社交信息及時為客戶推薦產品,設計產品,優(yōu)化產品流程。提高產品銷售的活躍率,幫助金融企業(yè)更好地為客戶設計產品。

5.4依據業(yè)務需求引入外部數據

利用數據進行畫像目的主要是為業(yè)務場景提供數據支持,包括尋找到產品的目標客戶和觸達客戶。金融企業(yè)自身的數據不足以了解客戶的消費特征、興趣愛好、社交信息。

金融企業(yè)可以引入外部信息來豐富客戶畫像信息,例如引入銀聯(lián)和電商的信息來豐富消費特征信息,引入移動大數據的位置信息來豐富客戶的興趣愛好信息,引入外部廠商的數據來豐富社交信息等。

外部信息的緯度較多,內容也很豐富,但是如何引入外部信息是一項具有挑戰(zhàn)的工作。外部信息在引入時需要考慮幾個問題,分別是外部數據的覆蓋率,如何和內部數據打通,和內部信息的匹配率,以及信息的相關程度,還有數據的鮮活度,這些都是引入外部信息的主要考慮緯度。外部數據魚龍混雜,數據的合規(guī)性也是金融企業(yè)在引入外部數據時的一個重要考慮,敏感的信息例如手機號、家庭住址、身份證號在引入或匹配時都應該注意隱私問題,基本的原則是不進行數據交換,可以進行數據匹配和驗證。

外部數據不會集中在某一家,需要金融企業(yè)花費大量時間進行尋找。外部數據和內部數據的打通是個很復雜的問題,手機號/設備號/身份證號的MD5數值匹配是一種好的方法,不涉及隱私數據的交換,可以進行唯一匹配。依據行業(yè)內部的經驗,沒有一家企業(yè)外部數據可以滿足企業(yè)要求,外部數據的引入需要多方面數據。一般情況下,數據覆蓋率達到70%以上,就是一個非常高的覆蓋率。覆蓋率達到20%以上就可以進行商業(yè)應用了。

金融行業(yè)外部數據源較好合作方有銀聯(lián)、芝麻信用、運營商、中航信、騰云天下、騰訊、微博、前海征信,各大電商平臺等。市場上數據提供商已經很多,并且數據質量都不錯,需要金融行業(yè)一家一家去挖掘,或者委托一個廠商代理引入也可以。獨立第三方幫助金融行業(yè)引入外部數據可以降低數據交易成本,同時也可以降低數據合規(guī)風險,是一個不錯的嘗試。另外各大城市和區(qū)域的大數據交易平臺,也是一個較好的外部數據引入方式。

5.5按照業(yè)務需求進行篩選客戶(DMP的作用)

用戶畫像主要目的是讓金融企業(yè)挖掘已有的數據價值,利用數據畫像技術尋找到目標客戶和客戶的潛在需求,進行產品推銷和設計改良產品。

用戶畫像從業(yè)務場景出發(fā),實現(xiàn)數據商業(yè)變現(xiàn)重要方式。用戶畫像是數據思維運營過程中的一個重要閉環(huán),幫助金融企業(yè)利用數據進行精細化運營和市場營銷,以及產品設計。用戶畫像就是一切以數據商業(yè)化運營為中心,以商業(yè)場景為主,幫助金融企業(yè)深度分析客戶,找到目標客戶。

DMP(大數據管理平臺)在整個用戶畫像過程中起到了一個數據變現(xiàn)的作用。從技術角度來講,DMP將畫像數據進行標簽化,利用機器學習算法來找到相似人群,同業(yè)務場景深度結合,篩選出具有價值的數據和客戶,定位目標客戶,觸達客戶,對營銷效果進行記錄和反饋。大數據管理平臺DMP過去主要應用在廣告行業(yè),在金融行業(yè)應用不多,未來會成為數據商業(yè)應用的主要平臺。

DMP可以幫助信用卡公司篩選出未來一個月可能進行分期付款的客戶,電子產品重度購買客戶,篩選出金融理財客戶,篩選出高端客戶(在本行資產很少,但是在他行資產很多),篩選出保障險種,壽險,教育險,車險等客戶,篩選出穩(wěn)健投資人,激進投資人,財富管理等方面等客戶,并且可以觸達這些客戶,提高產品轉化率,利用數據進行價值變現(xiàn)。DMP還可以了解客戶的消費習慣、興趣愛好、以及近期需求,為客戶定制金融產品和服務,進行跨界營銷。利用客戶的消費偏好,提高產品轉化率,提高用戶黏度。

DMP還作為引入外部數據的平臺,將外部具有價值的數據引入到金融企業(yè)內部,補充用戶畫像數據,創(chuàng)建不同業(yè)務應用場景和商業(yè)需求,特別是移動大數據、電商數據、社交數據的應用,可以幫助金融企業(yè)來進行數據價值變現(xiàn),讓用戶畫像離商業(yè)應用更加近一些,體現(xiàn)用戶畫像的商業(yè)價值。

用戶畫像的關鍵不是360度分析客戶,而是為企業(yè)帶來商業(yè)價值,離開了商業(yè)價值談用戶畫像就是耍流氓。金融企業(yè)用戶畫像項目出發(fā)點一定要從業(yè)務需求出發(fā),從強相關數據出發(fā),從業(yè)務場景應用出發(fā)。用戶畫像的本質就是深度分析客戶,掌握具有價值數據,找到目標客戶,按照客戶需求來定制產品,利用數據實現(xiàn)價值變現(xiàn)。

6 金融行業(yè)用戶畫像實踐

6.1銀行用戶畫像實踐介紹

銀行具有豐富的交易數據、個人屬性數據、消費數據、信用數據和客戶數據,用戶畫像的需求較大。但是缺少社交信息和興趣愛好信息。

到銀行網點來辦業(yè)務的人年紀偏大,未來消費者主要在網上進行業(yè)務辦理。銀行接觸不到客戶,無法了解客戶需求,缺少觸達客戶的手段。分析客戶、了解客戶、找到目標客戶、為客戶設計其需要的產品,成了銀行進行用戶畫像的主要目的。銀行的主要業(yè)務需求集中在消費金融、財富管理、融資服務,用戶畫像要從這幾個角度出發(fā),尋找目標客戶。

銀行的客戶數據很豐富,數據類型和總量較多,系統(tǒng)也很多??梢試栏褡裱脩舢嬒竦奈宕蟛襟E。先利用數據倉庫進行數據集中,篩選出強相關信息,對定量信息定性化,生成DMP需要的數據。利用DMP進行基礎標簽和應用定制,結合業(yè)務場景需求,進行目標客戶篩選或對用戶進行深度分析。同時利用DMP引入外部數據,完善數據場景設計,提高目標客戶精準度。找到觸達客戶的方式,對客戶進行營銷,并對營銷效果進行反饋,衡量數據產品的商業(yè)價值。利用反饋數據來修正營銷活動和提高ROI。形成市場營銷的閉環(huán),實現(xiàn)數據商業(yè)價值變現(xiàn)的閉環(huán)。另外DMP還可以深度分析客戶,依據客戶的消費特征、興趣愛好、社交需求、信用信息來開發(fā)設計產品,為金融企業(yè)的產品開發(fā)提供數據支撐,并為產品銷售方式提供場景數據。

簡單介紹一些DMP可以做到的數據場景變現(xiàn)。

A 尋找分期客戶

利用發(fā)卡機構數據+自身數據+信用卡數據,發(fā)現(xiàn)信用卡消費超過其月收入的用戶,推薦其進行消費分期。

B 尋找高端資產客戶

利用發(fā)卡機構數據+移動位置數據(別墅/高檔小區(qū))+物業(yè)費代扣數據+銀行自身數據+汽車型號數據,發(fā)現(xiàn)在銀行資產較少,在其他行資產較多的用戶,為其提供高端資產管理服務。

C 尋找理財客戶

利用自身數據(交易+工資)+移動端理財客戶端/電商活躍數據。發(fā)現(xiàn)客戶將工資/資產轉到外部,但是電商消費不活躍客戶,其互聯(lián)網理財可能性較大,可以為其提供理財服務,將資金留在本行。

D 尋找境外游客戶

利用自身卡消費數據+移動設備位置信息+社交好境外強相關數據(攻略,航線,景點,費用),尋找境外游客戶為其提供金融服務。

E 尋找貸款客戶

利用自身數據(人口屬性+信用信息)+移動設備位置信息+社交購房/消費強相關信息,尋找即將購車/購房的目標客戶,為其提供金融服務(抵押貸款/消費貸款)。

6.2保險行業(yè)用戶畫像實踐

保險行業(yè)的產品是一個長周期產品,保險客戶再次購買保險產品的轉化率很高,經營好老客戶是保險公司一項重要任務。保險公司內部的交易系統(tǒng)不多,交易方式不是很復雜,數據主要集中在產品系統(tǒng)和交易系統(tǒng)之中,客戶關系管理系統(tǒng)中也包含豐富了信息,但是數據集中在很多保險公司還沒有完成,數據倉庫建設可能需要在用戶畫像建設前完成。

保險公司主要數據有人口屬性信息,信用信息,產品銷售信息,客戶家人信息。缺少興趣愛好、消費特征、社交信息等信息。保險產品主要有壽險,車險,保障,財產險,意外險,養(yǎng)老險,旅游險。

保險行業(yè)DMP用戶畫像的業(yè)務場景都是圍繞保險產品進行的,簡單的應用場景可以是。

A依據自身數據(個人屬性)+外部養(yǎng)車App活躍情況,為保險公司找到車險客戶。

B依據自身數據(個人屬性)+移動設備位置信息,為保險企業(yè)找到商旅人群,推銷意外險和保障險。

C依據自身數據(家人數據)+人生階段信息,為用戶推薦理財保險,壽險,保障保險,養(yǎng)老險,教育險。

D依據自身數據+外部數據,為高端人士提供財產險和壽險。

6.3證券行業(yè)用戶畫像

2015年4月13日,一碼通實施之后,證券行業(yè)面臨了互聯(lián)網證券平臺的強力競爭,依據某機構發(fā)布的金融App排行榜,移動互聯(lián)網證券App,排名前5位的證券類App,只有一家傳統(tǒng)券商。排名第一的互聯(lián)網券商是排名第一傳統(tǒng)券商的6倍,前三名的互聯(lián)券商總體覆蓋用戶接近6000萬用戶。用戶總數還在不斷增加。傳統(tǒng)證券行業(yè)現(xiàn)在面臨的主要挑戰(zhàn)是用戶交易賬戶的爭奪,證券行業(yè)如何增加新用戶?如何留住用戶?如何提高證券行業(yè)用戶的活躍?如何提高單個客戶的收入?是證券行業(yè)主要的業(yè)務需求。

證券行業(yè)擁有的數據類型有個人屬性信息例如用戶名稱,手機號碼,家庭地址,郵件地址等。證券公司還擁有交易用戶的資產和交易紀錄,同時還擁有用戶收益數據,利用這些數據和外部數據,證券公司可以利用數據建立業(yè)務場景,篩選目標客戶,為用戶提供適合的產品,同時提高單個客戶收入。

證券公司可以利用用戶畫像數據來進行產品設計,下面舉幾個例子,看看用戶畫像和用戶分析來幫助證券公司創(chuàng)造商業(yè)價值。

7外部數據介紹

金融企業(yè)內部數據主要集中在個人屬性,信用屬性和消費特征上,缺少社交屬性和興趣偏好等信息,這些信息可以通過第三方獲得。

社交數據就是客戶在社交媒體上發(fā)表的言論和行為,可以是評論,文章,圖片,甚至可以是表情符號,音頻和視頻。社交數據可以依靠第三方平臺,在社交網站上利用爬蟲技術進行獲得(Spider)。社交數據的打通是一個挑戰(zhàn),如果能夠讓客戶的授權最好,金融企業(yè)就可以將社交數據納入到用戶畫像之中。社交數據具有實時和反映內心需要的特點,某銀行已經將社交數據作為分析客戶需求的一個重要數據緯度。例如如果某一個客戶在社交媒體上發(fā)表了一個問題,羅馬有哪些好玩的地方,金融企業(yè)就會推測客戶可能近期會有出境游的計劃,就會向客戶推銷一些旅游相關產品。

社交媒體數據正在成為金融企業(yè)積極爭取獲得的數據,除了利用網絡爬蟲技術到微博上進行數據采集之外,金融企業(yè)自身網站上到文本數據采集和呼叫中心(call center)紀錄的信息都可以進行文本挖掘。通過客戶編號,進行打通,將其補充到客戶畫像之中。社交數據需要通過數據挖掘將其定義為結構化數據,并且同業(yè)務場景、客戶需求向結合,清晰進行分類。例如將母嬰論壇發(fā)言活躍的用戶定義為潛在教育需求客戶,將學生論壇活躍的客戶定義為學區(qū)房需要客戶,將境外自助游論壇上活躍的客戶定義為境外旅游客戶,將理財APP上活躍的客戶定義為理財客戶等。金融企業(yè)完全可以從社交數據中挖掘出客戶近期的消費需求,及時進行市場營銷和定制產品。

興趣愛好數據可以借助于移動大數據位置信息獲得,客戶手機設備的位置軌跡信息可以揭示客戶喜歡何種品牌,喜歡吃辣還是吃火鍋,客戶喜歡旅游還是喜歡宅在家里,客戶喜歡看電影還是喜歡運動。客戶喜歡中檔品牌還是高檔品牌,客戶喜歡喝茶還是喝咖啡。移動手機上App的安裝情況和活動頻次一樣可以揭示客戶的興趣和愛好。同時移動大數據進行加工之后還可以告訴金融企業(yè),客戶近期的需求是買車還是買房。

外部數據引入過程中,金融企業(yè)面臨的巨大挑戰(zhàn)是外部數據的覆蓋率,如何打通內外部數據,外部數據同內部客戶的匹配率,外部數據同業(yè)務的相關度,外部數據的活躍程度等。用戶畫像平臺(DMP)可以通過技術手段將外部數據引入到金融企業(yè)內部,建立標準的標簽體系,提供靈活的用戶畫像方式,按照業(yè)務場景進行篩選客戶。

8 移動大數據的商業(yè)價值

移動互聯(lián)網時代,移動大數據具有較高的商業(yè)價值。如果一個用戶不喜歡一個App,其不會裝在手機上??蛻艚洺J褂玫腁pp可以推測用戶的興趣愛好和消費偏好。另外移動設備的位置信息可以幫助金融企業(yè)了解客戶行為軌跡、興趣愛好、品牌偏好和消費需求。

8.1移動App提供一切服務,App可以反映用戶喜好

智能手機上安裝的App正在代替PC互聯(lián)網為所有客戶提供服務,清晨起床可以看看天氣,了解一下今天的天氣情況。出門時可以通過打車App來預定出租車,安排出行?;蛘咄ㄟ^地圖App來了解路況信息,決定進行從哪條路到公司。快到中午時,可以通過外賣App預定午餐,如果想出去吃飯可以利用團購App訂餐和買單。中午可以利用旅游App預定家庭旅行機票和酒店,還可以將通過App看看理財產品。如果需要看電影,可以通過票務App來預定要電影票,如果需要看醫(yī)生,可以通過醫(yī)療App預約醫(yī)生。晚上可以透過App購物、監(jiān)督子女教育等??梢钥闯鲆苿覣pp已經可以滿足人們大部分生活需要,提供了人們的衣食住行、教育、醫(yī)療、旅游、金融等服務。移動App包圍了人們的日常生活,成為人們消費的主要場所。

智能手機上App使用的頻率,可以代表用戶的喜好。例如喜歡理財的客戶,其智能手機上一定會安裝理財App,并經常使用;母嬰人群也會安裝和母嬰相關的App,頻繁使用;商旅人群使用商旅App的頻率一定會高于其他移動用戶。80后、90后的消費行為將會以移動互聯(lián)網為主,App的安裝和活躍數據更加能夠反應出年輕人的消費偏好。

8.2智能設備的位置信息,商業(yè)價值廣大

智能手機設備的位置信息代表了消費者的位置軌跡,這個軌跡可以推測出消費者的消費偏好和習慣。在美國,移動設備位置信息的商業(yè)化較為成熟,GPS數據正在幫助很多企業(yè)進行數據變現(xiàn),提高社會運營效率。在中國,移動大數據的商業(yè)應用剛剛開始,在房地產業(yè)、零售行業(yè)、金融行業(yè)、市場分析等領域取得了一些效果。移動大數據中的位置信息代表了用戶軌跡,商業(yè)應用較早。2014年,美國移動設備位置信息的市場規(guī)模接近1000億美金。但中國移動設備位置信息的商業(yè)應用才剛剛開始。目前主要的應用在互聯(lián)網金融的反欺詐領域。

線上的欺詐行為具有較高的隱蔽性,很難識別和偵測。P2P貸款用戶很大一部分來源于線上,因此惡意欺詐事件發(fā)生在線上的風險遠遠大于線下。中國的很多數據處于封閉狀態(tài),P2P公司在客戶真實信息驗證方面面臨較大的挑戰(zhàn)。

移動大數據可以驗證P2P客戶的居住地點,例如某個客戶在利用手機申請貸款時,填寫自己居住地是上海。但是P2P企業(yè)依據其提供的手機設備信息,發(fā)現(xiàn)其過去三個月從來沒有居住在上海,這個人提交的信息可能是假信息,發(fā)生惡意欺詐的風險較高。移動設備的位置信息可以辨識出設備持有人的居住地點,幫助P2P公司驗證貸款申請人的居住地。

借款用戶的工作單位是用戶還款能力的強相關信息,具有高薪工作的用戶,其貸款信用違約率較低。這些客戶成為很多貸款平臺積極爭取的客戶,也是惡意欺詐團伙主要假冒的客戶。

某個用戶在申請貸款時,如果聲明自己是工作在上海陸家嘴金融企業(yè)的高薪人士,其貸款審批會很快并且額度也會較高。但是P2P公司利用移動大數據,發(fā)現(xiàn)這個用戶在過去的三個月里面,從來沒有出現(xiàn)在陸家嘴,大多數時間在城鄉(xiāng)結合處活動,那么這個用戶惡意欺詐的可能性就較大。

移動大數據可以幫助P2P公司在一定程度上來驗證貸款用戶真實工作地點,降低犯罪分子利用高薪工作進行惡意欺詐的風險。

P2P企業(yè)可以利用移動設備的位置信息,了解過去3個月用戶的行為軌跡。如果某個用戶經常在半夜2點出現(xiàn)在酒吧等危險區(qū)域,并且經常有飆車行為,這個客戶定義成高風險客戶的概率就較高。移動App的使用習慣和某些高風險App也可以幫助P2P企業(yè)識別出用戶的高風險行為。如果用戶經常在半夜2點頻繁使用App,其成為高風險客戶的概率就較大。

移動大數據在預防互聯(lián)網惡意欺詐和高風險客戶識別方面,已經有了成熟的應用場景。很多公司已經開始利用第三方機構的數據,預防互聯(lián)網惡意欺詐和識別高風險客戶,并取得了較好的效果。移動大數據應用場景正在被逐步挖掘出來,未來移動大數商業(yè)應用將更加廣闊。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論