在機器學(xué)習(xí)剛剛投入應(yīng)用時,最常見的就是電商領(lǐng)域——讓人們在網(wǎng)上買下自己不需要的東西。
如今電商平臺的形式越來越豐富:完全跟從平臺自身的直營模式、數(shù)據(jù)體系更完善的大品牌B類模式,以及低門檻的小微個人C類模式。其中,C類電商的智能推薦系統(tǒng)是最為復(fù)雜的。
C店的智能推薦為什么會難做?直營電商就不用討論太多了,統(tǒng)一的商品類目管理、統(tǒng)一的商品排序,在做智能推薦時,更多的是注重對用戶行為的識別和用戶數(shù)據(jù)的挖掘。天貓一類的B類品牌店鋪也一樣,店鋪數(shù)量較少,品牌店通常都有自己的專業(yè)的運營團隊、歷史數(shù)據(jù),在平臺方面,品牌店也會更加遵守規(guī)則。
可對于基數(shù)巨大、體量差異巨大、從業(yè)者生態(tài)復(fù)雜的C類店鋪來說,想要做出一套人人都滿意的智能推薦系統(tǒng),可沒那么容易。今天,我們就從C店賣家的角度出發(fā),看看智能推薦系統(tǒng)如何為其賦能。
逆推協(xié)同過濾算法,不僅僅是推薦
在C類電商中,智能推薦系統(tǒng)不僅僅要幫助用戶找到心儀的產(chǎn)品,還要幫助普通賣家更好的把握住流量。
我們可以看看早期的電商推薦系統(tǒng)是怎樣的。
以搜索展示為例,早期電商推薦最主要的原理就是文本相關(guān)性——也就是關(guān)鍵詞。最典型的表現(xiàn),就是淘寶商品往往會有一個特別長的標(biāo)題。
比如輸入“滑板”二字,會發(fā)現(xiàn)大多數(shù)商品會把滑板、長板、刷街、舞板甚至滑板車等等相關(guān)不相關(guān)的關(guān)鍵詞都加入了標(biāo)題中。這已經(jīng)是今天經(jīng)過多次修正后的搜索效果,可以想象一下,幾年前的電商搜索結(jié)果會是什么樣子:用戶想購買滑板,結(jié)果搜索結(jié)果里有一堆滑板車、滑板鞋、滑板襪……在標(biāo)題中加入多種名詞是商家為了獲取更多流量的無奈之舉,可對于用戶來說,這樣的體驗并不好。
而面對這種情況,電商行業(yè)衍生出了一種很有趣的解決方式——創(chuàng)造更豐富的數(shù)據(jù)體系,應(yīng)用更多的關(guān)聯(lián)推薦。
在電商買東西時,平臺總是向我們要求很多行為:收藏店鋪、收藏產(chǎn)品、加入購物車、為產(chǎn)品評分。這些行為都被平臺記錄,豐富著每個人的用戶畫像。
在應(yīng)用協(xié)同過濾推薦算法時,這些豐富的個人用戶畫像就成了重要的根據(jù),對單一用戶數(shù)據(jù)行為挖掘越深入、越準(zhǔn)確,就可以幫助用戶量較小的C類店鋪更好的預(yù)測買家行為、甚至對產(chǎn)品銷售進行預(yù)判。
比如我是一位第一次搜索滑板關(guān)鍵詞的買家,進入了一家C類店鋪,而我曾經(jīng)購買過運動休閑服飾,通過協(xié)同過濾算法,運動休閑服飾也會被推薦給在這家店鋪有過購買行為的用戶。這樣一來,賣家就能判斷我是一位有價值的用戶。
這樣的解釋或許有點復(fù)雜,但我們只要記住一點:豐富的行為數(shù)據(jù)體系會讓電商的協(xié)同過濾算法更加精準(zhǔn),而精準(zhǔn)的協(xié)同過濾算法不僅僅能把商品推薦給人,還能逆推得知人與商品的匹配程度。
對于賣家來說,他們可以從此得知每一次引流活動是否精準(zhǔn),更好的提高流量轉(zhuǎn)化率。
建立預(yù)測模型,讓數(shù)據(jù)找到彼此
對于如今的電商來說,搜索和頁面廣告兩個入口已經(jīng)不足以滿足賣家展示商品的需要和平臺間的競爭。主流的形式是在單一平臺上開拓更多的品類入口,比如京東的精品、淘寶的iFashion等等。
而平臺建立某一垂直品類的入口,自然不是拍腦門的決定,而是來自于流量、銷量的預(yù)測模型。
以iFashion這類面向年輕人的時裝入口為例,首先要做的就是數(shù)據(jù)特征的轉(zhuǎn)換,提取出用戶年齡、購買行為、消費能力,關(guān)聯(lián)出最受他們歡迎的產(chǎn)品品類。利用隨機森林或向量回歸等方式建模,模擬用戶在單一品類中的瀏覽行為、停留時間、甚至購買行為等等。
有了大概的估計后,再將入口上線、輔以流量支持。而對于C類店鋪的賣家而言,在更符合自己屬性的入口中不僅僅意味著獲取更精準(zhǔn)的流量,也能夠讓類似產(chǎn)品、用戶、店鋪進行關(guān)聯(lián)。
產(chǎn)品、用戶、店鋪三者形成一個三角,三者之間產(chǎn)生的任何數(shù)據(jù)關(guān)系帶來效果都是三倍計數(shù)。從而更好哺育未來預(yù)測模型的建立。
智能推薦的未來:識別非結(jié)構(gòu)化數(shù)據(jù)
除了以上兩種方式,目前的新趨勢,是通過NLP技術(shù)挖掘更多的非結(jié)構(gòu)化數(shù)據(jù)。
我們逐漸發(fā)現(xiàn),現(xiàn)在購物網(wǎng)站上的文字越來越多了——買家評價、電商頭條、商品問答等等。用戶在這些文字中流露出的情緒,對于賣家而言也是珍貴的數(shù)據(jù)資料。
對于C店而言,NLP技術(shù)的作用不僅僅是機器閱讀,更多的還有自然語言生成。阿里媽媽就推出過這樣的功能,利用NLP技術(shù)理解爆款產(chǎn)品的標(biāo)題,生成模型后為其他賣家修改產(chǎn)品標(biāo)題。相信未來通過算法模型生成爆款商品描述、宣傳文案等等也指日可待。
同樣的道理也能應(yīng)用在計算機視覺上,通過計算機視覺識別商品拍攝圖、店鋪網(wǎng)頁設(shè)計等等,歸納出適應(yīng)于不同品類、人群的設(shè)計風(fēng)格,供以賣家參考。想的更遙遠(yuǎn)一些,或許在未來,計算機視覺技術(shù)還可以通過商品圖片識別設(shè)計侵權(quán),從售賣渠道上斷絕侵權(quán)產(chǎn)品出現(xiàn)的可能。
總之,對于C類店鋪來說,在運營中對于智能營銷和機器學(xué)習(xí)等等的新技術(shù)的依賴要更加強烈。我們也能逐漸發(fā)現(xiàn),推薦算法本身似乎很少有改變,我們所做的,還是在更多的挖掘數(shù)據(jù),不管是設(shè)置用戶行為系統(tǒng)這樣主動的獲取方式,還是利用機器學(xué)習(xí)技術(shù)識別圖片、文字這樣被動的獲取。
而這對于平臺和C類店鋪賣家個人來說,都是最具性價比的方法。挖掘數(shù)據(jù)帶來好處更具普適性,C店電商本該是物種豐富的,平臺不能插手其中作物的生長,但有了數(shù)據(jù)作土壤,會讓整個生態(tài)更加繁茂。