王川:小米做 AI 爆款的方法論

虎嗅網(wǎng)
佚名
人工智能可能是2017年中國互聯(lián)網(wǎng)討論最多的一個關(guān)鍵詞,但如何落地、找到真實且剛需的用戶場景,一直是令業(yè)界最為頭疼的問題。 過去幾個月,小米有兩款人工智能產(chǎn)品成為市面上的爆品。在整個電視行業(yè)陷入低迷的20...

人工智能可能是2017年中國互聯(lián)網(wǎng)討論最多的一個關(guān)鍵詞,但如何落地、找到真實且剛需的用戶場景,一直是令業(yè)界最為頭疼的問題。

過去幾個月,小米有兩款人工智能產(chǎn)品成為市面上的爆品。在整個電視行業(yè)陷入低迷的2017年,小米一躍成為線上銷量第一的電視品牌,最大的貢獻來自其主打人工智能語音的系列——小米電視4A。小米AI音箱更是成為國內(nèi)賣的最多、也是最難買的一款智能音箱。而這兩款產(chǎn)品的爆紅,并不像外界想象的那樣,是趕上了AI的風口;恰恰相反,它們其實是跟隨用戶需求不斷進化而來的「網(wǎng)紅」。

最近我和小米聯(lián)合創(chuàng)始人、小米電視負責人王川聊了聊小米AI音箱的前世今生,以及小米連續(xù)制造爆款的最大秘密武器……

為了保證原汁原味地呈現(xiàn)干貨,接招以王川口述的形式加以整理、編輯。

雷軍最煩“布局”二字

“小愛同學”可以說是目前中國市場上使用體驗最好的智能音箱。微軟、亞馬遜和Google的相關(guān)負責人看了以后第一個反應(yīng)就是,怎么這么快?

其實我們在很多方面已經(jīng)不落后于國際的一線巨頭了,主要原因是我們有大量的用戶在用。小愛同學最早是在小米電視上實現(xiàn)的。當時為了解決電視語音的交互問題。因為電視跟手機不一樣,電視搜索一直是最困擾我們的問題。

在電視上,我今天看到的最好的交互工具就是遙控器,還沒有看到更好的交互工具。但是在電視上輸入一個文字是非常非常吃力的事兒。但有了語音以后,搜索問題就變成一句話的事兒了。我們最早在電視上做了語音助手,后來命名為“小愛同學”,再有現(xiàn)在的小愛音箱。可以說是環(huán)環(huán)相扣,但不存在布局一說。

在小米,雷軍最忌諱的就是“布局”二字,我們內(nèi)部沒有人談布局、沒人敢談布局??傆腥藛栁倚∶资窃趺床季值?,我說我們從來沒布局,在我們這兒布局是貶義詞。

我們想的就是怎么做出一款能“感動人心、價格厚道”的好產(chǎn)品。如果你能做出這樣的產(chǎn)品,這就是衡量你成功不成功的標志。所以我們其實看的都是產(chǎn)品,比如怎么把電視做好、怎么把它的交互做好、怎么把它的畫質(zhì)做好、怎么把它的音質(zhì)做好、怎么把它的外觀做漂亮。

小愛音箱其實也是產(chǎn)品需求的進化。我們這個團隊是做電視的,一直在研究電視的交互。去年10月我們在小米電視上嘗試了智能語音,在電視搜索上內(nèi)置了小愛同學這個智能語音功能。兩個月之后決定把這個功能升級為互聯(lián)網(wǎng)音箱,音質(zhì)特別特別好,上面帶了一個按鍵,帶語音,當時賣399,一下子賣得特別好。但那個是近場語音,遠場的一定更受歡迎。我們就把這個功能強化,推出了小愛音箱。

需求的進化:從遙控器到智能音箱

大家今天看到的是小愛音箱這個爆款,但沒有看到它是怎么一步步進化而來的。可以說,小米音箱的誕生,離不開我們最初的遙控器。小米電視最早做了11鍵遙控器,這是全球鍵數(shù)最少的遙控器。在此之前,所有的遙控器都是40多個按鍵,甚至100多個按鍵。

小米當時面臨的挑戰(zhàn)是,智能電視的功能要遠比功能機多很多。按照常規(guī),我們可能要加更多的按鍵才能控制智能電視這么多的功能。但是說實話,40多個按鍵已經(jīng)很難用了,如果再加幾百個按鍵基本上就不能用了。

當時決定做智能電視的時候,我問了一下傳統(tǒng)廠家:你們智能電視機的日活有多少?他們說先別說日活了,說聯(lián)網(wǎng)率,雖然智能電視賣出去了,但是真正連到互聯(lián)網(wǎng)的有多少?不到50%,聯(lián)網(wǎng)以后使用智能功能的有多少?他說不到5%。使用率極低,大家賣智能電視是把它當成一個噱頭來賣的。

后來我們開始當時設(shè)計這個遙控器,我對自己提了幾個要求:第一、我們能不能設(shè)計一個擁有世界上最少按鍵的遙控器、但是它能夠覆蓋功能機和智能機的全部功能;第二、這個遙控器應(yīng)該是4歲孩子到80歲老太太都能用;第三、不用看遙控器,可以盲操作。大家平時在家里看電視的時候燈光很昏暗,如果還需要看著遙控器去找按鍵,就很痛苦。所以我要求是憑手感、憑直覺,完全不用看。這是我們設(shè)計11鍵遙控器的初衷,這是當時世界上按鍵最少的電視遙控器。

做小米盒子就是為了做電視,所以設(shè)計小米盒子遙控器就是為了電視遙控器設(shè)計的。小米盒子出來以后才使得智能電視的使用成為可能。

以前為什么買回去智能電視,其中50%的人不聯(lián)網(wǎng)?聯(lián)網(wǎng)的人里面只有5%的人才會用智能電視功能?是因為根本沒法用,使用起來很痛苦。在Windows之前,我們?yōu)榱耸褂肈os,要上了一個月的課,就是你要先學一個月的課,然后才能使用Dos。Windows出來后,讓大家玩兩下就會上網(wǎng)。

有了這個遙控器,我一直覺得在智能電視的海量內(nèi)容下,操作應(yīng)該會很簡單了,但很快發(fā)現(xiàn)搜索一直是個問題。所以我們第一個在電視里頭做了“小愛同學”這個智能語音功能。因為我們發(fā)現(xiàn)一句話能解決的事兒,都特別適合語音來解決。

小米做AI的先天優(yōu)勢:數(shù)據(jù)

智能語音不是今天才有的,上個世紀我上大學的時候就有了,二十年來,一直沒有真正的使用。語音搜索一開始并不是百分之百準確,甚至很不靠譜。到今天,我們才突然發(fā)現(xiàn)它的準確率越來越高了,一個重要原因就是人工智能提升了它的準確率。當準確率達到一定程度的時候,用戶才可以接受。

我覺得這就像有一個無形的門檻:在門檻下,大家就不會用,過了門檻,大家都開始能接受了。所以,怎么使我這個語音的準確率達到用戶的使用門檻,我覺得是巨大的挑戰(zhàn)。

核心問題就是要有足夠多的數(shù)據(jù)。用的人越多,數(shù)據(jù)量越大,準確率就會越高。從小愛同學到小米音箱,之所以能夠持續(xù)爆款,就是因為小米有很大的用戶量。

“小愛同學”剛出來時,我說咱們做一塊錢公測,看看大家到底用不用,結(jié)果網(wǎng)上100多萬人報名,超出我想象。后來我說,再設(shè)計個門檻:家里至少有15個小愛同學能控制的家居設(shè)備(不是15件小米產(chǎn)品)的用戶才有資格參與。結(jié)果這100多萬人里有20多萬人符合。

公測以后,有用戶反饋說小愛同學控制不了家里的設(shè)備,我說怎么可能?就讓工程師去查,后來發(fā)現(xiàn)我們工程師限制了智能設(shè)備的連接數(shù)量,上限是200件。我說家里有200件?這不可能的啊。結(jié)果很多人說我們家里設(shè)備就是超過200件。

小愛音箱是今年7月份發(fā)布的,意圖準確度從當時的不到80%提升到了98%;真正銷售應(yīng)該是從9月底開始,到現(xiàn)在已經(jīng)有一億的數(shù)據(jù)了。就是因為小米有海量的數(shù)據(jù),所以使它在不停地學習,越用越好用。

當時做小愛音箱,其實心里也沒底。這個產(chǎn)品到底能不能被用戶接受,說實話,我們心里是打鼓的。從我個人來講,我認為肯定能賣,而且這個價錢也肯定能賣。但是到底能不能賣,得看實際情況,不能說我覺得好,它就能賣。創(chuàng)業(yè)這么多年,在產(chǎn)品上我們有過很多血淚教訓,我覺得特好的可能最后賣不動,我覺得不起眼的可能也賣得挺好。據(jù)說培養(yǎng)一個飛行員需要黃金等身,我覺得培養(yǎng)一個產(chǎn)品經(jīng)理可能需要花更多的錢、交更多的學費。

一開始我們只開了一套模具,一套模具是四萬臺的產(chǎn)量。為什么只開一套模具呢?因為我了解到市場上已有的同類產(chǎn)品,過去兩年時間才賣了四萬臺。一套模具一年大概是50萬臺的量,人家是兩年才干四萬臺,一年才兩萬臺,所以我覺得一套肯定夠。

很快,在公測之前我就覺得一套不夠了,我專門給廠商打電話,我說再加開兩套。沒想到的是,一上市,我又加開了四次模具。

 風口就是用戶需求

這都是根據(jù)需求一步一步向前推進的,而不是布局、規(guī)劃出來的。如果在電視上推了以后沒人用,我們就不會在音箱上去試了。我們最怕什么呢?最怕的不是技術(shù)先進不先進,而是用戶不用。如果小愛兩年只賣四萬臺,有什么用?你說我們的算法很好、科學家很好,語音都是世界最領(lǐng)先的,用戶沒用,就沒有數(shù)據(jù)。產(chǎn)品經(jīng)理就是要洞察用戶的需求,然后推動產(chǎn)品按照用戶的需求方向去走。我覺得這才是產(chǎn)品經(jīng)理的責任。

雷總經(jīng)常說風口,但風口是什么?我覺得這個風口就是用戶需求。用戶需求并不會隨著時間發(fā)生急劇的變化,實際上只是滿足用戶需求的解決方案在變。為什么解決方案會發(fā)生大規(guī)模變化呢?這就是技術(shù)帶來的。產(chǎn)品經(jīng)理就是要追求解決方案的最優(yōu)解。當時小米做遙控器,我們追求的就是最優(yōu)解。

最優(yōu)解有時間性。今天是一個最優(yōu)解,可能明天就不是了。不是最優(yōu)解發(fā)生了變化,而是技術(shù)發(fā)生了變化。比如小米遙控器原來的最優(yōu)解是11鍵,現(xiàn)在變成了12鍵,多了一個語音鍵,是因為今天語音技術(shù)成熟了。今天的最優(yōu)解不是昨天的最優(yōu)解,但是只有技術(shù)的變化才有可能產(chǎn)生新的最優(yōu)解。時機很重要。

我說的時機是什么呢?這個技術(shù)成熟到產(chǎn)生了新的最優(yōu)解,原來的最優(yōu)解變成了次優(yōu)解。在這個時間點,你應(yīng)該推出產(chǎn)品,早了它還是不是最優(yōu)解,晚了就不是你推出的最優(yōu)解了。

我記得很早以前IBM、索尼的產(chǎn)品都用指紋技術(shù),我也專門為這個買了筆記本,但是再也沒用過,那時的指紋功能根本不好用。但直到今天蘋果在手機上用了指紋以后,大家才算離不開指紋了。

語音識別其實有一個用戶體驗的門檻。在這個門檻之下,大家就不會用,超過這個門檻他就會用。產(chǎn)品經(jīng)理要把握這個門檻在哪,今天的技術(shù)到?jīng)]到這個程度,蘋果不會是現(xiàn)在有了指紋技術(shù),就采用它,蘋果一定是把握到了這個指紋已經(jīng)達到了用戶可接受的程度,才會在產(chǎn)品中采用。

雷總在做小米之前,大概是2009年10月份,他跟我講,2010年我們一定要創(chuàng)業(yè),一定要干,2010年不干,肯定來不及了,之前干又早了。他研究過,所有互聯(lián)網(wǎng)的大公司都是1998年進入互聯(lián)網(wǎng)或者轉(zhuǎn)型互聯(lián)網(wǎng)的。騰訊、阿里、百度、搜狐、網(wǎng)易,很奇怪都是1998年干的,或者1998年轉(zhuǎn)型的。從三大門戶到BAT,全是1998年那一年。

智能音箱這個事我覺得今年必須干,今年不干就很難了,今年就是風口,就是這個時機。我是從去年下半年才感受到,先推動在電視上弄。電視上一證明行,我就意識到今年必須干了,今年不成就來不及了,明年可能就做不大了。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論