12月20日,成立一年半的AI公司驀然認(rèn)知在北京的發(fā)布會(huì)上發(fā)布新一代決策引擎MorUI 2.0。主打千人千面、高效自然的人機(jī)交互服務(wù)。
MorUI 2.0的一個(gè)個(gè)性化、多輪交互場(chǎng)景是:
男主人問:最近有什么新聞?
搭載該引擎的電視開始播報(bào)體育+科技新聞。
女主人問:最近有什么新鮮事?
搭載該引擎的電視直接播放《演員的誕生》和袁立的短視頻新聞。
女主人還可以繼續(xù)發(fā)問:《演員的誕生》最新一期什么時(shí)間播?袁立演過(guò)什么?她得過(guò)什么獎(jiǎng)?她是什么星座?
在現(xiàn)階段,讓機(jī)器理解語(yǔ)義還不太容易。圖像識(shí)別、語(yǔ)音識(shí)別的準(zhǔn)確率已經(jīng)達(dá)到一定程度,但自然語(yǔ)言處理仍處在攻堅(jiān)期。要讓機(jī)器真正實(shí)現(xiàn)智能,必須提升語(yǔ)義理解的準(zhǔn)確度與可用性。驀然認(rèn)知想做的,就是實(shí)現(xiàn)人機(jī)間的多輪對(duì)話,讓上述場(chǎng)景更加順暢自然。
如何提高準(zhǔn)確度?如何讓這一技術(shù)快速落地?如何實(shí)現(xiàn)商業(yè)化?近日驀然認(rèn)知?jiǎng)?chuàng)始人兼CEO戴帥湘接受了鳳凰網(wǎng)科技的采訪,分享了技術(shù)背后的故事。
驀然認(rèn)知CEO戴帥湘
今年1月,驀然認(rèn)知宣布完成1000萬(wàn)美元融資,經(jīng)緯創(chuàng)投和源碼資本合投,襄禾資本跟投。其中,經(jīng)緯創(chuàng)投與襄禾資本為驀然認(rèn)知的天使輪投資方。創(chuàng)始人戴帥湘對(duì)鳳凰網(wǎng)科技透露,明年年初將啟動(dòng)新一輪融資。
驀然認(rèn)知是如何誕生的?
“眾里尋他千百度,驀然回首,那人卻在燈火闌珊處。”
在百度工作了9年后,時(shí)任主任架構(gòu)師的戴帥湘決定離職創(chuàng)業(yè),當(dāng)時(shí)他已經(jīng)是百度主任架構(gòu)師,長(zhǎng)期擔(dān)任百度Query理解方向負(fù)責(zé)人。
離職后,去年5月他在北京成立了一家主攻自然語(yǔ)言處理的AI公司,并給這家公司取名“驀然認(rèn)知”。
“我們之所以叫‘驀然’,和‘百度’是有關(guān)系的。百度是搜素引擎,搜索一個(gè)東西你自己挑選。我們做的是決策引擎,幫你找到信息并篩選出來(lái)。”戴帥湘說(shuō),決策引擎可以通過(guò)對(duì)話的方式和人交互,任何設(shè)備都可以互相連接起來(lái)。
在辦公室中,他演示了如何和裝有這個(gè)系統(tǒng)的電視對(duì)話,告訴它需要播放一部“90年代的動(dòng)作片”,或者“我要一杯焦糖瑪奇朵”、“訂一張明天下午去上海的機(jī)票”。
在這一過(guò)程中,技術(shù)要解決三大問題:首先是自然語(yǔ)言交互,讓機(jī)器理解人的語(yǔ)義;其次是知識(shí)的表示和推理,讓機(jī)器準(zhǔn)確推理出人們說(shuō)這句話,究竟是想讓機(jī)器做什么;第三是連接服務(wù)提供商,如視頻網(wǎng)站、訂餐網(wǎng)站。
戴帥湘用“認(rèn)知”這個(gè)詞概括這一套流程。他說(shuō)“感知”這件事已經(jīng)做的差不多了,已經(jīng)不是特別有前瞻性的東西,無(wú)論是圖像識(shí)別還是語(yǔ)音識(shí)別都到了一定階段。“認(rèn)知”則是指各種信息的綜合處理、分析、推理和學(xué)習(xí),使模擬人腦決策的過(guò)程,在下個(gè)時(shí)代顯得更為重要。
這就是公司名“驀然認(rèn)知”的由來(lái)。
如何選擇落地場(chǎng)景?
驀然認(rèn)知沒有面向C端的產(chǎn)品,而是作為語(yǔ)音交互和決策引擎,將前端SDK提供給B端客戶,由他們定制用戶界面并集成到各種智能產(chǎn)品中。
這就像Amazon Alexa,在這款智能控制設(shè)備上,你可以點(diǎn)星巴克、叫一輛Uber,它提供了超過(guò)25000種用于語(yǔ)音技術(shù)的應(yīng)用,接入它的智能設(shè)備覆蓋了生活的方方面面。
國(guó)內(nèi)很多公司做了智能音箱,巨頭和創(chuàng)業(yè)公司都已入場(chǎng),他們視音箱視為下一個(gè)入口,將語(yǔ)音應(yīng)用整合到音箱中。驀然認(rèn)知選擇to B的方向,為合作公司提供這一套決策引擎的解決方案,或者也在特定場(chǎng)景中提供硬件設(shè)備,銷售給有需要的公司。
家居是驀然認(rèn)知今年主攻的一大場(chǎng)景,明年他們會(huì)將更多精力放在汽車場(chǎng)景中。
在家居領(lǐng)域,他們選擇從電視切入,為電視提供一套引擎。已經(jīng)合作的有暴風(fēng)TV和另外幾家傳統(tǒng)電視廠商,接入了外賣、電影票,并正在接入代駕、停車、跑腿、購(gòu)物等更多服務(wù),形成交易閉環(huán)。
為什么是電商而不是音箱?戴帥湘的回答是:“我覺得我有一個(gè)逆反思維,我覺得大家都很熱烘烘的弄一件事,這個(gè)事八成有問題。”他認(rèn)為首先要解決存量市場(chǎng),有大量存量的設(shè)備需要技術(shù)去革新,這就是有價(jià)值的。而音箱在中國(guó)家庭中并不普及。
另外,汽車也是一個(gè)需要革新而且正在飛速發(fā)展的行業(yè)。目前驀然認(rèn)知和一家德系廠商和一家中國(guó)廠商已經(jīng)談成合作。其中一家驀然認(rèn)知會(huì)提供決策引擎,搭載到車的硬件中;另一家是驀然認(rèn)知直接提供硬件,他們自己設(shè)計(jì),找第三方生產(chǎn)。找合作商的過(guò)程中,戴帥湘發(fā)現(xiàn),和新興造車公司相比,傳統(tǒng)車廠對(duì)技術(shù)革新的訴求更強(qiáng)烈。但是談合作并不是件容易的事,前后大約準(zhǔn)備了半年,合作又談了半年,合作周期可以長(zhǎng)達(dá)3-4年。
在拓展汽車場(chǎng)景的前期,驀然認(rèn)知嘗試過(guò)后裝的途徑,選擇一家中間服務(wù)商來(lái)搭載引擎,服務(wù)商再和車廠合作。但他們發(fā)現(xiàn)如果技術(shù)的驗(yàn)證需要通過(guò)中間商,效果非常不可控。“技術(shù)要產(chǎn)品化,產(chǎn)品要市場(chǎng)化。如果產(chǎn)品化的過(guò)程你自己不能掌握,市場(chǎng)化的過(guò)程就更難。”
機(jī)器到底有多智能?
產(chǎn)品化的思路有了,但究竟能達(dá)到什么效果才是核心問題。和圖像識(shí)別與語(yǔ)音識(shí)別不同,自然語(yǔ)言處理目前還處在非常不成熟的階段,語(yǔ)義的復(fù)雜是落地應(yīng)用中最大的困難。深度學(xué)習(xí)算法也不是語(yǔ)義識(shí)別的最優(yōu)算法。
戴帥湘說(shuō),語(yǔ)義識(shí)別可以用多種模型去解決問題,缺乏一個(gè)綜合性的框架將各種模型統(tǒng)一起來(lái)。驀然認(rèn)知在成立之初就確定了一個(gè)統(tǒng)一的框架,這對(duì)技術(shù)落地十分必要。“并不是說(shuō)這個(gè)框架是最好的,只是說(shuō)我找到了一個(gè)可行的框架,在當(dāng)前狀態(tài)、當(dāng)前場(chǎng)景中很有效。之后是個(gè)逐步優(yōu)化、讓它更有效的過(guò)程。”
驀然認(rèn)知的Mor引擎可以關(guān)聯(lián)上下文,進(jìn)行多輪對(duì)話。例如對(duì)電視說(shuō)“我要訂一張明天下午北京到上海的機(jī)票”,電視呈現(xiàn)出來(lái)了,你再說(shuō)“南苑機(jī)場(chǎng)出發(fā)的”,它能識(shí)別出這是和上文有關(guān)的。
由于目前搭載Mor引擎的電視中,只有暴風(fēng)TV開售了,能收集的數(shù)據(jù)量還較少。明年年初當(dāng)另外幾家合作方的電視銷售出去后,有了更大的數(shù)據(jù)量,驀然認(rèn)知會(huì)快速開發(fā)自適應(yīng)機(jī)制,通過(guò)增強(qiáng)學(xué)習(xí)讓系統(tǒng)根據(jù)用戶反饋等進(jìn)行自我學(xué)習(xí)。
驀然認(rèn)知目前主要做的是一步?jīng)Q策或兩步?jīng)Q策,戴帥湘表示明年會(huì)做多步?jīng)Q策。就是對(duì)電視說(shuō)要訂機(jī)票,電視會(huì)推薦幾點(diǎn)的飛機(jī)、推薦落地后住哪個(gè)酒店?,F(xiàn)在的增強(qiáng)學(xué)習(xí)是分場(chǎng)景的,電影是電影,咖啡是咖啡,明年要實(shí)現(xiàn)跨場(chǎng)景學(xué)習(xí)。還要逐步打通用戶數(shù)據(jù),根據(jù)用戶喜好,主動(dòng)的進(jìn)行個(gè)性化推薦。
如何和大公司競(jìng)爭(zhēng)?
就是因?yàn)檎Z(yǔ)義識(shí)別尚未成熟,行業(yè)還未出現(xiàn)絕對(duì)壟斷者,驀然認(rèn)知這樣的公司才有機(jī)會(huì)。
戴帥湘認(rèn)為,和大公司相比,創(chuàng)業(yè)公司能夠快速的在單一場(chǎng)景落地,然后遷移到其他場(chǎng)景,來(lái)進(jìn)行規(guī)模,這是小公司的優(yōu)勢(shì)。大公司適合做平臺(tái),很難實(shí)現(xiàn)快速落地小場(chǎng)景或是遷移到其他場(chǎng)景。
驀然認(rèn)知目前有100多人,技術(shù)人員約50名。他們還剛剛在上海還設(shè)立了一個(gè)主攻汽車業(yè)務(wù)的研發(fā)中心,有11人,都是技術(shù)研發(fā)。團(tuán)隊(duì)計(jì)劃明年擴(kuò)張至200人。新一輪的融資規(guī)劃也已提上日程。
“AI是軟硬件結(jié)合體,手機(jī)的時(shí)代要逐步過(guò)去巔峰期,新設(shè)備契機(jī)來(lái)了,我們正好就是可以做到軟硬件結(jié)合,讓AI技術(shù)落地。”戴帥湘認(rèn)為,新的交互方式會(huì)讓更多硬件設(shè)備變得智能,車?yán)铩⒓依?、辦公區(qū)內(nèi)的設(shè)備都可能替代手機(jī)。讓一切更智能,也是他們的使命。