2019語音技術(shù)報(bào)告:語音經(jīng)濟(jì)規(guī)模將超移動(dòng)應(yīng)用

騰訊科技
無論是在線上還是線下,語音技術(shù)已經(jīng)在指引消費(fèi)者購物??煜窂S商正在探索,基于語音體驗(yàn),對(duì)于制作雞尾酒和品嘗威士忌等場(chǎng)景,可以如何提升產(chǎn)品定位和用戶忠誠度。

美國投資機(jī)構(gòu)Mangrove Capital Partners本周發(fā)布了2019年“語音技術(shù)報(bào)告”。報(bào)告題為“語音:歡迎下一代的顛覆者”,分析了語音助理服務(wù)的日益普及,并對(duì)2020年Siri的動(dòng)向做出了有趣的預(yù)測(cè)。

以下為編譯整理的報(bào)告全文:

在過去多年的鍵盤輸入和點(diǎn)擊手機(jī)屏幕之后,我們正在回歸到最初的“用戶界面”:語音。雖然我們尚未感受到語音技術(shù)帶來的全部影響,但這種技術(shù)正在改變我們與數(shù)字世界互動(dòng)的方式。

重要的是,這種轉(zhuǎn)變影響的遠(yuǎn)遠(yuǎn)不止是查看天氣預(yù)報(bào),獲取音樂,以及設(shè)置鬧鐘。語音帶來了平臺(tái)和用戶界面的轉(zhuǎn)變,足以與網(wǎng)頁和智能手機(jī)相媲美。作為人工智能和機(jī)器學(xué)習(xí)的入口,語音技術(shù)將通過強(qiáng)大的新方式為我們提供服務(wù)。

在Mangorve,我們相信,語音將成為未來10年決定性的主題之一。除了用數(shù)字服務(wù)影響各行各業(yè)以外,語音技術(shù)還將培育出新一代的科技公司。與人工智能一起,語音技術(shù)將從根本上改變?nèi)撕蜋C(jī)器的關(guān)系,給下一代軟件創(chuàng)造巨大價(jià)值。

向語音的轉(zhuǎn)移

自2011年蘋果推出Siri以來,語音技術(shù)已經(jīng)取得了長足發(fā)展。隨著機(jī)器學(xué)習(xí)的發(fā)展,我們?cè)谡Z音識(shí)別(語音轉(zhuǎn)文字)和自然語言處理(識(shí)別文本中的指令)兩方面都獲得了相當(dāng)大的進(jìn)步。事實(shí)上,語音系統(tǒng)的單詞識(shí)別準(zhǔn)確率已超過95%,這意味著它們已經(jīng)具備了與人類相仿的語言理解能力。相對(duì)于打字,語音產(chǎn)品提供了更自然、更便利、更高效的溝通形式。因此,語音注定將成為最主要的人機(jī)互動(dòng)接口。

根據(jù)Juniper Research的數(shù)據(jù),目前市面上已有25億個(gè)語音助理存在。隨著科技巨頭爭(zhēng)相加入競(jìng)爭(zhēng),越來越多家庭正在啟用語音服務(wù)。在美國,家用智能音箱的總數(shù)2018年大幅增長78%,從6670萬臺(tái)增加至1.855億臺(tái)。亞馬遜在這個(gè)市場(chǎng)的份額達(dá)到64.6%。Canalys預(yù)計(jì),全球范圍內(nèi)智能音箱的裝機(jī)量到2023年將增長至5億臺(tái)。

2023年,語音助手?jǐn)?shù)量將超過全球人口

語音也在成為智能家居和物聯(lián)網(wǎng)的入口。亞馬遜宣布,已有4500個(gè)品牌提供2.8萬款支持Alexa的智能家居設(shè)備,包括電視機(jī)、炊具和機(jī)器人吸塵器。除了進(jìn)入家庭場(chǎng)景之外,語音助手也在進(jìn)入萬豪等酒店的房間,并且在汽車信息娛樂系統(tǒng)中也很受歡迎。亞馬遜正在與多家汽車公司展開談判,有報(bào)道稱亞馬遜的車內(nèi)產(chǎn)品Echo Auto預(yù)售訂單已超過100萬。Echo Auto提供全方位的免提體驗(yàn),包括打電話、導(dǎo)航,以及操控智能家居設(shè)備。

語音技術(shù)也在超越語言障礙。目前谷歌的服務(wù)已經(jīng)支持30種語言,甚至可以同時(shí)理解用戶所說的多種語言。有趣的是,在中國語音服務(wù)的普及更快,阿里巴巴在中國的智能音箱市場(chǎng)處于領(lǐng)先。

各類受歡迎應(yīng)用的出現(xiàn)令人聯(lián)想到App Store發(fā)展的早期。亞馬遜Alexa提供的功能包括為新媽媽提供母乳喂養(yǎng)支持,鼓勵(lì)孩子們刷牙,幫助用戶鍛煉,指導(dǎo)足球隊(duì),以及指引人們?nèi)绾味\告。

語音電商的崛起

由于亞馬遜Alexa直接關(guān)聯(lián)至全球最大的電商平臺(tái)之一,語音購物也在初步發(fā)展。亞馬遜已經(jīng)看到,Alexa平臺(tái)的電商交易在2018年假日季同比增長至三倍。沃爾瑪近期也推出了基于谷歌語音助手的在線生鮮購物服務(wù),支持購物者通過谷歌Home、智能手機(jī)或智能手表將產(chǎn)品添加到購物車。

根據(jù)Juniper的數(shù)據(jù),在美國和英國,語音電商的規(guī)模將從2018年的20億美元增長至2022年的400億美元。有趣的是,語音電商最熱門的三大商品品類都是低價(jià)商品:生鮮雜貨(20%)、娛樂(19%)和電子(17%)。

亞馬遜精選”的重要性

因此對(duì)零售商來說,獲得“亞馬遜精選”的地位將會(huì)比以往更加重要。根據(jù)OC&C戰(zhàn)略咨詢公司的數(shù)據(jù),亞馬遜購物者中有85%最終會(huì)選擇亞馬遜推薦的商品。不過目前外界仍然不清楚,具體商品要如何才能獲得這樣的推薦。

語音電商的興起

無論是在線上還是線下,語音技術(shù)已經(jīng)在指引消費(fèi)者購物??煜窂S商正在探索,基于語音體驗(yàn),對(duì)于制作雞尾酒和品嘗威士忌等場(chǎng)景,可以如何提升產(chǎn)品定位和用戶忠誠度。

你不會(huì)再感到孤單

重要的是,語音服務(wù)正在從事務(wù)性向?qū)υ捫赞D(zhuǎn)變。這種趨勢(shì)的最終結(jié)果很難完全被理解,但你可以考慮這一點(diǎn):你永遠(yuǎn)不會(huì)再感到孤單,無論是在與Alexa說話,還是與另一個(gè)人或人工智能說話。人工智能的第一次浪潮使用算法去建立推薦引擎,提供訪問互聯(lián)網(wǎng)服務(wù),例如谷歌、亞馬遜和Facebook的快捷方式。而第二次浪潮則是幫助企業(yè)利用結(jié)構(gòu)化數(shù)據(jù)去優(yōu)化決策流程。類似Palantir的公司開始崛起,它們挖掘大量結(jié)構(gòu)化數(shù)據(jù),找出人眼和人腦難以發(fā)現(xiàn)的信息關(guān)聯(lián)性。

人工智能的第三次浪潮正在到來。人工智能獲得了眼睛、耳朵和無數(shù)其他感官,從而可以收集從來沒有過的新數(shù)據(jù),隨后使用這些數(shù)據(jù)推動(dòng)更復(fù)雜的流程自動(dòng)化。與此同時(shí),我們也在從基于命令的靜態(tài)流程轉(zhuǎn)向動(dòng)態(tài)流程。這是計(jì)算領(lǐng)域的結(jié)構(gòu)性變化,將徹底改變我們體驗(yàn)軟件,與軟件交互的方式,模糊了數(shù)字世界和現(xiàn)實(shí)世界之間的關(guān)聯(lián)。

隨著人工智能系統(tǒng)在對(duì)話中變得更熟練,收集關(guān)于人們及其周圍世界的更多數(shù)據(jù),它們將可以了解情景信息。人類通常可以不費(fèi)力地掌握這些關(guān)聯(lián)信息,并將其應(yīng)用在對(duì)話中。情景信息將幫助人類和機(jī)器以更自然的方式互動(dòng)和協(xié)作。而隨著體驗(yàn)的優(yōu)化,變得更有用,他們將會(huì)更加頻繁的互動(dòng),而機(jī)器也將掌握更多知識(shí)。

這樣的良性循環(huán)意味著,在未來3到5年內(nèi),計(jì)算機(jī)的對(duì)話能力將變得更復(fù)雜,更具變革性。與其將我們的時(shí)間花在鍵盤打字和智能手機(jī)觸控上,我們可以很方便地與無所不在的人工智能交談。重要的是,我們與軟件互動(dòng)的方式將被永久改變:表單將會(huì)消亡,接觸點(diǎn)將變成“監(jiān)聽點(diǎn)”。

這就可以解釋,為何全球最大的科技公司向語音技術(shù)進(jìn)行了大筆投資。語音技術(shù)帶來了平臺(tái)和用戶界面的改變,這足以媲美此前的網(wǎng)頁和智能手機(jī),而不同之處僅僅只是,用戶向語音的轉(zhuǎn)移不需要任何訓(xùn)練。對(duì)于這種未來主導(dǎo)性的平臺(tái),大型科技公司不容有失。因此,亞馬遜已有超過1萬名員工從事Alexa項(xiàng)目,而亞馬遜也是對(duì)語音技術(shù)創(chuàng)業(yè)公司最熱衷的投資方之一。

語音優(yōu)先界面的黎明

語音技術(shù)的影響非常深遠(yuǎn),每家公司都需要重新考慮如何與用戶進(jìn)行互動(dòng)。這不僅僅是調(diào)整SEO(搜索引擎優(yōu)化)等方面的工作,或是開發(fā)自己的Alexa“技能”或谷歌的“操作”。

企業(yè)最終需要提供能感知情景、語音優(yōu)先的界面。能建立用戶認(rèn)知和情感連接的企業(yè)將可以更好地吸引用戶,而如果只是用預(yù)設(shè)腳本去被動(dòng)響應(yīng)用戶問題,那么企業(yè)將處于明顯的劣勢(shì)。嚴(yán)重依賴通知去驅(qū)動(dòng)應(yīng)用使用的科技公司可能需要重新審視策略。消費(fèi)者對(duì)于那些用太多通知去打破“聲音門檻”的公司(例如LinkedIn)不會(huì)再有太多耐心。

最熱門的移動(dòng)應(yīng)用成為了今天的主導(dǎo)平臺(tái),而最能吸引用戶的語音優(yōu)先界面將會(huì)成為明天的主導(dǎo)服務(wù)。很難預(yù)測(cè)理想的界面應(yīng)該是什么樣,但下一代Airbnb、Monzo和Uber的出現(xiàn)很可能只要3到5年。

無屏幕手機(jī),例如Light Phone的出現(xiàn)向我們展示了未來,這樣的手機(jī)不依賴于我們了解并喜愛的移動(dòng)應(yīng)用??紤]到語音服務(wù)的學(xué)習(xí)曲線很短,能明顯減少用戶的使用障礙,因此可以很合理地假設(shè),在我們注意到全部潛力之后,語音經(jīng)濟(jì)將快速發(fā)展。

語音時(shí)代的工作

在我們與軟件交互的過程中,所花費(fèi)時(shí)間最長的場(chǎng)景就是工作。因此可以合理假設(shè),在工作場(chǎng)景我們將會(huì)看到最明顯的變化。盡管我們可能仍然需要與屏幕互動(dòng),但鍵盤很可能會(huì)變成多余的。畢竟,普通人每分鐘可以用鍵盤輸入40個(gè)單詞,但卻可以說出150個(gè)單詞。

無所不在的人工智能可以支持我們?nèi)粘9ぷ髦械脑S多任務(wù)和流程,例如回復(fù)電子郵件,整理會(huì)議信息,向團(tuán)隊(duì)成員發(fā)布信息,以及用數(shù)據(jù)更新相關(guān)系統(tǒng)等。這也可能意味著,我們將不再被捆綁在辦公桌,不必再久坐不動(dòng)。

更進(jìn)一步,無所不在的人工智能可以注意到效率最高的員工,并告知他人他的工作方式,從而優(yōu)化工作產(chǎn)出。能持續(xù)識(shí)別高績效者的特定策略,并將最佳績效建議分發(fā)給網(wǎng)絡(luò)中其他人的人工智能學(xué)習(xí)循環(huán)已經(jīng)開始出現(xiàn)。這些優(yōu)化網(wǎng)絡(luò)不是為了取代人工,而是依靠人類去學(xué)習(xí)并優(yōu)化流程。人類仍然會(huì)處于循環(huán)中。

一個(gè)值得關(guān)注的案例是Chorus.ai,該服務(wù)能加入通話,同時(shí)就有效回復(fù)做出提示。Chorus.ai并不是給銷售電話提供預(yù)設(shè)的腳本,而是會(huì)分析團(tuán)隊(duì)成員的不同方法,帶來更積極的成果,并鼓勵(lì)創(chuàng)造性。

通過讓人類變得更聰明、更高效,新一代的SaaS(軟件即服務(wù))產(chǎn)品將可以收取更高的訂購費(fèi)用,從而成為更具價(jià)值的一代企業(yè)軟件。

從虛擬人物到虛擬醫(yī)生

虛擬KOL莉兒米克拉(Lil Miquela)

我們已經(jīng)看到,虛擬KOL逐漸興起。例如,來自洛杉磯、19歲的虛擬KOL莉兒米克拉(Lil Miquela)在Instagram上積累了150萬粉絲,目前已經(jīng)參與過Calvin Klein等知名時(shí)尚品牌的營銷活動(dòng)。

位于舊金山的創(chuàng)意工作室Fable正在虛擬人物方面邁進(jìn)更多一步。該公司的虛擬人物具有完整的互動(dòng)能力,并且有自己的個(gè)性。很快,我們就能創(chuàng)建人工智能全息伴侶,例如《銀翼殺手》中的喬伊。喬伊由Wallace Corp制造,可以成為“你想看到的全部一切”。

虛擬人物很可能會(huì)改變娛樂和客服的表現(xiàn)形式,與此同時(shí)在給老年人和其他需要幫助的人群提供服務(wù)方面也可以扮演關(guān)鍵角色。畢竟,被認(rèn)為孤獨(dú)的人群健康下降的風(fēng)險(xiǎn)要高出59%,而社交孤立也是造成抑郁癥的最常見原因之一。

總部位于巴塞羅那的Safe365作為由科技驅(qū)動(dòng)的社區(qū)和互助網(wǎng)絡(luò)已經(jīng)吸引了許多老年人。語音產(chǎn)品提供了對(duì)用戶非常友好的方式,監(jiān)控健康和認(rèn)知能力,并提供關(guān)于鍛煉和服藥的提醒。

事實(shí)上,語音和人工智能最終有可能完全取代醫(yī)生。K Health已經(jīng)開發(fā)了一款人工智能,將數(shù)千名醫(yī)生的經(jīng)驗(yàn)結(jié)合在一起,以做出準(zhǔn)確的診斷。借助語音技術(shù),人工智能還可以像人類醫(yī)生一樣給病人提供安慰。

對(duì)語音技術(shù)融資的分析

根據(jù)我們的分析,對(duì)語音創(chuàng)業(yè)公司的投資正在加速。語音技術(shù)創(chuàng)業(yè)公司今年已融資7.86億美元,遠(yuǎn)遠(yuǎn)超過2018年的5.81億美元以及2017年的2.98億美元。這樣的融資增長表明了市場(chǎng)的信心,即語音技術(shù)將帶來變革。融資的規(guī)模也在大幅上升,2019年到目前為止平均交易規(guī)模是3000萬美元,而2018年和2017年分別為1800萬美元和1750萬美元。

語音技術(shù)創(chuàng)業(yè)公司融資情況

娛樂和播客是已經(jīng)吸引了大量興趣的領(lǐng)域之一。Spotify收購了播客創(chuàng)業(yè)公司Gimlet和Anchor,總共花費(fèi)3.37億美元。這個(gè)領(lǐng)域其他值得關(guān)注的創(chuàng)業(yè)公司還包括制作語音優(yōu)先收費(fèi)內(nèi)容的Sybel。

按國別或地區(qū),語音技術(shù)公司融資情況

與此同時(shí),從2015年成立以來,亞馬遜Alexa基金已經(jīng)進(jìn)行了72筆投資。過去18個(gè)月中,該基金投資的創(chuàng)業(yè)公司涉及娛樂、健康、教育、交通、電商、酒店和SaaS等行業(yè)。這表明,亞馬遜相信語音技術(shù)將改變一系列行業(yè)。

我們的分析還顯示,在語音技術(shù)創(chuàng)業(yè)公司的融資活動(dòng)中,美國處于領(lǐng)先。美國此類創(chuàng)業(yè)公司獲得了超過10億美元的投資,而歐洲只有1.18億美元。這尤其值得關(guān)注,因?yàn)檎Z音技術(shù)代表著范式轉(zhuǎn)換。如果歐洲希望在下一代技術(shù)發(fā)展中建立自己的地位,歐洲的創(chuàng)業(yè)者和投資人需要快速做出響應(yīng)。

挑戰(zhàn)

語音技術(shù)領(lǐng)域最大的挑戰(zhàn)之一是隱私保護(hù)。微軟的數(shù)據(jù)顯示,41%的語音助手用戶對(duì)信任、隱私和被動(dòng)監(jiān)聽感到擔(dān)憂。谷歌Nest設(shè)備中被發(fā)現(xiàn)存在隱藏的麥克風(fēng)造成了不利影響,而亞馬遜申請(qǐng)專利“監(jiān)聽房間里的所有對(duì)話”也是如此。

如何回應(yīng)這些關(guān)切取決于科技公司,而蘋果在這方面的工作卓有成效。蘋果收購Silk Labs值得贊賞,后者開發(fā)在設(shè)備中運(yùn)行的人工智能軟件,而不必使用云計(jì)算平臺(tái)去處理數(shù)據(jù)。

蘋果在圍繞語音服務(wù)構(gòu)建生態(tài)方面進(jìn)展緩慢。實(shí)際上,蘋果1987年提出的“知識(shí)導(dǎo)航工具”給出了更明確的語音服務(wù)愿景。語音服務(wù)社區(qū)期望蘋果在2020年全球開發(fā)者大會(huì)(WWDC)上為開發(fā)者社區(qū)發(fā)布Siri操作系統(tǒng),從而加速創(chuàng)新和普及。

Voicebot.ai的編輯和出版人布雷特金塞拉(Bret Kinsella)表示:“Siri操作系統(tǒng)對(duì)于鼓勵(lì)創(chuàng)新是有必要的。許多人認(rèn)為,蘋果需要匹配亞馬遜和谷歌語音助手取得的進(jìn)展。”

《機(jī)械姬》等熱門電影中提出的一個(gè)問題是,如果我們癡迷于機(jī)器人,愛上代碼而不是其他人,那么人工智能將成為人類的威脅。盡管對(duì)某些人來說這種說法聽起來很牽強(qiáng),但約會(huì)模擬游戲已被證明非常受歡迎。在中國,名為《戀與制作人》的游戲在上線首個(gè)月下載量突破700萬。

盡管挑戰(zhàn)了我們對(duì)隱私保護(hù)的觀念,就人類與技術(shù)的關(guān)系提出了新問題,但我們?nèi)匀挥泻芏嗬碛蓪?duì)語音技術(shù)保持樂觀。這種技術(shù)將驅(qū)動(dòng)新的生產(chǎn)力提升浪潮,造福消費(fèi)者、企業(yè)和社會(huì)。并且,這也將幫助我們更好地照料老年人,同時(shí)讓全球7.74億不識(shí)字的人群可以使用互聯(lián)網(wǎng)。

語音時(shí)代的預(yù)測(cè)

- 鍵盤的消亡:我們不再需要打字,而是可以使用語音和手勢(shì)。鍵盤將在未來5到10年內(nèi)基本上消亡。

- 語音技術(shù)將帶來全新的產(chǎn)品門類,包括無屏幕智能手機(jī)。

- 品牌很快需要通過“聲音身份”來被識(shí)別,產(chǎn)品搜索將被徹底改變。

- 因?yàn)樵谑褂谜Z音服務(wù)時(shí)用戶不太能注意到具體應(yīng)用,因此硬件將重新變得比軟件更重要。

- 虛擬伴侶將變成現(xiàn)實(shí),滿足你生活的全部需求。

- 蘋果將于2020年推出Siri操作系統(tǒng),從而在語音經(jīng)濟(jì)中推動(dòng)巨大的創(chuàng)新。到2025年,語音經(jīng)濟(jì)的規(guī)模將達(dá)到1萬億美元,超過移動(dòng)應(yīng)用經(jīng)濟(jì)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論