你可能已經(jīng)習慣了“前方路口左轉(zhuǎn)”這樣的地圖語音由一個標準的女聲,或者某明星的聲音發(fā)出。
但是,百度地圖最近推出的一個功能“語音定制”可能要顛覆你的認知了:指揮路癡的你怎么走,或者與你進行日常交互,或者告訴你景點信息、好吃好玩的聲音,可能是你自己的或者是你想要的某種聲音!
過去幾年,百度地圖陸續(xù)推出以AI為依托的殺手級應用功能,例如能夠識別復雜語音需求的“全語音操控”,用戶只需要隨心所欲用嘴說出自己要去哪、干什么,地圖就能夠自動甄選目的地并導航。
現(xiàn)在,每個人都可以有屬于自己的地圖定制化語音包,AI再一次讓百度地圖驚艷。而作為行業(yè)觀察者,響鈴和身邊的同事、家人、朋友要以用戶的身份,去看看這個百度內(nèi)部代號為“百雀靈”的語音定制項目落地后究竟能帶給我們什么樣的體驗和感受。
語音定制后,百度地圖這下把“個性化”玩到了底
由于有了全語音操控能力,在進入“語音定制”功能這件事上,百度地圖也充分利用了語音技術(shù)的優(yōu)勢,除了通過手動點擊地圖首頁的“出行助手”后進入“語音定制”,我們在打開APP后,只需要喚醒“小度小度”后說出“錄制我的語音”也能進入功能界面。
(喊“小度小度”開啟語音包錄制)
語音合成技術(shù)是一套復雜的技術(shù)體系,這里不多談。僅從我們普通用戶的使用而言,簡單來說,我們能接觸到的主要有三個階段:提供語音素材、等待后臺合成、最終上手使用,每一個階段都關(guān)乎體驗是否足夠良好。
過去地圖界也有類似的語音合成技術(shù),但由于技術(shù)并不足夠成熟,僅限于商用級別的明星、KOL個案聲音錄制,畢竟,每一個聲音都需要花費大量時間到專用的錄音棚采集聲音素材,長時間的合成運算也需要等上很長的時間(往往以月為單位)。
如果給我們普通用戶的個性化語音定制也是這么一套流程,定制也就失去了用戶體驗的意義。
現(xiàn)在,實際體驗下來,百度地圖的語音定制已經(jīng)解決這個商用技術(shù)走向“民用”的問題。
先看聲音素材采集階段。
實測只要找一個相對安靜的環(huán)境,不管是較少人聲的辦公室還是無人的會議室,跟著百度地圖的指引念出20句不超過15字的素材,采集就能順利完成。這個過程中,用戶還可以選擇不同的風格的引導語句跟讀,例如卡通素材、影視臺詞等。
百度地圖原本讓所有人用一套句子應當也可以,但它沒有這么做,可見即便素材采集已經(jīng)足夠簡單,用戶體驗的細節(jié)還是不放過。
(公司同事紛紛錄制屬于自己的聲音)
錄制完成后,進入等待期。百度地圖官方宣布用戶大約需要等待20分鐘,來進行云端的個性化語音合成。這個速度相對于過去以月為單位的合成速度,已經(jīng)呈現(xiàn)了幾何級提升。
但是,實際APP體驗時,用戶的等待時間往往只有15分鐘:
(實測等待時間普遍為15分鐘)
15分鐘后,經(jīng)過簡單的設(shè)置,選擇自己的語音包作為APP默認語音包,百度地圖各類導航、交互、資訊介紹全部變成用戶自己的聲音,以后甚至借助百度地圖的景區(qū)播報功能,可以自己當自己的導游!
為了當場測驗語音效果,響鈴設(shè)置了離辦公室不遠的星巴克作為目的地,駕車由百度地圖進行導航,
(個人導航語音包實測中)
實話實說,最終的個性化語音包與真人的擬合程度并沒有達到100%、一模一樣的水平,但直觀上,八到九成的相似度肯定有,隨機邀請寫字樓的朋友去“喝咖啡”,這位朋友被驚訝到,“怎么會是你的聲音”,沖擊感十分強烈。
這樣的擬合程度,僅從技術(shù)角度看,在簡便的素材采集和極短的合成時間下已經(jīng)非常高。
總體而言,自己和身邊的百度地圖用戶體驗下來,最大的感受是“個性化”做到了極致。
過去我們老談APP產(chǎn)品的個性化,但說實話這種個性化都是“一群一群”的,地圖APP給我們劃定了一個個明星包,大家“選擇”自己喜歡的,個性化程度比過去的一成不變要好很多。
但是,隨著我們用戶的個性化需求越來越強,這種“聚類”型的個性化已經(jīng)難以滿足需要。從語音包到語音定制,AI語音合成讓個性化真正變成字面意義,每一個人都開始擁有真正屬于自己的“一個一個”的個性化體驗和服務。
你的APP體驗,只有你才會有,這才是把個性化玩到了底。
AI+地圖玩到這個程度,大家終于不再有選擇困難癥了
選擇困難癥是移動互聯(lián)網(wǎng)信息爆炸、產(chǎn)品爆炸、功能爆炸時代每一個手機前的用戶常常犯的毛病,不知道用誰,有時候這個APP好,有時候又覺得那個產(chǎn)品不錯,結(jié)果手機里裝塞滿了各種舍不得卸載又不怎么用的APP,常常報警提醒我們要清理手機了。
語音定制功能的推出,是百度地圖AI+地圖玩法的深入,徹底的個性化后,不講其他行業(yè)大道理,起碼用戶的選擇困難癥可能不會再犯了。
實際體驗下來,理由有三:
1、徹底的個性化就是用戶粘度的最好來源
用戶之所以會選擇困難,原因無非在于產(chǎn)品或功能的同質(zhì)化,或者即便有差異化的地方,也不足以支撐用戶足夠忠誠于某款產(chǎn)品。
一個顯而易見的事實是,不少用戶手機里往往裝了好幾個地圖APP,在過去,使用哪個產(chǎn)是沒有偏好或者說偏好不強的,有時候用這個有時候用那個。
但是,語音定制可能改變這一狀況。直觀的使用感受就是,當語音包的聲音變成自己的聲音時,對APP的心態(tài)會發(fā)生變化,不再糾結(jié)選擇誰,而是自然而然去打開那個“有只屬于自己聲音”的APP,這并不是獵奇或嘗鮮,而是某種歸屬感所帶動。
我們常常談論的用戶粘度,不就是需要這樣的與用戶心智上的連接么?
2、外部情感的依從,推動了對APP的使用習慣
此次百度地圖推出語音定制,不僅僅有成年人錄制聲音的模式,還專門針對童聲發(fā)音不清晰、不流暢等情況進行了優(yōu)化,如果我們愿意,可以讓孩子的聲音為日常地圖交互增添色彩。
發(fā)布會現(xiàn)場,百度地圖事業(yè)部總經(jīng)理李瑩表示一上線就給其女兒錄制了專屬語音包,并設(shè)置為默認??梢哉f,此時的李瑩既是百度地圖的主要負責人,也可以代表一個有孩子的普通用戶。
而響鈴的同事黃女士,以普通用戶的身份也第一時間錄制了其4歲可愛女兒的聲音,并設(shè)置為默認語音包,按她的話說,“(對這個新功能的)第一感覺是感動”。
(黃女士正在引導女兒跟讀語音采集素材句子)
把現(xiàn)代人最重視的孩子納入到產(chǎn)品體驗當中來,許多APP產(chǎn)品未必想不到,但是,通過AI能力的巧妙應用,這種體驗就順勢變成了我們用戶的某種情感依從。
不只是孩子,還有現(xiàn)任女朋友、男朋友(如果你想的話,前任也不是不可以)、暗戀的人……地圖APP里有那些你珍視的人的聲音,你還會犯選擇困難癥嗎?
某種程度上,借助AI技術(shù)優(yōu)質(zhì),百度地圖成功把用戶的外部情感依從,轉(zhuǎn)化到了產(chǎn)品內(nèi)部的使用粘性。
3、技術(shù),永遠讓產(chǎn)品更豐富、更有趣、更能突破舊有限制
實測隨著此次語音定制一同上線的,還有一套帶有某種社交屬性和內(nèi)容平臺屬性的分享系統(tǒng),我們認為雖然官方的宣傳著墨不多,但這套系統(tǒng)更值得玩味。
一方面,我們用戶錄制的個人語音包可以直接分享給親朋好友,在熟人社交環(huán)境下可以相互分享“聲音”——異地的戀人怕是要感動不已。
另一方面,百度地圖上某些“人氣”的語音包,還有可能獲得官方推薦,成為地圖產(chǎn)品里的“好聲音”,而這已經(jīng)超出地圖產(chǎn)品的范疇,帶有某種內(nèi)容創(chuàng)作式的平臺屬性——雖然百度地圖未必這么想,但從用戶角度看,客觀上就是如此。
一個聲線優(yōu)美的女生,或者聲音溫暖磁性的男生,某一天或都有了僅通過聲音質(zhì)量創(chuàng)作內(nèi)容、表現(xiàn)自己的可能,或者,也來個語音包界的“網(wǎng)紅”?
輕互動、輕社交、輕內(nèi)容……相信更多人不會再糾結(jié)日常要使用哪個地圖APP了。
更好的AI,理應讓更多人分享
能夠給到我們普通用戶美好體驗的技術(shù),背后一定是經(jīng)過了長久的磨礪。用戶看到的永遠只是技術(shù)冰山露出來的一角,底下是無數(shù)時間和實踐的積累。
語音定制同樣如此,它背后是百度獨創(chuàng)的“說話人”韻律遷移技術(shù)Meitron,按百度語音首席架構(gòu)師賈磊的說法,能夠?qū)崿F(xiàn)“發(fā)音人音色轉(zhuǎn)換,多情感朗讀和韻律風格遷移”,簡而言之,即從各個方面完全學習發(fā)音人說話,做到合成后的語音與真人語音在各個方向貼近,讓人分不出。
事實上,早前央視公益節(jié)目《等著我》與百度合作,利用有限的素材合成已經(jīng)過世老排長聲音發(fā)出的句子,讓苦尋他多年的老戰(zhàn)士現(xiàn)場感動落淚,就是Meitron所實現(xiàn)。
更進一步看,Meitron背后還有百度語音方面的一系列體系化AI能力,它作為語音合成的一個分支,本身也是百度語音的重要技術(shù)成果之一。
從百度AI,到百度語音,到Meitron,到語音定制,一環(huán)扣一環(huán),最終個性化的語音合成定制門檻大大降低,普通用戶更加直接地觸摸到AI、感知到AI。
我們不必再把AI視為高高在上的存在,它就是我們身邊的技術(shù)。百度地圖的語音定制內(nèi)部代號是“百雀靈”,這樣來看是希望所有用戶都定制出自己的語音包,個性化語音合成的定制門檻大大降低,每一個人,都可以做一只擁有專屬聲音的“雀”。
這樣的語音定制可以、也應當應用到更多需要語音交互的產(chǎn)品上,讓那些非地圖場景下的用戶也能有類似的美好體驗,共同觸摸AI。