本文來自微信公眾號“王智遠(yuǎn)”,【作者】王智遠(yuǎn),ID:Z201440、暢銷書作家,代表作《復(fù)利思維》,陪你做穿越周期的成長者。
使用AI搜索時,我注意到一個問題:
不同AI搜索產(chǎn)品給出的答案數(shù)量參差不齊,有的比較簡單,一兩句話總結(jié);有的比較復(fù)雜,結(jié)構(gòu)化呈現(xiàn)5-6條,沒一個能用的。
這讓我好奇,AI搜索結(jié)果,到底展示多少條合適?要不要結(jié)構(gòu)化?多少條是人們接受的?帶著問題,進(jìn)行了測試和調(diào)研。
先說結(jié)論:最滿意Kimi.AI和知乎直答。為什么呢?
測試部分,我問Kimi探索版,AI搜索應(yīng)該顯示幾條內(nèi)容?它搜索39個網(wǎng)頁后,給出的結(jié)論只有5句話:即:
搜狗搜索每頁顯示10條結(jié)果,最多可以設(shè)置為100條;百度搜索可以提供10條、20條或50條內(nèi)容,數(shù)量取決于用戶選擇。
必應(yīng)則說自己有置頂框,會展示AI總結(jié)和相關(guān)鏈接。perplexity只呈現(xiàn)五六條結(jié)果;360 AI是通過答案再提供20到30條信源鏈接。
從Kimi的回答結(jié)果看,搜狗、百度的結(jié)論是基于傳統(tǒng)搜索引擎,而必應(yīng)、perplexity、360可能是基于AI的。
帶著問題,我又問了騰訊的ima.copilot,這是一個筆記軟件,能搜索所有公眾號內(nèi)容;我說:AI搜索應(yīng)該顯示幾條內(nèi)容?
它提到結(jié)果呈現(xiàn)方式取決于搜索目的、用戶需求、內(nèi)容類型和AI算法性能;百度一般顯示10條結(jié)果,最多100條;Google可以在10到100條之間顯示,根據(jù)用戶需求決定。
不過,它的答案的確很繁瑣,結(jié)構(gòu)化了還很長,以上都是我?guī)退鼉?yōu)化后的。
接著,我測試了知乎知答。答案很簡單,只有4句話:
AI搜索內(nèi)容不固定,由算法根據(jù)用戶最有價值、最相關(guān)的結(jié)果決定;搜索引擎的目標(biāo)是提供最相關(guān)的結(jié)果,數(shù)量從幾條到幾十條不等,同時考慮用戶體驗(yàn)和多樣性。
比如:谷歌搜索可能顯示10條結(jié)果,并提供下一頁鏈接以瀏覽更多內(nèi)容;AI搜索工具會挑選最重要、最合適的內(nèi)容,關(guān)鍵在于質(zhì)量而不是數(shù)量(這個例子是知乎直答答案中的)。
然后,我測試了文心一言,它給出5條結(jié)構(gòu)化內(nèi)容。
不同的是,它比較模棱兩可;它說,答案數(shù)量取決于用戶需求、搜索上下文、設(shè)備和界面、算法與性能以及用戶體驗(yàn),并且會根據(jù)這些因素動態(tài)調(diào)整。
微信的AI搜索自然也不能放過,它的AI在“搜一搜”里,相對隱蔽。我測試了幾個問題,發(fā)現(xiàn)微信搜一搜的AI生成式答案相對簡單直接。
我搜索“王智遠(yuǎn)是誰”時,結(jié)果顯示王智遠(yuǎn)是個多才多藝的人,有多種身份,包括一級建造師、藝人和商業(yè)創(chuàng)作者,每個身份都有進(jìn)一步的5點(diǎn)介紹。
綜上認(rèn)為,Kimi的答案結(jié)構(gòu)化,且簡潔有力;知乎知答則更為直接,沒有列出具體條數(shù),但直接給出了答案;相比之下,文心一言的回答與問題的相關(guān)性較弱,微信搜一搜則更注重直接陳述。
對比不難看出,AI搜索給出的答案,大致分為兩類:
一,簡潔明確的;問題和答案匹配,不拖泥帶水,二,切題詳實(shí)的,AI會圍繞答案展開很多討論;這些討論看似正確,實(shí)際上只有一部分對用戶有幫助。
為什么會這樣?帶著好奇,我詢問了身邊兩位技術(shù)朋友:他們說,可以從問題理解、技術(shù)邏輯和使用體驗(yàn)三個角度來看。
首先,使用AI搜索,不能指望它像人類一樣理解我們。
聊天時,我能知道你的過去、經(jīng)驗(yàn)和外貌,但AI做不到。AI更像一個“缸中之腦”(Brain in a Vat)。這個概念有點(diǎn)奇怪,就像一個人的大腦被放在裝滿營養(yǎng)液的缸里,通過電腦來操縱,讓它感覺像人腦一樣。
實(shí)際上,AI的模型像大腦,外部信息像營養(yǎng)液,我們給AI一個問題,它會在各種知識庫中搜索,然后整合信息找到答案。
因此,它對問題的理解是基于大量數(shù)據(jù)做出的平衡,平衡什么呢?就是那些被大量點(diǎn)擊的,或者相對準(zhǔn)確的信息,有些模型為了準(zhǔn)確性,自然會選擇呈現(xiàn)多一些內(nèi)容。
其次,從技術(shù)角度來看,當(dāng)你輸入一個問題后,AI會捕捉這個問題,利用搜索引擎,比如Google,或者一些第三方服務(wù)來尋找答案。
AI會用一種叫embedding的技術(shù)來處理搜索結(jié)果,這個技術(shù)就像給結(jié)果排序和分類,讓它們更容易管理;最后,AI會使用RAG技術(shù),從眾多網(wǎng)頁中挑選出與你問題相關(guān)的信息,再通過一個大型模型整合這些信息,最終給出答案。
很多AI搜索產(chǎn)品不會自己建立搜索引擎,因?yàn)槌杀咎吡?,爬?000萬個網(wǎng)頁可能需要花費(fèi)一兩百萬人民幣,而且爬取的內(nèi)容還需要進(jìn)行安全檢查。
現(xiàn)在大型搜索引擎擁有的網(wǎng)頁數(shù)量是以千億計(jì)的,這是多年積累的結(jié)果,從時間和金錢來,一般創(chuàng)業(yè)者難以承擔(dān)。
所以,AI搜索找到網(wǎng)頁內(nèi)容后,會把它們按照段落、句子切成小塊,這樣處理更方便,那么,很自然地如果問題很長,答案可能也會很詳細(xì);如果問題很短,或者一個詞有多個解釋,它也可能給出很多相關(guān)的信息。
這就像找東西,一個詞能引出很多相關(guān)內(nèi)容。
朋友還說,針對一個問題,AI給的答案比較豐富,也取決于生成式(generative)和交互式(interactive)。
什么意思呢?
AI搜索系統(tǒng)本質(zhì)上是一個問答系統(tǒng),它的答案和傳統(tǒng)檢索方式有很大區(qū)別。
傳統(tǒng)檢索只是把相關(guān)網(wǎng)頁展示出來,而生成式可能返回一個文檔或一組鏈接,這樣用戶可以直接獲取所有信息,不用再從多個來源中篩選總結(jié)。
這種技術(shù)有創(chuàng)造性,因?yàn)樗斫饽愕恼Z料后,再給出答案。所以,雖然有些內(nèi)容可能我們不需要,但這些多余的內(nèi)容能增強(qiáng)人與AI的互動性。
比如說:
你問“如何提升工作效率?”,AI可能會先給你一個常見的幾條建議,比如設(shè)定清晰目標(biāo)、合理分配時間等。
但它還可能進(jìn)一步提到一些新工具或方法,類似于“你可以嘗試使用時間管理工具,如Notion或Todoist,它們能幫助你更好地安排任務(wù)”;這樣,你會因?yàn)檫@些額外的信息對某個工具產(chǎn)生興趣,從而進(jìn)行下一次的搜索。
問題是:我們真需要那么多答案嗎?我從體驗(yàn)角度做了樣本測試。
有些人說:用AI搜索時,喜歡先看到結(jié)論,再看過程,這樣能讓他們更快地找到想要的信息。
雖然AI能提供很多長文本,但并不是每個人都想要,就像一個知識淵博的人能講很多,但并不是所有內(nèi)容我們都感興趣一樣。
你要不明白,就想象一下,在工作中,如果領(lǐng)導(dǎo)問你事情辦得怎么樣,你先說一大堆過程,最后才說沒辦成,領(lǐng)導(dǎo)肯定不高興,相反,先告訴領(lǐng)導(dǎo)結(jié)果,再詳細(xì)說過程,這樣更好。
但也有人覺得,AI搜索顯示的內(nèi)容越多越好,因?yàn)檫@樣可以學(xué)到更多知識,提高找信息的效率。
比如:我問一個問題,可能還沒完全想清楚,如果AI能展示很多內(nèi)容,有些反而會激發(fā)我的好奇心,這種好奇心再次引導(dǎo)我探索更多不同的解決方法。
然而,實(shí)際情況是這樣嗎?
雖然歷史上沒有專門研究AI搜索結(jié)果,但我查了一些關(guān)于傳統(tǒng)搜索引擎的用戶調(diào)研。
到了2024年,谷歌搜索的用戶調(diào)研顯示,排名第一的鏈接點(diǎn)擊率高達(dá)39.8%,第二名是18.7%,后面的點(diǎn)擊率會越來越低。這說明用戶更關(guān)注搜索結(jié)果頁面靠前的鏈接,越往下,關(guān)注度就越低「1」。
統(tǒng)計(jì)數(shù)據(jù)還顯示,75%的用戶從不瀏覽搜索結(jié)果第一頁之外的內(nèi)容,只有0.78%的用戶會點(diǎn)擊谷歌第二頁的結(jié)果。
而那些直接顯示答案的精選摘要(Featured Snippets),在2018年初的出現(xiàn)頻率約為12%,到2020年初增長到了約16%「2」;這意味著在搜索頁面上,直接展示答案可能減少了用戶對更多搜索結(jié)果頁面的需求。
換言之,用戶愿意直接獲取答案,不想瀏覽無關(guān)信息。
我也讀了谷歌核心工程師瑪麗莎·梅耶(Marissa Mayer)的一些用戶調(diào)研。她說:
很多用戶告訴她,他們希望每頁能看到盡可能多的結(jié)果,20個不夠,25個也不行,最好是30個;但當(dāng)她觀察用戶的實(shí)際行為時,發(fā)現(xiàn)了一個不同的趨勢:用戶其實(shí)更喜歡每頁顯示較少的結(jié)果。
當(dāng)搜索結(jié)果數(shù)量在10到20之間時,用戶的點(diǎn)擊率會急劇下降。當(dāng)每頁顯示25個結(jié)果時,點(diǎn)擊率下降得更多,而當(dāng)每頁顯示30個結(jié)果時,情況最為糟糕。
最后,梅耶決定每頁顯示10個搜索結(jié)果,這個決定也被谷歌一直沿用至今。
所以,這個結(jié)論是:用戶在AI搜索時,往往只關(guān)注一個屏幕內(nèi)的內(nèi)容;如果這一屏的前面就能完整呈現(xiàn)結(jié)論,他們就能獲取所需要的結(jié)果,而后面的內(nèi)容,對他們來說,可能就沒那么相關(guān)了。
問題是,為什么人們說的話和實(shí)際行為不一致呢?我們總說想看到更多內(nèi)容,但當(dāng)AI搜索結(jié)果真的呈現(xiàn)大量內(nèi)容時,卻不愿意花時間去看?
經(jīng)過長期使用AI搜索,我找到了答案:「速度」。很多人沒有意識到,大量搜索結(jié)果會干擾我們的認(rèn)知,影響體驗(yàn)。
舉個例子:
我嘗試了Kimi和天工AI的探索版,當(dāng)我問它們一個心理學(xué)研究的問題時,一個給了簡短有力的答案,并適當(dāng)引導(dǎo)我去網(wǎng)頁查看更多。
另一個卻給了很多內(nèi)容,要我先瀏覽再點(diǎn)擊鏈接查看;相比之下,后者讓我感到選擇困難,甚至覺得大腦負(fù)擔(dān)加重,而前者的信息,讓我獲取得更直接、更方便。
扎克伯格在Facebook早期發(fā)展時,也遇到過類似情況。
當(dāng)Facebook從哈佛擴(kuò)展到耶魯和哥倫比亞大學(xué)時,學(xué)生們一開始表示懷疑,甚至有些嘲諷l盡管他們抱怨,但沒人真正刪除信息或停止使用,反而使用頻率增加了。
扎克伯格得出結(jié)論:“人們并不擅長預(yù)測自己對新事物的反應(yīng)。”Facebook的成功證明,用戶可能對新事物持懷疑態(tài)度,但最終會喜歡成為其中的一部分。
很少有人能清楚表達(dá)自己的真實(shí)需求,尤其是在面對未知的新事物時,語言可能會騙人,但行動不會,因?yàn)樾袆拥拇鷥r比語言更大。
在產(chǎn)品開發(fā)中,我們常聽到一句話:“不要聽別人說什么,要看他們做什么。”這句話同樣適用于AI產(chǎn)品,用戶可能會說他們想要更多功能或選項(xiàng),但他們的行為表明,很多人更喜歡簡單快捷的解決方案。
所以,有兩個結(jié)論:
一,AI搜索一開始不要展示太多內(nèi)容,搜索引擎應(yīng)該先直接給出答案,然后,逐步引導(dǎo)用戶探索,這樣更合適。
二,AI越專業(yè),答案越簡潔,長文本能力應(yīng)該用在解釋過程上,而不是直接給答案。
你認(rèn)為是不是這樣?AI搜索后,你期望看到幾條結(jié)論?
研究參考:
1.WSR團(tuán)隊(duì).(2024).30+GOOGLE搜索引擎統(tǒng)計(jì)數(shù)據(jù)和趨勢[2024年更新].
2.谷歌洞察.(2024,March 8).用戶搜索行為分析.