曾記得十幾天之前否?那時(shí)我們躊躇滿志的跨進(jìn)了2018,滿懷著對(duì)未來(lái)的渴望和珍重……然后我們驚奇的發(fā)現(xiàn),2018第一個(gè)火起來(lái)的詞叫“撒幣”。
不是我說(shuō)啥,這可真出戲啊。
似乎一夜之間,直播答題和這個(gè)叫做”撒幣”的關(guān)鍵詞就火了。王思聰?shù)臎_頂大會(huì)、映客的芝士超人、花椒的百萬(wàn)贏家,一時(shí)之間大佬們瘋狂爭(zhēng)當(dāng)“大撒幣”,人民群眾則紛紛出頭相當(dāng)被幣砸到的那個(gè)幸運(yùn)兒。
當(dāng)然了,不管這些平臺(tái)們?nèi)绾?ldquo;撒”,最終“幣”還是要回到他們自己口袋里的,畢竟做生意是為了賺錢,搞出來(lái)這么大場(chǎng)面當(dāng)然是為了放后招,沒聽說(shuō)過(guò)哪位出題讓人答是為了做慈善的。除非...除非AI化妝成選手,也來(lái)答個(gè)題,說(shuō)不定能干到王思聰們沒幣可撒...
畢竟,答題也是講科學(xué)的對(duì)不對(duì)?
AI答題這件事其實(shí)也不新鮮,不信你百度輸入一個(gè)“長(zhǎng)城有多長(zhǎng)”之類的,馬上就會(huì)給你跳出來(lái)答案。這里就是用了AI的專業(yè)答題姿勢(shì):知識(shí)圖譜。
借著直播答題的春風(fēng),今天講講知識(shí)圖譜的故事吧。雖然在機(jī)器視覺、語(yǔ)音交互等“網(wǎng)紅技術(shù)”面前,作為AI重要分支之一的知識(shí)圖譜似乎不那么出位。但是以應(yīng)用度和腦洞指數(shù)來(lái)說(shuō),這個(gè)技術(shù)絕對(duì)當(dāng)仁不讓。更重要的是,在“AI感知”通向“AI理解”的大路上,知識(shí)圖譜近乎是無(wú)法繞開的一道關(guān)卡。
更更重要的是——他能幫你答題啊。
知識(shí)圖譜是什么鬼?
知識(shí)圖譜這個(gè)概念被提出并不算太久,但是要追根溯源理解這個(gè)技術(shù)到底是玩什么的,那可能真要往上倒騰幾十年才行。
上世紀(jì)40年代,人工智能被提出之后,無(wú)數(shù)科學(xué)家們就開始琢磨,到底用什么方式能讓機(jī)器模擬出人的智慧呢?琢磨來(lái)琢磨去,人對(duì)于信息能夠進(jìn)行關(guān)聯(lián)理解似乎是個(gè)路子。所謂信息關(guān)聯(lián),就是人類在接受一個(gè)信息后,會(huì)把它放在記憶中進(jìn)行歸納和調(diào)用。比如說(shuō)你打小認(rèn)識(shí)了你三舅,絕不可能過(guò)幾年管他叫二哥。
利用這個(gè)思路,上世紀(jì)50年代末,學(xué)術(shù)界提出了語(yǔ)義網(wǎng)絡(luò)(semantic network)的設(shè)想,打算把數(shù)據(jù)進(jìn)行結(jié)構(gòu)化的處理,讓單個(gè)信息組合成有聯(lián)系、能共鳴的“知識(shí)”。今天我們用到的很多技術(shù)都來(lái)源于語(yǔ)義網(wǎng)絡(luò),比如機(jī)器翻譯、自然語(yǔ)言處理等等,知識(shí)圖譜也是其中之一。
上世紀(jì)80年代,受到多方面刺激的地球人開始了一次AI復(fù)興運(yùn)動(dòng),而這次運(yùn)動(dòng)的主角,就是各國(guó)開始打造專家系統(tǒng)和知識(shí)庫(kù)。那時(shí)候科學(xué)家們相信,如果把人類大量知識(shí)進(jìn)行邏輯化關(guān)聯(lián)和語(yǔ)義網(wǎng)絡(luò)存儲(chǔ),最終人類就能打造出全知全能,啥啥都懂的人工智能??上Ш镁安婚L(zhǎng),最終AI沒等來(lái)呢PC先來(lái)了,專家系統(tǒng)紛紛被棄置。但是海量知識(shí)構(gòu)成的知識(shí)庫(kù)卻成為了寶物流傳了下來(lái)。
2002年,基于語(yǔ)義web技術(shù)和Freebase等優(yōu)質(zhì)知識(shí)庫(kù),谷歌宣布推出了知識(shí)圖譜(Knowledge Graph)概念,并在2013年投入使用。所謂知識(shí)圖譜,實(shí)際上是建立在網(wǎng)頁(yè)百科知識(shí)庫(kù)基礎(chǔ)上,利用語(yǔ)義網(wǎng)絡(luò)進(jìn)行知識(shí)關(guān)聯(lián)的技術(shù)。它可以用來(lái)幫助學(xué)術(shù)人員快速搜集和理解信息,也可以用來(lái)分析情報(bào),辨別信息真?zhèn)巍T诋a(chǎn)業(yè)端則為搜索、內(nèi)容推薦和智能問(wèn)答提供了基礎(chǔ),成為今天AI領(lǐng)域不是十分熱門,卻也足夠強(qiáng)勢(shì)的一個(gè)技術(shù)類別。
如果說(shuō)了這么多還沒明白,那就舉個(gè)直白的例子吧:
假如你這幾天很好奇一個(gè)叫PGone的詞為啥火了。然后你去搜索一下,結(jié)果給你推薦的詞是PGtwo、PGthree...那你就跟沒搜一樣。假如蹦出來(lái)兩個(gè)詞,一個(gè)是賈乃亮一個(gè)是地溝油,那么你就了然了嘛...
所謂的知識(shí)圖譜,就是讓智能體去理解知識(shí)之間網(wǎng)絡(luò)關(guān)系,并能主動(dòng)以此提供服務(wù)的技術(shù)。
今天的知識(shí)圖譜專治各種“撒幣”
假如你以為本文到此就該結(jié)束了,那么你又錯(cuò)了。
上文說(shuō)了知識(shí)圖譜專治各種“大撒幣”行為,并不是隨便講講的。我們要知道,2002年知識(shí)圖譜技術(shù)假如跟王思聰剛一波正面,那是基本沒有勝算的。
這里有幾種可能:首先是假如你的知識(shí)庫(kù)是更新到前年的,人家問(wèn)你PGone的嫂子是誰(shuí)你怎么辦?或者人家不問(wèn)你長(zhǎng)城有多長(zhǎng),問(wèn)你最長(zhǎng)的墻有多長(zhǎng)怎么辦?
在考教真人的直播答題過(guò)程中,可能面臨各種語(yǔ)言上的調(diào)整、提問(wèn)方式的改變,以及加入最新信息。這都是幾年前基于單一結(jié)構(gòu)知識(shí)庫(kù)的知識(shí)圖譜技術(shù)難以勝任的。
這就把知識(shí)圖譜難住了嗎?不能夠,畢竟為答題而生,必須要搞點(diǎn)新高度出來(lái)才行。
這項(xiàng)技術(shù)在近幾年間發(fā)生了重要變化,比如:
1、大數(shù)據(jù)+機(jī)器學(xué)習(xí)帶來(lái)了史無(wú)前例的效率契機(jī)。
今天的AI復(fù)興,是建立在機(jī)器學(xué)習(xí)驅(qū)動(dòng)大數(shù)據(jù)的基礎(chǔ)上的,知識(shí)圖譜也是如此。舉例來(lái)說(shuō),搜索引擎知識(shí)圖譜技術(shù),是建立在搜索數(shù)據(jù)和百科、問(wèn)答等數(shù)據(jù)庫(kù)之上的。數(shù)據(jù)本身的優(yōu)質(zhì)化是知識(shí)圖譜運(yùn)行的基礎(chǔ)。而在機(jī)器學(xué)習(xí)、深度學(xué)習(xí)領(lǐng)域的積累,則讓圖譜技術(shù)實(shí)現(xiàn)了及時(shí)化、逐步完善圖譜關(guān)聯(lián)強(qiáng)度和理解力提升。換句話說(shuō),知識(shí)圖譜技術(shù)正在變得愈發(fā)即時(shí)性與可成長(zhǎng)。
2、語(yǔ)音交互成為啟動(dòng)知識(shí)圖譜的新形式。
知識(shí)圖譜想要真的為人類所用,那么就不能是人類用固定方式去出發(fā)知識(shí)圖譜的模板。而應(yīng)該是知識(shí)圖譜主動(dòng)理解人類的語(yǔ)言和思維習(xí)慣,做到主動(dòng)輸出服務(wù)。這就需要知識(shí)圖譜與語(yǔ)音交互緊密結(jié)合。
3、強(qiáng)語(yǔ)義理解能力成為關(guān)鍵。
能聽懂“長(zhǎng)城有多長(zhǎng)”,卻聽不懂“長(zhǎng)城從東到西一共多少距離”的知識(shí)圖譜,顯然是知識(shí)沒譜。深度學(xué)習(xí)各種語(yǔ)意、語(yǔ)義、語(yǔ)序和方言的知識(shí)圖譜能力,也成為了目前知識(shí)圖譜技術(shù)的喚醒核心。
這幾種能力加持下,把知識(shí)圖譜偽裝成選手去搞點(diǎn)“撒幣”,顯然已經(jīng)不算什么了...但是如果只干這點(diǎn)事,其實(shí)也蠻虧的。
撒出一個(gè)明天
無(wú)論是語(yǔ)音交互還是機(jī)器視覺,我們今天正在努力教會(huì)AI一件事,就是識(shí)別??墒?,在識(shí)別之后呢?AI下一步要干什么?
識(shí)別的下一步當(dāng)然是理解和處理,但如果想讓AI開啟這些能力,很多人都認(rèn)為,知識(shí)圖譜的爆發(fā)將是AI下一步的必經(jīng)之路。
今天知識(shí)圖譜的核心,在于通過(guò)數(shù)據(jù)生成可視化的知識(shí)鏈條,用鏈條形成網(wǎng)絡(luò),利用網(wǎng)絡(luò)來(lái)進(jìn)行預(yù)測(cè)、生成自動(dòng)化,最終生成機(jī)器主動(dòng)提供的智能化服務(wù)。
要知道,人類理解世界并不是基于一個(gè)個(gè)散亂的信息,而是基于信息背后的“知識(shí)”。
我們期待的知識(shí)圖譜技術(shù),是通過(guò)這種技術(shù)的完善,把AI調(diào)整到主動(dòng)輸出服務(wù)模式。經(jīng)典計(jì)算階段是你想到的,電腦幫你做出來(lái)。而知識(shí)圖譜時(shí)代,是你想不到的,AI可以想到。
能做到這一步的AI技術(shù),當(dāng)然不會(huì)只滿足去答答題,做個(gè)直播。人家的使命是改變世界好不好?
其實(shí),知識(shí)圖譜作為一種隱藏的后端技術(shù),今天已經(jīng)悄然布局在了我們的生活。比如我們今天在百度搜“李白寫過(guò)哪些飲酒詩(shī)?”,已經(jīng)不是跳出來(lái)有這些關(guān)鍵詞的網(wǎng)站,而是直接跳出來(lái)你的答案,這背后就是知識(shí)圖譜即使已經(jīng)解答了你的問(wèn)題。
更重要的是,知識(shí)圖譜技術(shù)作為AI交互手段的必要觸達(dá)點(diǎn),正在為其他AI產(chǎn)業(yè)提供幫助,比如智能處理、無(wú)人駕駛。
更遠(yuǎn)的未來(lái),或許是利用知識(shí)圖譜技術(shù)達(dá)成物聯(lián)網(wǎng)間的協(xié)作、人機(jī)交互的全新升級(jí),那么最終所能抵達(dá)的,遠(yuǎn)遠(yuǎn)不是答題這一件小事而已。
所以呢,直播平臺(tái)上誰(shuí)給誰(shuí)撒幣,誰(shuí)是大撒幣,其實(shí)也不是很重要了。真正重要的是,技術(shù)正在努力把未來(lái)的幣,撒到現(xiàn)在的土壤里。