AI新貴上位記:圖網(wǎng)絡(luò)是怎么火起來(lái)的?

腦極體
Graph,翻譯成“圖”,或者“圖譜”。這是一個(gè)數(shù)學(xué)概念,指由頂點(diǎn)(nodes)和邊(edges)構(gòu)成的一種數(shù)學(xué)關(guān)系。后來(lái)這個(gè)概念引申到了計(jì)算機(jī)科學(xué)中,成為了一種重要的數(shù)據(jù)形式,用來(lái)表示單元間相互有聯(lián)系的數(shù)據(jù)網(wǎng)絡(luò)。

圖片來(lái)源@視覺(jué)中國(guó)

誰(shuí)是2018年AI圈最靚的仔?

這頂“桂冠”只有兩位候選人:俗話說(shuō),前端能打看BERT,底層深度看圖網(wǎng)絡(luò)。

其實(shí)并沒(méi)有這句俗話……但是BERT和圖網(wǎng)絡(luò)在今天的AI界并駕齊驅(qū),堪稱(chēng)被討論最多的兩種技術(shù),這一點(diǎn)是毫無(wú)疑問(wèn)的。

谷歌的BERT作為一種算法模型,在語(yǔ)言任務(wù)上展現(xiàn)出了不講道理的應(yīng)用效果,熠熠奪目自然很容易理解。

但另一個(gè)最近大家聽(tīng)到很多次的詞,圖網(wǎng)絡(luò),可能就沒(méi)那么容易理解了。相比某種算法,圖網(wǎng)絡(luò)更像是一個(gè)學(xué)術(shù)思考下若干種技術(shù)解決思路的集合,非常抽象和底層。它的價(jià)值到底在哪?為什么甚至能被抬高到“深度學(xué)習(xí)的救星”這種程度?

我們發(fā)現(xiàn),目前關(guān)于圖網(wǎng)絡(luò)的解釋?zhuān)蠖喽际菑恼撐某霭l(fā)。非技術(shù)背景的讀者可能會(huì)看得有點(diǎn)暈。所以這里想用一些“大白話”,來(lái)描述一下:風(fēng)口浪尖上的圖網(wǎng)絡(luò),究竟有什么秘密?

想讓自己在AI圈潮酷起來(lái)嗎?聊Graph和GNN吧

所謂圖網(wǎng)絡(luò),并不是指有圖片的網(wǎng)站……而是指基于圖(Graph)數(shù)據(jù)進(jìn)行工作的神經(jīng)網(wǎng)絡(luò)。

Graph,翻譯成“圖”,或者“圖譜”。這是一個(gè)數(shù)學(xué)概念,指由頂點(diǎn)(nodes)和邊(edges)構(gòu)成的一種數(shù)學(xué)關(guān)系。后來(lái)這個(gè)概念引申到了計(jì)算機(jī)科學(xué)中,成為了一種重要的數(shù)據(jù)形式,用來(lái)表示單元間相互有聯(lián)系的數(shù)據(jù)網(wǎng)絡(luò)。

此外,這個(gè)概念還引申到了生物學(xué)、社會(huì)科學(xué)和歷史學(xué)等無(wú)數(shù)學(xué)科,甚至變成了我們生活中的常見(jiàn)概念。在警匪片里,警局或者偵探辦公室的墻上,往往掛著罪犯的關(guān)系網(wǎng)絡(luò)圖,這大概是我們生活中最常見(jiàn)的Graph。

回到計(jì)算機(jī)科學(xué)領(lǐng)域,圖數(shù)據(jù)和基于圖的分析,廣泛應(yīng)用于各種分類(lèi)、鏈路、聚類(lèi)任務(wù)里。人工智能領(lǐng)域有個(gè)重要的分支,叫做知識(shí)圖譜?;具壿嬀褪菍⒅R(shí)進(jìn)行Graph化,從而在我們尋找知識(shí)時(shí),可以依據(jù)圖譜關(guān)系進(jìn)行追蹤和定位。

比如我們?cè)谒阉饕嬷兴涯硞€(gè)名人時(shí),相關(guān)推薦會(huì)跳出來(lái)跟這個(gè)人字面意義上無(wú)關(guān)的其他人。這就是知識(shí)圖譜在起作用。

那么圖網(wǎng)絡(luò)是怎么搞出來(lái)的呢?

大家可能知道這樣一個(gè)“唱衰AI”的小故事:用機(jī)器視覺(jué)技術(shù),AI今天可以很輕松識(shí)別出來(lái)一張照片上的幾張人臉。但它無(wú)法像真人一樣,一眼看出來(lái)圖上是朋友、戀人還是家庭聚會(huì)。

換句話說(shuō),一般意義上AI無(wú)法獲得和增強(qiáng)用人類(lèi)常識(shí)去進(jìn)行邏輯推理的能力。很多人以此判斷,今天的AI并不怎么智能。

AI科學(xué)家們琢磨了一下,表示這事兒有辦法搞定。

如果把圖/圖譜作為AI的一部分,將深度學(xué)習(xí)帶來(lái)的學(xué)習(xí)能力,和圖譜代表的邏輯關(guān)系結(jié)合起來(lái),是不是就好很多?

事實(shí)上,Graph+Deeplearning并不是一個(gè)全新概念。最早在2009年,就有研究提出了二者的結(jié)合。近幾年這個(gè)領(lǐng)域陸續(xù)在有研究出來(lái)。對(duì)于這個(gè)組合產(chǎn)物,學(xué)術(shù)界有人稱(chēng)之為圖卷積網(wǎng)絡(luò)(GCN),也有人稱(chēng)呼其為圖神經(jīng)網(wǎng)絡(luò)(GNN)或者圖網(wǎng)絡(luò)(GN,Graph Networks),其技術(shù)內(nèi)涵和命名思路也各不相同。這里暫且使用圖網(wǎng)絡(luò)這個(gè)籠統(tǒng)稱(chēng)呼。

圖網(wǎng)絡(luò)作為一種新的AI研究思路,之所以能夠在2018年被點(diǎn)燃,很大程度還是號(hào)稱(chēng)AI扛把子的DeepMind的功勞。

在火種拋出、全球跟進(jìn)以及反復(fù)爭(zhēng)論之后,圖網(wǎng)絡(luò)變成了AI學(xué)術(shù)圈最靚仔的那個(gè)關(guān)鍵詞。今天大有一種,聊深度學(xué)習(xí)不說(shuō)圖網(wǎng)絡(luò)就很low的感覺(jué)……

從識(shí)別小能手到推理專(zhuān)家:AI新貴求職記

有種論調(diào)是這么說(shuō)的:深度學(xué)習(xí)已死,圖網(wǎng)絡(luò)才是未來(lái)。

這句話怎么琢磨都有問(wèn)題。因?yàn)閺膱D網(wǎng)絡(luò)在去年被“翻新”出來(lái)那一刻,它在本質(zhì)上還是對(duì)流行的多層神經(jīng)網(wǎng)絡(luò)的一種補(bǔ)充。

讓我們來(lái)打個(gè)比方,看一下跟傳統(tǒng)深度學(xué)習(xí)相比,圖網(wǎng)絡(luò)應(yīng)該是如何工作的。

舉個(gè)例子,假如我們想讓教育我們的孩子,讓他認(rèn)識(shí)新來(lái)的鄰居一家人。我們應(yīng)該怎么辦呢?可以選擇給他講,隔壁新來(lái)了某個(gè)小朋友,他爸爸是誰(shuí)媽媽是誰(shuí)。但是這樣不直觀,孩子很容易記不住。而更快的方式或許是拿著照片給他看,告訴他照片上的人都是什么關(guān)系。

而在這個(gè)工作之前,其實(shí)我們已經(jīng)完成了一個(gè)先覺(jué)條件:我們已經(jīng)告訴過(guò)孩子,爸爸媽媽爺爺奶奶這些稱(chēng)呼,分別指代的是什么意思。他理解這些“邊”,然后再代入新鄰居一家人具體的樣貌性格交談作為“頂點(diǎn)”,最終構(gòu)成了對(duì)鄰居一家這個(gè)“圖”的網(wǎng)絡(luò)化認(rèn)識(shí)。

而我們?cè)谟蒙疃葘W(xué)習(xí)教導(dǎo)AI時(shí),往往是省略掉第一步。直接給出大量照片和語(yǔ)音文字資料進(jìn)行訓(xùn)練,強(qiáng)迫AI去“記住”這一家人的關(guān)系。然而在AI缺乏對(duì)家庭關(guān)系的基本常識(shí)情況下,它到底能不能記住,是怎么記住的,會(huì)不會(huì)出現(xiàn)偏差,其實(shí)我們都是不知道的。

某種程度上,這就是深度學(xué)習(xí)的黑箱性來(lái)源之一。

所以圖網(wǎng)絡(luò)的思路是,首先讓AI構(gòu)建一個(gè)“圖”數(shù)據(jù),先理解爸爸媽媽這一類(lèi)關(guān)系的含義,再去學(xué)習(xí)具體的家庭數(shù)據(jù)。這樣AI就可以依靠已經(jīng)積累的節(jié)點(diǎn)間的消息傳遞性,來(lái)自己推理下一個(gè)要認(rèn)識(shí)的家庭究竟誰(shuí)是爸爸誰(shuí)是兒子。

這也就意味著,圖網(wǎng)絡(luò)某種程度上有了自己推理的能力。如果將這種能力推而廣之,AI就將可能在非常復(fù)雜的聯(lián)系和推理中完成智能工作。

前面說(shuō)了,這個(gè)領(lǐng)域的工作其實(shí)一直沒(méi)有停止。但是之所以沒(méi)有廣泛流行,一方面是因?yàn)檫@個(gè)領(lǐng)域相對(duì)小眾,缺少重磅研究來(lái)引發(fā)大家的關(guān)注;另一方面也是因?yàn)榭床灰?jiàn)摸不著,缺少開(kāi)源模型來(lái)檢驗(yàn)理論的正誤。

去年6月,DeepMind聯(lián)合谷歌大腦、麻省理工等機(jī)構(gòu)的27位學(xué)者,共同發(fā)表了關(guān)于圖網(wǎng)絡(luò)的論文《Relational inductive biases, deep learning, and graph networks.》,接著開(kāi)源了相關(guān)的算法包GraphNet。

這篇文章中,DeepMind不僅提出了新的算法模型,希望能用圖網(wǎng)絡(luò)實(shí)現(xiàn)端到端的學(xué)習(xí);同時(shí)也總結(jié)歸納了此前圖網(wǎng)絡(luò)各個(gè)流派的研究方法,并將其在新算法上進(jìn)行了融合。

在這個(gè)有點(diǎn)承上啟下意味的研究出來(lái)后,大量關(guān)于圖網(wǎng)絡(luò)的綜述、應(yīng)用檢驗(yàn),以及新算法的探討開(kāi)始在學(xué)術(shù)界萌生。隨著全球AI圈的共同發(fā)力,這門(mén)AI技術(shù)新貴正在嘗試走向臺(tái)前。

圖網(wǎng)絡(luò),到底有什么用?

這個(gè)問(wèn)題或許可以分遠(yuǎn)近兩方面看。

近的方面,有一些AI要面對(duì)的任務(wù),天然就屬于圖結(jié)構(gòu)數(shù)據(jù)。因此用圖網(wǎng)絡(luò)來(lái)學(xué)習(xí)和處理可謂事半功倍。比如說(shuō)社交網(wǎng)絡(luò)、智能推薦、化學(xué)分子預(yù)測(cè)、知識(shí)圖譜等領(lǐng)域,都被證明可以廣泛應(yīng)用圖網(wǎng)絡(luò)技術(shù)來(lái)提升智能化效率,降低算力消耗。

而在非結(jié)構(gòu)化數(shù)據(jù),比如語(yǔ)音、文本、圖片等場(chǎng)景,圖網(wǎng)絡(luò)可以用來(lái)提取結(jié)構(gòu)化信息。比如在圖片中更好地識(shí)別家庭成員關(guān)系,認(rèn)識(shí)圖片中正在發(fā)生的行為等等。此外,圖網(wǎng)絡(luò)還能為數(shù)據(jù)的優(yōu)化組合提供更加智能化的應(yīng)用。

而從長(zhǎng)遠(yuǎn)方面看,圖網(wǎng)絡(luò)是對(duì)圖譜技術(shù)和深度學(xué)習(xí)技術(shù)兩個(gè)技術(shù)領(lǐng)域的融合與再拓展。這不僅讓沉睡已久的,AI中的知識(shí)表示流派具備了復(fù)活的潛力。更重要的因素在于,圖網(wǎng)絡(luò)可能讓深度學(xué)習(xí)打開(kāi)因果推理這扇大門(mén)。

具體一點(diǎn),作為一種底層邏輯上的更新,圖網(wǎng)絡(luò)似乎可以起到對(duì)深度學(xué)習(xí)幾個(gè)原生缺點(diǎn)的彌補(bǔ):

1、增強(qiáng)AI可解釋性。

“臭名昭著”的深度學(xué)習(xí)黑箱,來(lái)自于大量非結(jié)構(gòu)數(shù)據(jù)輸入之后,算法進(jìn)行歸納的邏輯無(wú)從掌握。而圖網(wǎng)絡(luò)可以操作知識(shí)的歸納邏輯,看出行為的因果關(guān)系,顯然對(duì)是黑箱性的一次突破。

2、減少“人工智障”式的視覺(jué)錯(cuò)判。

在機(jī)器視覺(jué)領(lǐng)域,AI另一個(gè)廣為人知的問(wèn)題,就是對(duì)對(duì)抗攻擊的低抵抗力。比如AI本來(lái)已經(jīng)認(rèn)識(shí)這是鳥(niǎo)了,結(jié)果照片上沾一個(gè)黑點(diǎn),它又不認(rèn)識(shí)了。這個(gè)問(wèn)題來(lái)自于AI本身識(shí)別的是像素,而不是物體概念本身。圖網(wǎng)絡(luò)如果將物體關(guān)系帶入其中,或許會(huì)讓AI的視覺(jué)判斷力更像人類(lèi)。

3、小樣本學(xué)習(xí)的可能性。

深度學(xué)習(xí)的另一個(gè)問(wèn)題,就是很多算法必須經(jīng)歷超大規(guī)模訓(xùn)練來(lái)提升精度。而這也是對(duì)算力和數(shù)據(jù)的暴力消耗。如果能讓AI具備邏輯上的遷移可能,那么具備人類(lèi)常識(shí)的AI,將可以在很小的數(shù)據(jù)樣本中完成相對(duì)復(fù)雜的工作。

4、向著通用智能的一小步。

我們知道,AI今天的主要能力是識(shí)別和理解,而推理是其若想。假如圖網(wǎng)絡(luò)彌補(bǔ)了這一弱勢(shì),是否意味著AI將從單體智能向通用智能走上一步呢?

這么多價(jià)值的圖網(wǎng)絡(luò),顯然想不火都難。2019年,或許將是圖網(wǎng)絡(luò)放出更多光芒的一年。

然而也別太樂(lè)觀,這個(gè)更多光芒完全是個(gè)相對(duì)值!雖然今天很多聲音高調(diào)吹捧圖網(wǎng)絡(luò)的價(jià)值,但要看到,圖網(wǎng)絡(luò)并不是AI的萬(wàn)能鑰匙。

心頭一動(dòng),道阻且長(zhǎng):如何看待圖網(wǎng)絡(luò)的發(fā)展現(xiàn)狀?

雖然今天產(chǎn)業(yè)端對(duì)于圖網(wǎng)絡(luò)的應(yīng)用還沒(méi)有怎么被提及,但就我所接觸過(guò)的AI學(xué)術(shù)界人士,確實(shí)普遍對(duì)圖網(wǎng)絡(luò)報(bào)以非常強(qiáng)烈的興趣。

當(dāng)然了,對(duì)圖網(wǎng)絡(luò)的爭(zhēng)議今天也普遍存在。整體而言,對(duì)它的整體評(píng)價(jià)分為了三個(gè)流派:

1、悲觀派。有一種觀點(diǎn)認(rèn)為,圖網(wǎng)絡(luò)無(wú)非是對(duì)深度學(xué)習(xí)劣根性打的一個(gè)補(bǔ)丁,屬于深度學(xué)習(xí)走不下去了,打算繞繞路。而且這個(gè)補(bǔ)丁并沒(méi)有被證明有效。今天還只是停留在概念和淺層實(shí)驗(yàn)階段。

2、客觀派認(rèn)為,圖網(wǎng)絡(luò)是深度學(xué)習(xí)發(fā)展的必然趨勢(shì)和重要補(bǔ)充,恰恰證明了AI作為一種底層技術(shù)正在不斷發(fā)展成長(zhǎng),拓展自己的邊界。不管圖網(wǎng)絡(luò)是不是真的能做到暢想的一切,至少證明了深度學(xué)習(xí)體系在今天是有發(fā)展能力的。

3樂(lè)觀派則提出,圖網(wǎng)絡(luò)的關(guān)鍵意義,是讓AI能夠獲取常識(shí)和推理能力,這種能力顯然是人類(lèi)智能的一個(gè)重要代表。我們一直期待的AI走向通用化的強(qiáng)人工智能,會(huì)不會(huì)就從圖網(wǎng)絡(luò)開(kāi)始呢?在他們看來(lái),圖網(wǎng)絡(luò)是關(guān)乎于AI去往下一個(gè)時(shí)代的關(guān)鍵開(kāi)關(guān)。

到底哪一派更接近未來(lái)的真相呢?可能就交給諸位和未來(lái)一起檢驗(yàn)吧。

總體而言,圖網(wǎng)絡(luò)是一種對(duì)今天流行的AI體系,從技術(shù)思想,到技術(shù)邏輯的一次重要修補(bǔ)和升級(jí)。它在某種程度上是一個(gè)未來(lái),但今天還缺乏實(shí)踐檢驗(yàn)和有效工作。

在實(shí)踐中,圖網(wǎng)絡(luò)的限制還非常多。比如其表示能力不足,無(wú)法承擔(dān)太復(fù)雜的圖結(jié)構(gòu)數(shù)據(jù)。并且對(duì)計(jì)算復(fù)雜度要求很高,對(duì)今天的計(jì)算架構(gòu)又提出了新的挑戰(zhàn)。

而且圖網(wǎng)絡(luò)主要解決的是AI對(duì)結(jié)構(gòu)化數(shù)據(jù)的處理,而在動(dòng)態(tài)數(shù)據(jù)、大規(guī)模數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)等領(lǐng)域,圖網(wǎng)絡(luò)的作為依舊有限。

再一個(gè),雖然AI是一個(gè)高度產(chǎn)學(xué)一體化的學(xué)科,從前瞻性研究到技術(shù)實(shí)踐的周期已經(jīng)被大大縮短。然而要客觀看到,二者并不是無(wú)縫對(duì)接的,從算法理論提出到實(shí)際應(yīng)用,還是會(huì)有一個(gè)比較長(zhǎng)的蟄伏期。我們不能指望去年的AI學(xué)術(shù)明星,今年就走進(jìn)千家萬(wàn)戶(hù)。

總之呢,這是個(gè)讓人動(dòng)心的技術(shù),但今天還僅僅是發(fā)現(xiàn)了藏寶圖。真正的寶藏,大概還在千山萬(wàn)水之外。

THEEND

最新評(píng)論(評(píng)論僅代表用戶(hù)觀點(diǎn))

更多
暫無(wú)評(píng)論