“如今,圖數(shù)據(jù)庫技術(shù)正越來越廣泛地應(yīng)用于各類商業(yè)場景中。”TigerGraph創(chuàng)始人兼CEO許昱博士談起圖分析的應(yīng)用和需求如數(shù)家珍,“客戶主動(dòng)找上門來,主要有兩類需求,一是對時(shí)間有要求,希望快速分析并得到結(jié)果;二是對分析深度有要求,比如一些做區(qū)塊鏈的金融客戶希望對數(shù)字貨幣交易可追蹤的深度不是幾十步,而是上百步甚至上千步。”
筆者與TigerGraph的第一次親密接觸還要回溯至2018年的杭州云棲大會(huì),那時(shí)TigerGraph剛剛開始在中國拓展業(yè)務(wù)。在會(huì)議期間,筆者采訪了許昱博士,也有了“圖數(shù)據(jù)庫猛于虎”的最初印象。
TigerGraph創(chuàng)始人兼CEO許昱博士
最近筆者再次對他進(jìn)行了采訪,他坦言:“TigerGraph現(xiàn)在最想做的就是讓更多的行業(yè)客戶了解圖數(shù)據(jù)庫、使用圖數(shù)據(jù)庫。”據(jù)他介紹,從事數(shù)字貨幣交易的客戶的需求比較特殊,交易本身就可以用一張交易圖解析,所以他們對圖數(shù)據(jù)庫的理解、應(yīng)用比很多傳統(tǒng)行業(yè)走得早、走得快。例如,TigerGraph已經(jīng)嘗試與普華永道、埃森哲合作,在預(yù)防金融犯罪上應(yīng)用其圖數(shù)據(jù)庫技術(shù)。
“但是最近幾年,傳統(tǒng)行業(yè)也對圖數(shù)據(jù)庫有了更強(qiáng)烈和迫切的需求,因?yàn)橛辛藞D數(shù)據(jù)庫,許多以前不能做的事現(xiàn)在都變成了可能。”許昱如是說。
圖數(shù)據(jù)庫可以做得更多
2018年,TigerGraph實(shí)現(xiàn)了預(yù)計(jì)中的快速增長,收入增長300%,客戶數(shù)量增長400%,全球員工數(shù)量增長67%,全球最大的三家銀行、Intuit、Zillow和VISA,以及中國的金融、電信、電力等行業(yè)的頭部客戶都是TigerGraph的客戶。作為業(yè)界首個(gè)實(shí)時(shí)原生并行圖數(shù)據(jù)庫,與那些在業(yè)界成名已久、但仍然是單機(jī)版的產(chǎn)品相比,TigerGraph的增長后勁兒十足,也顯示出足夠強(qiáng)大的顛覆性。
圖是一種數(shù)據(jù)結(jié)構(gòu),最核心的是點(diǎn)和邊,點(diǎn)就是實(shí)體,邊就是將實(shí)體進(jìn)行關(guān)聯(lián)的關(guān)系。圖數(shù)據(jù)庫在本質(zhì)上與關(guān)系數(shù)據(jù)庫是很類似的,只不過關(guān)系數(shù)據(jù)庫用表來做存儲(chǔ)和計(jì)算的模型,而圖數(shù)據(jù)庫是用圖來做存儲(chǔ)和計(jì)算的模型。圖分析與傳統(tǒng)的BI分析也類似,傳統(tǒng)的分析是基于表狀的數(shù)據(jù)進(jìn)行分析,而圖分析是基于圖關(guān)聯(lián)的數(shù)據(jù)做新的分析。與關(guān)系數(shù)據(jù)庫和NoSQL數(shù)據(jù)庫相比,圖數(shù)據(jù)庫具有十分明顯的優(yōu)勢,比如可以實(shí)現(xiàn)更好、更快地查詢和分析,更簡化、更自然地?cái)?shù)據(jù)建模,由點(diǎn)及面地挖掘知識體系,面向?qū)ο蟮乃季S,以及更強(qiáng)大的問題解決能力等。
“在大數(shù)據(jù)時(shí)代,數(shù)據(jù)是新的石油,而基于圖的數(shù)據(jù)分析就是新的煉油廠。”許昱 說,“圖分析可以把復(fù)雜數(shù)據(jù)關(guān)聯(lián)起來,提供許多新的洞察力。”Gartner也認(rèn)為,對數(shù)據(jù)驅(qū)動(dòng)進(jìn)行運(yùn)維和決策的企業(yè)來說,圖分析可能是單一最有效的競爭性優(yōu)勢。2019年1月,Gartner在一份研究報(bào)告中指出,從現(xiàn)在到2020年,圖數(shù)據(jù)庫市場的年復(fù)合增長率為100%,2020年保守估計(jì)市場規(guī)模將達(dá)到80億美元。
以前,企業(yè)客戶就很喜歡圖數(shù)據(jù)庫,但以前的產(chǎn)品不能擴(kuò)展到多機(jī),也不能處理大數(shù)據(jù),導(dǎo)致應(yīng)用只能處于研發(fā)階段或者根本不能上線。擁有唯一可擴(kuò)展的企業(yè)級圖數(shù)據(jù)庫,TigerGraph只用了一年時(shí)間就從默默無聞到贏得了全球很多行業(yè)大型企業(yè)的青睞,憑借的就是技術(shù)上的領(lǐng)先和不可替代性。
“我們的愿景是做圖數(shù)據(jù)庫市場的第一,賦能數(shù)據(jù)科學(xué)家、開發(fā)者和商業(yè)用戶,將復(fù)雜的數(shù)據(jù)關(guān)聯(lián)起來,并從關(guān)聯(lián)的數(shù)據(jù)中獲得深度洞察力。”許昱表示,“TigerGraph可以把企業(yè)的所有數(shù)據(jù),包括歷史數(shù)據(jù)和客戶信賴的數(shù)據(jù)全部綜合起來,并基于關(guān)聯(lián)的圖做各種各樣新的應(yīng)用程序。另外,圖與機(jī)器學(xué)習(xí)、AI天生就具有互補(bǔ)關(guān)系。”
圖數(shù)據(jù)庫必不可少
為什么有些分析采用圖數(shù)據(jù)庫的效果會(huì)更好?有兩種情況:第一種,數(shù)據(jù)量非常大,同時(shí)又要求做實(shí)時(shí)的多步分析,這是傳統(tǒng)關(guān)系數(shù)據(jù)庫根本做不到,而這卻是圖數(shù)據(jù)庫最擅長的;第二種,在一些業(yè)務(wù)查詢中,采用傳統(tǒng)關(guān)系數(shù)據(jù)庫根本無法描寫或表達(dá)其中人與人、人與社區(qū)或社區(qū)之間的關(guān)系等。
用戶是否要采用圖數(shù)據(jù)庫,其實(shí)有兩個(gè)簡單的判斷標(biāo)準(zhǔn):一是該任務(wù)是否要達(dá)到亞秒級,而且涉及多機(jī)多跳;二是某些任務(wù)是否無法用SQL描述。遇到上述兩種情況,用戶可以首選圖數(shù)據(jù)庫。
談到公司未來的發(fā)展,許昱概括說:“第一,聚焦產(chǎn)品,繼續(xù)技術(shù)創(chuàng)新,保持在企業(yè)級圖數(shù)據(jù)庫市場的領(lǐng)導(dǎo)地位;第二,發(fā)力云服務(wù),比如2018年底推出的TigerGraph Cloud可以在云中運(yùn)行可擴(kuò)展、更簡單、更強(qiáng)大的圖分析,用戶可以利用TigerGraph的可自定義圖算法庫為人工智能和機(jī)器學(xué)習(xí)提供強(qiáng)勁動(dòng)力;第三,在圖的可視化工具方面不斷創(chuàng)新,目前TigerGraph內(nèi)部已經(jīng)有了一個(gè)可視即可得的版本,只要通過拖拽的方式,系統(tǒng)就可實(shí)時(shí)反饋結(jié)果。”隨著技術(shù)的創(chuàng)新和產(chǎn)品快速的迭代,TigerGraph也在一些領(lǐng)域?qū)崿F(xiàn)了新的突破,比如醫(yī)療保健行業(yè)、零售行業(yè),TigerGraph與這些行業(yè)的客戶正在嘗試新的合作。
如今,通過圖分析來優(yōu)化是最熱門的研究方向。TigerGraph今年也會(huì)投入更多研發(fā)力量,改進(jìn)查詢語言、更新算法庫并在年中推出新版本TigerGraph 2.4。新技術(shù)將圖模式匹配與實(shí)施深度鏈接分析相結(jié)合,這一組合特別適用于提高機(jī)器學(xué)習(xí)與欺詐檢測、風(fēng)險(xiǎn)分析以及個(gè)性化推薦。許昱表示:“我們是個(gè)煉油廠,能把原始數(shù)據(jù)加工成新的、質(zhì)量更高的‘油’。用戶可以將這些高質(zhì)量的數(shù)據(jù)、顯性的數(shù)據(jù)之間的關(guān)系,用于機(jī)器訓(xùn)練或設(shè)計(jì)模型,那么訓(xùn)練的效果會(huì)更好,模型的質(zhì)量也會(huì)非常高。”
人才很重要
當(dāng)前,在所有類型的數(shù)據(jù)庫中,圖數(shù)據(jù)庫是發(fā)展最快的。許昱認(rèn)為,圖數(shù)據(jù)庫在發(fā)展過程中遇到的最大挑戰(zhàn)只有一個(gè),就是因?yàn)榧夹g(shù)本身比較新,需要培養(yǎng)更多的專業(yè)技術(shù)人才,在中國尤其如此。所以,TigerGraph將在中國開展更多培訓(xùn)和認(rèn)證工作。
TigerGraph成立的前5年一直埋頭開發(fā),并沒有開展商業(yè)銷售。當(dāng)TigerGraph開始市場銷售后,許昱對公司的產(chǎn)品相當(dāng)自信,基于C++從底層核心開始做起,利用分布式技術(shù),可支持萬億級別的節(jié)點(diǎn),具備高性能和高可擴(kuò)展高性,而且操作界面十分簡單。“原生、并行,這是我們產(chǎn)品的差異化競爭優(yōu)勢。”許昱進(jìn)一步解釋說,“原生,表明我們打造了一套專門針對圖數(shù)據(jù)庫管理的信息系統(tǒng);并行,表明我們的產(chǎn)品可以基于多CPU核心進(jìn)行并行處理,性能非常高。 ”
TigerGraph是典型的厚積薄發(fā),產(chǎn)品上市的一年時(shí)間里就吸引了眾多行業(yè)頭部客戶,業(yè)務(wù)呈現(xiàn)加速增長態(tài)勢。在中國,平安科技、招商銀行、中國移動(dòng)、中國聯(lián)通等都采用了TigerGraph的產(chǎn)品。TigerGraph正在與國內(nèi)的多個(gè)商業(yè)銀行洽談進(jìn)一步合作。“不論數(shù)據(jù)量大或小,只要涉及復(fù)雜關(guān)聯(lián)分析,就可以采用TigerGraph的產(chǎn)品。”許昱表示,“我們不僅可以做金融行業(yè)的反欺詐、反洗錢,而且以AI和機(jī)器學(xué)習(xí)、地理空間分析,以及時(shí)間序列分析等為基礎(chǔ),還可以廣泛應(yīng)用于企業(yè)知識圖譜、產(chǎn)品實(shí)時(shí)推薦、智能供應(yīng)鏈、網(wǎng)絡(luò)IT和云資源優(yōu)化等場景中,幫助企業(yè)洞悉深度關(guān)聯(lián)的商業(yè)價(jià)值。”
為了進(jìn)一步推動(dòng)圖數(shù)據(jù)庫應(yīng)用的落地,TigerGraph做了幾件事:第一,編寫并行圖原生電子書,旨在培養(yǎng)和教育圖數(shù)據(jù)庫專業(yè)人才;第二,通過舉辦在線研討會(huì)以及GSQL專家面對面活動(dòng),提升用戶對圖數(shù)據(jù)庫的認(rèn)識,普及并幫助用戶使用GSQL查詢語言,推動(dòng)相關(guān)應(yīng)用的發(fā)展;第三,更新了開源算法庫,做更多內(nèi)嵌的算法,讓用戶可以直接拿來使用,同時(shí)還會(huì)持續(xù)推出一些可視化工具,降低圖數(shù)據(jù)庫應(yīng)用的門檻。
還是那句話“圖數(shù)據(jù)庫猛于虎”,圖數(shù)據(jù)庫正展現(xiàn)出越來越廣闊的市場前景。