李飛飛說(shuō),云數(shù)據(jù)庫(kù)已經(jīng)成為數(shù)據(jù)庫(kù)最重要的發(fā)展方向,從國(guó)際國(guó)內(nèi)數(shù)據(jù)庫(kù)產(chǎn)業(yè)的發(fā)展來(lái)看,這個(gè)趨勢(shì)已經(jīng)非常明顯。在他看來(lái),在新技術(shù)大變革時(shí)期,中國(guó)數(shù)據(jù)庫(kù)市場(chǎng)也一定會(huì)發(fā)生一系列顯著的變化。
具體到阿里云的發(fā)展策略,他表示,作為中國(guó)排名第一的數(shù)據(jù)庫(kù)廠商,阿里云已經(jīng)做好了全面服務(wù)政企市場(chǎng)的準(zhǔn)備,并會(huì)在這個(gè)市場(chǎng)上持續(xù)發(fā)力。
以下為李飛飛演講的核心內(nèi)容:
數(shù)據(jù)庫(kù)的未來(lái):云原生+分布式
首先回顧整個(gè)數(shù)據(jù)庫(kù)的發(fā)展歷程。
過(guò)去幾十年,IT基礎(chǔ)設(shè)施的規(guī)模正在發(fā)生巨變,從早期的大型機(jī)、小型機(jī),再到X86服務(wù)器,到互聯(lián)網(wǎng),再到云+端的演進(jìn),底層的設(shè)備數(shù)量出現(xiàn)了從幾十臺(tái)到幾百萬(wàn)臺(tái)指數(shù)級(jí)的增長(zhǎng)。
這種基礎(chǔ)設(shè)施的變化,為上層數(shù)據(jù)庫(kù)的演進(jìn)提供了堅(jiān)實(shí)的基礎(chǔ)。就像物種會(huì)隨著環(huán)境的變化而演進(jìn)一樣,當(dāng)基礎(chǔ)設(shè)施——計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)這些基礎(chǔ)的計(jì)算資源不斷演進(jìn)的時(shí)候,這些基礎(chǔ)設(shè)施之上的數(shù)據(jù)庫(kù)系統(tǒng),也需相應(yīng)地持續(xù)演進(jìn)。
不同的基礎(chǔ)設(shè)施對(duì)應(yīng)了不同的應(yīng)用場(chǎng)景,以及數(shù)據(jù)庫(kù)發(fā)展的不同歷史階段。
過(guò)去幾十年,數(shù)據(jù)庫(kù)經(jīng)歷了從早期的關(guān)系型數(shù)據(jù)庫(kù),到后來(lái)的數(shù)據(jù)倉(cāng)庫(kù)和關(guān)系型數(shù)據(jù)庫(kù)配合,OLTP和OLAP兩個(gè)領(lǐng)域的細(xì)分,到后面開源數(shù)據(jù)庫(kù),再到今天云數(shù)據(jù)庫(kù)的一個(gè)發(fā)展歷程。
DB-Engines對(duì)數(shù)據(jù)庫(kù)領(lǐng)域有深入的跟蹤分析。目前,這個(gè)網(wǎng)站上有近400款不同的數(shù)據(jù)庫(kù)的產(chǎn)品,這個(gè)數(shù)字直白地說(shuō)明數(shù)據(jù)庫(kù)市場(chǎng)競(jìng)爭(zhēng)非常激烈。
DB-Engines網(wǎng)站上的數(shù)據(jù)庫(kù)分為不同類型,有關(guān)系型數(shù)據(jù)庫(kù)、圖、文檔、分析型數(shù)據(jù)庫(kù)等,分別對(duì)應(yīng)不同行業(yè)特點(diǎn)和客戶需求的細(xì)分市場(chǎng)。除了傳統(tǒng)商業(yè)化數(shù)據(jù)庫(kù),開源社區(qū)的數(shù)據(jù)庫(kù)發(fā)展也非常迅猛。
DB-Engines有一個(gè)指數(shù)——Popularity Trend,這是通過(guò)各種指標(biāo)計(jì)算出的。該指數(shù)顯示開源數(shù)據(jù)庫(kù)和商業(yè)數(shù)據(jù)庫(kù)之間的流行差距已經(jīng)快速縮小。
這一切都表明了數(shù)據(jù)庫(kù)行業(yè)正在發(fā)生新的變化。權(quán)威市場(chǎng)研究機(jī)構(gòu)Gartner在相關(guān)報(bào)告中闡述了幾個(gè)非常重要的趨勢(shì):
第一,數(shù)據(jù)規(guī)模爆炸性增長(zhǎng)。我們處在一個(gè)大數(shù)據(jù)時(shí)代,毋庸置疑。
第二,數(shù)據(jù)生產(chǎn)和處理的實(shí)時(shí)化需求越來(lái)越強(qiáng)。這也是為什么阿里云今天提出云原生數(shù)據(jù)庫(kù)2.0,提供一站式數(shù)據(jù)管理與服務(wù)。
第三,生產(chǎn)和數(shù)據(jù)處理的智能化?,F(xiàn)在用戶對(duì)數(shù)據(jù)的處理不再停留在傳統(tǒng)的事務(wù)處理、交易以及簡(jiǎn)單或聚合類的分析查詢,而是希望能從數(shù)據(jù)中得到更多洞察,利用數(shù)據(jù)驅(qū)動(dòng)智能的業(yè)務(wù)決策。這對(duì)我們數(shù)據(jù)庫(kù)后續(xù)的發(fā)展也提出了新的挑戰(zhàn)。
最后,數(shù)據(jù)在加速上云。這是非常明顯的行業(yè)趨勢(shì),雖然有公共云、混合云、私有云等各種形態(tài),但是各行業(yè)對(duì)云化的部署方式已是深信不疑。根據(jù)Gartner預(yù)測(cè),到2023年,全世界75%的數(shù)據(jù)庫(kù)都會(huì)以云的方式在運(yùn)行。
數(shù)據(jù)庫(kù)系統(tǒng)架構(gòu)也在快速演進(jìn)。最早數(shù)據(jù)庫(kù)是單節(jié)點(diǎn)架構(gòu),傳統(tǒng)的商業(yè)數(shù)據(jù)庫(kù)和開源數(shù)據(jù)庫(kù)都是這個(gè)架構(gòu)。
在實(shí)際的應(yīng)用部署中,這種數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)是部署簡(jiǎn)單,開發(fā)簡(jiǎn)單。但是也有缺點(diǎn),首先無(wú)法提供高可用能力、主備的運(yùn)維、高可用切換、非常復(fù)雜且面對(duì)非常大的技術(shù)挑戰(zhàn);其次,無(wú)法快速擴(kuò)容。就比如自己家后院的小倉(cāng)庫(kù),當(dāng)數(shù)據(jù)量或者并發(fā)處理的要求超過(guò)容量的時(shí)候,沒有辦法快速擴(kuò)容。
為了解決彈性擴(kuò)展、高可用等問題,業(yè)界衍生出兩個(gè)核心技術(shù)路線,一個(gè)是云原生的技術(shù)路線,一個(gè)是分布式數(shù)據(jù)庫(kù)的技術(shù)路線。
云原生技術(shù)路線
云原生的本質(zhì)就是將資源池化,就像以前家家戶戶在后院挖個(gè)水井,今天不會(huì)再在后院挖個(gè)水井,而是會(huì)打開水龍頭,按需按量使用,彈性計(jì)費(fèi)使用水的資源,有一個(gè)大的池子,這就叫資源池化,其實(shí)和云計(jì)算使用計(jì)算存儲(chǔ)網(wǎng)絡(luò)資源是一樣的道理。
云原生數(shù)據(jù)庫(kù)核心的理念就是利用云計(jì)算的本質(zhì),運(yùn)用虛擬化的技術(shù),將數(shù)據(jù)庫(kù)里面的核心資源進(jìn)行池化處理,以此解決資源彈性、高可用的挑戰(zhàn)。這里面還有一個(gè)核心的理念——存儲(chǔ)計(jì)算分離,通過(guò)將存儲(chǔ)和計(jì)算解耦,分別靈活彈性地滿足客戶業(yè)務(wù)需求。
分布式技術(shù)路線
通過(guò)分布式的方式,可以將計(jì)算和存儲(chǔ)進(jìn)行水平拓展,滿足業(yè)務(wù)的大數(shù)據(jù)量以及高并發(fā)的需求。當(dāng)然這也有挑戰(zhàn),分布式的事務(wù)處理,數(shù)據(jù)庫(kù)仍需要滿足ACID原子性、一致性、隔離性、持久性等特性。在分布式架構(gòu)下,保證讀寫的高效處理非常有挑戰(zhàn)。
數(shù)據(jù)庫(kù)未來(lái)的發(fā)展趨勢(shì)一定是將云原生能力和分布式能力合二為一,既提供分布式的水平拓展能力,也提供云原生的彈性高可用能力。將兩者結(jié)合起來(lái),也是阿里云以PolarDB為代表的云原生數(shù)據(jù)庫(kù),進(jìn)一步去探索和發(fā)展的方向。
云計(jì)算改變數(shù)據(jù)庫(kù)市場(chǎng)格局
阿里云數(shù)據(jù)庫(kù)在云原生領(lǐng)域持續(xù)進(jìn)行了多年的耕耘和積累,我們?nèi)〉昧艘恍┻M(jìn)展。Gartner預(yù)測(cè)在2023年75%的數(shù)據(jù)庫(kù)都會(huì)以云的方式來(lái)運(yùn)行。
Gartner每年都會(huì)做魔力象限,對(duì)云計(jì)算IT領(lǐng)域重要賽道進(jìn)行評(píng)估。2013年之前,數(shù)據(jù)庫(kù)領(lǐng)導(dǎo)者象限基本是被傳統(tǒng)的幾個(gè)巨頭占據(jù),Oracle、微軟、IBM的DB2,還有SAP。
到2020年,市場(chǎng)發(fā)生了翻天覆地的變化,在海外市場(chǎng)有一個(gè)明顯的特點(diǎn)是,除了傳統(tǒng)數(shù)據(jù)庫(kù)巨頭,AWS、谷歌、微軟等云廠商也進(jìn)入領(lǐng)導(dǎo)者象限。
值得一提的是現(xiàn)在的微軟和當(dāng)年的微軟完全不同,微軟此次進(jìn)入領(lǐng)導(dǎo)者象限是由于其云數(shù)據(jù)庫(kù)的服務(wù)能力快速提升,極具競(jìng)爭(zhēng)力。結(jié)合其線下數(shù)據(jù)庫(kù)和云數(shù)據(jù)庫(kù)兩個(gè)賽道的優(yōu)勢(shì),微軟已經(jīng)實(shí)現(xiàn)了在整體市場(chǎng)份額上對(duì)Oracle的反超。
阿里云數(shù)據(jù)庫(kù)在2020年首次進(jìn)入了全球數(shù)據(jù)庫(kù)領(lǐng)導(dǎo)者象限,這也是Gartner在產(chǎn)品成熟度、技術(shù)先進(jìn)性、客戶滿意度,以及市場(chǎng)占有率等多個(gè)維度深度評(píng)估后給出的高度認(rèn)可。
圖片來(lái)源:特大號(hào)
上圖是十年前和2020年最新的全球數(shù)據(jù)庫(kù)市場(chǎng)份額排名對(duì)比。全球數(shù)據(jù)庫(kù)市場(chǎng)份額列表包含了云數(shù)據(jù)庫(kù)的市場(chǎng)份額以及傳統(tǒng)線下數(shù)據(jù)庫(kù)的市場(chǎng)份額,兩者結(jié)合分析,過(guò)去Oracle一直占據(jù)第一,2020年微軟第一次反超Oracle。
這其實(shí)是微軟利用SQL Server以及Azure云數(shù)據(jù)庫(kù)的快速成長(zhǎng),兩個(gè)賽道結(jié)合實(shí)現(xiàn)了對(duì)Oracle的反超,這是非常具有歷史意義的里程碑事件,再次凸顯了云數(shù)據(jù)庫(kù)在新的環(huán)境下,對(duì)各個(gè)廠商及數(shù)據(jù)庫(kù)市場(chǎng)的重要性。
另外,在過(guò)去幾年,阿里云的市場(chǎng)份額持續(xù)提升,已經(jīng)到了全球第七位。如果只看云數(shù)據(jù)庫(kù)賽道,阿里云排名全球第四,位列AWS、微軟、谷歌之后。
數(shù)據(jù)庫(kù)產(chǎn)業(yè)的歷史新機(jī)遇
雖然數(shù)據(jù)庫(kù)是一個(gè)發(fā)展了四十年的賽道,但它并不是一個(gè)墨守成規(guī)的賽道。我認(rèn)為在今天這個(gè)時(shí)間節(jié)點(diǎn),數(shù)據(jù)庫(kù)還是一個(gè)非常有活力的賽道,孕育著大量新的市場(chǎng)機(jī)遇和新的爆發(fā)點(diǎn)。
第一,數(shù)據(jù)庫(kù)是基礎(chǔ)軟件類目的第一大賽道,基礎(chǔ)軟件有很多,但數(shù)據(jù)庫(kù)是基礎(chǔ)軟件里最為核心的類目,也是市場(chǎng)體量最大的一個(gè)類目。
第二,從開發(fā)者的角度看,超過(guò)一半的開發(fā)者都需要使用數(shù)據(jù)庫(kù),其重要性毋庸置疑。
中國(guó)數(shù)據(jù)庫(kù)的產(chǎn)業(yè)發(fā)展有幾個(gè)新的機(jī)遇,可以稱之為四新——新政策、新面孔、新技術(shù)、新機(jī)遇。
圖片第一,新政策。這主要是國(guó)家出臺(tái)了系列政策,將對(duì)基礎(chǔ)軟件的重視程度提升到了前所未有的高度。國(guó)家非常鼓勵(lì)我們中國(guó)的企業(yè),通過(guò)開放、公平的市場(chǎng)競(jìng)爭(zhēng)方式,提升國(guó)產(chǎn)數(shù)據(jù)庫(kù)的競(jìng)爭(zhēng)力,從技術(shù)水位、市場(chǎng)份額來(lái)看,國(guó)家也提供了非常好的環(huán)境。
圖片第二,新面孔。傳統(tǒng)的上一代國(guó)產(chǎn)數(shù)據(jù)庫(kù)廠商叫四小龍,衍生到今天國(guó)產(chǎn)數(shù)據(jù)庫(kù)的賽道百花齊放,出現(xiàn)了更多的新面孔,包括以阿里云為代表的云服務(wù)廠商,還有專門做企業(yè)級(jí)數(shù)據(jù)庫(kù)軟件的廠商等。
圖片第三,新技術(shù)。今天之所以我們有這個(gè)機(jī)遇去挑戰(zhàn)傳統(tǒng)數(shù)據(jù)庫(kù)廠商市場(chǎng)第一的地位,并且實(shí)現(xiàn)了超越,本質(zhì)上是我們所處的環(huán)境發(fā)生了巨大變化。
如同達(dá)爾文的《進(jìn)化論》,物種要快速進(jìn)化的前提是周圍的環(huán)境發(fā)生變化,新物種適應(yīng)環(huán)境的能力比具有統(tǒng)治地位的老物種更快,它的進(jìn)化速度就會(huì)更快。
新技術(shù)的產(chǎn)生,像云原生、分布式、智能化,面向物聯(lián)網(wǎng)的多模數(shù)據(jù)的處理、安全可信、新硬件、以及開源,這些維度是今天以及未來(lái)很長(zhǎng)一段時(shí)間,各個(gè)數(shù)據(jù)庫(kù)廠商會(huì)展開激烈競(jìng)爭(zhēng)的賽道。
圖片最后,新機(jī)遇。越來(lái)越多的企業(yè)級(jí)用戶會(huì)選擇云的部署方式,這個(gè)為我們進(jìn)入傳統(tǒng)政企市場(chǎng)提供了非常好的機(jī)遇。
阿里云數(shù)據(jù)庫(kù)不僅在公共云市場(chǎng)處于領(lǐng)導(dǎo)者地位,也做好了全面為線下傳統(tǒng)政企市場(chǎng)服務(wù)的準(zhǔn)備,事實(shí)上我們已經(jīng)服務(wù)了大量傳統(tǒng)政企客戶,并且用云原生、云計(jì)算的方式,為他們帶來(lái)了以前傳統(tǒng)部署方式享受不到的技術(shù)紅利,不僅僅是從IT降成本,保障穩(wěn)定運(yùn)行,更是帶來(lái)了新的業(yè)務(wù)價(jià)值,新的業(yè)務(wù)機(jī)遇。
云原生數(shù)據(jù)庫(kù)2.0:一站式數(shù)據(jù)管理
回顧阿里巴巴數(shù)據(jù)庫(kù)的發(fā)展歷程:
2005年-2009年,電商高速發(fā)展時(shí)期,阿里巴巴集團(tuán)擁有亞洲最大的Oracle集群;
2010年-2013年,阿里巴巴成功用自主開源的AliSQL替換了傳統(tǒng)商業(yè)數(shù)據(jù)庫(kù);
2014年,阿里巴巴開始布局自研數(shù)據(jù)庫(kù),因?yàn)闃I(yè)務(wù)推著我們往前走,比如雙十一電商場(chǎng)景,有異地多活、熱點(diǎn)打卡、秒殺的需求,讓我們看到了自研數(shù)據(jù)庫(kù)的價(jià)值,于是我們堅(jiān)定投入到數(shù)據(jù)庫(kù)這個(gè)基礎(chǔ)軟件的自主研發(fā)中去;
2017年到今天,通過(guò)多年積累的數(shù)據(jù)庫(kù)技術(shù),我們提供了豐富的數(shù)據(jù)庫(kù)的服務(wù),比如云數(shù)據(jù)庫(kù)的托管服務(wù)RDS、云原生數(shù)據(jù)庫(kù)PolarDB和分布式版本PolarDB-X、以及云原生數(shù)據(jù)倉(cāng)庫(kù)AnalyticDB,這些核心產(chǎn)品形成了我們數(shù)據(jù)庫(kù)產(chǎn)品和服務(wù)的矩陣。
通過(guò)技術(shù)迭代,云原生數(shù)據(jù)庫(kù)2.0時(shí)代,我們希望提供一站式的數(shù)據(jù)管理與服務(wù)。
阿里云數(shù)據(jù)庫(kù)已經(jīng)毫無(wú)爭(zhēng)議的來(lái)到了中國(guó)數(shù)據(jù)庫(kù)市場(chǎng)第一的位置,在全球舞臺(tái)上,具備了向更高臺(tái)階、更高市場(chǎng)份額競(jìng)爭(zhēng)和挑戰(zhàn)的能力,進(jìn)入了Gartner全球數(shù)據(jù)庫(kù)領(lǐng)導(dǎo)者象限。
另外,根據(jù)IDC最新的中國(guó)關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)份額的研究報(bào)告,公共云加線下合起來(lái)統(tǒng)計(jì),阿里云數(shù)據(jù)庫(kù)的市場(chǎng)份額占比28%,超越了第二名十個(gè)百分點(diǎn)。在Forrester最新數(shù)倉(cāng)報(bào)告中,云原生數(shù)倉(cāng)AnalyticDB也進(jìn)入了全球的強(qiáng)勁領(lǐng)導(dǎo)者象限,在業(yè)界的標(biāo)準(zhǔn)基準(zhǔn)測(cè)試?yán)锩?,取得多?xiàng)性能及性價(jià)比第一的結(jié)果。
我們不僅在商業(yè)市場(chǎng)上取得巨大的突破和成就,還得到了國(guó)家的高度認(rèn)可。云原生最核心的產(chǎn)品,云原生數(shù)據(jù)庫(kù)PolarDB去年獲得中國(guó)電子學(xué)會(huì)的科技進(jìn)步一等獎(jiǎng),這是中國(guó)電子學(xué)會(huì)最高的獎(jiǎng)項(xiàng)。我們的數(shù)據(jù)庫(kù)也是唯一入選的數(shù)據(jù)庫(kù)的產(chǎn)品,體現(xiàn)了從國(guó)家層面,從科研的角度,對(duì)我們的新技術(shù)、新科研實(shí)力的認(rèn)可。
云原生數(shù)倉(cāng)AnalyticDB也獲得了浙江省科技進(jìn)步一等獎(jiǎng),我們進(jìn)行了對(duì)x86、ARM等多種硬件以及操作系統(tǒng)的適配,這樣可以更好的服務(wù)中國(guó)的企業(yè)級(jí)市場(chǎng)和客戶。
展望未來(lái)
我認(rèn)為云原生數(shù)據(jù)庫(kù)已經(jīng)發(fā)展到了Gartner提到的市場(chǎng)發(fā)展階段,開始直面數(shù)據(jù)的實(shí)時(shí)性、在線交易分析一體化、數(shù)據(jù)智能化處理等新需求。
因此,我們提出云原生數(shù)據(jù)庫(kù)2.0,提供一站式數(shù)據(jù)管理與服務(wù)的能力,通過(guò)數(shù)據(jù)生產(chǎn)和集成,到數(shù)據(jù)實(shí)時(shí)處理、存儲(chǔ),再到數(shù)據(jù)分析和發(fā)現(xiàn),最后到數(shù)據(jù)開發(fā)和管理,提供全鏈路數(shù)據(jù)生命周期的管理。
在這個(gè)基礎(chǔ)上,我們?yōu)榭蛻籼峁┟嫦蛐袠I(yè)的解決方案,也就是面向不同客戶且能產(chǎn)生行業(yè)價(jià)值的解決方案,最后聯(lián)合我們的生態(tài)合作伙伴一起服務(wù)客戶,從分銷生態(tài)到ISV被集成,再到服務(wù)生態(tài),再到開發(fā)者,形成一整套的數(shù)據(jù)全鏈路的管理和服務(wù)的能力。
圖片