分布式數(shù)據(jù)庫嶄露頭角 亟須構(gòu)建產(chǎn)業(yè)生態(tài)環(huán)境

中國軟件評(píng)測(cè)中心 呂韜
根據(jù)目前我國分布式數(shù)據(jù)庫技術(shù)現(xiàn)狀,我們認(rèn)為分布式數(shù)據(jù)庫是具備分布式事務(wù)處理能力、可平滑擴(kuò)展、分布于計(jì)算機(jī)網(wǎng)絡(luò)且邏輯上統(tǒng)一的數(shù)據(jù)庫。

分布式數(shù)據(jù)庫是傳統(tǒng)數(shù)據(jù)庫技術(shù)與計(jì)算機(jī)網(wǎng)絡(luò)的有機(jī)結(jié)合,相比于傳統(tǒng)的單機(jī)或主備模式的集中式數(shù)據(jù)庫,分布式數(shù)據(jù)庫在平滑擴(kuò)展、高性能、高可靠、高可用、低成本等方面具有優(yōu)勢(shì),特別是在性能方面可突破集中式數(shù)據(jù)庫的瓶頸,具有很強(qiáng)的研究和應(yīng)用價(jià)值,目前很多數(shù)據(jù)庫企業(yè)研發(fā)了分布式數(shù)據(jù)庫產(chǎn)品,并在金融、電信、互聯(lián)網(wǎng)等重點(diǎn)行業(yè)進(jìn)行了成功應(yīng)用,具有良好的發(fā)展前景。

互聯(lián)網(wǎng)及金融領(lǐng)域?qū)Ψ植际綌?shù)據(jù)庫需求迫切

分布式數(shù)據(jù)庫最早于20世紀(jì)80年代提出,受限于當(dāng)時(shí)的計(jì)算機(jī)軟硬件及網(wǎng)絡(luò)發(fā)展水平,數(shù)據(jù)庫專家M.TamerÖzsu和Patrick Valduriez在經(jīng)典著作《分布式數(shù)據(jù)庫系統(tǒng)原理(第3版)》中,把分布式數(shù)據(jù)庫定義為一群分布在計(jì)算機(jī)網(wǎng)絡(luò)上、邏輯上相互關(guān)聯(lián)的數(shù)據(jù)庫。隨著信息技術(shù)的發(fā)展,集中式數(shù)據(jù)庫也正向基于網(wǎng)絡(luò)的共享集群路線發(fā)展,而市場(chǎng)上的分布式數(shù)據(jù)庫也不僅限于網(wǎng)絡(luò)分布、邏輯關(guān)聯(lián)等特性,經(jīng)典的分布式數(shù)據(jù)庫定義顯然已不能體現(xiàn)分布式數(shù)據(jù)庫當(dāng)前技術(shù)特點(diǎn),難以滿足數(shù)據(jù)庫種類區(qū)分要求。

根據(jù)目前我國分布式數(shù)據(jù)庫技術(shù)現(xiàn)狀,我們認(rèn)為分布式數(shù)據(jù)庫是具備分布式事務(wù)處理能力、可平滑擴(kuò)展、分布于計(jì)算機(jī)網(wǎng)絡(luò)且邏輯上統(tǒng)一的數(shù)據(jù)庫。

相比于集中式數(shù)據(jù),分布式數(shù)據(jù)庫具有平滑擴(kuò)展、高可靠、高可用、低成本等關(guān)鍵特性和顯著優(yōu)點(diǎn)。目前部分分布式數(shù)據(jù)庫實(shí)現(xiàn)了分布式事務(wù)的強(qiáng)一致性,保證分布式事務(wù)的ACID(原子性、一致性、隔離性、持久性)要求,為分布式數(shù)據(jù)庫在關(guān)鍵領(lǐng)域的領(lǐng)域奠定了基礎(chǔ),而且成熟的分布式數(shù)據(jù)庫透明性較好,上層應(yīng)用系統(tǒng)可以像使用集中式數(shù)據(jù)庫一樣使用分布式數(shù)據(jù)庫事務(wù),無需關(guān)注分布式數(shù)據(jù)庫的內(nèi)部細(xì)節(jié)。

互聯(lián)網(wǎng)是分布式數(shù)據(jù)庫首先被重點(diǎn)應(yīng)用的領(lǐng)域。從成本考慮,隨著數(shù)據(jù)量和系統(tǒng)訪問量增加,依賴縱向擴(kuò)展的傳統(tǒng)數(shù)據(jù)庫架構(gòu),采用小型機(jī)、磁陣和商用數(shù)據(jù)庫軟件的購買和維護(hù)成本會(huì)越來越高。而采用廉價(jià)PC服務(wù)器、使用本地存儲(chǔ)的分布式數(shù)據(jù)庫,成本顯著下降,同時(shí)還帶來良好的系統(tǒng)成長(zhǎng)性。另外,互聯(lián)網(wǎng)應(yīng)用,包括各種大促、春節(jié)搶票、秒殺等場(chǎng)景,都有短時(shí)間內(nèi)并發(fā)量激增的情形。如果按照業(yè)務(wù)峰值提前采購計(jì)算資源,必然會(huì)導(dǎo)致資源浪費(fèi)。借助分布式數(shù)據(jù)庫的彈性擴(kuò)縮容的能力,能更好滿足業(yè)務(wù)場(chǎng)景的需求,并避免資源浪費(fèi)。

金融領(lǐng)域是使用分布式數(shù)據(jù)庫的另一個(gè)重要場(chǎng)景,分布式數(shù)據(jù)庫可以滿足金融核心領(lǐng)域高安全、高性能、低成本及高質(zhì)量等要求。目前金融核心業(yè)務(wù)架構(gòu)普遍采用“大/小機(jī)+Oracle/DB2”集中式數(shù)據(jù)庫系統(tǒng)。一方面隨著我國經(jīng)濟(jì)和科技,尤其是移動(dòng)支付的發(fā)展,現(xiàn)有系統(tǒng)已無法滿足金融類企業(yè)高安全、高性能、低成本及高質(zhì)量等要求;另一方面隨著國際形勢(shì)的變化,現(xiàn)有系統(tǒng)可能會(huì)面臨服務(wù)下降甚至斷供的風(fēng)險(xiǎn)。所以逐步以自主可控的分布式數(shù)據(jù)庫替換現(xiàn)有集中式數(shù)據(jù)庫成為金融行業(yè)的必然選擇之一。

分布式數(shù)據(jù)庫將向云化方向發(fā)展

一是分布式數(shù)據(jù)庫的產(chǎn)品化日趨成熟。隨著國產(chǎn)分布式數(shù)據(jù)庫在金融、互聯(lián)網(wǎng)等重點(diǎn)行業(yè)中的應(yīng)用,促使產(chǎn)品技術(shù)不斷迭代,兼容性、易用性、可擴(kuò)展性等問題將一一克服。未來隨著分布式數(shù)據(jù)庫等的標(biāo)準(zhǔn)體系及評(píng)價(jià)體系的健全,分布式數(shù)據(jù)庫產(chǎn)品的生態(tài)體系也將逐漸完善,在運(yùn)維保障、數(shù)據(jù)遷移、運(yùn)行監(jiān)測(cè)等方面的配套工具也將逐步成熟。

二是與人工智能等新技術(shù)融合實(shí)現(xiàn)高效運(yùn)維。在數(shù)字經(jīng)濟(jì)的推動(dòng)下,數(shù)據(jù)的全生命周期管理尤為重要,而分布式數(shù)據(jù)庫數(shù)據(jù)通常由幾十臺(tái)至數(shù)千臺(tái)服務(wù)器組成,數(shù)據(jù)庫的運(yùn)維顯得尤為重要。隨著人工智能技術(shù)的發(fā)展,將人工智能技術(shù)融入分布式數(shù)據(jù)庫的全生命周期,實(shí)現(xiàn)自運(yùn)維、自管理、自調(diào)優(yōu)、故障自診斷和自愈,是未來發(fā)展的必然趨勢(shì)。另外,在交易、分析和混合負(fù)載場(chǎng)景下,可以通過人工智能的學(xué)習(xí)算法,實(shí)現(xiàn)數(shù)據(jù)庫的自動(dòng)調(diào)優(yōu)。

三是分布式數(shù)據(jù)庫的服務(wù)方式將向云化發(fā)展。云計(jì)算技術(shù)已在我國各行業(yè)信息化建設(shè)中大規(guī)模應(yīng)用,為適應(yīng)未來信創(chuàng)領(lǐng)域信息化建設(shè)技術(shù)方向,降低數(shù)據(jù)庫運(yùn)維成本,靈活調(diào)度資源,國內(nèi)數(shù)據(jù)庫廠商積極布局云數(shù)據(jù)庫產(chǎn)品及服務(wù)。阿里云、騰訊云、華為等已經(jīng)發(fā)布了基于自有云平臺(tái)的云數(shù)據(jù)庫產(chǎn)品,傳統(tǒng)數(shù)據(jù)庫廠商達(dá)夢(mèng)也推出云數(shù)據(jù)庫產(chǎn)品??傮w上,國內(nèi)云數(shù)據(jù)庫與國際先進(jìn)水平基本持平,為未來信創(chuàng)云數(shù)據(jù)庫發(fā)展提供良好基礎(chǔ)。

大力發(fā)展分布式數(shù)據(jù)庫的技術(shù)產(chǎn)品

目前,國內(nèi)絕大部分?jǐn)?shù)據(jù)庫企業(yè)均推出了分布式數(shù)據(jù)庫產(chǎn)品,我國分布式數(shù)據(jù)庫發(fā)展基本與國際同步,在一些技術(shù)指標(biāo)和應(yīng)用層面處于領(lǐng)先水平,而且互聯(lián)網(wǎng)、金融等領(lǐng)域應(yīng)用場(chǎng)景對(duì)分布式數(shù)據(jù)庫具有切實(shí)需求,當(dāng)前應(yīng)大力發(fā)展分布式數(shù)據(jù)庫的技術(shù)產(chǎn)品,加快行業(yè)應(yīng)用,促進(jìn)數(shù)據(jù)庫產(chǎn)業(yè)高質(zhì)量發(fā)展。

首先,政策引導(dǎo),形成分布式數(shù)據(jù)庫的典型案例。

客觀地說,分布式數(shù)據(jù)庫不是傳統(tǒng)集中式數(shù)據(jù)庫的更新?lián)Q代,而是充分結(jié)合分布式計(jì)算技術(shù),使得在一定規(guī)模的節(jié)點(diǎn)和付出一定規(guī)模的成本后,實(shí)現(xiàn)了較高的性能水平,并不是所有的應(yīng)用場(chǎng)景都適合使用分布式數(shù)據(jù)庫,既沒有必要神話分布式數(shù)據(jù)庫的作用,也不應(yīng)該去貶低其作用。因此我們希望在政產(chǎn)學(xué)研用等多方努力下,共同打造分布式數(shù)據(jù)庫的最佳實(shí)踐,樹立一批典型的行業(yè)解決方案,并加以宣傳推廣

其次,產(chǎn)用協(xié)同,提升分布式數(shù)據(jù)庫產(chǎn)品成熟度。

分布式數(shù)據(jù)庫作為數(shù)據(jù)庫領(lǐng)域的創(chuàng)新,目前其產(chǎn)品化程度不高,甚至目前的一些所謂分布式數(shù)據(jù)庫產(chǎn)品,其實(shí)更像是產(chǎn)品與應(yīng)用融合后的解決方案,并不利于市場(chǎng)推廣。因此我們建議充分利用好數(shù)據(jù)庫以及基礎(chǔ)軟件領(lǐng)域的創(chuàng)新中心、適配基地及重點(diǎn)實(shí)驗(yàn)室等機(jī)構(gòu),加強(qiáng)供需雙方的產(chǎn)用協(xié)同,形成良性的問題反饋機(jī)制,共同解決一些共性的技術(shù)和產(chǎn)品問題,逐步打磨優(yōu)秀的分布式數(shù)據(jù)庫產(chǎn)品。

最后,營造環(huán)境,打造分布式數(shù)據(jù)庫的生態(tài)體系。

從產(chǎn)業(yè)發(fā)展角度來看,相比于集中式數(shù)據(jù)庫,分布式數(shù)據(jù)庫還處于發(fā)展的初期,技術(shù)體系、標(biāo)準(zhǔn)規(guī)范、測(cè)評(píng)機(jī)制、產(chǎn)品推廣等方面尚不健全。建議第三方研究和服務(wù)機(jī)構(gòu)前牽頭,聯(lián)合推進(jìn)技術(shù)標(biāo)準(zhǔn)、測(cè)評(píng)認(rèn)證、遷移驗(yàn)證、示范試點(diǎn)等工作,共同營造良性的分布式數(shù)據(jù)庫生態(tài)體系。目前華為、PingCAP等企業(yè)發(fā)起了分布式數(shù)據(jù)庫的開源社區(qū),并形成了部分商業(yè)發(fā)行版產(chǎn)品,這可能也是建設(shè)分布式數(shù)據(jù)庫生態(tài)體系的新思路。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論