本文根據(jù)DTCC 2021大會現(xiàn)場采訪整理。采訪人為IT168企業(yè)級&ITPUB執(zhí)行總編老魚,受訪嘉賓為阿里云數(shù)據(jù)庫事業(yè)部產(chǎn)品與解決方案部總經(jīng)理王偉民。
記者:請介紹下您目前在阿里云數(shù)據(jù)庫所負責(zé)的日常工作。
王偉民:首先介紹一下自己,我先后在Oracle、Microsoft、華為等企業(yè)從事數(shù)據(jù)庫相關(guān)的工作,擔(dān)任過不同的崗位。今年加入了阿里云,目前我主要負責(zé)四個方面的工作。
第一部分是產(chǎn)品管理,和我以前的工作是完全一樣的,主要是以市場、客戶需求為導(dǎo)向,去看我們需要研發(fā)哪些產(chǎn)品。
第二部分是解決方案,為產(chǎn)品的商業(yè)成功負責(zé),包括行業(yè)、區(qū)域和國際市場。
第三部分是產(chǎn)品體驗,包括文檔、體驗設(shè)計等,主要是為了讓用戶有更好的體驗并更高效地使用我們的產(chǎn)品和服務(wù)。
第四部分是品牌和生態(tài),品牌方面包括要持續(xù)對行業(yè)內(nèi)構(gòu)筑產(chǎn)品的影響力。生態(tài)方面,數(shù)據(jù)庫作為基礎(chǔ)類軟件,在PaaS層,不像計算、網(wǎng)絡(luò)存儲、安全這些通用能力,大家都需要;也不像SaaS應(yīng)用那樣自帶流量入口。所以,單獨去推廣數(shù)據(jù)庫不是特別高效,我們需要通過生態(tài)的方式去做市場、推廣,和伙伴們一起去更快速地推廣和復(fù)制到應(yīng)用場景。
以上是目前我在阿里云的工作。
記者:相當于OLAP、OLTP還有NoSQL,研發(fā)針對各自產(chǎn)品做集成與研發(fā),你這邊就變成產(chǎn)品化的。
王偉民:對,客戶需求都是到我們團隊。我們會去規(guī)劃產(chǎn)品,研發(fā)來承接需求、投入資源、按產(chǎn)品規(guī)劃的路標來推動產(chǎn)品上市。另外產(chǎn)品的商業(yè)模式、定價等GTM工作,也都是在我們團隊負責(zé)。
記者:您今天的演講主題是“云原生數(shù)據(jù)庫2.0,一站式全鏈路數(shù)據(jù)管理與服務(wù)”。為什么會選擇這個主題,這個主題您覺得對于參會的人來說,它能夠獲得哪些收益?
王偉民:我們首先強調(diào)的是“一站式”,這個“站”是“One Stop”的意思,不是“技術(shù)棧”的“棧”,這個叫“Stack”。我們現(xiàn)在做的是云服務(wù),各類引擎上架后實現(xiàn)了多樣化的供給;每一款產(chǎn)品或引擎是為特定的用戶場景做定制優(yōu)化的,這也是經(jīng)典的General Purpose(GP)和Special Purpose(SP)之間的trade-off。有很多公司嘗試用General Purpose的方式解決所有的問題,但目前為止,它可能在某些場景里是最優(yōu)解,但在所有其他場景里都是次優(yōu)解。當然General Purpose有個好處,對產(chǎn)品研發(fā)團隊來說,它的ROI是最高的,持續(xù)性投入打造一款產(chǎn)品試圖解決所有場景。
但其實存在一個問題,我們看到有很多為專用場景設(shè)計的產(chǎn)品,比如緩存、嵌入式的IoT場景、邊緣場景、多模,都不是GP產(chǎn)品能很好地解決的。到目前為止,千行百業(yè)都在做數(shù)字化轉(zhuǎn)型和上云,想用一款產(chǎn)品解決所有的問題,從哲學(xué)上來講,這是一種過于理想的狀態(tài),是不可能實現(xiàn)的。我們想用的方式是用產(chǎn)品和產(chǎn)品的組合去滿足各類業(yè)務(wù)場景的需求,相當于我們是GP+SP的模式去做。所以這是我們選這個主題的原因。
其次要強調(diào)“全鏈路”,我們做過調(diào)研,絕大部分企業(yè)里,各類產(chǎn)品和解決方案都是非常紛繁復(fù)雜的,但目前它們之間的拉通和協(xié)調(diào)仍存在很大問題。我們用云的方式可能能解決“煙囪”的問題,但其實只是解決了資源的“煙囪”,業(yè)務(wù)和數(shù)據(jù)上仍然沒有打通。既然數(shù)據(jù)是新的生產(chǎn)資料,就需要有一個數(shù)據(jù)的操作系統(tǒng),我們想用DMS來實現(xiàn)DataOS。這是我們的想法,也是我們一直努力的方向。
到目前為止,豐富的業(yè)務(wù)場景以及里面不同的業(yè)務(wù)負載特性,使得很難用一款產(chǎn)品最終解決所有問題,這是我們最大的洞察。所以我們希望可以帶來實際的變化。
記者:您正好提到了這個觀點,和我下面問到的趨勢是一樣的。專用數(shù)據(jù)庫、多模數(shù)據(jù)庫方面,顯然你們的專用數(shù)據(jù)庫是類似于亞馬遜的,而非像微軟的“一庫包打天下”——一套產(chǎn)品應(yīng)用于所有場景?,F(xiàn)在所有的廠商其實都在聊云原生,你們的云原生架構(gòu)在演進時候有什么不一樣嗎?
王偉民:首先,像微軟和Oracle其實只是品牌比較聚焦和統(tǒng)一,但它其實也是GP、SP相組合的,Oracle有比較多的品牌,比如面向緩存場景的叫Oracle TimesTen,面向高可用場景的是Oracle RAC,所以O(shè)racle有一級品牌和二級品牌之分。同樣微軟針對分析、報表、集成等有SSIS、SSAS、SSRS,面向多模有Azure CosmosDB……
所以我認為大家之所以不約而同地選擇了“邁向云原生2.0”這條路,核心原因是大家都看到負載的多樣性對底層基礎(chǔ)軟件的設(shè)計太挑戰(zhàn)了,無法用一個架構(gòu)、一套code去cover所有。在云原生1.0那個既往時代,大家其實已經(jīng)把產(chǎn)品化和服務(wù)化做完了,基本都已完成基礎(chǔ)設(shè)施池化了,在管控上做到多租戶、按需使用、按量計量,而且能夠做不同程度的擴縮容。
而云原生2.0時代,更看重產(chǎn)品與服務(wù)之間的聯(lián)動。在我剛才的分享中(第十二屆中國數(shù)據(jù)庫技術(shù)大會)提到七個客戶案例,其中沒有一個場景是用單款產(chǎn)品去應(yīng)對的。為了滿足客戶的轉(zhuǎn)型需求,基本都需要交易型、分析型、數(shù)據(jù)實時入倉、庫倉一體等很多需求,都需要實現(xiàn)數(shù)據(jù)的發(fā)現(xiàn)、洞察和價值變現(xiàn)。
在我們看來,云原生2.0時代可能會朝兩個方向演進,第一,持續(xù)不斷夯實、增強單品的差異化競爭力。第二,多種產(chǎn)品之間的高效協(xié)同和體驗提升。
記者:單品方面,要繼續(xù)強化自己的優(yōu)勢。整體上,你們也會強調(diào)整體解決方案的優(yōu)勢,不管是OLTP、OLAP還是NoSQL,所有產(chǎn)品尋求更好地協(xié)同。
王偉民:我們現(xiàn)在有一個想法,即把解決方案產(chǎn)品化。比如客戶想要一個在線電商系統(tǒng),我們可以直接提供一個有緩存和交易,中間帶著鏈路,像一個小型數(shù)倉一樣已就緒的系統(tǒng)。因為起步時可能沒有那么多數(shù)據(jù),所以這個數(shù)倉是可擴縮容的。
雖然是在云上,但也是垂直的,業(yè)務(wù)是煙囪,資源是水平拉通的,這是我們正在做的嘗試。
解決方案產(chǎn)品化,其實業(yè)界有很多公司都做過。我們可能也只能在通用方案上去做,想要結(jié)合行業(yè)領(lǐng)域know how去做,可能還是比較困難的。
記者:如果要用一個比較簡單的方式、一句話兩句話去描述“云原生數(shù)據(jù)庫2.0”,應(yīng)該怎樣去說呢?讓別人一下就能理解“云原生數(shù)據(jù)庫2.0”的概念。
王偉民:“一站式全鏈路”還是相對偏技術(shù)術(shù)語,如果用業(yè)務(wù)術(shù)語來講的話,應(yīng)該是多引擎的高效組合,以滿足客戶多樣化的業(yè)務(wù)負載。另外一種提法是“全場景”、“數(shù)據(jù)全生命周期”,但這些相對偏Marketing術(shù)語。
記者:對,對于非技術(shù)人員來說,理解起來還是有點晦澀。下一個問題,其實來源于TiDB黃東旭曾提到的一個觀點,他認為目前所謂的云原生數(shù)據(jù)庫都不是真正的云原生,凡是能回歸到線下部署的都不叫云原生。您怎么看這個觀點?
王偉民:這個觀點挺新穎的,之前確實沒聽說過。我們遇到過一類上云的客戶會要求數(shù)據(jù)可回流、隨時可以下云??蛻粲羞@個訴求的核心原因是擔(dān)心云是一個超級的lock in,擔(dān)心“我上了你的云,除非我掛了,否則今生今世在你這上面”。
在與客戶交流的過程中,會發(fā)現(xiàn)有些客戶比較抵制差異化特性,擔(dān)心因為差異化特性而對某廠商產(chǎn)生依賴。當然,在這方面也有很多不同的技術(shù)流派,有些客戶在寫SQL時候用的并不用數(shù)據(jù)庫專用語法,它中間有一層抽象層,可以適配底層的MySQL,也可以換成SQL Server或者Oracle,對他來說不可見。業(yè)界其實有這樣的產(chǎn)品,比如Source Pro,能夠?qū)ι蠈討?yīng)用屏蔽底層數(shù)據(jù)庫的差異性,所以我不太贊同這個論斷。
數(shù)據(jù)庫產(chǎn)品化和云化應(yīng)該是兩個階段,它可以是一個產(chǎn)品,這個產(chǎn)品可以provision在on-premise,也可以在云上,但是在云上能夠發(fā)揮資源彈性伸縮等很多云上所特有的能力,但并非只能在云上。
比如,RDS MySQL不能下云嗎?它一定能下云,如果按照剛才的標準,它就不是云原生數(shù)據(jù)庫。但如果給它做了解耦,變成AWS Aurora那樣,計算和存儲解耦了,Aurora是很難下來的。
是否屬于“云原生”,應(yīng)以客戶業(yè)務(wù)場景和需求出發(fā)去考慮,而非從技術(shù)實現(xiàn)上去判別,畢竟很多客戶的要求是不一樣的。比如拎包入住酒店,今天入住這個酒店,明天入住那個酒店,但酒店并不能不讓客戶走。
記者:你覺得他的說法是否是基于國外市場得出的結(jié)論?像您說的這種既能上又能下的,是否是國內(nèi)市場特有的需求?還是說,這是全球市場的需求?其實最近我看到一篇文章,其觀點是“國外都不用分布式,所以國內(nèi)要用分布式”。
王偉民:關(guān)于您提到的,這是否是國內(nèi)市場的特殊情況?我覺得,未來公有云成為主流,一定會出現(xiàn)用戶如何考慮平臺中立、云中立的問題?,F(xiàn)在已經(jīng)看到很多類似需求了,比如客戶的主站在A云,容災(zāi)在B云;另一種是交叉的,一部分業(yè)務(wù)生產(chǎn)在A,備份或Standby在B,另一部分業(yè)務(wù)主站在B,備站在A。客戶的需求在將來可能會持續(xù)不斷的變化,我們的理念是“客戶第一”,這是我們必須考慮的事情。東旭的觀點目前來說比較新穎,但你說TiDB可不可以線下部署?肯定是可以的。
關(guān)于最近看到這篇文章指的是InfoQ最近才實現(xiàn)底層數(shù)據(jù)庫的分庫,之前都是單庫。就產(chǎn)品及其架構(gòu)實現(xiàn)而言,首先云廠商本身是有目標市場選擇的,比如說AWS不做線下市場,它不做on-premise部署,最多有一個Outposts邊緣部署,只提供受限的能力,可能是他客戶選擇的問題。
記者:東旭的觀點比較超前,他們好多客戶在國外,國外的市場對于公有云的擁抱程度很高,但對國內(nèi)來說,顯然對線下部署、混合云、私有云等,要比對公有云的擁抱程度更高,至少在金融、電信等行業(yè)貢獻大戶來說,相對來說是這樣的。
王偉民:在公有云的大趨勢方面,我的判斷跟東旭是一樣的。對于國內(nèi)金融、電信行業(yè)很大業(yè)務(wù)負載還沒有在公有云上,我認為可能有兩個原因:第一,國內(nèi)在信息安全、行業(yè)監(jiān)管、合規(guī)遵循等方面的政策要求;第二,客戶在系統(tǒng)軟件運維管理方面的自主可控需求。
其實你說在公有云上就不安全嗎?不一定的。美國國防部100億的JEDI項目都是在公有云上,美國第一大銀行CapitalOne是100%在公有云上的,沒有用私有云。我認為,公有云的未來是比較樂觀的。很多行業(yè)都需要一個過程,上云可能是長達十幾年的過程,賽道很長。
記者:因為國外不用分布式,所以分布式就沒有意義或應(yīng)用價值嗎?
王偉民:這又是一個特別值得討論的問題,我認為復(fù)雜度是守恒的事情。國外,比如GitHub之前沒有用分布式,但不代表這部分工作就不做了,它的這部分工作可能在應(yīng)用層、中間件層做了;只不過從數(shù)據(jù)庫角度來說,我們希望把復(fù)雜留給數(shù)據(jù)庫,把簡單留給應(yīng)用。我們希望分布式數(shù)據(jù)庫能像單機一樣去做應(yīng)用開發(fā)、去做管理運維,這樣應(yīng)用就不需要關(guān)注底層數(shù)據(jù)庫容量、事務(wù)、伸縮擴容、一致性備份等問題。
其實國外數(shù)據(jù)庫在并發(fā)用戶量和用戶規(guī)模方面,沒有國內(nèi)這么凸顯,畢竟我們有人口紅利。比如阿里的雙十一“剁手節(jié)”,可不可以把支付系統(tǒng)用Oracle數(shù)據(jù)庫支撐呢?肯定可以,把底下的OceanBase換成Oracle也可以,但這樣TCO太高。
因此,到底是用分布式產(chǎn)品去解決,還是用分布式解決方案去解決,這又是另外一個思路。比如應(yīng)用接分布式中間件,比如ShardingSphere和底下接單機數(shù)據(jù)庫,都一樣可以做這個事情。
我覺得并非說國外沒有用它,它就沒有意義,而是看這些投入是在哪個層面去做的。比如我認為從產(chǎn)品的維度來講,隨著使用量的增加,邊際成本是持續(xù)下降的,所以我認為做這件事情是非常有意義的,比如可以讓應(yīng)用不用關(guān)心柔性事務(wù)、業(yè)務(wù)沖正等,這個復(fù)雜度都在數(shù)據(jù)庫層面處理了,所以我覺得分布式數(shù)據(jù)庫還是非常有意義的。在國外,可能不需要用分布式數(shù)據(jù)庫,但可以把分布式數(shù)據(jù)庫退化成單實例使用,在Oracle RAC也可以只用一個節(jié)點,這都是沒問題的。
記者:從您的角度來說,阿里云數(shù)據(jù)庫從技術(shù)、產(chǎn)品、商業(yè)、生態(tài)等各個角度,相對于其他競爭對手,它的優(yōu)勢在哪?
王偉民:首先,針對我們產(chǎn)研團隊,我認為第一個優(yōu)勢是從組織上的高度統(tǒng)一和一致,我們能做到力出一孔。李飛飛既是阿里云數(shù)據(jù)庫事業(yè)部的一號位,他同時又是達摩院數(shù)據(jù)庫與存儲實驗室的一號位,所以相當于他統(tǒng)領(lǐng)了整個阿里體系所有數(shù)據(jù)庫的產(chǎn)品、研發(fā)和預(yù)研團隊,在產(chǎn)品的戰(zhàn)略、溝通、市場等策略方面是高度一致的,這是第一個優(yōu)勢。
第二,阿里確實有先發(fā)優(yōu)勢,我們很多客戶不是才上云,比如基于IDC,剛上云。而是day one就是長在云上,生于云長在云。
第三,在產(chǎn)品方面比較聚焦,我們沒有非常多的產(chǎn)品,我們的產(chǎn)品分成三大類:開源托管類、商業(yè)產(chǎn)品托管類和自研產(chǎn)品類,核心是希望聚焦,而且針對這三類產(chǎn)品,我們有不同的策略。
比如開源托管類聚焦的是簡單易用、安全可靠和高性價比;商業(yè)產(chǎn)品主要利用它的開放生態(tài),在這方面,我們主要是解決業(yè)務(wù)合規(guī)生態(tài)多元的問題,我們和SQL Server、MongoDB是直接商業(yè)合作的,這些是需要阿里云持續(xù)地去合規(guī)的;自研產(chǎn)品,我們聚焦四個大的品類,PolarDB、AnalyticDB、Lindorm、Tair,并沒有很發(fā)散。
講到生態(tài),其實各個廠商做生態(tài)的方式是不一樣的。有些友商雖然在做數(shù)據(jù)庫,但并不是要把數(shù)據(jù)庫作為一個獨立產(chǎn)業(yè)來做。通過打造一個第二平面去解決“卡脖子”的問題,這也非常了不起,我們也需要這樣的技術(shù)。
阿里在做生態(tài)方面,尤其我們更多地是希望以“被集成”的方式來做。生態(tài)要開放繁榮,最主要的就是要能夠和伙伴實現(xiàn)利益分享,如果做不到這一點,我覺得生態(tài)是做不起來的。所以我們一直在探索怎么樣讓生態(tài)的參與者和我們一起,去把餅做大,同時去看如何更好地兼顧各方。
生態(tài)方面我們也一直在持續(xù)投入,比如分銷的伙伴、SaaS被集成、ISV、交付伙伴、培訓(xùn)認證等都在搞,但的確我們這一塊的投入量還需要持續(xù)加強。
記者:上個月阿里媒體溝通會上,我采訪李飛飛,他提到你們要去打線下市場,因為他覺得線上格局基本已經(jīng)定了。針對線下市場的數(shù)據(jù)庫領(lǐng)域高端客戶,阿里現(xiàn)在去打線下這塊兒市場,準備怎么做?你們的差異化優(yōu)勢在哪兒?
王偉民:首先,線下市場的需求是剛性的,這是客觀存在的。目前,我們積累了包括運營商、金融行業(yè)、政府等很多客戶。大家都在討論一個問題,如果重新再做一次,是原封不動地換平臺還是在原有基礎(chǔ)上做轉(zhuǎn)型升級?
目前我們看到,包括運營商在內(nèi)的客戶有一個普遍需求,今天我也分享了一個運營商案例,它的業(yè)務(wù)系統(tǒng)(包括boss系統(tǒng))都直接云化了。在這個過程中,他們要將包括“云”在內(nèi)的很多理念、對上層應(yīng)用做“泳道化”切割、微服務(wù)化,以及整個運維開發(fā)都要結(jié)合起來,我認為這個替換不是單純地去拿一個產(chǎn)品替換,而是用解決方案替換。
第二,在政企市場去和Oracle直接PK,比方說性能,我們認為這個可能是被誤導(dǎo)的。因為用戶在選型的時候,性能不是唯一因素,還有非常多其他的因素。我們希望可以用DBStack敏捷交付,無縫集成,將這樣一個輕量化、可以部署到客戶本地的云,把用戶可能會用到的數(shù)據(jù)引擎都放上去?,F(xiàn)在,廣東移動、安徽移動等客戶,都是用了這些產(chǎn)品。
相比友商,他們可能會有他們的靈活度,我們也有自己差異化特色。比如友商明確了不做私有云,就會把很大一塊市場放出來,也勢必有很多友商去填補這個市場空白。
關(guān)于李飛飛提到的這一點,我理解我們要去做的核心原因有兩個:第一,這是高端市場,也是標桿,是擺在明面上的市場剛需。第二,這些業(yè)務(wù)場景和業(yè)務(wù)負載對牽引產(chǎn)品研發(fā)、檢驗和持續(xù)提升產(chǎn)品穩(wěn)定性、可靠性都非常有幫助。我覺得結(jié)合這兩方面因素,我們肯定會堅定不移地去做。
記者:我們看到的這些所謂的趨勢,比如云原生+分布式、軟硬一體化、湖倉一體、HTAP等,它本身都是一種融合,背后是用戶簡單化需求的推動。對于用戶來說,管理一個數(shù)據(jù)庫和同時管理四個數(shù)據(jù)庫的復(fù)雜度、難度肯定不一樣。趨勢上,大家希望簡化,但我們看到大家還是專用的場景用專用的數(shù)據(jù)庫,這個是不是有點矛盾?
王偉民:我們要解決的很多問題其實都是多變量的。首先,想要兼顧所有變量,是非常有挑戰(zhàn)性的,以及這些變量之間要如何排優(yōu)先級,比如可靠性、開發(fā)、管理、運維等一系列因素,都要綜合考慮。
其次,既然通用產(chǎn)品無法滿足需求,那就用“通用+專用”的組合去搞,又要降低復(fù)雜度,怎么辦?我們用DAS、DMS等技術(shù)手段去解決。我們希望DAS可以把以前傳統(tǒng)DBA的補丁升級、日常巡檢、參數(shù)配置或調(diào)整、備份告警等日常工作用AI的技術(shù)手段來解決?,F(xiàn)在有一個特別好的趨勢,我們已經(jīng)積累了海量的數(shù)據(jù)庫負載、水位線、慢SQL治理等最佳實踐,可供我們?nèi)プ鲞@些工作。和深度學(xué)習(xí)一樣,楊立昆老師90年代剛提出的時候,它只能在90年代美國郵政里面檢測郵政編碼,不像今天有非常廣泛的用途,主要是數(shù)據(jù)和算力上來了。
回到剛才講的問題,這個矛盾可能放在以前的確是難以逾越的。但在今天,我們看到解決的契機了,我們可以用AI4DB的方式來解決。這樣,人就可以更多的聚焦類似于Application DBA、邏輯設(shè)計、數(shù)據(jù)的data placement等高價值的工作,常規(guī)工作讓程序自動化來做將兩者有機的結(jié)合起來。
記者:這次云棲大會上,你們開源PolarDB-X這樣一個分布式數(shù)據(jù)庫,我可以理解為,這是你們進軍線下市場的組合拳嗎?
王偉民:對,可以理解為這是其中一個關(guān)鍵的action。國內(nèi)做數(shù)據(jù)庫的各參與方熱情高漲,廠家非常多。但對很多企業(yè)而言,他們非常擔(dān)心你這家公司有多大規(guī)模?我們是不是會貢獻你50%-60%的營收?他們其實非常擔(dān)心數(shù)據(jù)庫公司的可持續(xù)經(jīng)營能力,這其實還是信任的問題。開源在我看來包括兩個方面:第一,用開源的方式、開放的心態(tài)去解決開放的問題和挑戰(zhàn),吸引更多人參與;第二,開源相當于智力的眾籌。
另外,開源也表示一種自信,是一種可以讓用戶檢視質(zhì)量的方式,這樣能夠把信任建立過程中的挑戰(zhàn)大幅度降低。
最后,當然我們也希望通過這種方式做生態(tài),比如應(yīng)用的生態(tài)、人才的生態(tài)。
記者:所以,開源只是一種策略,它并不是決定數(shù)據(jù)庫公司、廠商能否在未來競爭中脫穎而出的必要條件?
王偉民:對,它并不是。有很多開源產(chǎn)品,可能叫好,但未必叫座(商業(yè)化成功)。也有很多產(chǎn)品,從不叫好也不叫座,直接就玩不下去了,它就只好Open Source了。我們希望用這種方式持續(xù)去做,不代表這樣做了就一定成功,因為的確有太多開源項目,最后其實是商業(yè)化不成功的。不光在數(shù)據(jù)庫領(lǐng)域,其他領(lǐng)域也一樣。比如以前有OpenOffice,Open Solaris。即便我們嚴肅認真地去做Open Source,中間也有很多需要學(xué)習(xí)的地方和規(guī)避的坑,這期間要做的事情非常多。
記者:國產(chǎn)數(shù)據(jù)庫落地應(yīng)用越來越多,但實際上更多是存在于邊緣業(yè)務(wù)上,核心業(yè)務(wù)相對來說比較少。很多企業(yè)在部署國產(chǎn)數(shù)據(jù)庫的同時,還在續(xù)費Oracle數(shù)據(jù)庫,甚至到現(xiàn)在為止兩條線并著跑。這種現(xiàn)象是由于客戶心里的顧慮——怕國產(chǎn)數(shù)據(jù)庫撐不住,還是目前國產(chǎn)數(shù)據(jù)庫在承擔(dān)高端、核心業(yè)務(wù)上,確實有一定的問題?
王偉民:這兩方面因素都有,而且還不止這兩方面因素。確實很多客戶在嘗試用更多的供應(yīng)商,包括國產(chǎn)數(shù)據(jù)庫廠商,同時持續(xù)不斷地使用商業(yè)數(shù)據(jù)庫的產(chǎn)品,這是目前的現(xiàn)狀。原因有幾方面:
第一,商業(yè)數(shù)據(jù)庫經(jīng)過幾十年的發(fā)展和海量用戶(上百萬)長期真實業(yè)務(wù)負載的考驗,它的企業(yè)級特性、穩(wěn)定性、商業(yè)模式、服務(wù)等各方面,都是經(jīng)過考驗的。不管用什么產(chǎn)品,用戶業(yè)務(wù)系統(tǒng)都能高效的運轉(zhuǎn)起來。
而目前國內(nèi)很多廠商,無論是從研發(fā)的投入、產(chǎn)品的成熟度,還是產(chǎn)品資料、生態(tài)、人才等各方面,與商業(yè)數(shù)據(jù)庫相比還是有差距的。這是客觀事實,我們也應(yīng)該正視這個客觀事實。人家干了五十年,我們干了十年,投入比人家少很多,不可能就超越人家,這不符合客觀規(guī)律。
第二,的確有很多業(yè)務(wù)場景不需要那么高端的產(chǎn)品。這句話有兩層意思,一是目前很多產(chǎn)品在企業(yè)功能、特性、完備度、性能、穩(wěn)定性等各方面(與商業(yè)數(shù)據(jù)庫)有差距,但不代表這個差距不可逾越,只是需要時間去逾越。二是很多業(yè)務(wù)場景里,很多商業(yè)數(shù)據(jù)庫的功能、特性其實都是沒有被用到的也不需要用到,這個是有統(tǒng)計數(shù)據(jù)表明的。
記者:之前我了解到,使用Oracle的絕大部分企業(yè)可能連一半的功能、性能都未必用得上,對于很多企業(yè)來說,性能問題可以被很多架構(gòu)很好地解決。
王偉民:在很大程度上,我們的產(chǎn)品對很多核心業(yè)務(wù)場景、業(yè)務(wù)典型負載來說,都是夠用的,但是我們產(chǎn)品的穩(wěn)定性或其他方面,可能還有較長的路要走,還需要接受海量用戶長時間、持續(xù)的負載考驗。
記者:之前我看到關(guān)于國產(chǎn)數(shù)據(jù)庫的目標分為技術(shù)目標和市場目標。市場目標,第一個是實現(xiàn)國產(chǎn)化的自主可控,第二個是走向全球。從技術(shù)目標來說,分為四個目標:人有我無、人有我有、人無我有、人有我優(yōu)。您覺得,目前整個國產(chǎn)數(shù)據(jù)庫市場從技術(shù)目標、市場目標來說,分別是什么階段?
王偉民:我覺得從技術(shù)目標、功能特性角度來講,可能有一些特性是人無我有的,但對于很多普遍需求的特性、共性,我們還處在追趕和補充階段,“人有我有一部分”或“人有我優(yōu)一小部分”,不同廠商在清單的完備程度上不太一樣。
市場方面差的就更遠了。如果統(tǒng)計線上、線下市場,阿里云在中國做到了第一,超過了Oracle。但如果回到全球視角,根據(jù)2020年Gartner統(tǒng)計數(shù)據(jù),微軟第一,Oracle第二,阿里云排到全球第七,在To B、云和數(shù)據(jù)庫市場,我們和領(lǐng)先企業(yè)還有不小差距。
舉個例子,Oracle一個季度的凈利潤差不多100多億美金,就算數(shù)據(jù)庫只占40%,除去它的標準服務(wù),可能也有幾十億美金,這是個不得了的數(shù)據(jù)。中國的軟件業(yè)百強的凈利潤加起來可能都沒有這么多。
記者:目前,你們幫客戶去O、去MySQL、去Teradata等的時候,會面臨哪些挑戰(zhàn)?你們通常是以什么方式幫助客戶?
王偉民:目前最大的挑戰(zhàn)是生態(tài)層面的。沒有哪個客戶的業(yè)務(wù)系統(tǒng)能做到drop-in replacement,北向可能有應(yīng)用側(cè),縱向可能有數(shù)據(jù)的集成,還有南側(cè)可能有操作系統(tǒng)、硬件等一系列的適配。你要想去替換的時候,很多客戶會說“不光要替換這個產(chǎn)品,還要保留原來的管控、開發(fā)、運維、應(yīng)用等一系列流程的對接。所以,生態(tài)方面是一個很大的挑戰(zhàn)。
第二是人才方面。很多企業(yè)在人才方面要求有一定的專業(yè)積累,換產(chǎn)品可能需要有一個學(xué)習(xí)的過程,對人才來說,要降低學(xué)習(xí)曲線的坡度,學(xué)習(xí)成本不要太高。所以我們在兼容性方面,要做很多工作。關(guān)于兼容性的工作又是動態(tài)移動靶,今天做到了某個點,被兼容的對象又往前走了,又要繼續(xù)去做。兼容性工作,做到90分和80分的區(qū)別不大,但是從90分到95分工作量巨大,要從95分到100分幾乎是不可能的任務(wù)。所以我們在想是不是要跟隨,哪些方面我們要跟隨,哪些方面我們要用別的方式來替代——或者干脆不考慮兼容性了等等,這些都是要思考的問題。當然,這中間的取舍是非常難的。
記者:今天的采訪就到這兒,感謝你的分享。