長久以來,私有云廠商都被一朵烏云籠罩著:私有云是否是一個偽命題,這個世界是否終將被公有云統(tǒng)治?無論如何振振有詞,當(dāng)2006年3月14日亞馬遜向全世界公開其公有云服務(wù)AWS時,IT的歷史車輪就碾入了公有云紀(jì)元,傳統(tǒng)IT廠商不得不面對AWS這個門外的野蠻人。關(guān)于私有云,AWS CTO Werner Vogels在2010年就做出了他的論斷,Vogels稱所謂的私有云不過是個銷售話術(shù),是IT廠商為了將客戶蒙在鼓里設(shè)計出來的詞匯。Vogels認(rèn)為私有云是“false cloud“,其目的是想讓客戶購買更多硬件來“build your own cloud”。雖然“false cloud”和“build your own cloud”本身就存在邏輯矛盾,但這并妨礙AWS表明其態(tài)度:私有云不過是IT廠商造出來自high的救命稻草,根本不能稱為“云”。過去幾年我被多次問到這個問題,問題的核心在于公有云是否終將統(tǒng)治世界。
只有公有云的世界是什么樣子?
如果全世界的IT基礎(chǔ)設(shè)施被幾家公有云壟斷,會是什么樣子?首先Intel會淪為附庸,除了為不斷萎縮的PC市場生產(chǎn)CPU外,其所有服務(wù)器芯片只能賣給公有云從而徹底喪失議價權(quán)。公有云也會用其它架構(gòu)的CPU(例如ARM)來打壓Intel的價格,AWS在此次re:Invent 2018年度云大會上就發(fā)布了基于ARM芯片Gravtion的EC2實例。
DELL、HP、Cisco等硬件公司會倒閉或被公有云收購。所有的計算、存儲、網(wǎng)絡(luò)能力都集中在公有云手中,沒人會再買他們的硬件。公有云也不會購買商業(yè)硬件,而是自己制造。不用等到未來,現(xiàn)在公有云/互聯(lián)網(wǎng)巨頭已經(jīng)大量使用白牌硬件,HP不再做公有云/互聯(lián)網(wǎng)公司的服務(wù)器生意,實在無利可圖。
微軟、Oracle等基礎(chǔ)軟件公司會消亡(微軟可以通過Azure重新統(tǒng)治世界)。公有云會用自己的產(chǎn)品取代現(xiàn)有一切基礎(chǔ)軟件,提供自己的操作系統(tǒng)、數(shù)據(jù)庫以及一切PaaS。他們已經(jīng)開始這樣做了,并且會越來越成功。
應(yīng)用軟件商要看公有云臉色過活。如果足夠的有利可圖,公有云會毫不猶豫的進(jìn)入你的領(lǐng)域,依靠龐大的技術(shù)生態(tài)制造出類似的產(chǎn)品并打壓市場價格。巨頭沒有邊界,2014年AWS就推出了WorkSpaces云桌面產(chǎn)品。
這樣的未來,IT創(chuàng)新可能會停滯。公有云之間仍有競爭,但I(xiàn)T市場實在太大,幾家分享數(shù)萬億美元的市場很容易讓巨頭們達(dá)成默契的壟斷。
這像是危言聳聽,畢竟跟我們熟悉的IT世界太不一樣。但不要忘記,在幾十年前的大型機(jī)時代,每個人一臺便攜移動計算機(jī)(手機(jī))更像天方夜譚。而現(xiàn)在都成真了。
沒有SLA,AWSOutposts不性感
“我們能統(tǒng)治世界”,2010年的AWS多半這樣認(rèn)為。僅僅過了8年,2018年的re:Invent云大會上AWS發(fā)布了Outposts產(chǎn)品,一款從產(chǎn)品形態(tài)和商業(yè)模式上都不性感的混合云產(chǎn)品。Outposts基于AWS的自有硬件(基于Nitro架構(gòu)的服務(wù)器,類似于阿里云的神龍服務(wù)器),可以部署在客戶自己的數(shù)據(jù)中心,AWS負(fù)責(zé)安裝部署并提供后期升級運(yùn)維等服務(wù),客戶可以在自己的數(shù)據(jù)中心內(nèi)使用AWS公有云上流行的產(chǎn)品(例如EC2、ECS,后期還會包含RDS這樣的PaaS產(chǎn)品)。Outposts提供VMWare兼容以及AWS兼容兩種模式,客戶既可以使用他們熟悉的VMWare控制平面,也可以基于AWS API編寫程序讓應(yīng)用在本地數(shù)據(jù)中心和AWS公有云無縫部署。除了首發(fā)使用自有硬件,AWS表示未來不排除跟HP、DELL等廠商合作,讓Outposts運(yùn)行在這些廠商的硬件上。
Outposts沒有發(fā)明新東西。產(chǎn)品形態(tài)上,Azure Stack做了同樣的事情。按使用付費(fèi)的租賃模式,國內(nèi)一些廠商做的更徹底,提供從機(jī)架到虛擬機(jī)里應(yīng)用打包的全租賃。跟公有云相比,Outposts缺少一個核心:超高的SLA(Service-Level Agreement,服務(wù)等級協(xié)議,供應(yīng)商對客戶服務(wù)的質(zhì)量承諾,達(dá)不到服務(wù)質(zhì)量會有相應(yīng)的賠償)。從本質(zhì)上講,公有云出售的是“資源的使用權(quán)+SLA”。傳統(tǒng)IT廠商其實也提供SLA,但內(nèi)容條款跟公有云很不一樣。SLA在上世紀(jì)90年代末或2000年初變得流行,早期的IT廠商是以產(chǎn)品保修的方式提供售后服務(wù),隨著客戶越來越重視業(yè)務(wù)的在線時間,IT廠商發(fā)現(xiàn)服務(wù)質(zhì)量保證可以成為額外的收入來源,故通過SLA跟客戶簽訂如產(chǎn)品故障后限定多少時間內(nèi)修復(fù)或換貨的承諾。公有云將業(yè)務(wù)在線時間相關(guān)SLA提高到傳統(tǒng)IT廠商無法達(dá)到的高度,源于對IT基礎(chǔ)設(shè)施的控制力,從機(jī)房、電、網(wǎng)絡(luò)、硬件到軟件都能控制,故能提供分鐘級別的SLA。例如AWS的EC2(虛擬機(jī))、EBS(塊存儲)SLA的月度在線時間比例(Monthly Uptime Percentage)是99.99%,相當(dāng)于每個月最多有4分23秒的不可用時間,對SLA未達(dá)到的情況會做出10%~30%消費(fèi)賠償。IT廠商做不到這樣的SLA,因為他們的產(chǎn)品只是整個IT架構(gòu)的一部分,有太多第三方因素可能會影響SLA,硬件故障、機(jī)房斷電、運(yùn)維誤操作等等。超高的SLA對看重業(yè)務(wù)在線時間的客戶極具吸引力?;ヂ?lián)網(wǎng)公司尤其如此,設(shè)想一下微信、支付寶這樣的應(yīng)用因IT基礎(chǔ)設(shè)施故障停用數(shù)天會導(dǎo)致什么樣的災(zāi)難。雖然微信、支付寶能夠構(gòu)造AWS類似的基礎(chǔ)設(shè)施,但大部分對SLA有高要求的企業(yè)是無力自建這樣的基礎(chǔ)設(shè)施的,公有云對他們來說是很好的選擇。
Outposts無法提供公有云的SLA。其產(chǎn)品形態(tài)讓它跟普通IT產(chǎn)品一樣,只是客戶整個IT架構(gòu)中的一部分,有太多因素超出AWS掌控,例如客戶數(shù)據(jù)中心遭遇暴風(fēng)雪而導(dǎo)致大面積斷電。即使未來AWS為Outposts擬定SLA,其條款也只會類似IT廠商的常規(guī)條款,例如售后服務(wù)響應(yīng)時間、產(chǎn)品升級或更換硬件導(dǎo)致的服務(wù)不可用時間等。雖然媒體用很多新興概念來描述Outposts,但正如8年前Vogels指責(zé)傳統(tǒng)IT廠商在任何產(chǎn)品前都加一個“云”字一樣,這只是一種“sales pitch”(銷售話術(shù))。Outposts將AWS的部分公有云產(chǎn)品本地化固然給客戶帶來了巨大的價值,但這種價值來源于AWS公有云的成功,Azure、阿里云也在做同樣的事情??傊?,公有云為IT帶來了巨大的創(chuàng)新,但一旦它的產(chǎn)品失去了SLA,就不再性感。
Outposts是AWS對物質(zhì)世界的妥協(xié)
對于AWS推出Outposts的動機(jī),中外媒體大多認(rèn)為是一種妥協(xié),AWS自己也承認(rèn)客戶想在自己的數(shù)據(jù)中心獲得跟AWS公有云一樣的功能和體驗。妥協(xié)這個詞含有一種不是創(chuàng)新者乏力而是這些客戶不行的意思。AWS在TO B的世界有著蘋果在手機(jī)領(lǐng)域相同的創(chuàng)新者地位,人們對于顛覆性創(chuàng)新者總有無限期盼,希望他們毫無妥協(xié)的改造這個舊世界。但AWS妥協(xié)了,對象并不是手中握有大筆IT預(yù)算的CIO,而是我們生存的物質(zhì)世界。
盡管IT幫助所有的行業(yè)提高了效率,這個世界仍有大量的生產(chǎn)活動還沒有被IT徹底替代。種植糧食的仍然是農(nóng)業(yè)機(jī)械、挖礦的還是礦機(jī)、鉆取石油的依然是鉆井,總之除了幾萬億美元的IT支出外,還有幾百萬億美元投入到了其它的生產(chǎn)活動中?;氐皆朴嬎?,未來輔助生產(chǎn)活動的IT基礎(chǔ)設(shè)施是否只有公有云?AWS給出了否定的答案。這里有復(fù)雜的原因,但可以粗略歸為:異構(gòu)IT的復(fù)雜性、計算/存儲能力的本地化以及網(wǎng)絡(luò)的不可靠。
異構(gòu)IT的復(fù)雜性
大多數(shù)生產(chǎn)系統(tǒng)并非是圍繞IT設(shè)計的,他們比IT更早出現(xiàn),現(xiàn)在被IT改造,例如給煉鋼設(shè)備安裝大量的傳感器收集數(shù)據(jù),給生產(chǎn)線安裝機(jī)械手臂。這些改造的復(fù)雜性制造出異構(gòu)性IT。如果世界只有公有云,意味著所有的IT都要接入公有云,這不符合公有云的商業(yè)模式。公有云能快速發(fā)展壯大是因為向客戶提供標(biāo)準(zhǔn)的IT模型(例如AWS最早的經(jīng)典網(wǎng)絡(luò)以及后來的VPC)從而實現(xiàn)規(guī)?;?。當(dāng)客戶的IT太過異構(gòu)不能直接套入公有云IT模型中時,面臨的選擇只有兩個:一是期待客戶IT系統(tǒng)改造以適應(yīng)公有云;二是提供私有云來適應(yīng)客戶IT系統(tǒng)。第一條路目前行不通,且不說傳統(tǒng)的力量多么強(qiáng)大,單從體量上講,千億美元規(guī)模的公有云很難要求動輒萬億美元的行業(yè)為它改變。只有第二條路可走,提供私有云來適應(yīng)客戶IT系統(tǒng)。反對者可能會說AWS Outposts輸出的仍然是公有云產(chǎn)品,沒有特別的改變,這個留到后面分析Outposts產(chǎn)品形態(tài)時再講。
計算/存儲能力的本地化和網(wǎng)絡(luò)不可靠問題
即使異構(gòu)IT都能接入公有云,仍然面臨當(dāng)前IT技術(shù)的限制。我們杜撰一個AI系統(tǒng),它能根據(jù)煉鋼設(shè)備傳感器數(shù)據(jù)實時控制煉鋼設(shè)備。那么傳感器數(shù)據(jù)存儲在哪兒?AI系統(tǒng)又運(yùn)行在何處(需要依賴的計算能力在哪)?假設(shè)鋼廠地處偏遠(yuǎn),煉鋼設(shè)備就必須通過網(wǎng)絡(luò)接入數(shù)千公里外的公有云數(shù)據(jù)中心,將數(shù)據(jù)傳送至AI系統(tǒng)并等待分析結(jié)果再做下一步操作。這樣的IT系統(tǒng)難以讓人充滿信心,因為它運(yùn)行在不可靠的網(wǎng)絡(luò)上。相對于人類社會的數(shù)據(jù)總量(據(jù)傳為100ZB,約為10的14次方GB),目前的網(wǎng)絡(luò)絕對是一個低帶寬、高延時、不可靠系統(tǒng)。要保證上述鋼廠網(wǎng)絡(luò)的帶寬和延時,得通過專線連接數(shù)千公里外的數(shù)據(jù)中心,且必須有冗余,否則無法防范施工隊的鏟車軋斷線路導(dǎo)致生產(chǎn)中斷。這無疑是巨大的投資。如果把煉鋼系統(tǒng)的傳感器換成攝像頭,要求AI系統(tǒng)做出低延時的圖像識別,網(wǎng)絡(luò)建設(shè)成本更是不可想象。解決的辦法是將計算/存儲能力本地化,例如在鋼廠500米內(nèi)建一個機(jī)房,讓AI系統(tǒng)就近運(yùn)行,網(wǎng)絡(luò)的問題也就解決了。對于云計算廠商來說,輸出一套私有云/混合云系統(tǒng)到鋼廠的機(jī)房,比設(shè)計一個橫跨數(shù)千公里接入公有云的系統(tǒng)更為簡單和可靠,這是目前IT技術(shù)的限制。
生產(chǎn)制造業(yè)的例子似乎聽起來很遙遠(yuǎn),但就在日常辦公中公有云也會有IT接入的難題。2014年3月AWS發(fā)布WorkSpaces云桌面產(chǎn)品時,我的第一反應(yīng)是在想AWS的云桌面怎么跟辦公室里的打印機(jī)、掃描儀以及視頻會議系統(tǒng)連接起來,因為云桌面的主要場景為日常辦公,不可避免的要跟辦公室的各種設(shè)備對接。后來我在AWS官網(wǎng)找到了打印機(jī)使用的文檔,但同時也在AWS論壇上看到了不少打印機(jī)無法使用的吐槽。這樣的例子有很多,銀行的U盾、智能投影儀等,總之在公有云接入本地設(shè)備還不那么容易。
假如我們生存在一個虛擬世界,不需要衣食住行只靠信息交換就可以生存(像科幻電影中那樣戴一個頭盔接入虛擬世界),則公有云完全可以滿足生產(chǎn)活動的所有IT需求。我說AWS是對物質(zhì)世界妥協(xié),因為目前的公有云只滿足現(xiàn)實世界的部分IT需求。再來看一下蘋果和AWS的創(chuàng)新,你會發(fā)現(xiàn)蘋果在發(fā)布IPhone短短幾年內(nèi)幾乎消滅了所有老牌手機(jī)廠商,諾基亞、摩托羅拉、黑莓。而AWS雖然對傳統(tǒng)IT廠商打擊巨大,但I(xiàn)BM、HP、DELL、Oracle仍然堅挺的活著。這是因為IPhone除了巨大的創(chuàng)新外,還滿足了客戶對手機(jī)的所有需求,如果IPhone不能打電話,諾基亞仍然會是最好的手機(jī)廠商。盡管AWS跟蘋果一樣帶動了新行業(yè)的發(fā)展(移動互聯(lián)網(wǎng)、SaaS等),獲取了巨大的創(chuàng)新紅利,但他并沒有滿足這個世界的所有IT需求。傳統(tǒng)IT廠商活了下來,做著AWS稱為“false cloud”的私有云,現(xiàn)在AWS Outposts來了,吹走了私有云天空最后一片烏云,不必再爭論私有云/混合云是不是偽命題,是“true cloud”或是“false cloud”。正視物質(zhì)世界IT需求的復(fù)雜性,也許未來公有云會滿足一切IT,但不是現(xiàn)在。
用VMWare,AWS又做對了
Outposts是AWS和VMWare合作的產(chǎn)品,客戶可以使用他們熟悉的VMWare的控制面板,也可以使用AWS Native模式,第一代產(chǎn)品主要是IaaS功能,提供EC2、EBS。可以肯定Outposts的IaaS部分幾乎全是VMWare貢獻(xiàn)的,AWS也宣稱客戶可以使用VMWareNSX、AppDefense、vRealize等產(chǎn)品。從技術(shù)角度來說,AWS要實現(xiàn)Outposts有兩條路可以走,一是基于AWS公有云的代碼改造,一是跟VMWare這樣的廠商合作。AWS選擇第二條路,這是對的。公有云和私有云面對不同的復(fù)雜性,公有云更強(qiáng)調(diào)規(guī)模和性能,用統(tǒng)一的IT架構(gòu)提供資源,對傳統(tǒng)IT異構(gòu)性和利舊基本不考慮。私有云則必須面對異構(gòu)的IT形態(tài)并兼容利舊各種設(shè)備,但規(guī)模和性能上不必向公有云看齊。Outposts的目標(biāo)客戶是想在自己數(shù)據(jù)中心中使用AWS產(chǎn)品的企業(yè),他們多為傳統(tǒng)IT架構(gòu),如果通過改造AWS公有云代碼來滿足客戶需求,無論難度還是風(fēng)險都非常大,這意味AWS的公有云產(chǎn)品在后續(xù)發(fā)展中都不得不為私有云考慮,這不僅會拖慢公有云創(chuàng)新的步伐,實際上也難操作。想象一下AWS的內(nèi)核工程師在優(yōu)化虛擬機(jī)熱遷移功能時要顧及一款他從來沒有聽說過的PCI設(shè)備,因為私有云客戶會透傳它給虛擬機(jī)使用的。采用VMWare做IaaS則沒有這個問題,VMWare從來就是服務(wù)于傳統(tǒng)企業(yè)客戶,20年來趟坑無數(shù),沉淀出大量傳統(tǒng)IT需要的功能。前面提到AWS可以通過部署Outposts來適應(yīng)企業(yè)客戶的傳統(tǒng)IT需求,反對者可能認(rèn)為Outposts輸出的也是AWS公有云產(chǎn)品(例如EC2、EBS),并沒有為異構(gòu)IT做任何適配。是的,AWS自己沒有做,VMWare幫他做到了。AWS宣稱Outposts可以在一臺服務(wù)器上運(yùn)行,離開VMWare也是無法辦到的。要在一臺服務(wù)器上將AWS公有云的控制面和數(shù)據(jù)面全部塞進(jìn)去,還要運(yùn)行客戶自身的業(yè)務(wù),無異于將一頭大象塞進(jìn)冰箱。
在商業(yè)策略,跟VMWare合作也是正確的選擇。VMWare除了自身的產(chǎn)品優(yōu)勢外,最強(qiáng)大的是遍布全世界的銷售網(wǎng)絡(luò)。外媒報道Outposts會在VMWare銷售網(wǎng)絡(luò)中售賣,這無疑極大的節(jié)省了這款產(chǎn)品觸達(dá)客戶的時間。要讓一款新產(chǎn)品快速的被市場認(rèn)可和接受,即使伴著AWS的高光也需要花費(fèi)不少力氣。這不僅僅是技術(shù)問題,還是銷售體系、供應(yīng)鏈、售后服務(wù)體系的問題。亞馬遜本身是互聯(lián)網(wǎng)公司,更偏向線上售賣,而VMWare則擅長線下售賣。在這場合作中,怎么看AWS都是受益的。VMWare則禍福難料,一旦開放自己的銷售網(wǎng)絡(luò)讓AWS觸達(dá)終端客戶,在產(chǎn)品建立起認(rèn)可度后,很難說AWS不會專門成立部門用自己的技術(shù)完全取代VMWare并建立適合線下的銷售系統(tǒng)。此外,AWS也不僅僅只有VMWare一家伙伴,HP、DELL、Cisco可能正等著歡迎Outposts進(jìn)入他們的銷售渠道。
與AWS技術(shù)路線相反,Azure Stack選擇用其公有云代碼改造能在幾臺服務(wù)器中運(yùn)行的混合云產(chǎn)品。微軟歷來有統(tǒng)一code base的沖動,在智能手機(jī)方面就嘗試用Windows相同的代碼打造適用于PC和手機(jī)的操作系統(tǒng),最終結(jié)果是從智能手機(jī)市場退出。雖然現(xiàn)在不能斷定Azure Stack這種技術(shù)路線是否成功,但它始終會面臨同一套代碼要服務(wù)于兩個截然不同市場的問題。內(nèi)部的技術(shù)團(tuán)隊協(xié)調(diào)也會遭遇挑戰(zhàn),公有云團(tuán)隊強(qiáng)勢必然導(dǎo)致Azure Stack的很多技術(shù)需求得不到及時響應(yīng),Azure Stack團(tuán)隊強(qiáng)勢則會拖慢公有云團(tuán)隊創(chuàng)新的步伐,甚至將他們拖入傳統(tǒng)IT的泥沼中。
我個人贊同AWS的路線,保證產(chǎn)品體驗一致性才是核心,這只需要在Outposts的數(shù)據(jù)面/控制面的API上和公有云兼容即可。至于是一套代碼或兩套代碼并不重要,一是客戶不關(guān)心,二是公有云和私有云的市場規(guī)模都非常巨大,營運(yùn)兩個技術(shù)團(tuán)隊服務(wù)于不同的市場是值得的。AWS也提到他們并不打算通過Outposts輸出所有AWS產(chǎn)品,且承認(rèn)公有云和私有云交付模式不同(Our initial goal is not to re-create all of AWS in Outposts--they're kind of different delivery models...but there are some really basic components that we're hearing consistently that are wanted on-premises)。這反應(yīng)出AWS對Outposts的定位非常明確,在小規(guī)模的產(chǎn)品形態(tài)中是無法將所有AWS產(chǎn)品都交付到客戶數(shù)據(jù)中心的。實際上企業(yè)客戶也沒有能力負(fù)擔(dān)和運(yùn)維整個AWS公有云,大部分企業(yè)僅僅需要AWS的幾個基本功能,這正是Outposts出現(xiàn)的目的。當(dāng)然也有客戶需要整個AWS公有云,例如正在競標(biāo)中的美國國防部百億美元大單,這時AWS自然會將所有產(chǎn)品帶到客戶數(shù)據(jù)中心,當(dāng)然不是用Outposts。
公有云的未來:要么統(tǒng)治世界,要么滅亡
未來,公有云要么統(tǒng)治一切IT基礎(chǔ)設(shè)施,要么消失,到時將不再有云計算這個詞匯。這都不依賴于現(xiàn)在IT從業(yè)者的力量,而是依靠物理學(xué)家在基礎(chǔ)物理上的重大突破,顛覆現(xiàn)有的計算機(jī)體系。公有云接入傳統(tǒng)IT的幾個問題中,只要網(wǎng)絡(luò)問題解決了,其它都能解決。目前低帶寬、高延時、不可靠的網(wǎng)絡(luò)極大的阻礙了公有云統(tǒng)治世界的步伐,盡管網(wǎng)絡(luò)性能在不斷提升,但這種小步伐提高遠(yuǎn)遠(yuǎn)趕不上人類生產(chǎn)數(shù)據(jù)增長的速度。如果基礎(chǔ)物理創(chuàng)造出超級網(wǎng)絡(luò),訪問不受地域距離限制,達(dá)到目前CPU訪問內(nèi)存的帶寬、延時和可靠性,那么世界只需要公有云。我們不再需要本地計算能力,可以將所有的計算、存儲集中在幾個公有云巨頭的數(shù)據(jù)中心里,然后通過超級網(wǎng)絡(luò)訪問。如果基礎(chǔ)物理向著計算/存儲能力方面突破,假設(shè)未來手機(jī)大小的計算機(jī)就可以擁有現(xiàn)在AWS公有云全部的計算/存儲能力,那我們就不再需要云這個概念,計算可以在任何時間地點發(fā)生,中心化的基礎(chǔ)設(shè)施失去存在的理由。
未來世界的樣子還無法預(yù)測,但在這個時間,AWS發(fā)布了Outposts產(chǎn)品,他終于進(jìn)入了傳統(tǒng)IT廠商相同的維度,從降維打擊到同維競爭,后十年的云計算領(lǐng)域一定會更加精彩。