如果說(shuō)多云是當(dāng)今數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展戰(zhàn)略,那么跨云就是它們未來(lái)的發(fā)展愿景。這種預(yù)測(cè)來(lái)自于一種普遍性的需求,即在相同云服務(wù)提供商內(nèi)部實(shí)現(xiàn)跨不同地區(qū)的無(wú)縫移動(dòng)和交換數(shù)據(jù),甚至是實(shí)現(xiàn)跨不同的云服務(wù)之間的數(shù)據(jù)無(wú)縫移動(dòng)和交換。
地理位置和云平臺(tái)不兼容之類的情況阻礙了數(shù)據(jù)全球訪問(wèn)的目標(biāo)。這導(dǎo)致企業(yè)難以在整個(gè)企業(yè)中安全地共享數(shù)據(jù),不同地理位置之間存在管理延遲,以及多個(gè)云服務(wù)之間出現(xiàn)數(shù)據(jù)孤島。
變革即將到來(lái)。不久,所有的企業(yè)數(shù)據(jù)將變得沒(méi)有國(guó)界。無(wú)論企業(yè)將數(shù)據(jù)存儲(chǔ)在何處或使用哪個(gè)云提供商,只要選擇訪問(wèn)數(shù)據(jù),那么他們都可以訪問(wèn)存儲(chǔ)在任何地方的所有數(shù)據(jù)。
目前的數(shù)據(jù)限制
盡管云的優(yōu)勢(shì)已得到了充分證明,但是由于兩個(gè)重要因素,云服務(wù)提供商尚未兌現(xiàn)其全部承諾:
· 地理:云交付的本質(zhì)要求公司使用區(qū)域云。原因在于只有當(dāng)用戶靠近云端時(shí),服務(wù)才能發(fā)揮最佳效能。任何試圖查詢或共享存儲(chǔ)在遙遠(yuǎn)位置上的云端數(shù)據(jù)的人都知道延遲是一個(gè)問(wèn)題。因此,企業(yè)通常會(huì)按地區(qū)創(chuàng)建個(gè)人賬戶。這些賬戶成為本地用戶存儲(chǔ)和查詢數(shù)據(jù)的實(shí)際場(chǎng)所。對(duì)于分布在多個(gè)地區(qū)的企業(yè)而言,這種設(shè)置并不理想,因?yàn)樗麄儫o(wú)法輕松地在整個(gè)組織中共享數(shù)據(jù)。
· 專有API:主要的云平臺(tái)(Amazon Web Services,Microsoft Azure,Google Cloud Platform)在構(gòu)建時(shí)都使用了專有的API。這導(dǎo)致采用多云策略的企業(yè)最終會(huì)將其數(shù)據(jù)分散在這些云平臺(tái)之中。如果無(wú)法便捷地實(shí)現(xiàn)共享,那么數(shù)據(jù)將再次變成孤島,這次是在云服務(wù)平臺(tái)中,而不是在本地服務(wù)器中。
當(dāng)前的挑戰(zhàn)包括:
· 無(wú)法分析所有數(shù)據(jù)
數(shù)據(jù)被在本地創(chuàng)建和存儲(chǔ)對(duì)于擁有全球業(yè)務(wù)的跨國(guó)企業(yè)來(lái)說(shuō)是遠(yuǎn)遠(yuǎn)不夠的。盡管本地系統(tǒng)可能運(yùn)行良好,但要匯集所有能夠回答重要業(yè)務(wù)問(wèn)題所需的相關(guān)數(shù)據(jù)是一個(gè)復(fù)雜的過(guò)程。
· 缺乏與其他系統(tǒng)的連接
連接跨地區(qū)、國(guó)家和大洲的數(shù)據(jù)中心需要復(fù)雜的基礎(chǔ)設(shè)施設(shè)置和持續(xù)性的維護(hù),只有這樣才能確保安全無(wú)縫的連接。但是這項(xiàng)工作既復(fù)雜又昂貴,尤其是當(dāng)它們需要跨很遠(yuǎn)的數(shù)據(jù)中心移動(dòng)大量數(shù)據(jù)時(shí)。這導(dǎo)致許多數(shù)據(jù)系統(tǒng)都沒(méi)有相互連接,無(wú)論這些系統(tǒng)是否在云端。
· 復(fù)雜的復(fù)制過(guò)程
通常,數(shù)據(jù)復(fù)制是一個(gè)非常分散的過(guò)程,這使其設(shè)置成本高昂且管理復(fù)雜。只有財(cái)力雄厚的企業(yè)才能匯集到能夠解決此問(wèn)題的資源和人力。
· 關(guān)于供應(yīng)商鎖定的問(wèn)題
就像四十年前的企業(yè)不想被某個(gè)特定的硬件供應(yīng)商鎖定一樣,現(xiàn)在的企業(yè)開(kāi)始擔(dān)心被某個(gè)云提供商鎖定。企業(yè)希望自己能夠自由地移動(dòng)數(shù)據(jù)和應(yīng)用程序,以便從新服務(wù)或更好的價(jià)格中受益。數(shù)據(jù)可移植性成為一個(gè)艱巨的命題,尤其是當(dāng)企業(yè)需要移動(dòng)多個(gè)PB級(jí)的數(shù)據(jù)時(shí)。
全球化數(shù)據(jù)的優(yōu)勢(shì)
在一個(gè)統(tǒng)一平臺(tái)上建立起一個(gè)互連的數(shù)據(jù)世界一直是一個(gè)美好的愿景。當(dāng)我們?cè)谒袇^(qū)域?qū)嵗驮铺峁┥讨g建立橋梁,以便數(shù)據(jù)可以自由移動(dòng)時(shí),那么這種愿景就將變?yōu)楝F(xiàn)實(shí)。為了實(shí)現(xiàn)這一未來(lái)目標(biāo),我們需要跨云功能。
跨云有兩個(gè)要求。首先是創(chuàng)建一個(gè)中立的云層,該層在每個(gè)由云提供商構(gòu)建的云區(qū)域的頂部提供了一個(gè)統(tǒng)一數(shù)據(jù)管理平臺(tái)。第二個(gè)要求是通過(guò)高吞吐量的通信“網(wǎng)格”將這些區(qū)域互連,該網(wǎng)格允許數(shù)據(jù)在任何區(qū)域之間,各大洲之內(nèi)和之間,甚至跨由不同云提供商管理的多個(gè)區(qū)域之間移動(dòng)。
簡(jiǎn)而言之,無(wú)論數(shù)據(jù)位于何處或使用什么專有云系統(tǒng),中立的云層和網(wǎng)格都可以在任何云系統(tǒng)上運(yùn)行。這樣可以消除所有的數(shù)據(jù)障礙,創(chuàng)建一個(gè)“虛擬多云全球數(shù)據(jù)中心”,無(wú)論數(shù)據(jù)存儲(chǔ)在哪里,都可以通過(guò)便捷的方式以較低的成本訪問(wèn)數(shù)據(jù)。
借助這種分析數(shù)據(jù)平臺(tái),企業(yè)可以實(shí)現(xiàn):
· 橋接地理區(qū)域并輕松移動(dòng)數(shù)據(jù)??梢栽诓煌脑粕线\(yùn)行相同的代碼以執(zhí)行全球分析。
· 在想要的任何云平臺(tái)上運(yùn)行,并且真正成為多云。被某個(gè)云服務(wù)提供商鎖定的威脅將消失。
· 使用復(fù)制解決數(shù)據(jù)的鄰近性和完整性,讓延遲挑戰(zhàn)成為過(guò)去。企業(yè)可以復(fù)制遠(yuǎn)程數(shù)據(jù)并將其與本地?cái)?shù)據(jù)結(jié)合起來(lái),從而形成一個(gè)集中的單一位置來(lái)訪問(wèn)所有全球數(shù)據(jù),進(jìn)而不必使用存儲(chǔ)在不同地區(qū)或不同大洲上的數(shù)據(jù)。
· 通過(guò)現(xiàn)代化復(fù)制技術(shù)存儲(chǔ)兩個(gè)或更多數(shù)據(jù)副本對(duì)于故障轉(zhuǎn)移和業(yè)務(wù)連續(xù)性至關(guān)重要。在成本方面,企業(yè)建立高可用性系統(tǒng)的成本只有老舊復(fù)制系統(tǒng)的零頭。
實(shí)現(xiàn)真正的數(shù)據(jù)驅(qū)動(dòng)決策
我們正生活在一個(gè)全球化的商業(yè)世界當(dāng)中。邊界正在消亡,這些邊界中就包括云壁壘。企業(yè)需要全球數(shù)據(jù)才能實(shí)現(xiàn)真正以數(shù)據(jù)為依據(jù)的決策。
跨云將兌現(xiàn)全球化數(shù)據(jù)的承諾,使企業(yè)能夠完全執(zhí)行多云策略。通過(guò)讓數(shù)據(jù)自由地、安全地移動(dòng)并整合為單一的真相來(lái)源,企業(yè)將發(fā)展成為真正的全球化企業(yè)。
作者:Benoit Dageville為并行執(zhí)行和自調(diào)優(yōu)數(shù)據(jù)庫(kù)系統(tǒng)方面的專家,同時(shí)也是Snowflake公司的聯(lián)合創(chuàng)始人,目前擔(dān)任產(chǎn)品部門(mén)總裁。
編譯:陳琳華
原文網(wǎng)址:https://www.infoworld.com/article/3444587/whats-next-for-the-cloud-data-warehouse.html