如果我們要列出當(dāng)前影響企業(yè)數(shù)據(jù)中心的相關(guān)主要趨勢,大多數(shù)技術(shù)人員和技術(shù)投資人可能會就一系列的核心趨勢方面達(dá)成一致。該核心趨勢清單將包括諸如云計算、容器和虛擬化、微服務(wù)、機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)、閃存、邊緣計算、NVMe和GPU等技術(shù)。這些技術(shù)對于推動當(dāng)前企業(yè)組織機(jī)構(gòu)的數(shù)字化轉(zhuǎn)型都非常的重要。
但較難回答的問題則是:接下來會發(fā)生什么呢?哪些新興技術(shù)或趨勢的轉(zhuǎn)變有望成為數(shù)據(jù)中心業(yè)界的下一個大事件呢?而這些新興的技術(shù)及趨勢又將對硬件和軟件市場產(chǎn)生什么樣的影響呢?
目前,一種新興的趨勢已經(jīng)開始在大型企業(yè)中獲得了較為廣泛的關(guān)注。這是一種被稱為“DataOps(數(shù)據(jù)操作運(yùn)營)”的實(shí)踐方案。這一新的術(shù)語是由另一個更為出名的“DevOps”這一概念衍生而來的,“DevOps”這一概念在十年前就已經(jīng)出現(xiàn)了,其目的是整合軟件的開發(fā)(“dev”)和操作運(yùn)營(“ops”)。盡管DataOps與DevOps在某些方面的目標(biāo)是一致的,但其更為顯著的體現(xiàn)了我們今天在數(shù)據(jù)中心業(yè)界所看到的一些主要變化。
DevOps概念的提出
讓我們先從DevOps開始展開我們的討論吧。早在2008年,當(dāng)DevOps這一概念首次被提出的時候,其描述的是一項(xiàng)旨在最大限度地提高應(yīng)用程序構(gòu)建和部署過程中的自動化和可重復(fù)性的IT實(shí)踐。其宗旨是:如果軟件開發(fā)人員和操作運(yùn)營專業(yè)人員可以緊密合作,那么,構(gòu)建和部署應(yīng)用程序?qū)?,成本更低。?shí)踐的目標(biāo)包括提升靈活敏捷性,實(shí)現(xiàn)更快的產(chǎn)品上市時間和持續(xù)的應(yīng)用程序交付。
諸如VMware、Docker、Puppet和Chef這樣的公司都已經(jīng)趕上了DevOps的這一波浪潮。
DevOps泡沫的破滅
盡管經(jīng)歷了軟件開發(fā)人員們早期的狂熱和興奮階段,DevOps目前已經(jīng)停滯不前了。根據(jù)2017年的一項(xiàng)研究表明,DevOps尚未完全履行其最初承諾。在這項(xiàng)研究中,共計有2197名企業(yè)IT主管接受了調(diào)查,其中只有17%的受訪者將DevOps列為對其所在的企業(yè)組織有重大戰(zhàn)略影響——而這一比例遠(yuǎn)遠(yuǎn)低于大數(shù)據(jù)(41%)和公共云基礎(chǔ)設(shè)施即服務(wù)(39%)。其中一名受訪者解釋說:DevOps方法并沒有充分考慮到數(shù)據(jù)密集型的應(yīng)用程序。
數(shù)據(jù)的興起
如果說現(xiàn)在已經(jīng)有一種趨勢幾乎影響到所有行業(yè)的企業(yè)組織的話,那么毫無疑問,這一趨勢便是企業(yè)越來越重視通過對于數(shù)據(jù)的分析使用來推動業(yè)務(wù)價值的實(shí)現(xiàn)了。而根據(jù)IDC公司的一項(xiàng)研究預(yù)測,到2020年,全球范圍內(nèi)的數(shù)據(jù)量將達(dá)到44澤字節(jié),而1986年則只有3艾字節(jié)。無論是改善客戶體驗(yàn),提高運(yùn)營效率還是創(chuàng)造新的收入來源,數(shù)據(jù)都能夠?yàn)榭绺鱾€行業(yè)的企業(yè)組織提升市場競爭優(yōu)勢提供了杠桿支撐。
為什么如此數(shù)據(jù)重要
如果說數(shù)據(jù)的使用已成為當(dāng)前企業(yè)所采用的顛覆性的商業(yè)模式的一部分,那么考慮如何管理和部署數(shù)據(jù)密集型應(yīng)用程序則已成為企業(yè)組織IT實(shí)踐的核心。與DevOps方法所重點(diǎn)關(guān)注的輕量級應(yīng)用程序不同,當(dāng)企業(yè)組織開始討論數(shù)據(jù)密集型應(yīng)用程序時,會出現(xiàn)一系列新的考慮事項(xiàng)。
數(shù)據(jù)管理實(shí)踐方案涉及到整個應(yīng)用程序的生命周期。例如,數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)應(yīng)用程序的發(fā)展需要使用大量的訓(xùn)練數(shù)據(jù)。而操作運(yùn)營團(tuán)隊所部署的應(yīng)用程序也有所不同;出于性能原因方面的考慮,數(shù)據(jù)密集型應(yīng)用程序需要考慮數(shù)據(jù)的局部性,這意味著需要在持續(xù)產(chǎn)生數(shù)據(jù)的位置附近部署流程。此外,只要企業(yè)組織內(nèi)部的各個不同的團(tuán)隊需要使用數(shù)據(jù),那么對于數(shù)據(jù)的訪問就必須受到嚴(yán)格的IT安全策略的控制和管理。
DataOps適用于數(shù)據(jù)驅(qū)動的應(yīng)用程序
這些以數(shù)據(jù)為中心的新的理念激發(fā)了數(shù)據(jù)中心業(yè)界對于超越DevOps限制的實(shí)踐方面的需求。簡而言之,DataOps是開發(fā)和部署數(shù)據(jù)密集型應(yīng)用程序的一種靈活敏捷的方法。這種做法很大程度上受到企業(yè)內(nèi)機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)團(tuán)隊發(fā)展的鼓勵,這需要涉及到企業(yè)內(nèi)的軟件開發(fā)人員和架構(gòu)師、安全與管理專業(yè)人員、數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和運(yùn)營人員之間的密切合作。DataOps是一個人員加流程的模式,旨在提高可重復(fù)性、生產(chǎn)力、靈活敏捷性和自助服務(wù),同時實(shí)現(xiàn)持續(xù)的數(shù)據(jù)科學(xué)模型部署。
在我們與一些大型企業(yè)組織的合作過程中,我們發(fā)現(xiàn)一些大型企業(yè)雇傭了數(shù)千名的數(shù)據(jù)科學(xué)家,我注意到:這些企業(yè)在用來支持DataOps的基礎(chǔ)架構(gòu)、平臺和工具類型方面發(fā)生了相應(yīng)的變化。盡管用于支持DevOps實(shí)踐的一些工具(例如容器和虛擬化)仍然是DataOps的核心,但還有其他需要強(qiáng)制使用更新的技術(shù),這可能暗示了未來十年的市場贏家。
首先,在工具層,DataOps實(shí)踐方案需要一款能夠支持相關(guān)語言和框架(如Python、R、data science notebooks和Github)的數(shù)據(jù)科學(xué)平臺。此外,一種強(qiáng)有力的方案應(yīng)該有助于在流程的各個階段執(zhí)行嚴(yán)格的數(shù)據(jù)訪問和管理政策。數(shù)據(jù)即服務(wù)(Data-as-a-service)或自助服務(wù)數(shù)據(jù)市場工具是相當(dāng)關(guān)鍵的。
在平臺層,DataOps需要一款統(tǒng)一的數(shù)據(jù)架構(gòu),可以管理和提供大量數(shù)據(jù)的訪問,包括傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)以及更新的非結(jié)構(gòu)化和流式數(shù)據(jù)集。借助一款全球數(shù)據(jù)架構(gòu),可以跨物理位置管理數(shù)據(jù),并使用廣泛的計算引擎(包括集裝箱化流程)來處理數(shù)據(jù)。最后,選擇支持?jǐn)?shù)據(jù)密集型應(yīng)用程序的平臺必須針對數(shù)據(jù)局部性進(jìn)行優(yōu)化。
下一代的市場贏家
作為軟件行業(yè)的資深人士兼學(xué)生,我知道該行業(yè)唯一不變的就是不斷的變化。雖然沒有人擁有能夠預(yù)測未來的水晶球,但我認(rèn)為可以肯定地說未來十年的數(shù)據(jù)中心將與過去十年的數(shù)據(jù)中心不同。 DataOps是一個值得關(guān)注的趨勢。隨著企業(yè)對于這些實(shí)踐方案的采用變得越來越普遍,我預(yù)測我們將看到技術(shù)市場的相應(yīng)轉(zhuǎn)變。而市場的贏家將是那些能夠提供相應(yīng)工具和平臺的公司,以便使得開發(fā)和部署數(shù)據(jù)密集型的應(yīng)用程序變得更容易。