由于眾多企業(yè)用戶將他們IT環(huán)境的更多負(fù)載遷移至云,云供應(yīng)商們也各自快速發(fā)展了一批不同的、易于部署的、功能完備的服務(wù)集合。
成本效益當(dāng)然是企業(yè)的一大關(guān)注點,但除了將諸如數(shù)據(jù)倉庫、商業(yè)智能和分析環(huán)境等IT業(yè)務(wù)遷移至云的潛在成本優(yōu)勢之外,還有四個因素讓云成為CIO們眼中極具吸引力的選擇:將業(yè)務(wù)功能遷移至云平臺后,確保他們系統(tǒng)保持最新更新狀態(tài)和現(xiàn)代化的能力;訪問可部署在最新和最好硬件平臺上的虛擬化系統(tǒng),從而減少硬件過時的可能性;云主機所提供服務(wù)種類日益增多;以及將系統(tǒng)管理和維護等工作委托給云供應(yīng)商的能力。
從對數(shù)據(jù)倉庫、分析與報告環(huán)境進(jìn)行革新和現(xiàn)代化的角度來看,云服務(wù)一詞實際上涵蓋了范圍廣泛的資源和功能。這些資源與功能包括且不限于:
(1)數(shù)據(jù)存儲:有幾種不同的、現(xiàn)成可用的大規(guī)??蓴U展存儲選項,例如文件存儲(類似于傳統(tǒng)的分層文件系統(tǒng))、塊存儲或?qū)ο蟠鎯?,其中?shù)據(jù)項是以對象形式進(jìn)行存儲的,另外還配備了用于描述數(shù)據(jù)的元數(shù)據(jù),從而簡化可訪問性。
(2)計算平臺:每一家云供應(yīng)商都允許用戶以不同的CPU、內(nèi)存和臨時存儲的配置指定和啟動平臺。其成本取決于運行計算任務(wù)所需的資源。
(3)數(shù)據(jù)庫管理系統(tǒng):從傳統(tǒng)關(guān)系型數(shù)據(jù)庫管理系統(tǒng)到更復(fù)雜的N哦SQL數(shù)據(jù)庫,再到列導(dǎo)向和內(nèi)存內(nèi)數(shù)據(jù)庫等選項都針對性能進(jìn)行了優(yōu)化。
(4)大數(shù)據(jù)分析環(huán)境:供應(yīng)商們還支持各種大數(shù)據(jù)應(yīng)用件,其中包括Hadoop、Spark、數(shù)據(jù)流功能以及大規(guī)模數(shù)據(jù)倉庫等。
(5)網(wǎng)絡(luò)與負(fù)載平衡:旨在以預(yù)設(shè)計算配置管理不同節(jié)點的運行性能。
(6)新興服務(wù):這是最有趣的一類,其選項包括機器學(xué)習(xí)、非結(jié)構(gòu)化搜索、文本分析、語音與自然語言API、數(shù)據(jù)可視化以及其他功能。
遷移至云平臺的決策為用戶帶來了一些靈活性,他們可以在云供應(yīng)商配合下從一系列計算平臺、存儲、應(yīng)用程序、數(shù)據(jù)庫等服務(wù)選項,以及管理工具、開發(fā)人員工具、安全管理功能、系統(tǒng)監(jiān)控等其他功能中進(jìn)行選擇。在很多情況下,云供應(yīng)商將提供平臺和對服務(wù)的訪問,他們還會與您的數(shù)據(jù)消費者一起了解他們的分析需求。他們還將幫助您設(shè)計、實施和管理您的業(yè)務(wù)智能平臺,所有“即服務(wù)”。
對于成本敏感的企業(yè)來說,在全面實施云戰(zhàn)略之前,更好地理解云計算經(jīng)濟學(xué)是非常重要的??赡軙嬖谥恍┳屓舜蟪砸惑@的隱藏成本,從而影響對于存儲類型、計算平臺、數(shù)據(jù)訪問模式和服務(wù)的決策,這些決策在相當(dāng)大的程度上取決于總體支出預(yù)期。這個成本模式可能會有些混亂,特別是當(dāng)所使用的度量單位不一定匹配時——即便是來自于同一供應(yīng)商的不同服務(wù)亦是如此,當(dāng)試圖進(jìn)行同類服務(wù)比較時也不要介意不同的供應(yīng)商。
考慮如下這些示例:
1、計算——通常是指基于虛擬CPU或機器內(nèi)核的數(shù)量、內(nèi)存容量以及在某些情況下與虛擬機相關(guān)聯(lián)臨時存儲進(jìn)行配置的資源;
2、存儲——可以根據(jù)所請求的存儲容量、存儲對象的數(shù)量、請求的數(shù)量以及數(shù)據(jù)傳輸?shù)膸拋矶▋r;
3、數(shù)據(jù)庫——可根據(jù)在指定配置的虛擬服務(wù)器上使用數(shù)據(jù)庫的單位時間價格來收取費用。而更復(fù)雜的高性能數(shù)據(jù)庫和數(shù)據(jù)倉庫服務(wù)將產(chǎn)生更高的費用。
其他服務(wù)則是在使用時收取費用。例如,可考慮允許用戶對持久對象存儲執(zhí)行SQL查詢并按照查詢支付費用的供應(yīng)商。但是,這個服務(wù)的成本包括了基于數(shù)據(jù)訪問數(shù)量的單次查詢扁平成本,以及將查詢結(jié)果存回對象存儲的成本。如果使用未壓縮的數(shù)據(jù),多次執(zhí)行這樣的查詢可能會導(dǎo)致更高的費用。但如果以壓縮格式存儲數(shù)據(jù)并以列狀數(shù)據(jù)布局進(jìn)行部署,那么查詢返回的數(shù)據(jù)將會更少,總體成本也會有所降低。
更新用戶的分析環(huán)境了解可用的平臺和服務(wù)可為制定更新用戶報告與分析環(huán)境的計劃提供了起點。實施一個現(xiàn)代化的環(huán)境將實現(xiàn)兩個目標(biāo):首先,它將把現(xiàn)有的功能遷移至一個成本更低、但性能更高的平臺上;其次,也許更重要的是它可以實現(xiàn)創(chuàng)新分析功能的應(yīng)用,其中包括實時獲取多個數(shù)據(jù)流、諸如機器學(xué)習(xí)和人工智能的算法應(yīng)用程序,以及集成的實時分析。
但是,過多的選項如何實現(xiàn)系統(tǒng)可用性、數(shù)據(jù)可用性、整體性能和持續(xù)成本的平衡能力變得更復(fù)雜了。針對其中某一個變量進(jìn)行優(yōu)化配置可能會導(dǎo)致其他一個或多個變量的影響變差。例如,一個將每個事務(wù)映射到其自己的數(shù)據(jù)對象的數(shù)據(jù)部署布局可能會減輕數(shù)據(jù)訪問的難度,但是隨著事務(wù)數(shù)量的增長,相關(guān)的數(shù)據(jù)對象數(shù)量也會增加。因此,這樣做會增加對象存儲的成本,因為其收費是按照對象數(shù)量來計算的。另一方面,在較少數(shù)量的文件中收集眾多記錄并作為對象進(jìn)行存儲可降低單個對象的成本,但是訪問特定記錄需要訪問更大量的數(shù)據(jù),從而增加了數(shù)據(jù)傳輸成本。
換而言之,“云計算經(jīng)濟學(xué)”成為了系統(tǒng)設(shè)計眾多因素中的一個重要變量。當(dāng)考慮將數(shù)據(jù)倉庫、商業(yè)智能、報告與分析功能遷移至云時,評估數(shù)據(jù)使用模式、確定信息模型的類型以及評估用戶群體需求是非常重要的。與云供應(yīng)商開展合作,找出涉及數(shù)據(jù)架構(gòu)、服務(wù)與應(yīng)用程序設(shè)計相關(guān)的最佳方法,從而優(yōu)化數(shù)據(jù)可用性、數(shù)據(jù)利用率、系統(tǒng)性能與費用支出。