早期的云計算采用者往往被“即用即付”(pay-as-you-go)的靈活性以及云按需擴(kuò)展性所吸引。然而,數(shù)據(jù)安全是企業(yè)是采用早期云計算的主要擔(dān)憂的問題之一,因此IT部門采用云技術(shù)的速度很慢。
如今,越來越多的IT部門采用云計算。像AT&T、GE、CapitalOne這樣的企業(yè)已經(jīng)公開宣布,他們打算將大部分工作負(fù)載轉(zhuǎn)移到云端,因為云端的數(shù)據(jù)安全性已經(jīng)變得不那么重要了。AWS是調(diào)研機(jī)構(gòu)Gartner公司“云基礎(chǔ)架構(gòu)即服務(wù)魔力象限”的市場領(lǐng)導(dǎo)者,它是近期IT采納云趨勢的主要受益者。然而,就像任何技術(shù)平臺一樣,組織不可能僅僅注冊一個賬戶,沒采用一個謹(jǐn)慎的方法立即獲得回報。有興趣利用AWS的力量的組織應(yīng)該在構(gòu)建數(shù)據(jù)集成解決方案時考慮以下最佳實(shí)踐。
1.實(shí)現(xiàn)最佳帶寬和延遲的實(shí)現(xiàn)
采用AWS云的第一個最佳實(shí)踐與性能有關(guān)。這種做法假設(shè)-特別是對于諸如數(shù)據(jù)刷新(初始負(fù)載)之類的大數(shù)據(jù)傳輸,網(wǎng)絡(luò)限制了性能。兩個因素限制了網(wǎng)絡(luò)數(shù)據(jù)傳輸速率:帶寬和延遲(往返時間)。大多數(shù)人了解帶寬限制,因為互聯(lián)網(wǎng)連接是按可用帶寬評估的。
然而,延遲可能會限制網(wǎng)絡(luò)性能,因為通過線路發(fā)送確認(rèn)。延遲限制數(shù)據(jù)傳輸速率的程度取決于如何使用網(wǎng)絡(luò)通信(通常是TCP/IP)。而通信需要往返以確認(rèn)數(shù)據(jù)是否被正確接收,以及(1)往返頻率,(2)往返之間的數(shù)據(jù)量,(3)往返時間之間的更快或后來的延遲將開始限制數(shù)據(jù)傳輸速率。要最大限度地提高性能,請實(shí)施一個架構(gòu)利用:
數(shù)據(jù)壓縮,因此需要傳輸更少的數(shù)據(jù)塊,并且每個塊都包含更多的數(shù)據(jù)
大塊傳輸,進(jìn)一步限制網(wǎng)絡(luò)傳輸
通信優(yōu)化(例如,通過發(fā)送集合大批量傳送確認(rèn)的塊集)
2.識別感興趣的信息以提高效率
由于數(shù)據(jù)傳輸是一個潛在的瓶頸,所以必須盡量減少必須傳輸?shù)臄?shù)據(jù)量。為此,請使用更改數(shù)據(jù)捕獲(CDC)技術(shù)通過批量提取和后續(xù)的數(shù)據(jù)比較?;谌罩镜漠惒綌?shù)據(jù)捕獲(CDC)被廣泛認(rèn)為比基于觸發(fā)器的捕獲更為優(yōu)越,因為基于日志的數(shù)據(jù)捕獲(CDC)不會影響實(shí)際的事務(wù),因此,事務(wù)性應(yīng)用程序的開銷如果更加明顯,則會更少?;谌罩镜臄?shù)據(jù)捕獲(CDC)可以通過在分布式設(shè)置中運(yùn)行進(jìn)一步優(yōu)化。許多用例不需要所有數(shù)據(jù)庫更改,甚至在數(shù)據(jù)庫之外,數(shù)據(jù)庫事務(wù)日志除了存儲表數(shù)據(jù)更改外還存儲額外的數(shù)據(jù)。從效率角度來看,在發(fā)送跨網(wǎng)絡(luò)的更改前,確定與事務(wù)日志相近的信息子集是有意義的。
3.考慮采用除了防火墻以外的數(shù)據(jù)安全解決方案
組織實(shí)施數(shù)據(jù)安全的一種方法是盡可能嚴(yán)密地鎖定防火墻,既限制開放端口,又限制可能通過的網(wǎng)絡(luò)地址,以防止外部人員訪問系統(tǒng)的可能性。由于企業(yè)IT不喜歡在他們的網(wǎng)絡(luò)中開放防火墻,因此盡可能避免使用這種方法。
作為打開防火墻的替代方案,請考慮以下三個選項。
首先,啟動內(nèi)部通信。在云端,使用虛擬私有云(VPC)IP地址進(jìn)行通信,而不是外部IP地址,以限制暴露。
安全的第二個方面是數(shù)據(jù)加密。除非企業(yè)的數(shù)據(jù)本質(zhì)上都不敏感,否則不能對數(shù)據(jù)進(jìn)行加密。使用SSL(安全套接字層,加密)通信,或只傳遞加密的數(shù)據(jù)。亞馬遜密鑰管理系統(tǒng)與其許多服務(wù)集成在一起,也可以通過API進(jìn)行客戶端加密。
安全性的第三個重要方面是身份驗證。AWS云平臺中有一個選項可以使用授權(quán)的實(shí)例配置文件自動管理認(rèn)證信息的輪換。考慮采用這種能力來簡化密碼管理。外部身份驗證可以通過顯式SSL證書來改進(jìn),而不是像https調(diào)用那樣進(jìn)行協(xié)商的證書。
AWS云平臺是一個強(qiáng)大的工具-遵循這些最佳實(shí)踐可以充分發(fā)揮其潛力
云計算數(shù)據(jù)集成可以應(yīng)用于各種用例:無論是從各種來源到S3數(shù)據(jù)湖,本地遷移到AWS云,在云端運(yùn)行實(shí)時分析還是集成到各種云系統(tǒng)。不管用例如何,這三個關(guān)鍵的最佳實(shí)踐將確保企業(yè)的云計劃取得成功:
性能:如何最大限度地提高帶寬性能,
效率:在哪里以及如何讓“工作”發(fā)生,只處理正在發(fā)生的變化,
安全:如何確保數(shù)據(jù)在傳輸和空閑時的安全。