怎樣才能讓你的云端數(shù)據(jù)管理更專業(yè)?

51cto.com
亦安
【51CTO.com快譯】當(dāng)Carolinas HealthCare系統(tǒng)的腫瘤學(xué)家在腫瘤委員會進行審查前討論患者病例時,表示他們正在尋求有關(guān)治療計劃和臨床試驗的反饋。這些醫(yī)生在演示過程中展示了基因數(shù)據(jù)、病理報告、實驗室結(jié)果和醫(yī)...

【51CTO.com快譯】當(dāng)Carolinas HealthCare系統(tǒng)的腫瘤學(xué)家在腫瘤委員會進行審查前討論患者病例時,表示他們正在尋求有關(guān)治療計劃和臨床試驗的反饋。這些醫(yī)生在演示過程中展示了基因數(shù)據(jù)、病理報告、實驗室結(jié)果和醫(yī)生的筆記。而所有內(nèi)容都是通過指尖點擊就完成了,因為這些數(shù)據(jù)都存儲在了Azure的Hadoop云中。

這是非盈利性醫(yī)院網(wǎng)絡(luò)第一次進入云計算,也體現(xiàn)了CHS對如何保護和管理其云端數(shù)據(jù)的一些細(xì)致地考慮。這家醫(yī)療服務(wù)組織擁有員工62000多人,在東南亞經(jīng)營39家醫(yī)院和900個其他醫(yī)療機構(gòu)。

對此,CHS信息和分析服務(wù)(IAS)副總裁Chris Danzi表示,CHS需要解決的兩大問題是網(wǎng)絡(luò)和治理問題。管理內(nèi)部和外部數(shù)據(jù)之間的一個顯著區(qū)別是:在云端,數(shù)據(jù)可能會在數(shù)百英里之外。Danzi指出:“你正在談?wù)撨h(yuǎn)程移動數(shù)據(jù),所以你必須有一個電路和安全的網(wǎng)絡(luò)來連接?!睘榇_保每天晚上都能夠準(zhǔn)確無誤地將云數(shù)據(jù)傳輸?shù)皆铺峁┥棠抢?,光這數(shù)千兆字節(jié)的傳輸就要求他們必須與電信運營商購買一條安全的醫(yī)療保健網(wǎng)絡(luò)專線。

在將數(shù)據(jù)遷移到云端的一年中,CHS一直在使用一個VPN,來實現(xiàn)與Azure的私有連接。同時該線路也用于其Office 365系統(tǒng)?!傲硪患惚仨毧紤]的事情是,我買這條線路不僅是為了獲得更好的速度,還必須為需要實時訪問的互動用戶分段,以及將要做的大批量文件傳輸。” Danzi解釋說。

他認(rèn)為,在云中管理數(shù)據(jù)不同于在內(nèi)部管理數(shù)據(jù),包括在員工技能方面,都需要考慮如何設(shè)置數(shù)據(jù)治理計劃以及如何啟用部分技術(shù)基礎(chǔ)架構(gòu)。

Danzi說:“從可能試圖竊取您的數(shù)據(jù)的人的角度來看,這些領(lǐng)域都必須完全重新考慮。我們已經(jīng)掌握了很好的內(nèi)部部署,現(xiàn)在我們正在傳輸數(shù)據(jù)并將其存儲在不同的地方,所以我們必須重新考慮它。你必須不斷去重新思考,因為每天我們都會聽到一些新的,更為聰明的方式能破譯數(shù)據(jù)。”

更多公司選擇了外部數(shù)據(jù)存儲

毫無疑問,云已成為許多組織的IT和數(shù)據(jù)環(huán)境的組成部分。IDC數(shù)據(jù)集成軟件研究總監(jiān)Stewart Bond表示,最近的IDC調(diào)查顯示,越來越多的組織正在將數(shù)據(jù)整合到混合和僅云環(huán)境中,而不是將數(shù)據(jù)嚴(yán)格地保留在內(nèi)部。

“云中數(shù)據(jù)可以是SaaS應(yīng)用程序,PaaS系統(tǒng)或包含在IaaS中實現(xiàn)的數(shù)據(jù)庫和文件服務(wù)器。”Bond表示,在SaaS應(yīng)用程序中訪問數(shù)據(jù)通常需要使用API,使用Web服務(wù)訪問數(shù)據(jù)與使用SQL腳本與關(guān)系應(yīng)用程序數(shù)據(jù)庫非常不同。

“在PaaS環(huán)境中,實施將決定是否需要Web服務(wù)API,或者如果使用SQL或NoSQL方法來訪問數(shù)據(jù)?!盉ond說,在IaaS環(huán)境中的數(shù)據(jù)可能可以使用也可用于內(nèi)部部署數(shù)據(jù)源的編程結(jié)構(gòu)來訪問,但該訪問需要通過安全通信通道進行。無論如何,主數(shù)據(jù)管理技術(shù)有助于在多個不同的數(shù)據(jù)孤島之間進行調(diào)和。

技術(shù)業(yè)務(wù)管理(TBM)理事會的新任總裁Erez Yarkoni表示,在考慮如何管理云數(shù)據(jù)的步驟時,首先組織需要非常仔細(xì)地規(guī)劃網(wǎng)絡(luò)容量。

“當(dāng)我們的數(shù)據(jù)中心的數(shù)據(jù)是正確的時候,我們所理解的顯而易見的事情正在發(fā)生變化,基本上是擴展你的網(wǎng)絡(luò)足跡,你必須非常小心你的設(shè)計方式。”Yarkoni另一個身份是Telstra和T-Mobile的CIO,“這又增加了另外一個因素,如果你不仔細(xì)地計劃出口和退出環(huán)境,從往返云本身以及人們?nèi)绾闻c你放入云中的信息進行互動,那么這個花費可能非常昂貴?!彼f。

Yarkoni表示,當(dāng)他參與設(shè)計數(shù)據(jù)環(huán)境時,他盡可能避免將大量數(shù)據(jù)傳輸?shù)皆贫?,如果有必要,可以在一天的某些時間進行?!叭绻銓⑿畔臄?shù)據(jù)中心移動到云端,并且希望獲得一些服務(wù)質(zhì)量保證,則必須保證這些位置之間的鏈接。”

檢查云供應(yīng)商

Forrester公司副總裁兼首席分析師Andras Cser表示,雖然組織通常會對云提供商進行審核,但這一過程往往出現(xiàn)脫節(jié)。“我們看到大多數(shù)組織對云計算提供商進行初步審核,他們計劃存儲數(shù)據(jù),但持續(xù)的審計很少?!边@可能是由于其他優(yōu)先事項,流程的復(fù)雜性,云中存儲的數(shù)據(jù)量以及采用云的速度加快等因素使然。而Forrester通常會看到公司要求ISO27001和SOC1/SOC2認(rèn)證。CHS則規(guī)定其云提供商將進行SOC2審核,并且可以訪問這些結(jié)果。CHS的Danzi表示,CHS可以審核他們與計費做法相關(guān)的記錄。通過適當(dāng)?shù)耐ㄖ?,CHS也可以檢查其供應(yīng)商的數(shù)據(jù)中心。

不過,像Azure的ExpressRoute和Amazon的Direct Connect這樣的產(chǎn)品可以在內(nèi)部部署環(huán)境和各自的云端之間提供專門的網(wǎng)絡(luò)連接?!耙坏?shù)據(jù)在云中,IT商店就不再需要數(shù)據(jù)庫管理工具來管理數(shù)據(jù)庫,因為管理數(shù)據(jù)庫性能、調(diào)優(yōu)和設(shè)置的耗時過程都由云提供商處理?!弊稍児救驍?shù)據(jù)戰(zhàn)略公司信息管理總經(jīng)理Donna Burbank說。

她指出:“了解你的數(shù)據(jù),并知道它在哪里和保護它是重要的,但它的許多日常管理已經(jīng)消失了。云提供商現(xiàn)在監(jiān)督諸如性能和調(diào)優(yōu)等任務(wù),并檢查服務(wù)器是否正在運行并正在進行備份。(換言之,在某種程度上監(jiān)督供應(yīng)商是一個很好的做法)”

保護云數(shù)據(jù)

“管理云中的數(shù)據(jù)不同于在內(nèi)部管理數(shù)據(jù),特別是在處理敏感數(shù)據(jù)(例如客戶信息)時。”Burbank說。當(dāng)另一個實體控制個人信息時,她建議使用PCI數(shù)據(jù)安全標(biāo)準(zhǔn)和令牌化密鑰。當(dāng)公司利用云提供的效率時,“有很多假設(shè)的信任,但是你仍然沒有完全控制它。”

Forrester高級分析師Heidi Shey同意Burbank的意見,即安全令牌是保護數(shù)據(jù)的一種方式,但她表示,組織應(yīng)該規(guī)定誰掌握這些數(shù)據(jù),“一些安全解決方案將加密作為這些控制之一,誰擁有的是關(guān)鍵問題。有些公司希望擁有自己的控制權(quán),而其他公司則會相信供應(yīng)商??刂颇阕约旱蔫€匙是最好的選擇。這樣做有時會增加另一層復(fù)雜性,因為你是一個管理者,但它是一個額外的控制?!?/span>

除了確保云端數(shù)據(jù)安全外,確保數(shù)據(jù)在傳輸過程中的安全也很重要。這可能需要VPN連接、HTTPS、SFTP/FTPS和其他安全的通信方式。

IDC的調(diào)查還表明,隨著數(shù)據(jù)在云中分布越來越多,信任越來越困難,主數(shù)據(jù)特別是有關(guān)組織關(guān)心的人員,地點和事物的數(shù)據(jù)是最分散的,因為某些形式的需求將需要存在于每個應(yīng)用程序中。

云數(shù)據(jù)管理難題

然而,在2017年1月份的Forrester調(diào)查中,通過對美國和加拿大的150位數(shù)據(jù)安全專業(yè)人員的調(diào)查,只有31%的受訪者會根據(jù)其敏感度對云中的企業(yè)數(shù)據(jù)進行分類。另外,只有約三分之一(34%)的數(shù)據(jù)安全專業(yè)人員知道他們的云計算公司數(shù)據(jù)位于何處。

對此,F(xiàn)orrester的Shey認(rèn)為,還必須考慮云安全治理流程,以及將企業(yè)安全要求與合規(guī)性和隱私權(quán)法律相一致,特別是涉及個人信息時。

因為是一個醫(yī)療保健實體,CHS正在尋求在云中更加復(fù)雜的安全性。CHS的Danzi解釋說,人們在云中使用的大量Hadoop環(huán)境并不比結(jié)構(gòu)化關(guān)系數(shù)據(jù)庫環(huán)境成熟。CHS正在使用Apache Hadoop的HDInsight,它具有Apache Ranger等產(chǎn)品用于管理和管理用戶級訪問的Enterprise Hadoop的安全層。

Azure支持兩個版本的Hadoop實現(xiàn)。完全管理的HDInsight版本不支持Ranger以及IaaS版本HDP。“HDInsight符合HIPAA標(biāo)準(zhǔn)”,但沒有Ranger的用戶級安全特性,所以我們必須限制訪問。”Danzi解釋說。這是CHS早期學(xué)習(xí)的重要課程,即確保云端供應(yīng)商支持公司正在使用或希望使用的軟件版本?!澳悴荒芤詾檫@些東西提供你所使用的所有安全協(xié)議和保護。”

此外,“我們知道,我們使用的Hadoop版本是全部或無論在誰被授予訪問權(quán)限。但CHS只希望其信息和分析服務(wù)(IAS)管理員能夠訪問其環(huán)境。因此,CHS在Microsoft SharePoint中構(gòu)建了一個安全的應(yīng)用程序,僅向腫瘤板上的醫(yī)生提供患者信息。

Shey補充說,云中管理數(shù)據(jù)的另一個重要方面是數(shù)據(jù)駐留和數(shù)據(jù)傳輸?!叭绻阌衼碜蕴囟▏一虻貐^(qū)的客戶數(shù)據(jù),你會看到一般數(shù)據(jù)保護條例的作用,但具體國家可能有自己的數(shù)據(jù)居住要求?!?/span>

Global Data Strategy的Burbank認(rèn)為:“你需要知道數(shù)據(jù)在何處存在數(shù)據(jù),因為法律在不同國家是不同的?!?/span>

其他云管理考慮

Burbank指出,數(shù)據(jù)備份和恢復(fù)應(yīng)該在云提供商的服務(wù)級別協(xié)議中闡明,這是他們應(yīng)該提供的關(guān)鍵優(yōu)勢之一。這些SLA應(yīng)包括有關(guān)提供者是否具有故障切換站點以及該故障轉(zhuǎn)移站點所在位置的信息。“另外需要考慮你是否可以選擇這些故障轉(zhuǎn)移的地方。”

“組織還應(yīng)該考慮他們在云中管理的數(shù)據(jù)的格式。它可能在關(guān)系數(shù)據(jù)庫、平面文件或電子郵件中。如果客戶數(shù)據(jù)存儲在大容量的數(shù)據(jù)倉庫中,他們還需要考慮是否擁有內(nèi)部管理技能?!盉urbank指出,“如果你在數(shù)據(jù)周圍進行大量的清理和管理,那么這是需要考慮的事情,而且很多云技術(shù)都不那么先進。但是,如果你有原始數(shù)據(jù)可以輕松擴展和遷移,那么它非常適合于云端,因為它不需要很多管理?!?/span>

“由于技術(shù)如此之新,所以管理云中數(shù)據(jù)所需的技能可能難以實現(xiàn)?!盜DC的 Bond表示,必要的技能將取決于數(shù)據(jù)是SaaS、PaaS還是IaaS模型。在技術(shù)層面上,IT人員可能需要熟悉互聯(lián)網(wǎng)技術(shù),如Web服務(wù)、SSL、安全FTP和RESTful API。他們也可能需要熟悉IaaS體系結(jié)構(gòu),如虛擬機、對象存儲,可用區(qū)域和子網(wǎng)絡(luò)。在業(yè)務(wù)層面,用戶需要意識到管理數(shù)據(jù)輸入和維護的策略,以及跨多個系統(tǒng)進行數(shù)據(jù)復(fù)制的延遲問題。

計劃意外

CHS的Danzi表示,他們發(fā)現(xiàn)CHS的一些“熱切的數(shù)據(jù)科學(xué)家”剛剛開始運行R編程語言編寫模型來研究再入院風(fēng)險。因此,在Azure,IAS小組撰寫腳本,以便在不需要計算時在晚上關(guān)閉模型?!霸葡褚粋€擴大的氣球,你必須告訴它讓空氣流出來,它讓你有能力編寫腳本關(guān)閉服務(wù)器。這就是所謂的彈性,你想確保你的云供應(yīng)商能夠彈性上下,只有在你使用它們的時候才支付資源?!?/span>

他還建議受監(jiān)管機構(gòu)應(yīng)該擁有良好法律技能的人員,“你與第三方服務(wù)提供商必須確保所有HIPAA合規(guī)性和良好的業(yè)務(wù)關(guān)聯(lián)協(xié)議”。

許多云供應(yīng)商提供分析產(chǎn)品,并為潛在客戶提供基準(zhǔn)分析,Danzi認(rèn)為,需要確保這些供應(yīng)商在將你的數(shù)據(jù)提供給你所在的行業(yè)同行時,將其數(shù)據(jù)匿名化。

組織可能不會考慮的另一個問題是,如果他們在Azure上編寫算法,可能希望保護該算法的知識產(chǎn)權(quán),以免其他人在云中使用它。Danzi認(rèn)為,所有數(shù)據(jù)將在15年時間內(nèi)在云端托管。在管理云數(shù)據(jù)時需要大量的額外工作,但這些是值得的,“雖然新環(huán)境需要更加持續(xù)的警惕,但你可以訪問這種令人驚奇的技術(shù)?!?/span>

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論