自數據出現(xiàn)以來,海量數據的碎片化就是一個一直存在的問題。而專注于解決此問題的CIO將能夠獲得更好的洞察力,并實現(xiàn)更多的業(yè)務利益。
去年,我寫了兩篇關于海量數據碎片化(MDF)的文章。第一篇文章對此進行了定義,第二篇則強調了如何解決問題。自從這幾篇文章發(fā)表以來,我已經與IT專業(yè)人士就這個主題以及它的重要性進行了多次討論,我相信它值得引起CIO們的關注。
二級存儲不應該只是數據碎片化的產物
從歷史上看,數據的管理,尤其是存儲,是由一群中級到高級工程師來完成的,CIO通常對此并不太關注。原因在于,多年來,二級存儲一直是數據行業(yè)數據碎片化的產物。它通常很難訪問,經常存儲在過時的本地文件服務器和磁帶上,經常是重復的,并且很難使用。
然而,現(xiàn)實是,數字化的成功依賴于對所有數據的訪問。首席信息官的任務是幫助企業(yè)推動創(chuàng)新,這需要從數據開始。消除海量數據的碎片化將提高工人的生產率,使企業(yè)能夠以數據為中心,并更具競爭力。
消除數據碎片的3個步驟
1.將以前用于備份、歸檔、文件共享、測試/開發(fā)和分析的獨立解決方案整合到一個平臺上。這消除了對現(xiàn)有遺留基礎設施的需要。這在以前是不可能的,但現(xiàn)在高度融合的基礎設施(HCI)使之變得容易了。
2.通過單個GUI管理所有方面。這包括設置保護策略和SLA,在全球范圍內管理數據中心或云環(huán)境以及確保資源的最佳使用。這也使得確保遵守相關的法規(guī)要求變得更加容易。
3.在相同的平臺上運行應用程序,這可以方便地利用輔助數據的價值并加速數字化轉型。這包括了自行開發(fā)的應用程序,也包括ISV或合作伙伴開發(fā)的應用程序。
消除海量數據碎片的好處
消除海量數據碎片有幾個好處,包括:
•消除信息孤島。整合平臺可以避免對孤立的遺留基礎設施的需求,例如備份和重復數據刪除設備、NAS存儲、云網關和媒體服務器。這可以通過在HCI平臺上運行功能齊全的以軟件定義的替換功能來實現(xiàn),以同時處理所有的次要工作負載。我和一些公司談過,他們發(fā)現(xiàn)單是備份一項就能節(jié)省高達70%的TCO成本。重要的是要理解數據不是生來就是一致統(tǒng)一的。而對它的控制有效地掩蓋了軟件中潛在的復雜性。
•消除副本。相同數據的多個副本可能是業(yè)務流程的喪鐘,因為用于找到正確版本的時間可能比用于手頭實際任務的時間還要多。合并數據可以使用重復數據刪除來減少所管理的數據占用空間,并消除數據副本的擴散。如果測試/開發(fā)等需要一個副本,那么可以在不影響資源的情況下獲取數據的快照副本。
•數據變得與位置無關。數據的集中控制使企業(yè)能夠在任何環(huán)境中實現(xiàn)管理,包括在數據中心、公共和私有云、遠程辦公室和邊緣位置。這使得二級存儲和應用程序可以在任何位置上進行控制,而無需網關或其他中間設備。
•重點將從數據收集轉移到數據連接上來。通過跨越物理上隔離的數據孤島,可以創(chuàng)建一個邏輯上的數據結構,就好像它們是集中在 一起一樣。這允許在不移動或復制數據的情況下進行就地分析。這里的一大好處是,它減少了為許多分析用例組裝數據湖的需要,因為數據可以保留在適當的位置。
•操作簡單。通過消除海量數據的碎片化,你可以避免需要多個專業(yè)操作員來執(zhí)行輔助操作(如備份、文件共享、云和測試/開發(fā))。單個管理員功能可以使用單個管理GUI。
•無限制的規(guī)模。 HCI解決方案旨在通過按需付費模式在內部或云中實現(xiàn)無限擴展。所有的東西都是完全分布式的,沒有單一的瓶頸,因此企業(yè)可以從小規(guī)模開始,并根據需要添加更多的東西,而不會出現(xiàn)中斷。
•提高了可見性和搜索能力??刂泼姘宓暮喜⑹箶祿軌虮蛔詣铀饕⒖梢粤⒓幢凰阉?,從而“照亮”以前黑暗的數據。這可以有助于顯示其二級數據區(qū)域的“位置”和“內容”,允許組織檢查其GDPR合規(guī)性,做出有關是否數據保留的明智決策,及時滿足電子發(fā)現(xiàn)請求,或監(jiān)控可能存在安全威脅的異常行為。
幾十年來,無法連接埋藏在信息孤島內的信息是個一直存在的問題。但是,影響僅限于用戶的不便,因為二級存儲通常并不是關鍵任務。而如今,其風險則要高得多,因為數據變成了數字企業(yè)的命脈。首席信息官需要將消除海量數據的碎片化問題作為其首要任務,因為能夠做到這一點的公司將擁有更好的洞察力,從而超越競爭對手。而那些做不到的公司將逐漸落后并掙扎在生存邊緣。