數(shù)據(jù)管理,數(shù)據(jù)治理,數(shù)據(jù)中心,數(shù)據(jù)中臺,數(shù)據(jù)湖這下就分清楚了!

人民數(shù)據(jù)
人民數(shù)據(jù)
數(shù)據(jù)湖一般是公有云服務(wù)商提出的一個(gè)概念,即企業(yè)的結(jié)構(gòu)化,非結(jié)構(gòu)化數(shù)據(jù)都可以全部采集和存儲到我這里來。數(shù)據(jù)湖就是一個(gè)大的存儲站,這個(gè)存儲是分布式可無限擴(kuò)展的,存儲過來的數(shù)據(jù)也不會去清洗和加工,盡量保持原樣。

隨著信息技術(shù)的不斷涌現(xiàn)和普及,業(yè)務(wù)發(fā)展加快了數(shù)據(jù)膨脹的速度,行業(yè)內(nèi)衍生了較多的新名詞,如數(shù)據(jù)治理、數(shù)據(jù)管理、數(shù)據(jù)資源管理、數(shù)據(jù)資產(chǎn)管理等名詞的定義很多,概念容易混淆,本文對這些名詞術(shù)語及內(nèi)涵進(jìn)行系統(tǒng)的解析,便于讀者對數(shù)據(jù)相關(guān)的概念有全面的認(rèn)識。

數(shù)據(jù)治理和數(shù)據(jù)管理

簡單來說治理就是管理的管理。

管理你得遵循一定得標(biāo)準(zhǔn)規(guī)范體系,一定得流程,一定得組織角色分工,而這些內(nèi)容就必須先通過數(shù)據(jù)治理定義清楚。管理只是根據(jù)數(shù)據(jù)治理規(guī)范體系去執(zhí)行管理和監(jiān)督的職責(zé)。管理執(zhí)行的依據(jù)是治理規(guī)范體系。

如下圖:

2345截圖20200908083720.png

數(shù)據(jù)中臺和數(shù)據(jù)湖

這個(gè)要解釋清楚不太容易,因此我盡量做簡化。

數(shù)據(jù)湖一般是公有云服務(wù)商提出的一個(gè)概念,即企業(yè)的結(jié)構(gòu)化,非結(jié)構(gòu)化數(shù)據(jù)都可以全部采集和存儲到我這里來。數(shù)據(jù)湖就是一個(gè)大的存儲站,這個(gè)存儲是分布式可無限擴(kuò)展的,存儲過來的數(shù)據(jù)也不會去清洗和加工,盡量保持原樣。

在存過來后,數(shù)據(jù)湖再提供一些標(biāo)準(zhǔn)的開放接口給你使用數(shù)據(jù),這些接口包括了查詢SQL類接口,計(jì)算引擎接口,流處理接口等。提供接口的目的也很簡單,就是能夠方便得使用你存儲過來的數(shù)據(jù)。

數(shù)據(jù)湖的存儲一般是分布式對象存儲或分布式文件存儲,即使你是結(jié)構(gòu)化數(shù)據(jù)庫采集過來的數(shù)據(jù),仍然會轉(zhuǎn)成統(tǒng)一的存儲方法,方便擴(kuò)展。

數(shù)據(jù)中臺簡單來說就是企業(yè)共享數(shù)據(jù)能力下沉并對外開放。

數(shù)據(jù)中臺包括了底層數(shù)據(jù)技術(shù)平臺(可以是我們熟悉的大數(shù)據(jù)平臺能力),中間的數(shù)據(jù)資產(chǎn)層,上層的數(shù)據(jù)對外能力開放。

核心的資產(chǎn)層本身也分層,從最底層的貼源數(shù)據(jù),到分域應(yīng)用數(shù)據(jù),再到上層的數(shù)據(jù)倉庫和數(shù)據(jù)標(biāo)簽庫。而數(shù)據(jù)湖更多對應(yīng)到數(shù)據(jù)中臺概念里面的數(shù)據(jù)貼源層。

企業(yè)實(shí)際在建數(shù)據(jù)中臺的時(shí)候?qū)嶋H很少用數(shù)據(jù)湖這個(gè)概念。

兩者的對比映射如下:

2345截圖20200908083720.png

數(shù)據(jù)中心

對于數(shù)據(jù)中心這個(gè)詞,原來在BI系統(tǒng)應(yīng)用里面也經(jīng)常出現(xiàn)。

但是現(xiàn)在數(shù)據(jù)中心一般特指IT基礎(chǔ)設(shè)施,大的公有云數(shù)據(jù)機(jī)房等,在BI系統(tǒng)或數(shù)據(jù)中臺里面都很少用這個(gè)詞。即數(shù)據(jù)中心這個(gè)詞偏I(xiàn)T硬件基礎(chǔ)設(shè)施層面了。

比如下圖,一般指硬件和網(wǎng)絡(luò)基礎(chǔ)設(shè)施架構(gòu)了。

2345截圖20200908083720.png

數(shù)據(jù)資產(chǎn)

數(shù)據(jù)資產(chǎn)(Data Asset)是指由企業(yè)擁有或者控制的,能夠?yàn)槠髽I(yè)帶來未來經(jīng)濟(jì)利益的,以物理或電子的方式記錄的數(shù)據(jù)資源,如文件資料、電子數(shù)據(jù)等。在企業(yè)中,并非所有的數(shù)據(jù)都構(gòu)成數(shù)據(jù)資產(chǎn),數(shù)據(jù)資產(chǎn)是能夠?yàn)槠髽I(yè)產(chǎn)生價(jià)值的數(shù)據(jù)資源。

數(shù)據(jù)資產(chǎn)的屬性:數(shù)據(jù)資產(chǎn)具有無形資產(chǎn)的屬性,從這個(gè)角度出發(fā),我們可以發(fā)現(xiàn)數(shù)據(jù)資產(chǎn)主要有以下特性:

無消耗性:數(shù)據(jù)資產(chǎn)的每次使用只需要花費(fèi)很低的成本,不會因?yàn)槭褂妙l率的增加而磨損、消耗,與其他傳統(tǒng)無形資產(chǎn)有相似性。

增值性:企業(yè)通過穩(wěn)定發(fā)展,會促使數(shù)據(jù)資產(chǎn)在原有的基礎(chǔ)上,數(shù)據(jù)規(guī)模和數(shù)據(jù)維度的不斷積累,整體價(jià)值進(jìn)一步提升。

依附性:與其他無形資產(chǎn)類似,數(shù)據(jù)資產(chǎn)不能獨(dú)立發(fā)揮作用,其發(fā)揮作用和效應(yīng)往往依附于相應(yīng)的軟件、硬件。

價(jià)值易變性:數(shù)據(jù)資產(chǎn)時(shí)刻受到數(shù)據(jù)容量、數(shù)據(jù)時(shí)效程度、應(yīng)用場景等因素的影響,與其他無形資產(chǎn)相比,其價(jià)值更易發(fā)生變化。

戰(zhàn)略性:一切數(shù)據(jù)業(yè)務(wù)化,一切業(yè)務(wù)數(shù)據(jù)化,具有戰(zhàn)略性。

數(shù)據(jù)資產(chǎn)管理

數(shù)據(jù)資產(chǎn)管理(Data Asset Management)是指規(guī)劃、控制和提供數(shù)據(jù)及信息資產(chǎn)的一組業(yè)務(wù)職能,包括開發(fā)、執(zhí)行和監(jiān)督有關(guān)數(shù)據(jù)的計(jì)劃、政策、方案、項(xiàng)目、流程、方法和程序,從而控制、保護(hù)、交付和提高數(shù)據(jù)資產(chǎn)的價(jià)值。數(shù)據(jù)資產(chǎn)管理需要充分融合業(yè)務(wù)、技術(shù)和管理,以確保數(shù)據(jù)資產(chǎn)保值增值。

數(shù)據(jù)資產(chǎn)管理(Data Asset Management)一般來說包括統(tǒng)籌規(guī)劃、管理實(shí)施、稽核檢查和資產(chǎn)運(yùn)營四個(gè)主要階段,貫穿數(shù)據(jù)采集、存儲、應(yīng)用和銷毀整個(gè)生命周期全過程。企業(yè)管理數(shù)據(jù)資產(chǎn)就是對數(shù)據(jù)進(jìn)行全生命周期的資產(chǎn)化管理,促進(jìn)數(shù)據(jù)在“內(nèi)增值,外增效”兩方面的價(jià)值變現(xiàn),同時(shí)控制數(shù)據(jù)在整個(gè)管理流程中的成本消耗。

2345截圖20200908083720.png

數(shù)據(jù)資產(chǎn)管理過程

數(shù)據(jù)資產(chǎn)管理(Data Asset Management)包括兩個(gè)重要方面,一是數(shù)據(jù)資產(chǎn)管理的核心管理職能;二是確保這些管理職能落地實(shí)施的保障措施,包括戰(zhàn)略規(guī)劃、組織架構(gòu)、制度體系等。

數(shù)據(jù)管理、數(shù)據(jù)資源管理與數(shù)據(jù)資產(chǎn)管理有著密切關(guān)系和關(guān)聯(lián),但隨著現(xiàn)代數(shù)字技術(shù)的高速發(fā)展,三者在內(nèi)涵、側(cè)重、延伸等方面存在差異。

2345截圖20200908083720.png

數(shù)據(jù)管理、數(shù)據(jù)資源管理與數(shù)據(jù)資產(chǎn)管理的關(guān)系

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論