數(shù)字化轉(zhuǎn)型數(shù)據(jù)治理的定義是對數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動集合。其最終目的是挖掘數(shù)據(jù)價值,推動業(yè)務(wù)發(fā)展,實(shí)現(xiàn)盈利。數(shù)據(jù)治理平臺是以元數(shù)據(jù)為基礎(chǔ),實(shí)現(xiàn)數(shù)據(jù)的產(chǎn)生、存儲、遷移、使用、歸檔、銷毀等環(huán)節(jié)的數(shù)據(jù)生命周期管理。實(shí)現(xiàn)數(shù)據(jù)從源到數(shù)據(jù)中心再到應(yīng)用端的全過程管理,為用戶提供了準(zhǔn)確便捷的企業(yè)資產(chǎn)信息。數(shù)據(jù)治理平臺也包括數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)質(zhì)量。
1.從質(zhì)量管理到質(zhì)量與服務(wù)并重
在傳統(tǒng)的關(guān)系型數(shù)據(jù)庫時代,開展數(shù)據(jù)治理更多的是為了能夠解決數(shù)據(jù)質(zhì)量問題,提升數(shù)據(jù)決策水平。而在大數(shù)據(jù)時代,除了需要保證數(shù)據(jù)質(zhì)量之外,對數(shù)據(jù)治理也提出了更高的要求,數(shù)據(jù)必須更好地適應(yīng)不確定性的需求,即插即用,服務(wù)不斷變化的業(yè)務(wù)創(chuàng)新,發(fā)揮出數(shù)據(jù)更大的價值。
在這種要求下,可以通過數(shù)據(jù)資產(chǎn)管理,在傳統(tǒng)的數(shù)據(jù)治理能力之外,提供數(shù)據(jù)資產(chǎn)視圖能力、數(shù)據(jù)檢索能力、數(shù)據(jù)共享能力、數(shù)據(jù)價值運(yùn)營能力等,實(shí)現(xiàn)數(shù)據(jù)的可見、可懂、可用、可運(yùn)營,并不斷增值。數(shù)據(jù)管理部門也有機(jī)會從一個純粹的的成本中心逐漸轉(zhuǎn)變成企業(yè)的創(chuàng)新中心和高利潤部門。
可見:通過對數(shù)據(jù)資產(chǎn)的全面盤點(diǎn),形成數(shù)據(jù)資產(chǎn)地圖。針對數(shù)據(jù)生產(chǎn)者、管理者、使用者等不同的角色,用數(shù)據(jù)資產(chǎn)目錄的方式共享數(shù)據(jù)資產(chǎn),用戶可以快速、精確地查找到自己關(guān)心的數(shù)據(jù)資產(chǎn)。
可懂:通過元數(shù)據(jù)管理,完善對數(shù)據(jù)資產(chǎn)的描述。同時在數(shù)據(jù)資產(chǎn)的建設(shè)過程中,注重數(shù)據(jù)資產(chǎn)業(yè)務(wù)含義的提煉,將數(shù)據(jù)加工和組織成人人可懂的、無歧義的數(shù)據(jù)資產(chǎn)。具體來說,在數(shù)據(jù)中臺之上,需要將數(shù)據(jù)資產(chǎn)進(jìn)行標(biāo)簽化。標(biāo)簽是面向業(yè)務(wù)視角的數(shù)據(jù)組織方式。
可用:通過統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)、提升數(shù)據(jù)質(zhì)量和數(shù)據(jù)安全性等措施,增強(qiáng)數(shù)據(jù)的可信度,讓數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析人員沒有后顧之憂,放心使用數(shù)據(jù)資產(chǎn),降低因為數(shù)據(jù)不可用、不可信而帶來的溝通成本和管理成本。
可運(yùn)營:數(shù)據(jù)資產(chǎn)運(yùn)營的最終目的是讓數(shù)據(jù)價值越滾越大,因此數(shù)據(jù)資產(chǎn)運(yùn)營要始終圍繞資產(chǎn)價值來開展。通過建立一套符合數(shù)據(jù)驅(qū)動的組織管理制度流程和價值評估體系,改進(jìn)數(shù)據(jù)資產(chǎn)建設(shè)過程,提升數(shù)據(jù)資產(chǎn)管理的水平,提升數(shù)據(jù)資產(chǎn)的價值。
2.人工智能大幅提升數(shù)據(jù)治理效率
高質(zhì)量的大數(shù)據(jù)作為AI的原料,不斷地訓(xùn)練出表現(xiàn)越來越出色的AI模型。反過來,AI也可以反哺大數(shù)據(jù)的處理能力,幫助人類大幅度提升大數(shù)據(jù)處理效率。目前很多企業(yè)和大數(shù)據(jù)服務(wù)提供商都在探索用機(jī)器人學(xué)習(xí)的方式幫助組織增強(qiáng)數(shù)據(jù)治理能力。
通過應(yīng)用機(jī)器學(xué)習(xí)技術(shù),來識別哪些數(shù)據(jù)可能有問題,哪些數(shù)據(jù)是用戶的隱私數(shù)據(jù)。一旦數(shù)據(jù)特征被確認(rèn),就會自動給它們打上標(biāo)簽,從而使用這種自動化的機(jī)制來完成一部分?jǐn)?shù)據(jù)治理工作。
比如當(dāng)碰到某類有特殊標(biāo)記的數(shù)據(jù)時,就會有相應(yīng)的流程契動。而解決這類問題的傳統(tǒng)機(jī)制往往需要人工操作,費(fèi)時費(fèi)力,在大數(shù)據(jù)時代,這樣的人力成本投入已經(jīng)不再實(shí)現(xiàn),機(jī)器學(xué)習(xí)惡意將這一整串流程完全自動化,且準(zhǔn)確率達(dá)到較高的水平。
在數(shù)據(jù)安全管理方面,人工智能的介入將幫助組織發(fā)現(xiàn)更多可疑的數(shù)據(jù)竊取、數(shù)據(jù)泄露的潛在風(fēng)險,識別潛在的系統(tǒng)攻擊,幫助組織建立健全的數(shù)據(jù)安全管理措施,填補(bǔ)技術(shù)上的漏洞。
3.以元數(shù)據(jù)為核心的分布式數(shù)據(jù)治理
隨著云計算、邊緣計算的興起,未來的數(shù)據(jù)治理必須滿足分布式的要求,因為數(shù)據(jù)治理總是隨著數(shù)據(jù)存儲的位置進(jìn)行。而實(shí)現(xiàn)這些,需要數(shù)據(jù)治理圍繞元數(shù)據(jù)展開,無論數(shù)據(jù)分散在何處,都可以在數(shù)據(jù)保留在原地的情況下,通過元數(shù)據(jù)把它們關(guān)聯(lián)在一起,因此元數(shù)據(jù)將成為未來數(shù)據(jù)治理的基礎(chǔ)和核心。
本文轉(zhuǎn)自《數(shù)字化轉(zhuǎn)型方法論》