自2010年國(guó)際上首次提出“數(shù)據(jù)湖”概念以來(lái),數(shù)據(jù)湖就被視為大數(shù)據(jù)的終極挑戰(zhàn)。所謂數(shù)據(jù)湖,即把所有的數(shù)據(jù)以原始格式存儲(chǔ)在一個(gè)統(tǒng)一的地方,以供后續(xù)使用。數(shù)據(jù)湖的出現(xiàn),是為了應(yīng)對(duì)城市和企業(yè)無(wú)法及時(shí)處理各種海量數(shù)據(jù)而先行將數(shù)據(jù)存儲(chǔ)起來(lái),后續(xù)使用的時(shí)候隨需取用。“數(shù)據(jù)湖”被視為打破城市和企業(yè)的數(shù)據(jù)孤島的重要基礎(chǔ)設(shè)施,而且由于“數(shù)據(jù)湖”中存儲(chǔ)了全量全域數(shù)據(jù)而更能為人工智能所用,從而創(chuàng)造更大的價(jià)值,例如用人工智能對(duì)一個(gè)城市或企業(yè)的全量數(shù)據(jù)進(jìn)行分析,從而得出超越現(xiàn)有經(jīng)驗(yàn)的全新洞察。
近年來(lái),各地都在興建“數(shù)據(jù)湖”,往往一個(gè)數(shù)據(jù)湖項(xiàng)目就涉及上百畝產(chǎn)業(yè)園以及數(shù)十億投資。因此,“數(shù)據(jù)湖”也被視為智慧城市和智慧企業(yè)發(fā)展的重大投資。簡(jiǎn)單理解,數(shù)據(jù)湖就是要給城市和企業(yè)建立一個(gè)數(shù)據(jù)中臺(tái),建立一個(gè)打通城市和企業(yè)的智慧基礎(chǔ)設(shè)施。然而,Gartner曾預(yù)測(cè),到2018年將有90%的數(shù)據(jù)湖將毫無(wú)用處,因?yàn)檫@些原始數(shù)據(jù),缺乏有效的技術(shù)手段去使用它們。換句話說(shuō),只有“數(shù)據(jù)+智能”的智能數(shù)據(jù)解決方案,才能喚醒數(shù)據(jù)湖的真正價(jià)值。
2019年6月5日,華為在北京發(fā)布智能數(shù)據(jù)解決方案FusionData,支持智能的數(shù)據(jù)全生命周期管理,讓數(shù)據(jù)存得下、流得動(dòng)、算得快、用得好,把數(shù)據(jù)資源轉(zhuǎn)變?yōu)閿?shù)據(jù)資產(chǎn)。華為Cloud & AI產(chǎn)品與服務(wù)總裁侯金龍表示:“不久的將來(lái),可實(shí)現(xiàn)一家企業(yè)一個(gè)數(shù)據(jù)湖,一座城市一個(gè)數(shù)據(jù)湖,滿足居民的生產(chǎn)與生活、企業(yè)的運(yùn)營(yíng)和發(fā)展、城市政府的管理和服務(wù)等各項(xiàng)需求,加速全社會(huì)的智能化進(jìn)程。”
(華為Cloud & AI產(chǎn)品與服務(wù)總裁侯金龍致辭)
數(shù)字化轉(zhuǎn)型也要不斷升級(jí)
眾所周知,世界上90%的數(shù)據(jù)是在過(guò)去兩年內(nèi)產(chǎn)生的,并且以每?jī)赡攴兜臄?shù)據(jù)往上遞增,這些數(shù)據(jù)有結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。從現(xiàn)在到未來(lái)五年,將有500億臺(tái)互聯(lián)的智能機(jī)器,這些互聯(lián)智能機(jī)器和設(shè)備用來(lái)分析、收集和采集數(shù)據(jù)。如何獲得數(shù)據(jù)、如何有效使用數(shù)據(jù)并且把數(shù)據(jù)用以指導(dǎo)業(yè)務(wù),這是新的課題。
國(guó)家戰(zhàn)略性新興產(chǎn)業(yè)專家委員會(huì)秘書(shū)長(zhǎng)杜平在2019數(shù)博會(huì)的專業(yè)論壇上發(fā)言認(rèn)為,數(shù)字經(jīng)濟(jì)是數(shù)字技術(shù)與資本、人才、市場(chǎng)相融合的一種經(jīng)濟(jì)形態(tài),當(dāng)前整個(gè)社會(huì)經(jīng)濟(jì)發(fā)展向網(wǎng)絡(luò)化、數(shù)字化、智能化轉(zhuǎn)型,在轉(zhuǎn)型過(guò)程中由于人們的社會(huì)經(jīng)濟(jì)活動(dòng)而源源不斷產(chǎn)生新的數(shù)據(jù),這是數(shù)字社會(huì)與之前工業(yè)社會(huì)和信息社會(huì)中前期最大的不同之處。
對(duì)于當(dāng)前正在進(jìn)行的數(shù)字化轉(zhuǎn)型,杜平強(qiáng)調(diào)轉(zhuǎn)型必須不斷迭代升級(jí),同時(shí)要取得投資回報(bào),特別是長(zhǎng)期要有投資回報(bào),否則不可持續(xù)。為此,要同時(shí)強(qiáng)調(diào)成本和產(chǎn)出:成本既包括資金,也包括時(shí)間、效率、營(yíng)商環(huán)境;而產(chǎn)出不僅要有資金回報(bào),還要帶來(lái)體驗(yàn)感,也就是數(shù)字社的便利性、安全感、獲得感。換句話說(shuō),數(shù)字經(jīng)濟(jì)時(shí)代是大家共享發(fā)展成果,這與之前的社經(jīng)經(jīng)濟(jì)模式不同,因此要統(tǒng)籌考慮成本和產(chǎn)出問(wèn)題。
然而,當(dāng)前的大部分應(yīng)用仍為舊應(yīng)用或傳統(tǒng)應(yīng)用。政府和企業(yè)擁有大量的數(shù)據(jù)管理員,他們當(dāng)中的大多數(shù)在管理著傳統(tǒng)數(shù)據(jù)庫(kù),日常管理包括打補(bǔ)丁和升級(jí)等,都屬于重復(fù)性人工勞動(dòng)。而政府和企業(yè)希望至少能拿出50%的人力進(jìn)行創(chuàng)新和革新,希望這些人員用更多時(shí)間在數(shù)據(jù)建模、數(shù)據(jù)生命周期管理,以及前置性措施預(yù)測(cè)數(shù)據(jù)漏洞及安全,以保障和提升企業(yè)在市場(chǎng)上的聲譽(yù)。
因此,不論對(duì)于政府還是企業(yè)來(lái)說(shuō),“數(shù)據(jù)湖”能夠統(tǒng)一容納和管理傳統(tǒng)數(shù)據(jù)技術(shù)以及新興數(shù)據(jù)技術(shù),把所有的數(shù)據(jù)管理員集中起來(lái)重新分配工作特別是進(jìn)行創(chuàng)新性工作,而不是像之前那樣不同的數(shù)據(jù)庫(kù)系統(tǒng)都要配備高級(jí)數(shù)據(jù)管理員從事日常管理工作。更重要的是,“數(shù)據(jù)湖”作為一個(gè)企業(yè)和一個(gè)城市的統(tǒng)一數(shù)據(jù)基礎(chǔ)設(shè)施,可以在統(tǒng)一軟件架構(gòu)的管理下,不斷升級(jí)舊技術(shù)的同時(shí)容納新技術(shù),最終實(shí)現(xiàn)可持續(xù)發(fā)展的基礎(chǔ)設(shè)施。從這個(gè)角度來(lái)說(shuō),“數(shù)據(jù)湖”是大數(shù)據(jù)的終極基礎(chǔ)設(shè)施。
持續(xù)釋放數(shù)據(jù)的長(zhǎng)期價(jià)值
華為全球產(chǎn)業(yè)展望(GIV)報(bào)告顯示,全球數(shù)據(jù)量將從2018年32.5ZB快速增長(zhǎng)到2025年的180ZB。但企業(yè)生產(chǎn)活動(dòng)產(chǎn)生的數(shù)據(jù)中只有不到2%被保存,而其中得到分析利用的不足10%,數(shù)據(jù)價(jià)值沒(méi)有得到充分釋放,并且企業(yè)普遍存在煙囪式業(yè)務(wù)系統(tǒng),導(dǎo)致數(shù)據(jù)管理、應(yīng)用效率低。對(duì)此,華為IT產(chǎn)品線副總裁、智能數(shù)據(jù)與存儲(chǔ)領(lǐng)域總裁周躍峰表示,“各行各業(yè)在實(shí)現(xiàn)數(shù)據(jù)價(jià)值時(shí)面臨數(shù)據(jù)接入難、分析難、消費(fèi)難等挑戰(zhàn),亟待更智能的數(shù)據(jù)解決方案。”
例如,北京把智慧城市建設(shè)作為推動(dòng)政府決策科學(xué)化、城市管理精細(xì)化、公共服務(wù)便利化的重要手段,大力實(shí)施北京大數(shù)據(jù)行動(dòng)計(jì)劃,形成“四梁八柱深地基”的大數(shù)據(jù)平臺(tái)體系總體架構(gòu),包括截止2018年完成了40個(gè)市級(jí)部門(mén)714類政務(wù)數(shù)據(jù)匯聚工作,涉及數(shù)據(jù)9.4億條,這是今年初北京2019年經(jīng)濟(jì)和信息化工作會(huì)上透露的。而在北京大數(shù)據(jù)平臺(tái)體系總體架構(gòu)中,城市大數(shù)據(jù)湖就是建立在北京政務(wù)云和網(wǎng)絡(luò)基礎(chǔ)設(shè)施之上的關(guān)鍵“地基”。
作為企業(yè)代表,招商銀行總行數(shù)據(jù)中心應(yīng)用與數(shù)據(jù)庫(kù)管理室經(jīng)理田永江介紹,目前招商銀行零售業(yè)務(wù)兩大APP的總用戶數(shù)超過(guò)1.4億、月活8000萬(wàn)+、承接客戶流量占比92%。隨著兩大APP全年365天每天都可能有新業(yè)務(wù)上線,用戶浪涌特征非常明顯,即事先難以估計(jì)客群訪問(wèn)量,對(duì)業(yè)務(wù)資源快速擴(kuò)展提出非常高的要求,大量業(yè)務(wù)數(shù)據(jù)也帶來(lái)了大數(shù)據(jù)決策需求。在關(guān)鍵的數(shù)據(jù)庫(kù)技術(shù)方面,由于現(xiàn)有的開(kāi)源數(shù)據(jù)庫(kù)內(nèi)核還達(dá)不到Oracle的性能和功能,并且會(huì)導(dǎo)致集群規(guī)模過(guò)大、性價(jià)比低、維護(hù)成本高,為此招商銀行與華為進(jìn)行分布式數(shù)據(jù)庫(kù)聯(lián)合創(chuàng)新,這就是前不久發(fā)布的華為GaussDB數(shù)據(jù)庫(kù)OLTP版本,由招商銀行負(fù)責(zé)需求和解決方案設(shè)計(jì),華為OLTP數(shù)據(jù)庫(kù)團(tuán)隊(duì)負(fù)責(zé)技術(shù)實(shí)現(xiàn)。
GaussDB OLTP數(shù)據(jù)庫(kù)在產(chǎn)品架構(gòu)上采取了三層架構(gòu)設(shè)計(jì),頂層是分布式擴(kuò)展層,中間層是企業(yè)級(jí)內(nèi)核層,能夠承載企業(yè)級(jí)業(yè)務(wù)的高性能以及通用數(shù)據(jù)庫(kù)能力,最底層是分布式存儲(chǔ)層,采用云存儲(chǔ)技術(shù),構(gòu)筑軟硬件垂直整合的高性能、高可用、Cloud Native云數(shù)據(jù)庫(kù)能力。GaussDB OLTP版本利用華為在數(shù)據(jù)庫(kù)領(lǐng)域的經(jīng)驗(yàn)進(jìn)行自主創(chuàng)新,基于新型硬件能力進(jìn)行基礎(chǔ)設(shè)施整合,實(shí)現(xiàn)云上部署和三高一低的總體目標(biāo)(高可用、高安全、高性能、低成本)。
招商銀行在數(shù)字技術(shù)領(lǐng)域的嘗試與互聯(lián)網(wǎng)金融企業(yè)的差異性在于,招商銀行是在非常嚴(yán)格的監(jiān)管以及為客戶負(fù)責(zé)的前提下進(jìn)行規(guī)劃實(shí)施,是在考慮了可用性、安全性和客戶體驗(yàn)的前提下,實(shí)現(xiàn)的高可用、高擴(kuò)展和高彈性。田永江強(qiáng)調(diào),GaussDB在一套系統(tǒng)里統(tǒng)一解決了高可用和容災(zāi)的所有問(wèn)題,而且具有自動(dòng)路由分布能力,運(yùn)維復(fù)雜度大幅降低。而此前,招商銀行已經(jīng)全面啟動(dòng)了基于華為FusionInsight HD的大數(shù)據(jù)云化服務(wù)化建設(shè),實(shí)現(xiàn)了大數(shù)據(jù)的異地存儲(chǔ)和容災(zāi);隨著各類業(yè)務(wù)快速發(fā)展,行內(nèi)群集數(shù)量快速增長(zhǎng),在精準(zhǔn)營(yíng)銷(xiāo)、客戶推薦、風(fēng)控管理經(jīng)營(yíng)決策數(shù)據(jù)分析等各個(gè)領(lǐng)域,發(fā)揮了大數(shù)據(jù)“發(fā)動(dòng)機(jī)”的作用。
(華為IT產(chǎn)品線副總裁、智能數(shù)據(jù)與存儲(chǔ)領(lǐng)域總裁周躍峰發(fā)布華為智能數(shù)據(jù)解決方案)
本次華為發(fā)布的FusionData智能數(shù)據(jù)解決方案,就是過(guò)去多年服務(wù)政企客戶需求和聯(lián)合創(chuàng)新以及自研技術(shù)創(chuàng)新的集大成的系統(tǒng)。FusionData智能數(shù)據(jù)解決方案支持智能的數(shù)據(jù)全生命周期管理,從三個(gè)層面重新定義數(shù)據(jù)基礎(chǔ)設(shè)施:
數(shù)據(jù)連接層面,智能數(shù)據(jù)連接部件ROMA支持多數(shù)據(jù)源接入、消息和API的統(tǒng)一管理、智能通道選擇等技術(shù)實(shí)現(xiàn)智能全連接并加速數(shù)據(jù)流動(dòng),特別是支持1100多種應(yīng)用和異構(gòu)數(shù)據(jù)源接入,通過(guò)開(kāi)放式數(shù)據(jù)接入框架可靈活接入第三方數(shù)據(jù)源;在數(shù)據(jù)處理層面,包含分布式存儲(chǔ)FusionStorage、分布式數(shù)據(jù)庫(kù)GaussDB和大數(shù)據(jù)平臺(tái)FusionInsight等,通過(guò)多類型數(shù)據(jù)融合存儲(chǔ)、融合分析引擎等技術(shù)實(shí)現(xiàn)從單一處理到智能融合處理,特別是通過(guò)存儲(chǔ)與計(jì)算分離技術(shù)打破系統(tǒng)煙囪式建設(shè),通過(guò)智能分布式存儲(chǔ)的多協(xié)議融合技術(shù)實(shí)現(xiàn)一份數(shù)據(jù)同時(shí)支持?jǐn)?shù)據(jù)庫(kù)、大數(shù)據(jù)、AI等多種業(yè)務(wù)的分析需求;在數(shù)據(jù)使能層面,智能數(shù)據(jù)使能部件DAYU通過(guò)智能元數(shù)據(jù)感知和OneQuery Turbo技術(shù)構(gòu)建數(shù)據(jù)處理與業(yè)務(wù)創(chuàng)新的橋梁,特別是通過(guò)AI技術(shù)自動(dòng)化智能化生成全局統(tǒng)一的數(shù)據(jù)視圖,實(shí)現(xiàn)多數(shù)據(jù)源、多類型數(shù)據(jù)的統(tǒng)一訪問(wèn)等。
華為EBG中國(guó)區(qū)總裁蔡英華表示“站在智能時(shí)代的入口,在堅(jiān)持‘被集成’的基礎(chǔ)上,華為企業(yè)業(yè)務(wù)通過(guò)‘無(wú)處不在的聯(lián)接+數(shù)字平臺(tái)+無(wú)所不及的智能’,致力于打造數(shù)字世界的底座。”而這樣一個(gè)數(shù)字世界的底座,向上支持應(yīng)用快速開(kāi)發(fā)、靈活部署,使能各行業(yè)業(yè)務(wù)敏捷創(chuàng)新;向下通過(guò)無(wú)處不在的聯(lián)接,做到云管端協(xié)同優(yōu)化,真正實(shí)現(xiàn)物理世界的數(shù)字化。
(華為EBG中國(guó)區(qū)總裁蔡英華致辭)
盡管FusionData為未來(lái)的“數(shù)據(jù)湖”世紀(jì)打下了技術(shù)底座基礎(chǔ),但“羅馬不是一天建成的”,走向“數(shù)據(jù)湖”之上的數(shù)字經(jīng)濟(jì)與數(shù)字社會(huì)也需要經(jīng)歷一步一步的轉(zhuǎn)型過(guò)程。而FusionData則是很好的新舊技術(shù)結(jié)合,截至目前,華為智能數(shù)據(jù)解決方案FusionData已經(jīng)應(yīng)用于全球60多個(gè)國(guó)家及地區(qū),服務(wù)于1500多個(gè)客戶,擁有500多家商業(yè)合作伙伴,并廣泛應(yīng)用于金融、運(yùn)營(yíng)商、政府、大企業(yè)等行業(yè)。
2019年6月6日,中國(guó)發(fā)放了首批5G商用牌照。專家認(rèn)為,5G將以全新網(wǎng)絡(luò)架構(gòu),數(shù)十倍于4G的峰值速率、毫秒級(jí)的傳輸時(shí)延和億萬(wàn)級(jí)的連接能力,開(kāi)啟萬(wàn)物泛在互聯(lián)、人機(jī)深度交互、智能引領(lǐng)變革的新征程。5G也將加深當(dāng)前的大數(shù)據(jù)和“數(shù)據(jù)洪荒”困境,而面向“數(shù)據(jù)湖”的FusionData智能數(shù)據(jù)解決方案發(fā)布,恰逢5G商用時(shí)代的開(kāi)始,無(wú)疑將成為“5G+大數(shù)據(jù)”的時(shí)代“地基”。