為了成為一名出色的大數(shù)據(jù)架構(gòu)師,首先必須成為一名數(shù)據(jù)架構(gòu)師,但這兩種角色的職責(zé)各有不同。
數(shù)據(jù)分為結(jié)構(gòu)化和非結(jié)構(gòu)化兩種。盡管大數(shù)據(jù)為各種規(guī)模的組織提供了許多洞察和分析的機(jī)會,但處理起來非常困難,并且需要一系列的特定技能。
大數(shù)據(jù)由大數(shù)據(jù)架構(gòu)師處理,這是一個(gè)非常專業(yè)的職位。很多組織需要大數(shù)據(jù)架構(gòu)師采用數(shù)據(jù)技術(shù)Hadoop分析數(shù)據(jù)來解決重大的問題。
大數(shù)據(jù)架構(gòu)師需要大規(guī)模處理數(shù)據(jù)庫并分析數(shù)據(jù),以便幫助組織做出正確的業(yè)務(wù)決策。具有這種才能的架構(gòu)師需要成為一支強(qiáng)大團(tuán)隊(duì)的領(lǐng)導(dǎo)者。他應(yīng)該具有指導(dǎo)團(tuán)隊(duì)成員工作并與不同的團(tuán)隊(duì)合作的能力。對于他們而言,與各種組織和供應(yīng)商建立良好的合作關(guān)系也至關(guān)重要。
從事大數(shù)據(jù)架構(gòu)師工作所需的6種技能
成為大數(shù)據(jù)架構(gòu)師需要多年的學(xué)習(xí)培訓(xùn),需要具有廣泛的能力,而這些能力會隨著領(lǐng)域的發(fā)展而增長。大數(shù)據(jù)架構(gòu)師需要具備以下6種技能:
(1)數(shù)據(jù)分析的決策權(quán),應(yīng)具備采用大數(shù)據(jù)技術(shù)分析海量數(shù)據(jù)的能力。
(2)應(yīng)該了解機(jī)器學(xué)習(xí)技術(shù),因?yàn)檫@是至關(guān)重要的知識。還要具有模式識別、處理數(shù)據(jù)的聚類以及文本挖掘等能力。
(3)大數(shù)據(jù)架構(gòu)師應(yīng)該對編程語言和所有最新技術(shù)有濃厚的興趣和經(jīng)驗(yàn)。了解所有類型的JavaScript框架,如HTML5、RESTful服務(wù)、Spark、Python、Hive、Kafka和CSS都是必不可少的框架。
(4)大數(shù)據(jù)架構(gòu)師應(yīng)具備必要的知識和經(jīng)驗(yàn),以處理最新的數(shù)據(jù)技術(shù),例如Hadoop、MapReduce、HBase、oozie、Flume、MongoDB、Cassandra和Pig。
(5)應(yīng)該知道如何更好在云計(jì)算環(huán)境中工作,并且具有云計(jì)算的經(jīng)驗(yàn)和知識。
(6)在數(shù)據(jù)倉庫和挖掘方面具有豐富的經(jīng)驗(yàn)。
大數(shù)據(jù)架構(gòu)師有哪些特殊要求?
對于大數(shù)據(jù)架構(gòu)師特定的工作要求是:
理解和溝通大數(shù)據(jù)獲得業(yè)務(wù)的方式的能力。
能夠處理各種各樣的數(shù)據(jù),這些數(shù)據(jù)非常龐大,而且可能來自各種來源。
具備大數(shù)據(jù)工具和技術(shù)方面的技能,其中包括Hadoop、accumulo、MapReduce、Hive、HBase、panoply和redshift等技術(shù)。
大數(shù)據(jù)架構(gòu)師必須在很多方面都很出色,并需要具有設(shè)計(jì)和實(shí)施的經(jīng)驗(yàn)。
通過培訓(xùn)成為大數(shù)據(jù)架構(gòu)師
為了成為一名優(yōu)秀的大數(shù)據(jù)架構(gòu)師,需要首先成為一名出色的數(shù)據(jù)架構(gòu)師,但這兩者的工作內(nèi)容是不同的。數(shù)據(jù)架構(gòu)師主要是創(chuàng)建與管理系統(tǒng)相關(guān)藍(lán)圖,而大數(shù)據(jù)架構(gòu)師需要設(shè)計(jì)、集中、集成和保護(hù)組織的數(shù)據(jù)源。