“開源”模式帶來的好處很多,其中最吸引人的就是可以幫助企業(yè)降低成本。另外,開源模式消除了供應(yīng)商的限制和壁壘,并且可讓技術(shù)變得更加協(xié)作,合作者會不斷更新開源軟件,使技術(shù)得到持續(xù)的完善和發(fā)展。云計算和大數(shù)據(jù)目前都是熱門話題,兩者的發(fā)展與開源技術(shù)的結(jié)合,及如何在云上實現(xiàn)大數(shù)據(jù)項目,都是新的實踐領(lǐng)域。
開源云計算現(xiàn)狀
云計算發(fā)展到今天,已經(jīng)成為企業(yè)IT基礎(chǔ)設(shè)施的主流選擇;以Docker為代表的Container技術(shù),也推動著云計算在PaaS層面的發(fā)展;而SaaS應(yīng)用更是方興未艾。云計算已經(jīng)從概念走向?qū)嶋H應(yīng)用,且將愈加促進信息化、工業(yè)化的整合進程。
敏捷、靈活、可定制,這是各大公司在解釋他們?yōu)槭裁赐顿Y云計算時最愛提到的三個詞。與此同時,當今領(lǐng)先的云供應(yīng)商雖然心中想著最佳的技術(shù)利益,但從財務(wù)權(quán)益方面來考慮,卻阻止他們提供開放的云環(huán)境。因此,在這個企業(yè)IT“云”化的過程中,開源技術(shù)正在成為未來的重要選擇。
開源云計算帶來的好處很多,其中最吸引人的就是可以幫助企業(yè)降低成本。另外,開源模式消除了供應(yīng)商的限制和壁壘,并且可讓技術(shù)變得更加協(xié)作,合作者會不斷更新開源軟件,使該技術(shù)得到持續(xù)的完善和發(fā)展。
有關(guān)開源云計算的系統(tǒng)、產(chǎn)品與服務(wù)正得到不斷地創(chuàng)新推出。以目前擁有最多傳統(tǒng)IT巨頭支持的云架構(gòu)開源項目OpenStack為例,在國內(nèi)外都受到了普遍關(guān)注。在OpenStack基金會發(fā)布的白皮書中顯示,OpenStack在實際生產(chǎn)環(huán)境的部署已得到大幅提升,并且在傳統(tǒng)行業(yè)的滲透已經(jīng)呈現(xiàn)規(guī)?;厔?,在制造業(yè)、能源、零售、醫(yī)療、交通、保險、媒體等行業(yè)長勢喜人。從全球用戶活躍度來看,歐洲和亞洲力量凸顯,中國用戶在其貢獻排行榜上居于前茅。
然而,任何事情都是一把雙刃劍,目前的開源云也同樣存在著明顯的缺點。比供應(yīng)商的獨立缺乏支持、開源云工具的支持問題有待進一步解決。另外,像OpenStack、Docker等時下流行的開源云計算應(yīng)用,都存在著技術(shù)成熟度欠缺、缺乏完整性等問題。
開源大數(shù)據(jù)現(xiàn)狀
移動互聯(lián)網(wǎng)、云計算等技術(shù)的快速水之土日,使全球數(shù)據(jù)量得到爆炸性增長,大數(shù)據(jù)時代已經(jīng)全面到來。從龐雜的數(shù)據(jù)背后挖掘、分析用戶的行為習(xí)慣和喜好,找出更符合用戶“口味”的產(chǎn)品和服務(wù),并結(jié)合用戶需求有針對性地調(diào)整和優(yōu)化自身,這就是大數(shù)據(jù)技術(shù)所帶來的巨大價值。
而面對龐大的業(yè)務(wù)、海量的數(shù)據(jù)都在不斷的增長,幾乎沒有任何一家傳統(tǒng)的商業(yè)方案能夠獨立解決這些業(yè)務(wù)。企業(yè)內(nèi)部的“合作”已經(jīng)成為局限,要想應(yīng)對這些,需要更多的力量,這無疑給開源模式帶來了新的機遇和挑戰(zhàn)。開源浪潮之所以風(fēng)生水起,是因為成本低、靈活性強,又有受過培訓(xùn)的人員,幫助使業(yè)更好地挖掘隱藏在大數(shù)據(jù)當中的價值。
Hadoop無疑是目前大數(shù)據(jù)領(lǐng)域中最熱的開源技術(shù),它承諾能夠降低成本同時獲得企業(yè)級的IT自由度。 Hadoop、R和NoSQL現(xiàn)在是許多企業(yè)制定的大數(shù)據(jù)戰(zhàn)略的三大支柱,無論這些戰(zhàn)略是管理非結(jié)構(gòu)化數(shù)據(jù),還是對非結(jié)構(gòu)化數(shù)據(jù)進行復(fù)雜的統(tǒng)計分析。這些開源技術(shù)平臺與專有軟件相比的一個優(yōu)勢就在于,于它們能夠更快速地改進。而且它們也得到許多不同機構(gòu)的不斷開發(fā)和完善。Hadoop已經(jīng)變得無處不在,EMC、戴爾、IBM、甚至微軟都已經(jīng)開始躋身Hadoop陣營。
大數(shù)據(jù)領(lǐng)域的另一位生力軍Spark現(xiàn)在也是名聲大噪,作為通用的并行處理框架,Spark具有類似Hadoop的一些優(yōu)點,而且Spak在迭代計算上具有比Hadoop更高的效率,還提供了更為廣泛的數(shù)據(jù)集操作類型的開發(fā)等等。眾多優(yōu)越的性能和比Hadoop更廣泛的適用面讓Spark的進一步發(fā)展值得期待。
結(jié)語
綜上所述,開源模式確實為企部和開發(fā)者署云環(huán)境創(chuàng)造了條件,推動了云技術(shù)的發(fā)展。但是,站在用戶的角度看,特別是不具備軟件開發(fā)、運維能力的傳統(tǒng)企業(yè),大規(guī)模采用開源云項目仍然存在一定的風(fēng)險。另外,開源的開放所帶來的一大弊端就是安全問題。也正是出于對這種風(fēng)險的考慮,目前有很多大數(shù)據(jù)項目都沒有放在云環(huán)境中運行。
但是,不管怎樣,云計算與大數(shù)據(jù)在應(yīng)用中產(chǎn)生的價值是有目共睹的,兩者之間的結(jié)合,遠比相互分離要好得多。而在選擇云計算及大數(shù)據(jù)的平臺時,企業(yè)一定要結(jié)合自己的實際情況和需求來選擇適合自己的云計算平臺,避免單純?yōu)榱碎_源、為了云而做出盲目的選擇。當然從長遠考慮,與開源想法搭起橋梁要比試圖對開源想法視若無明智得多。