亚州中文字幕,亚洲中文无码不卡在线观看

基于HBase的工業(yè)大數(shù)據(jù)存儲(chǔ)實(shí)戰(zhàn)

2018-12-27 11:05

快資訊

為了你詩(shī)情畫(huà)意

HBase是一個(gè)高可靠性、高性能、面向列、可伸縮的分布式存儲(chǔ)系統(tǒng)，利用HBase技術(shù)可在廉價(jià)PC Server上搭建起大規(guī)模結(jié)構(gòu)化存儲(chǔ)集群。

隨著工業(yè)4.0時(shí)代的到來(lái)，工業(yè)互聯(lián)網(wǎng)和企業(yè)的智能化、信息化都將不斷推進(jìn)，傳統(tǒng)的工業(yè)實(shí)時(shí)數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)已經(jīng)難以完全勝任工業(yè)大數(shù)據(jù)的存儲(chǔ)，

了解HBase

與傳統(tǒng)數(shù)據(jù)庫(kù)的相比，

（1）線性擴(kuò)展，隨著數(shù)據(jù)量增多可以通過(guò)節(jié)點(diǎn)擴(kuò)展進(jìn)行支撐；

（2）數(shù)據(jù)存儲(chǔ)在hdfs上，備份機(jī)制健全；

（3）通過(guò)zookeeper協(xié)調(diào)查找數(shù)據(jù)，訪問(wèn)速度快。

HBase實(shí)戰(zhàn)案例

為了更好的介紹HBase在人工智能場(chǎng)景下的使用，下面我們

目前，該公司的業(yè)務(wù)場(chǎng)景里面有很多面板相關(guān)的特征數(shù)據(jù)，每張面板數(shù)據(jù)大概3.2k。這些面板數(shù)據(jù)又被分成很多組，每個(gè)面板特征屬于某個(gè)組。組和面板的數(shù)據(jù)分布如下：

——43%左右的組含有1張面板數(shù)據(jù)；

——47%左右的組含有2~9張面板數(shù)據(jù)；

——其余的組面板數(shù)范圍為10~10000張。

現(xiàn)在的業(yè)務(wù)需求主要有以下兩類：

——根據(jù)組的id查找該組下面的所有面板數(shù)據(jù)；

——根據(jù)組id+面板id查找某個(gè)面板的具體數(shù)據(jù)。

原有方案：MySQL+OSS

之前業(yè)務(wù)數(shù)據(jù)量比較小的情況使用的存儲(chǔ)主要為MySQL以及OSS(對(duì)象存儲(chǔ))。相關(guān)表主要有面板組表group和面板表face。表的格式如下：

因?yàn)槊總€(gè)面板組包含的玻璃特征數(shù)相差很大(1~10000)，所以基于上面的表設(shè)計(jì)，我們需要

我們?nèi)绻枰鶕?jù)面板組id查找該組下面的所有面板，那么需要從MySQL中讀取很多行的數(shù)據(jù)，從中獲取到組和面板對(duì)應(yīng)的關(guān)系，然后到OSS里面根據(jù)面板id獲取所有相關(guān)的特征數(shù)據(jù)。

這樣的查詢導(dǎo)致鏈路非常長(zhǎng)。從上面的設(shè)計(jì)可看出，如果查詢的組包含的面板張數(shù)比較多的情況下，那么我們需要從MySQL里面掃描很多行，然后再?gòu)腛SS里面拿到這些特征數(shù)據(jù)，

HBase解決方案：

針對(duì)這兩個(gè)問(wèn)題，格創(chuàng)東智的大數(shù)據(jù)團(tuán)隊(duì)進(jìn)行了分析，認(rèn)為這是

——HBase擁有動(dòng)態(tài)列的特性，支持萬(wàn)億行，百萬(wàn)列；

——HBase支持多版本，所有的修改都會(huì)記錄在HBase中；

——HBase 2.0引入了MOB(Medium-Sized Object)特性，支持小文件存儲(chǔ)。

HBase的MOB特性針對(duì)文件大小在1k~10MB范圍的，比如圖片，短視頻，文檔等，具有低延遲，讀寫(xiě)強(qiáng)一致，檢索能力強(qiáng)，水平易擴(kuò)展等關(guān)鍵能力。

上面我們創(chuàng)建了名為glass的表，IS_MOB屬性說(shuō)明列簇c將啟用MOB特性，MOB_THRESHOLD是MOB文件大小的閾值，單位是字節(jié)，這里的設(shè)置說(shuō)明文件大于2k的列都當(dāng)做小文件存儲(chǔ)。大家可能注意到上面原始方案中采用了OSS對(duì)象存儲(chǔ)，那我們?yōu)槭裁床恢苯邮褂肙SS存儲(chǔ)面板特征數(shù)據(jù)呢，如果有這個(gè)疑問(wèn)，可以看看下面表的性能測(cè)試：

String CF_DEFAULT="c";根據(jù)上面的對(duì)比，使用HBase MOB特性來(lái)存儲(chǔ)小于10MB的對(duì)象相比直接使用對(duì)象存儲(chǔ)有一些優(yōu)勢(shì)。

我們現(xiàn)在來(lái)看看具體的表設(shè)計(jì)，使用面板id作為列名。我們只使用了HBase的一張表就替換了之前方面的三張表！雖然我們啟用了MOB，但是具體插入的方法和正常使用一樣，代碼片段如下：

Put put=new Put(groupId.getBytes());

用戶如果需要根據(jù)面板組id獲取所有面板數(shù)據(jù)，可以使用下面方法：

這樣我們可以拿到某個(gè)組id對(duì)應(yīng)的所有面板數(shù)據(jù)。如果需要根據(jù)組id+面板id查找某個(gè)面板的具體數(shù)據(jù)，看可以使用下面方法：

經(jīng)過(guò)上面的改造，在2臺(tái)HBaseWorker節(jié)點(diǎn)內(nèi)存為32GB，核數(shù)為8，每個(gè)節(jié)點(diǎn)掛載四塊大小為250GB的SSD磁盤，并寫(xiě)入100W行，每行有1W列，讀取一行的時(shí)間在100ms-500毫秒左右。在每行有1000個(gè)face的情況下，讀取一行的時(shí)間基本在20-50毫秒左右，相比之前的10秒提升200~500倍。

從下面這張對(duì)比表，我們可以清楚的看到

現(xiàn)在，我們已經(jīng)將面板特征數(shù)據(jù)存儲(chǔ)在Cloudera HBase之中，這個(gè)只是數(shù)據(jù)應(yīng)用的第一步，如何將隱藏在這些數(shù)據(jù)背后的價(jià)值發(fā)揮出來(lái)？這就得

THEEND

免責(zé)聲明：凡注明為其它來(lái)源的信息均轉(zhuǎn)自其它平臺(tái)，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對(duì)此類作品本站僅提供交流平臺(tái)，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益，請(qǐng)作者持權(quán)屬證明與本站聯(lián)系，我們將及時(shí)更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點(diǎn)資訊

美國(guó)巴士公司FlixBus與Pico合作推出世界首個(gè)長(zhǎng)途大巴VR體驗(yàn)

基于HBase的工業(yè)大數(shù)據(jù)存儲(chǔ)實(shí)戰(zhàn)

2024 信息化觀察網(wǎng)

長(zhǎng)按掃描二維碼閱讀原文

基于HBase的工業(yè)大數(shù)據(jù)存儲(chǔ)實(shí)戰(zhàn)

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

數(shù)據(jù)劇增，安全受威脅元宇宙存儲(chǔ)將何去何從

Dev 無(wú)視 CVE 嚴(yán)重性，將其 GitHub 存儲(chǔ)庫(kù)設(shè)為只讀

湖北省新發(fā)布公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)管理辦法，不同在哪？

云環(huán)境下的存儲(chǔ)架構(gòu)選擇和存儲(chǔ)服務(wù)化實(shí)現(xiàn)

本月熱門

AI 原生時(shí)代，字節(jié)想要復(fù)刻第三次增長(zhǎng)奇跡

2024 年預(yù)防網(wǎng)絡(luò)攻擊的 12 項(xiàng)網(wǎng)絡(luò)安全最佳實(shí)踐措施

從5G到6G：開(kāi)啟無(wú)線通信的未來(lái)

2024年上半年中國(guó)云終端市場(chǎng)跟蹤報(bào)告：出貨量達(dá)到166.3萬(wàn)臺(tái)，同比增長(zhǎng)22.4%

DevSecOps建設(shè)標(biāo)桿丨民生證券攜手懸鏡安全，共建敏捷安全開(kāi)發(fā)體系

ESIS 2024第三屆中國(guó)電子半導(dǎo)體數(shù)智峰會(huì)正式啟動(dòng)，邀您共創(chuàng)電子半導(dǎo)體行業(yè)美好未來(lái)!

精選文章

Arm推出Cortex-A65AE芯片帶來(lái)更安全的自動(dòng)駕駛體驗(yàn)

2023光合組織解決方案大賽

聚焦等保2.0時(shí)代的政務(wù)安全首屆中國(guó)電子政務(wù)安全大會(huì)將于10月在京開(kāi)幕

亞馬遜云科技與博泰車聯(lián)網(wǎng)開(kāi)啟戰(zhàn)略合作

QuestMobile 2023中國(guó)移動(dòng)互聯(lián)網(wǎng)秋季大報(bào)告：全網(wǎng)用戶穩(wěn)定增長(zhǎng)，三大特點(diǎn)支撐回暖，00后與60后持續(xù)增長(zhǎng)

黑科技!加州理工學(xué)院團(tuán)隊(duì)利用AR為盲人提供空間語(yǔ)音導(dǎo)航

熱點(diǎn)資訊

電子檔案檔案數(shù)據(jù)離線光盤刻錄歸檔長(zhǎng)期保存方案

走進(jìn)智能工廠，見(jiàn)證卓越智造的力量

美妝界的數(shù)字化奇跡：漠小曼的電商轉(zhuǎn)型與國(guó)潮崛起

2024 數(shù)智化創(chuàng)新應(yīng)用技術(shù)大會(huì) | 一號(hào)邀請(qǐng)

SRM趨勢(shì)洞察：供應(yīng)商關(guān)系管理將走向何方？

美國(guó)巴士公司FlixBus與Pico合作推出世界首個(gè)長(zhǎng)途大巴VR體驗(yàn)

中國(guó)駐比利時(shí)使館推出移動(dòng)支付領(lǐng)事收費(fèi)服務(wù)

基于HBase的工業(yè)大數(shù)據(jù)存儲(chǔ)實(shí)戰(zhàn)

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

欄目推薦

數(shù)據(jù)劇增，安全受威脅 元宇宙存儲(chǔ)將何去何從

Dev 無(wú)視 CVE 嚴(yán)重性，將其 GitHub 存儲(chǔ)庫(kù)設(shè)為只讀

湖北省新發(fā)布公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)管理辦法，不同在哪？

云環(huán)境下的存儲(chǔ)架構(gòu)選擇和存儲(chǔ)服務(wù)化實(shí)現(xiàn)

本月熱門

精選文章

熱點(diǎn)資訊

美國(guó)巴士公司FlixBus與Pico合作 推出世界首個(gè)長(zhǎng)途大巴VR體驗(yàn)

中國(guó)駐比利時(shí)使館推出移動(dòng)支付領(lǐng)事收費(fèi)服務(wù)

數(shù)據(jù)劇增，安全受威脅元宇宙存儲(chǔ)將何去何從

湖北省新發(fā)布公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)管理辦法，不同在哪？

美國(guó)巴士公司FlixBus與Pico合作推出世界首個(gè)長(zhǎng)途大巴VR體驗(yàn)