亚洲午夜精品久久久久久性色,人妻互换精品无码专区黑

PostgreSQL中的大容量空間探索時間序列數據存儲

2018-10-24 03:10

Linux公社

姚佳靈編譯

歐洲航天局科學數據中心（the European Space Agency Science Data Center，簡稱ESDC）利用TimescaleDB擴展切換到用PostgreSQL來存儲他們的數據。ESDC的各種數據，包括結構化的、非結構化的和時間序列指標在內接近數...

歐洲航天局科學數據中心（the European Space Agency Science Data Center，簡稱ESDC）利用TimescaleDB擴展切換到用PostgreSQL來存儲他們的數據。ESDC的各種數據，包括結構化的、非結構化的和時間序列指標在內接近數百TB，還有使用開源工具查詢跨數據集的需求。

ESDC收集來自他們每一個空間任務的海量數據（每天的量以TB計算），并把這些數據提供給包括普通公眾在內的團隊使用。包括空間任務和衛(wèi)星的元數據，以及在空間任務執(zhí)行期間生成的數據，這些數據都可以是結構化的，也可以是非結構化的。生成的數據包括地理空間和時間序列數據。因為需要能夠使用現成的、開源工具來分析數據，所以在選擇數據存儲解決方案時，對數據集的交叉運用就成了一個需求項。團隊希望擺脫像Oracle和Sybase這樣的傳統(tǒng)系統(tǒng)。

因為PostgreSQL的成熟，以及對各種數據類型和非結構化數據的支持，ESDC團隊已經確定使用PostgreSQL。除了這些例行要求外，ESDC也需要存儲和處理地理空間和時間序列數據。地理空間數據是那些附有位置信息的數據，比如行星在天空中的位置。這必須在不使用不同類型或數據源的不同數據存儲的情況下完成。之所以決定遷移到PostgreSQL，是因為它支持這種處理的擴展機制。PostgreSQL針對JSON和全文本搜索有原生支持。PostGIS、pg_sphere和q3c擴展運行ESDC使用常規(guī)SQL來運行基于位置的查詢以及更專業(yè)的分析。

對于像太陽軌道器項目（the Solar Orbiter project）這樣的任務產生的時間序列數據，PostgreSQL還必須高效且可擴展地存儲它們。這對寫入速度要求很低，因為收集到的數據存儲在本地的衛(wèi)星上，“用于每天的地面站通行期間的稍后下行鏈路”，并分批次插入數據庫。但是，針對這個數據庫的查詢，必須支持結構化的數據類型、數據集之間的ad-hoc匹配和高達數百TB的大型數據集。

目前，還不清楚哪些特定的時間序列數據庫得到了評估，但是，該團隊沒有選擇其中任何一個，因為他們已經將SQL標準化為首選的查詢語言，并把PostgreSQL作為平臺，因為它滿足了他們的其他要求。過去有一些方法可以把時間序列數據存儲在PostgreSQL上。它最近的分區(qū)特性試圖解決這樣的問題：將大表索引保存在內存中，并在每次更新時將其寫入磁盤，方法是將表分割成更小的分區(qū)。當按時間進行分區(qū)時，分區(qū)也可以用于存儲時間序列數據，遵循著這些分區(qū)上的索引。ESDC存儲時間序列數據的時候，遇到了性能問題，于是轉而使用名為TimescaleDB的擴展。

TimescaleDB使用名為hypertable的抽象來隱藏跨多個維度（如時間和空間）的分區(qū)。每個hypertable被分成“塊（chunk）”，每個塊對應一個特定的時間間隔。塊的大小是一定的，因此，用于表索引的所有B樹結構都能夠在數據插入數據庫期間駐留內存，類似于PostgreSQL進行分區(qū)的方式。索引是根據時間和分區(qū)關鍵字自動產生的。可以針對任意“維度”進行查詢，就像其他時間序列數據庫允許針對標簽查詢一樣。

TimescaleDB和其他分區(qū)工具（如pg_partman）的區(qū)別之一是自動調整分區(qū)大小。盡管據報道，與基于PostgreSQL 10分區(qū)的解決方案和InfluxDB相比，TimescaleDB有更高的性能基準，但人們一直擔心可維護性。在撰寫本文時，TimescaleDB的集群部署仍處于開發(fā)階段。

原文作者：Hrishikesh Barua

THEEND

免責聲明：凡注明為其它來源的信息均轉自其它平臺，由網友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權負責。本網站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。若有來源標注錯誤或侵犯了您的合法權益，請作者持權屬證明與本站聯系，我們將及時更正、刪除，謝謝。聯系郵箱：xiali@infoobs.com

本月熱門

精選文章

為什么現代計算使用的是64位操作系統(tǒng)，而非32位？

12月13日
國家電網數字化轉型與數據安全實踐

2月16日
僵尸網絡無從對付？你需要這份指導指南

11月30日
2021第五屆中國軟件和信息服務業(yè)年度風云榜正式揭榜

1月18日
又一省聯社大數據平臺上線，神州信息“六合上甲”再獲大獎

4月11日
何翠芹：各行各業(yè)進入轉型快車道互聯網+成經濟轉型升級“助推器”

9月30日

熱點資訊

用谷歌Jump VR套件，讓觀眾成為藝術作品的一部分

PostgreSQL中的大容量空間探索時間序列數據存儲

2024 信息化觀察網

長按掃描二維碼閱讀原文

PostgreSQL中的大容量空間探索時間序列數據存儲

最新評論（評論僅代表用戶觀點）

數據管理：云技術還是數據中心？

“綠色算力”的3條途徑與5大發(fā)展趨勢

數據中心暖通系統(tǒng)建設交付關鍵路徑分析

數據中心現代化：升級舊數據中心以滿足當前和未來的業(yè)務需求

本月熱門

AI 原生時代，字節(jié)想要復刻第三次增長奇跡

2024 年預防網絡攻擊的 12 項網絡安全最佳實踐措施

2024年上半年中國云終端市場跟蹤報告：出貨量達到166.3萬臺，同比增長22.4%

從5G到6G：開啟無線通信的未來

DevSecOps建設標桿丨民生證券攜手懸鏡安全，共建敏捷安全開發(fā)體系

權威解答+圖解 | 《工業(yè)和信息化領域數據安全事件應急預案（試行）》

精選文章

為什么現代計算使用的是64位操作系統(tǒng)，而非32位？

國家電網數字化轉型與數據安全實踐

僵尸網絡無從對付？你需要這份指導指南

2021第五屆中國軟件和信息服務業(yè)年度風云榜正式揭榜

又一省聯社大數據平臺上線，神州信息“六合上甲”再獲大獎

何翠芹：各行各業(yè)進入轉型快車道互聯網+成經濟轉型升級“助推器”

熱點資訊

DevSecOps建設標桿丨民生證券攜手懸鏡安全，共建敏捷安全開發(fā)體系

ESIS 2024第三屆中國電子半導體數智峰會正式啟動，邀您共創(chuàng)電子半導體行業(yè)美好未來!

榮耀應用市場攜手數智融合應用伙伴共創(chuàng)綠色生態(tài)

“皇冠丹麥曲奇”勝訴 “藍罐曲奇”敗訴——市場競爭需遵守法律底線

什么是 OSI 模型？OSI 模型的七層是哪些？

用谷歌Jump VR套件，讓觀眾成為藝術作品的一部分

移動互聯網營銷的十大法則

PostgreSQL中的大容量空間探索時間序列數據存儲

最新評論（評論僅代表用戶觀點）

欄目推薦

數據管理：云技術還是數據中心？

“綠色算力”的3條途徑與5大發(fā)展趨勢

數據中心暖通系統(tǒng)建設交付關鍵路徑分析

數據中心現代化：升級舊數據中心以滿足當前和未來的業(yè)務需求

本月熱門

精選文章

熱點資訊

用谷歌Jump VR套件，讓觀眾成為藝術作品的一部分

移動互聯網營銷的十大法則

數據管理：云技術還是數據中心？

用谷歌Jump VR套件，讓觀眾成為藝術作品的一部分