搜索 - java技术圈 - java技术社区

关于时序数据库的一些思考

前言其实我之前是不太了解时序数据库以及它相关的机制的，只是大概知晓它的用途。但因为公司的业务需求，我意外参与并主导了公司内部开源时序数据库influxdb的引擎改造，所以我也就顺理成章的成为时序数据库“从业者”。造飞机的人需要时刻理解开飞机的人的需求。我不算时序数据库的使用者，但我想站在用户的角度去思考，他们需要一款怎样的“时序数据库”，我司的influxdb的第一阶段改造已经完成，所以我写下这篇文章，总结一下自己在开发中的一些思考与想法。也许有些地方还不够成熟，但胜在人会慢慢进步。正文一、几款优秀的时序数据库Prometheus、Influxdb和opentsdb是三款业内比较知名且实际生产使用的时序数据库了，总的来说三款各有优缺点，这里不谈它们的性能，主要谈谈使用和生态。Influxdb...阅读全文

博文 2020-11-03 08:12:52 知乎

阅读:3911次评论:0条 0人喜欢

时序数据库技术体系－时序数据存储模型设计 – 有态度的HBase/Spark/BigData

时序数据库技术体系中一个非常重要的技术点是时序数据模型设计，不同的时序系统有不同的设计模式，不同的设计模式对时序数据的读写性能、数据压缩效率等各个方面都有不同程度的影响。这篇文章笔者将会分别针对OpenTSDB、Druid、InfluxDB以及Beringei这四个时序系统中的时序数据模型设计进行介绍。在详细介绍时序数据模型之前，还是有必要简单回顾一下时序数据的几个基本概念，如下图所示：上图是一个典型的时序数据示意图，由图中可以看出，时序数据由两个维度坐标来表示，横坐标表示时间轴，随着时间的不断流逝，数据也会源源不断地吐出来；和横坐标不同，纵坐标由两种元素构成，分别是数据源和metric，数据源由一系列的标签（tag，也称为维度）唯一表示，图中数据源是一个广告数据源，这个数据源由publ...阅读全文

博文 2022-04-15 07:21:46 hbasefly.com

阅读:2984次评论:0条 0人喜欢

OpenTSDB 数据存储详解

本文首发于 vivo互联网技术微信公众号链接： https://mp.weixin.qq.com/s/qayKiwk5QAIWI7-nyD3FVA作者：DuZhimin随着互联网、尤其是物联网的发展，我们需要把各种类型的终端实时监测、检查与分析设备所采集、产生的数据记录下来，在有时间的坐标中将这些数据连点成线，往过去看可以做成多纬度报表，揭示其趋势性、规律性、异常性;往未来看可以做大数据分析，机器学习，实现预测和预警。这些数据的典型特点是：产生频率快（每一个监测点一秒钟内可产生多条数据）、严重依赖于采集时间（每一条数据均要求对应唯一的时间）、测点多信息量大（实时监测系统均有成千上万的监测点，监测点每秒钟都产生数据，每天产生几十GB的数据量）。基于时间序列数据的特点，关系型数据库无法满足对时...阅读全文

博文 2023-05-11 08:18:32 知乎

阅读:2077次评论:0条 0人喜欢

InfluxDB基本概念和操作 - shhnwangjian

InfluxDB基本概念 1、数据格式在 InfluxDB 中，我们可以粗略的将要存入的一条数据看作一个虚拟的 key 和其对应的 value(field value)。格式如下： cpu_usage,host=server01,region=us-west value=0.64 1434055562000000000 虚拟的 key 包括以下几个部分： database, retention policy, measurement, tag sets, field name, timestamp。 database: 数据库名，在 InfluxDB 中可以创建多个数据库，不同数据库中的数据文件是隔离存放的，存放在磁盘上的不同目录。 retention policy: 存储策略，用于设置数...阅读全文

博文 2024-03-22 10:48:56 博客园

阅读:1777次评论:0条 0人喜欢

饿了么轻量级分布式时序数据库的设计与探索

饿了么轻量级分布式时序数据库的设计与探索 2018-07-19 10:14 作者介绍黄杰，2015年加入饿了么，现任框架工具部高级开发经理，主要负责饿了么的监控系统及监控系统周边的工具。一、背景饿了么对时序数据库的需求主要来自各监控系统，主要用于存储监控指标。原来使用的是graphite，后来慢慢对指标有了多维的需求，主要体现在对一个指标加多个Tag来组成Series，然后对Tag进行Filter和Group进行计算，这时graphite基本很难满足需求。业界现在用的比较多的主要有如下几类TSDB： InfluxDB：很多公司都在用，包括饿了么有部分监控系统也是用的InfluxDB。其优点在于支持多维和多字段，存储也根据TSDB的特点做了优化，不过开源的部分并不支持。很多公司自己做集...阅读全文

博文 2024-09-06 15:21:49 www.sohu.com

阅读:1771次评论:0条 0人喜欢

手把手教你编写自定义Categraf插件

本文分享自天翼云开发者社区《手把手教你编写自定义Categraf插件》，作者：任****佳Categraf 是一个监控采集 Agent，类似 Telegraf、Grafana-Agent、Datadog-Agent，希望对所有常见监控对象提供监控数据采集能力，采用 All-in-one 的设计，不但支持指标采集，也希望支持日志和调用链路的数据采集。相比于其他采集器，Categraf 的优势在于：支持 remote_write 写入协议，支持将数据写入 promethues、M3DB、VictoriaMetrics、InfluxDB；指标数据只采集数值，不采集字符串，标签维持稳态结构；采用 all-in-one 的设计，所有的采集工作用一个 agent搞定；未来也可以把日志和 trace 的采...阅读全文

博文 2024-11-05 16:17:50 Tianyiyun

阅读:1735次评论:0条 0人喜欢

6大数据库，挖掘7种业务场景的存储更优解

6大数据库，挖掘7种业务场景的存储更优解获课：97java.xyz/898/获取ZY↑↑方打开链接↑↑6 大数据库，挖掘 7 种业务场景的存储更优解在数字化浪潮中，数据呈爆炸式增长，如何高效存储和管理数据成为企业发展的关键。不同的业务场景对数据存储有着不同的需求，而当下主流的 6 大数据库在各自擅长的领域展现出独特优势，为 7 种常见业务场景提供了存储更优解。一、6 大数据库概述关系型数据库（如 MySQL、Oracle）：基于关系模型，以表格形式存储数据，具有严格的表结构和数据完整性约束，擅长处理结构化数据，支持复杂的 SQL 查询，确保数据的一致性和可靠性。非关系型数据库 - NoSQL文档型数据库（如 MongoDB）：以文档形式存储数据，通常使用 JSON 或类似格式，数据结构灵活，...阅读全文

博文 2025-02-12 13:01:14 zsdsz

阅读:1347次评论:0条 0人喜欢

分布式时序数据库 - LinDB

背景饿了么对时序数据库的需求主要来自各监控系统，主要用于存储监控指标。原来使用graphite，后来慢慢有对指标有多维的需求(主要体现在对一个指标加多个Tag，来组成Series，然后对Tag进行Filter和Group进行计算)，这时graphite基本很难满足需求。业界现在用的比较多的主要有如下几类TSDB：InfluxDB：很多公司都在用，包括饿了么有部分监控系统也是用InfluxDB。优点，支持多维和多字段，存储也根据TSDB的特点做了优化。但开源的部分不支持，很多公司自己做集群化，但大多基于指标名来，这样会有单指的热点问题。现在饿了么也是类似的做法，但热点问题很严重，大的指标已经用了最好的服务器，但是查询性能还是不够理想，如果做成按Series Sharding那成本还是有一...阅读全文

博文 2023-04-19 07:41:25 知乎

阅读:836次评论:0条 0人喜欢

最新评论