高可用（Thanos）+ 分级告警 + Recording Rules

张开发

• 2026/6/19 12:31:55 • 15 分钟阅读

分享文章

在 Prometheus 生产环境进阶中，Thanos（高可用）+ 分级告警 + Recording Rules是构建企业级可观测性平台的三大支柱。它们分别解决：数据持久化与全局视图、告警治理、查询性能优化。下面逐一深入解析。一、Thanos：将 Prometheus 升级为企业级高可用架构原生 Prometheus 存在三大痛点：单点故障、数据本地存储无法长期保留、多集群无法统一查询。Thanos 通过云原生架构完美解决了这些问题。1.1 核心组件与工作原理Thanos 采用无侵入式设计，直接扩展 Prometheus 的能力，无需修改现有配置：组件部署位置核心职责Sidecar与 Prometheus 同 Pod① 将本地数据上传至对象存储（S3/MinIO）；② 暴露 gRPC 接口供查询Store Gateway独立 Deployment从对象存储读取历史数据，实现长期存储查询Query独立 Deployment全局查询入口，聚合 Sidecar（实时）+ Store（历史）数据，自动去重Compactor独立 Deployment① 压缩数据块；②降采样（Downsampling）：将原始数据聚合为 5m/1h 粒度，大幅降低存储成本1.2 高可用核心机制1. 数据冗余与持久化每个 Prometheus 实例独立采集数据，通过 Sidecar 上传到对象存储（如 AWS S3、MinIO）对象存储具备11 个 9 的持久性，即使整个 K8s 集群崩溃，历史数据依然安全多副本 Prometheus（≥2 实例）+ 反亲和性部署，避免单点故障2. 全局查询与数据去重Thanos Query 提供统一查询入口，屏蔽底层多 Prometheus 实例的复杂性自动去重：通过prometheus_replica标签识别重复数据，Query 返回唯一结果3. 长期存储与成本优化Compactor 的降采样策略是核心成本控制手段：数据粒度保留时长用途

更多文章

前端开发 2026/6/19 12:26:08

Windows用户必备：一键解决苹果设备驱动安装难题

Windows用户必备：一键解决苹果设备驱动安装难题【免费下载链接】Apple-Mobile-Drivers-Installer Powershell script to easily install Apple USB and Mobile Device Ethernet (USB Tethering) drivers on Windows! 项目地址: https://gitcode.com/gh_mirrors/a…

张开发

前端开发 2026/6/19 13:47:33

雷达信号处理必看：如何通过模糊度图判断目标分辨能力？

雷达信号处理实战：从模糊度图解析目标分辨能力的核心逻辑雷达工程师们常遇到一个经典难题：当两个目标在距离或速度上非常接近时，如何确保系统能准确分辨它们？这个问题的答案，很大程度上隐藏在模糊度图的等高线里。不同…

张开发

前端开发 2026/6/19 13:50:49

STDF-Viewer架构解密：半导体测试数据可视化的高性能技术实现

STDF-Viewer架构解密：半导体测试数据可视化的高性能技术实现【免费下载链接】STDF-Viewer A free GUI tool to visualize STDF (semiconductor Standard Test Data Format) data files. 项目地址: https://gitcode.com/gh_mirrors/st/STDF-Viewer 在半导体制…

张开发

前端开发 2026/6/14 17:23:25

Phi-3-mini-128k-instruct效果展示：自动生成软件测试用例与面试题答案

Phi-3-mini-128k-instruct效果展示：自动生成软件测试用例与面试题答案最近在软件测试社区里，有个话题讨论得挺热闹：有没有什么工具能帮我们快速搞定那些繁琐的测试用例设计，或者整理出一份像样的面试题答案？毕竟&…

张开发

前端开发 2026/6/19 13:54:26

Vue 项目实战：基于 vxe-table 的动态高度虚拟滚动表格性能调优与避坑指南

1. 为什么需要动态高度虚拟滚动表格在开发后台管理系统或者数据展示平台时，我们经常会遇到需要展示大量数据的场景。传统的表格渲染方式在面对上万条数据时，浏览器会直接卡死，因为DOM节点实在太多了。我自己就遇到过这样的坑，当时…

张开发

前端开发 2026/6/19 13:51:36

TP4552B低功耗 5V 常开的锂电池充放电解决方案

概述 TP4552B 是一款集成线性充电管理、同步升压转换、电池电量指示和多种保护功能的单芯片电源管理 SOC，为锂电池的充放电提供完整的单芯片电源解决方案。 TP4552B 内部集成了线性充电管理模块、同步升压放电管理模块、电量检测与 LED 指示模块、保护模块。TP4552B…

张开发

前端开发 2026/6/14 17:23:26

123云盘VIP解锁脚本：三步实现高速下载权限

123云盘VIP解锁脚本：三步实现高速下载权限【免费下载链接】123pan_unlock 基于油猴的123云盘解锁脚本，支持解锁123云盘下载功能项目地址: https://gitcode.com/gh_mirrors/12/123pan_unlock 123云盘VIP解锁脚本是一款基于油猴的实用工具&#x…

张开发

前端开发 2026/6/19 13:53:21

AtlasOS兼容性终极指南：避开版本陷阱的实战解决方案

AtlasOS兼容性终极指南：避开版本陷阱的实战解决方案【免费下载链接】Atlas 🚀 An open and lightweight modification to Windows, designed to optimize performance, privacy and usability. 项目地址: https://gitcode.com/GitHub_Trending/atlas1…

张开发

前端开发 2026/6/19 13:42:51

PyTorch 2.8镜像多场景落地：制造业设备故障预测时序模型训练平台建设

PyTorch 2.8镜像多场景落地：制造业设备故障预测时序模型训练平台建设 1. 制造业设备预测性维护的挑战在制造业生产线上，设备故障往往会导致严重的生产中断和经济损失。传统基于阈值的报警系统存在两个主要问题：一是误报率高，二…

张开发

前端开发 2026/6/19 13:49:30

Qwen3.5-9B-AWQ-4bit图文对话实战：医疗检验单识别+异常指标中文解读

Qwen3.5-9B-AWQ-4bit图文对话实战：医疗检验单识别异常指标中文解读 1. 医疗场景下的图文对话需求在医疗健康领域，检验报告单是医生诊断的重要依据。然而对于普通患者来说，这些充满专业术语和数值指标的检验单往往难以理解。传统方式需要等…

张开发

前端开发 2026/6/14 17:23:28

5分钟上手RVC：用AI技术轻松实现专业级语音转换

5分钟上手RVC：用AI技术轻松实现专业级语音转换【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrieval-based-Voice-Conversion-Web…

张开发

前端开发 2026/6/14 17:23:29

LION：基于分层潜在点扩散模型的3D形状生成艺术实践

1. LION模型如何革新3D数字艺术创作第一次看到LION生成的3D模型时，我正为一个游戏项目寻找高质量的角色资产。传统建模软件需要数天才能完成的复杂生物造型，LION在几分钟内就给出了令人惊艳的初稿。这个基于分层潜在点扩散模型的技术，正在彻…

张开发

高可用（Thanos）+ 分级告警 + Recording Rules

最新文章

FPGA异步FIFO读写位宽转换实战：从8bit到32bit的数据拼接与拆分（Vivado+Modelsim）

从图像模糊到语音识别：卷积在AI中的实战应用与Python代码示例

车载OTA升级中Docker层缓存失效导致回滚失败？3步构建可复现、可签名、可审计的分层镜像流水线（含Sigstore+Notary v2集成）

盛合晶微科创板上市，开盘市值近1858亿，无锡国资投资回报率超600%

如何用AI大模型技术一键批量生成和发布短视频？MoneyPrinterPlus全攻略

一张“网”如何拯救生命？浅谈医疗系统集成平台iPaaS

推荐文章

相关文章

分享文章

更多文章

Windows用户必备：一键解决苹果设备驱动安装难题

雷达信号处理必看：如何通过模糊度图判断目标分辨能力？

STDF-Viewer架构解密：半导体测试数据可视化的高性能技术实现

Phi-3-mini-128k-instruct效果展示：自动生成软件测试用例与面试题答案

Vue 项目实战：基于 vxe-table 的动态高度虚拟滚动表格性能调优与避坑指南

TP4552B低功耗 5V 常开的锂电池充放电解决方案

123云盘VIP解锁脚本：三步实现高速下载权限

AtlasOS兼容性终极指南：避开版本陷阱的实战解决方案

PyTorch 2.8镜像多场景落地：制造业设备故障预测时序模型训练平台建设

Qwen3.5-9B-AWQ-4bit图文对话实战：医疗检验单识别+异常指标中文解读

5分钟上手RVC：用AI技术轻松实现专业级语音转换

LION：基于分层潜在点扩散模型的3D形状生成艺术实践