构建完整云上指标监控体系
可观测监控 Prometheus 版作为云原生指标监控平台,完整兼容 Prometheus 开源生态,为运维工程师、SRE工程师等不同角色提供一站式指标观测平台,满足业务自定义监控 / 应用组件监控 / 云服务监控 / 容器监控 / 系统监控等场景的监控、告警需求。
更优性能
数据采集性能较开源版本提升 20 倍,支持长时间区间数据秒级查询及全局聚合查询。
更低成本
全托管式服务,运维成本降低 90%,按指标量计费,更提供大量免费指标。
更高可用性
支持采集多副本横向扩展,云端分布式存储保障数据可靠性。
产品功能
专精容器延展至全栈观测,打造一体化指标观测大盘
覆盖业务监控/应用组件监控/云服务监控/容器监控/系统监控
系统层指标观测
如 CPU、内存、磁盘、I/O 等基础指标
多云、多集群指标观测
如阿里云集群容器集群、ECS 集群、非阿里云集群等
容器层指标观测
与阿里云容器服务 ACK 深度集成,基础指标免费
云服务指标观测
如数据库、消息队列、微服务、存储等云服务
应用组件层(自建)指标观测
如中间件、数据库、消息队列等自建应用组件
应用性能指标观测
与 ARMS 应用监控/前端监控深度集成,并支持 OpenTelemetry 标准
业务自定义指标观测
如成交率、下单率、用户打开率等自定义指标
Grafana 看板增强
一键接入各种监控大盘与告警
预置常见云服务、应用组件看板模板
提供各种云服务的数据源配置及预置大盘,实现各种可观测数据的统一展示
Grafana 插件自由扩展
通过 Grafana 官方自由增加新插件,添加新的可视化模板以及数据源,进一步满足个性化运维监控需求
针对容器服务ACK等主流服务提供 Pro 大盘模板
针对容器服务ACK、消息队列 Kafka 等主流云服务,提供 Grafana Pro 大盘,帮助运维进行更精细化指标观测
更加安全的权限管理体系
打通阿里云账号体系 SSO(主子账号),并支持阿里云用户权限控制 RAM
智能告警管理增强
故障处理协同效率提升,有效提升告警精度
多渠道数据推送
支持 Slack、钉钉、邮件、短信、Webhook 等10 + 监控数据源,确保及时触达
告警协作提升协同效率
基于钉钉的 ChatOps,借助报警管理、报警记录、历史查看,让告警变得可协作,可追溯,可统计
智能降噪
提供异常检查、智能降噪等算法能力有效减少无效告警
告警根因分析
基于应用上下文的告警根因分析,提升故障定位效率
多实例全局聚合查询
全局统一聚合查询,统一 Grafana 数据源,统一告警等能力
阿里云可观测监控 Prometheus 版与开源自建对比
对比项 | 阿里云可观测监控 Prometheus 版 | 自建 Prometheus 监控 |
---|---|---|
资源购买&系统搭建 | 阿里云全托管 | 自行购买相关资源并部署系统 |
运维成本 | 免运维 | 日常自行运维 |
高可用性 | 支持采集存储组件多副本,可水平扩展,可用性高 | 单进程,无法水平扩展,可用性低 |
数据接入 | 一键接入常见云服务,覆盖数据库、中间件等主流应用组件,以及 Java/Go 等主流编程语言构建的应用,支持 ECS 集群中间件的免 Agent 安装监控 | 创建对应组件的 Exporter,完成数据接入 |
数据存储 | 基于云上存储,存储容量无上限 | 受限于存储容量 |
数据可视化 | 内置 Grafana,各类常见监控模板开箱即用 | 需要单独部署 Grafana,并自行配置看板 |
告警管理 | 集成 ARMS 告警中心,全面提升告警效率与精度 | 自行接入 Alertmanager 插件 |
单副本采集性能(2C4G) | 6000k 数据点 | 1000k 数据点 |
数据查询性能(6亿时间点) | 8~10s | 180s |
安全管理 | 与阿里云安全服务集成,满足企业安全及合规要求 | 不支持 |
其他能力 | 支持预聚合、降采样等能力 | 不支持 |
应用场景
云服务统一指标观测
可观测监控 Prometheus 版提供云产品监控功能,将众多云服务指标数据统一展现、查询、告警,为运维团队提供更便捷的日常运维观测界面。目前已接入超过 50 款云服务,并持续增加。
容器层指标观测
与阿里云容器服务 ACK 深度集成,配置容器集群过程中即可开启。针对容器提供工作负载性能监控、ingress 性能监控、CoreDNS 性能监控等组件, 并提供专属观测大盘覆盖容器服务、应用组件、云服务和应用自身观测指标,同步云资源 Tag 进行业务维度监控数据展现。
观测对象
应用性能指标观测
与应用实时监控服务 ARMS 集成,一键接入应用性能观测指标,预置应用性能指标观测大盘。并支持服务发现方式,上报应用性能数据。
观测对象
多云应用组件指标观测
针对三方云/线下 IDC 中心提供相应 Exporter 接入方案,满足第三方云/线下 IDC 内组件指标观测需求。
业务自定义指标观测
根据业务特点,设定业务目标指标、业务服务质量指标、技术组件指标、基础资源指标,通过指标自定义,配置相关抓取任务,关联指标完整展现,提升数据关联性。