为应用安装探针后,ARMS即可开始监控应用,您可以在应用概览页面了解应用的请求数、错误数、耗时、实例数等信息。
前提条件
ARMS应用监控面向已开通新版计费的用户提供全新的监控详情页面,新版计费详情,请参见产品计费(新版)。
对于未开通新版计费的用户,如需查看新版监控详情页面,可在应用列表页面单击切换新版。
已为应用安装探针,具体操作,请参见应用监控接入概述。
查看应用概览
登录ARMS控制台,在左侧导航栏选择 。
在应用列表页面顶部选择目标地域,然后单击目标应用名称。
说明语言列的图标含义如下:
:接入应用监控的Java应用。
:接入应用监控的Golang应用。
:接入应用监控的Python应用。
-:接入可观测链路 OpenTelemetry 版的应用。
在上方导航栏单击应用概览。
大盘说明
应用概览页面会根据应用接入的信息自动适配展示大盘,并针对ECS环境和容器环境对CPU信息做区别展示。
在容器场景下,如果已经接入可观测监控 Prometheus 版,则优先以可观测监控 Prometheus 版数据作为容器信息的展示。容器环境接入可观测监控 Prometheus 版的操作,请参见容器可观测。
容器环境如果未接入可观测监控 Prometheus 版,需要确保应用监控探针版本在4.1.0以上,对应数据展示容器的基础信息。应用监控探针说明,请参见探针(Java Agent)版本说明。
ECS环境
面板 | 样式 | 说明 |
请求数 | 翻牌器 | 应用在指定时间段的请求数总和。 日同比:应用在指定时间段的请求数同比前一日在相同时间段的请求数增减的百分比。 |
错误数 | 翻牌器 | 应用在指定时间段的错误数总和。 日同比:应用在指定时间段的错误数同比前一日在相同时间段的错误数增减的百分比。 |
平均耗时 | 翻牌器 | 应用在指定时间段的平均耗时。 日同比:应用在指定时间段的平均耗时同比前一日在相同时间段的平均耗时增减的百分比。 |
实例数 | 翻牌器 | 应用在指定时间段的实例数总和。 日同比:应用在指定时间段的实例数同比前一日在相同时间段的实例数增减的百分比。 |
请求数 | 柱状图 | 应用在指定时间段的请求数趋势,按照调用类型分类做堆叠展示。 |
错误数 | 柱状图/趋势图 | 错误数:应用在指定时间段的错误数趋势,以柱状图做展示,左侧坐标为错误数单位。 错误率:应用在指定时间段的错误率趋势,右侧坐标为错误率单位。 |
耗时 | 趋势图 | 应用在指定时间段的耗时趋势,提供平均耗时、P99、P90、P75趋势。 |
CPU使用率峰值 | 蜂窝图 | 应用在指定时间段的主机CPU使用率峰值。 状态区分为:
|
请求数提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口请求总数TOP 5。 提供服务的调用类型包含:
|
错误数提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口错误总数TOP 5。 提供服务的调用类型包含:
|
平均耗时提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口平均耗时TOP 5。 提供服务的调用类型包含:
|
CPU使用率峰值实例排行 | TOP 5 | 应用在指定时间段CPU使用率最高的主机。 |
容器环境(Prometheus版)
面板 | 样式 | 说明 |
请求数 | 翻牌器 | 应用在指定时间段的请求数总和。 日同比:应用在指定时间段的请求数同比前一日在相同时间段的请求数增减的百分比。 |
错误数 | 翻牌器 | 应用在指定时间段的错误数总和。 日同比:应用在指定时间段的错误数同比前一日在相同时间段的错误数增减的百分比。 |
平均耗时 | 翻牌器 | 应用在指定时间段的平均耗时。 日同比:应用在指定时间段的平均耗时同比前一日在相同时间段的平均耗时增减的百分比。 |
实例数 | 翻牌器 | 应用在指定时间段的实例数总和。 日同比:应用在指定时间段的实例数同比前一日在相同时间段的实例数增减的百分比。 |
请求数 | 柱状图 | 应用在指定时间段的请求数趋势,按照调用类型分类做堆叠展示。 |
错误数 | 柱状图/趋势图 | 错误数:应用在指定时间段的错误数趋势,以柱状图做展示,左侧坐标为错误数单位。 错误率:应用在指定时间段的错误率趋势,右侧坐标为错误率单位。 |
耗时 | 趋势图 | 应用在指定时间段的耗时趋势,提供平均耗时、P99、P90、P75趋势。 |
CPU用量 | 蜂窝图 | 应用在指定时间段的容器CPU使用量。多集群的情况下只取最早有上报的一个集群做展示。 |
请求数提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口请求总数TOP 5。 提供服务的调用类型包含:
|
错误数提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口错误总数TOP 5。 提供服务的调用类型包含:
|
平均耗时提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口平均耗时TOP 5。 提供服务的调用类型包含:
|
CPU使用量排行 | TOP 5 | 应用在指定时间段CPU使用量最多的容器。多集群的情况下只取最早上报的一个集群做展示。 |
容器环境(ARMS自采集版)
面板 | 样式 | 说明 |
请求数 | 翻牌器 | 应用在指定时间段的请求数总和。 日同比:应用在指定时间段的请求数同比前一日在相同时间段的请求数增减的百分比。 |
错误数 | 翻牌器 | 应用在指定时间段的错误数总和。 日同比:应用在指定时间段的错误数同比前一日在相同时间段的错误数增减的百分比。 |
平均耗时 | 翻牌器 | 应用在指定时间段的平均耗时。 日同比:应用在指定时间段的平均耗时同比前一日在相同时间段的平均耗时增减的百分比。 |
实例数 | 翻牌器 | 应用在指定时间段的实例数总和。 日同比:应用在指定时间段的实例数同比前一日在相同时间段的实例数增减的百分比。 |
请求数 | 柱状图 | 应用在指定时间段的请求数趋势,按照调用类型分类做堆叠展示。 |
错误数 | 柱状图/趋势图 | 错误数:应用在指定时间段的错误数趋势,以柱状图做展示,左侧坐标为错误数单位。 错误率:应用在指定时间段的错误率趋势,右侧坐标为错误率单位。 |
耗时 | 趋势图 | 应用在指定时间段的耗时趋势,提供平均耗时、P99、P90、P75趋势。 |
CPU用量 | 蜂窝图 | 应用在指定时间段的容器CPU使用量。 |
请求数提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口请求总数TOP 5。 提供服务的调用类型包含:
|
错误数提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口错误总数TOP 5。 提供服务的调用类型包含:
|
平均耗时提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口平均耗时TOP 5。 提供服务的调用类型包含:
|
CPU使用量排行 | TOP 5 | 应用在指定时间段CPU使用量最多的容器。 |
面板功能说明
行动点
单击趋势图面板上的图标,可以查看分组对比以及历史时间对比。
分组选项分为基础字段和实例标签:
基础字段:所有指标里公共的Label,目前主要透出serverIp用于分组对比。
实例标签:除了默认实例标签外,您可以添加自定义实例标签扩展更多分组对比能力。具体操作,请参见添加并使用标签。
对比时间:选择对比时间段和当前时间段进行对比。
查询语句
单击面板上的图标,可以查看对应面板的PromQL。您可以在Prometheus或Grafana中直接使用获取到的PromQL,完成自定义配置。
常见问题
P99分位数耗时无数据
分位数指标默认关闭,如需查看分位数数据,请在自定义配置页面打开分位数统计功能,具体操作,请参见Java应用自定义配置。
旧版控制台应用概览页面总请求量与最近五分钟数据加和不一致
ARMS页面展示的数据一般要比用户实际选择的时间区间往前多取一分钟的数据,最近五分钟实机会展示6分钟的数据,最近30分钟实际会展示31分钟的数据。
旧版控制台应用概览页面慢SQL数与通过POP接口查询出的不一致
POP查询慢SQL时,同时查询了数据库及NoSQL数据库、缓存相关的慢请求数据,但是控制台仅查询了数据库相关的慢请求数据,所以会有差异。
如需使pop查询到的数据和控制台页面展示的数据相同,可在查询时添加rpcType相关的过滤条件。
示例:
QueryMetricByPageRequest.Filters filters2 = QueryMetricByPageRequest
.Filters
.builder()
.key("rpcType")
.value("60|62|63|65|66|67|68|69|58|59")
.build();
实例数大于实际运行的数量
如果查询时间过长,则已经销毁的实例也会被计算到实例数中。