全部產品
Search
文件中心

Application Real-Time Monitoring Service:應用概覽

更新時間:Nov 08, 2024

為應用安裝探針後,ARMS即可開始監控應用,您可以在應用概覽頁面瞭解應用的請求數、錯誤數、耗時、執行個體數等資訊。

前提條件

重要

ARMS應用監控面向已開通新版計費的使用者提供全新的監控詳情頁面,新版計費詳情,請參見產品計費(新版)

對於未開通新版計費的使用者,如需查看新版監控詳情頁面,可在應用列表頁面單擊切換新版

已為應用安裝探針,具體操作,請參見應用監控接入概述

查看應用概覽

  1. 登入ARMS控制台,在左側導覽列選擇應用監控 > 應用列表

  2. 應用列表頁面頂部選擇目標地區,然後單擊目標應用程式名稱。

    說明

    語言列的表徵圖含義如下:

    Java表徵圖:接入應用監控的Java應用。

    image:接入應用監控的Golang應用。

    image:接入應用監控的Python應用。

    -:接入Managed Service for OpenTelemetry的應用。

  3. 在上方導覽列單擊應用概覽

大盤說明

應用概覽頁面會根據應用接入的資訊自動適配展示大盤,並針對ECS環境和容器環境對CPU資訊做區別展示。

在容器情境下,如果已經接入Managed Service for Prometheus,則優先以Managed Service for Prometheus資料作為容器資訊的展示。容器環境接入Managed Service for Prometheus的操作,請參見容器可觀測

容器環境如果未接入Managed Service for Prometheus,需要確保應用監控探針版本在4.1.0以上,對應資料展示容器的基礎資訊。應用監控探針說明,請參見探針(Java Agent)版本說明

ECS環境

image

面板

樣式

說明

請求數

翻牌器

應用在指定時間段的請求數總和。

日同比:應用在指定時間段的請求數同比前一日在相同時間段的請求數增減的百分比。

錯誤數

翻牌器

應用在指定時間段的錯誤數總和。

日同比:應用在指定時間段的錯誤數同比前一日在相同時間段的錯誤數增減的百分比。

平均耗時

翻牌器

應用在指定時間段的平均耗時。

日同比:應用在指定時間段的平均耗時同比前一日在相同時間段的平均耗時增減的百分比。

執行個體數

翻牌器

應用在指定時間段的執行個體數總和。

日同比:應用在指定時間段的執行個體數同比前一日在相同時間段的執行個體數增減的百分比。

請求數

柱狀圖

應用在指定時間段的請求數趨勢,按照調用類型分類做堆疊展示。

錯誤數

柱狀圖/趨勢圖

錯誤數:應用在指定時間段的錯誤數趨勢,以柱狀圖做展示,左側座標為錯誤數單位。

錯誤率:應用在指定時間段的錯誤率趨勢,右側座標為錯誤率單位。

耗時

趨勢圖

應用在指定時間段的耗時趨勢,提供平均耗時、P99、P90、P75趨勢。

CPU使用率峰值

蜂窩圖

應用在指定時間段的主機CPU使用率峰值。

狀態區分為:

  • 正常情況下對應主機區塊為綠色

  • 使用率超過60%區塊為黃色

  • 使用率超過70%區塊為紅色

請求數提供服務排行

TOP 5

應用在指定時間段提供服務的介面請求總數TOP 5。

提供服務的調用類型包含:

  • HTTP

  • Dubbo

  • HSF

  • DSF

  • user_method

  • MQ

  • Kafka

  • Server

  • Producer

  • gRPC

  • Thrift

  • Sofa

  • Schedulerx

  • Spring_Scheduled

  • JDK_Timer

  • XXL_Job

  • Quartz

錯誤數提供服務排行

TOP 5

應用在指定時間段提供服務的介面錯誤總數TOP 5。

提供服務的調用類型包含:

  • HTTP

  • Dubbo

  • HSF

  • DSF

  • user_method

  • MQ

  • Kafka

  • Server

  • Producer

  • gRPC

  • Thrift

  • Sofa

  • Schedulerx

  • Spring_Scheduled

  • JDK_Timer

  • XXL_Job

  • Quartz

平均耗時提供服務排行

TOP 5

應用在指定時間段提供服務的介面平均耗時TOP 5。

提供服務的調用類型包含:

  • HTTP

  • Dubbo

  • HSF

  • DSF

  • user_method

  • MQ

  • Kafka

  • Server

  • Producer

  • gRPC

  • Thrift

  • Sofa

  • Schedulerx

  • Spring_Scheduled

  • JDK_Timer

  • XXL_Job

  • Quartz

CPU使用率峰值執行個體排行

TOP 5

應用在指定時間段CPU使用率最高的主機。

容器環境(Prometheus版)

image

面板

樣式

說明

請求數

翻牌器

應用在指定時間段的請求數總和。

日同比:應用在指定時間段的請求數同比前一日在相同時間段的請求數增減的百分比。

錯誤數

翻牌器

應用在指定時間段的錯誤數總和。

日同比:應用在指定時間段的錯誤數同比前一日在相同時間段的錯誤數增減的百分比。

平均耗時

翻牌器

應用在指定時間段的平均耗時。

日同比:應用在指定時間段的平均耗時同比前一日在相同時間段的平均耗時增減的百分比。

執行個體數

翻牌器

應用在指定時間段的執行個體數總和。

日同比:應用在指定時間段的執行個體數同比前一日在相同時間段的執行個體數增減的百分比。

請求數

柱狀圖

應用在指定時間段的請求數趨勢,按照調用類型分類做堆疊展示。

錯誤數

柱狀圖/趨勢圖

錯誤數:應用在指定時間段的錯誤數趨勢,以柱狀圖做展示,左側座標為錯誤數單位。

錯誤率:應用在指定時間段的錯誤率趨勢,右側座標為錯誤率單位。

耗時

趨勢圖

應用在指定時間段的耗時趨勢,提供平均耗時、P99、P90、P75趨勢。

CPU用量

蜂窩圖

應用在指定時間段的容器CPU使用量。多叢集的情況下只取最早有上報的一個叢集做展示。

請求數提供服務排行

TOP 5

應用在指定時間段提供服務的介面請求總數TOP 5。

提供服務的調用類型包含:

  • HTTP

  • Dubbo

  • HSF

  • DSF

  • user_method

  • MQ

  • Kafka

  • Server

  • Producer

  • gRPC

  • Thrift

  • Sofa

  • Schedulerx

  • Spring_Scheduled

  • JDK_Timer

  • XXL_Job

  • Quartz

錯誤數提供服務排行

TOP 5

應用在指定時間段提供服務的介面錯誤總數TOP 5。

提供服務的調用類型包含:

  • HTTP

  • Dubbo

  • HSF

  • DSF

  • user_method

  • MQ

  • Kafka

  • Server

  • Producer

  • gRPC

  • Thrift

  • Sofa

  • Schedulerx

  • Spring_Scheduled

  • JDK_Timer

  • XXL_Job

  • Quartz

平均耗時提供服務排行

TOP 5

應用在指定時間段提供服務的介面平均耗時TOP 5。

提供服務的調用類型包含:

  • HTTP

  • Dubbo

  • HSF

  • DSF

  • user_method

  • MQ

  • Kafka

  • Server

  • Producer

  • gRPC

  • Thrift

  • Sofa

  • Schedulerx

  • Spring_Scheduled

  • JDK_Timer

  • XXL_Job

  • Quartz

CPU使用量排行

TOP 5

應用在指定時間段CPU使用量最多的容器。多叢集的情況下只取最早上報的一個叢集做展示。

容器環境(ARMS自採集版)

image

面板

樣式

說明

請求數

翻牌器

應用在指定時間段的請求數總和。

日同比:應用在指定時間段的請求數同比前一日在相同時間段的請求數增減的百分比。

錯誤數

翻牌器

應用在指定時間段的錯誤數總和。

日同比:應用在指定時間段的錯誤數同比前一日在相同時間段的錯誤數增減的百分比。

平均耗時

翻牌器

應用在指定時間段的平均耗時。

日同比:應用在指定時間段的平均耗時同比前一日在相同時間段的平均耗時增減的百分比。

執行個體數

翻牌器

應用在指定時間段的執行個體數總和。

日同比:應用在指定時間段的執行個體數同比前一日在相同時間段的執行個體數增減的百分比。

請求數

柱狀圖

應用在指定時間段的請求數趨勢,按照調用類型分類做堆疊展示。

錯誤數

柱狀圖/趨勢圖

錯誤數:應用在指定時間段的錯誤數趨勢,以柱狀圖做展示,左側座標為錯誤數單位。

錯誤率:應用在指定時間段的錯誤率趨勢,右側座標為錯誤率單位。

耗時

趨勢圖

應用在指定時間段的耗時趨勢,提供平均耗時、P99、P90、P75趨勢。

CPU用量

蜂窩圖

應用在指定時間段的容器CPU使用量。

請求數提供服務排行

TOP 5

應用在指定時間段提供服務的介面請求總數TOP 5。

提供服務的調用類型包含:

  • HTTP

  • Dubbo

  • HSF

  • DSF

  • user_method

  • MQ

  • Kafka

  • Server

  • Producer

  • gRPC

  • Thrift

  • Sofa

  • Schedulerx

  • Spring_Scheduled

  • JDK_Timer

  • XXL_Job

  • Quartz

錯誤數提供服務排行

TOP 5

應用在指定時間段提供服務的介面錯誤總數TOP 5。

提供服務的調用類型包含:

  • HTTP

  • Dubbo

  • HSF

  • DSF

  • user_method

  • MQ

  • Kafka

  • Server

  • Producer

  • gRPC

  • Thrift

  • Sofa

  • Schedulerx

  • Spring_Scheduled

  • JDK_Timer

  • XXL_Job

  • Quartz

平均耗時提供服務排行

TOP 5

應用在指定時間段提供服務的介面平均耗時TOP 5。

提供服務的調用類型包含:

  • HTTP

  • Dubbo

  • HSF

  • DSF

  • user_method

  • MQ

  • Kafka

  • Server

  • Producer

  • gRPC

  • Thrift

  • Sofa

  • Schedulerx

  • Spring_Scheduled

  • JDK_Timer

  • XXL_Job

  • Quartz

CPU使用量排行

TOP 5

應用在指定時間段CPU使用量最多的容器。

面板功能說明

行動點

單擊趨勢圖面板上的image表徵圖,可以查看分組對比以及歷史時間對比。

image

  • 分組選項分為基礎欄位和執行個體標籤:

    image

    • 基礎欄位:所有指標裡公用的Label,目前主要透出serverIp用於分組對比。

    • 執行個體標籤:除了預設執行個體標籤外,您可以添加自訂執行個體標籤擴充更多分組對比能力。具體操作,請參見添加並使用標籤

  • 對比時間:選擇對比時間段和目前時間段進行對比。

查詢語句

單擊面板上的image表徵圖,可以查看對應面板的PromQL。您可以在Prometheus或Grafana中直接使用擷取到的PromQL,完成自訂配置。

image

  • Managed Service for Prometheus控制台的指標探索頁面執行PromQL查看相關指標。具體操作,請參見指標探索

  • 在Grafana中配置大盤時,可以直接使用對應的PromQL配置面板。整合資料來源的操作,請參見雲端服務整合

常見問題

P99分位元耗時無資料

分位元指標預設關閉,如需查看分位元資料,請在自訂配置頁面開啟分位元統計功能,具體操作,請參見Java應用自訂配置

舊版控制台應用概覽頁面總請求量與最近五分鐘資料加和不一致

ARMS頁面展示的資料一般要比使用者實際選擇的時間區間往前多取一分鐘的資料,最近五分鐘實機會展示6分鐘的資料,最近30分鐘實際會展示31分鐘的資料。

舊版控制台應用概覽頁面慢SQL數與通過POP介面查詢出的不一致

POP查詢慢SQL時,同時查詢了資料庫及NoSQL資料庫、緩衝相關的慢請求資料,但是控制台僅查詢了資料庫相關的慢請求資料,所以會有差異。

如需使pop查詢到的資料和控制台頁面展示的資料相同,可在查詢時添加rpcType相關的過濾條件。

樣本:

QueryMetricByPageRequest.Filters filters2 = QueryMetricByPageRequest
.Filters
.builder() 
.key("rpcType") 
.value("60|62|63|65|66|67|68|69|58|59") 
.build();

執行個體數大於實際啟動並執行數量

如果查詢時間過長,則已經銷毀的執行個體也會被計算到執行個體數中。