為應用安裝探針後,ARMS即可開始監控應用,您可以在應用概覽頁面瞭解應用的請求數、錯誤數、耗時、執行個體數等資訊。
前提條件
ARMS應用監控面向已開通新版計費的使用者提供全新的監控詳情頁面,新版計費詳情,請參見產品計費(新版)。
對於未開通新版計費的使用者,如需查看新版監控詳情頁面,可在應用列表頁面單擊切換新版。
已為應用安裝探針,具體操作,請參見應用監控接入概述。
查看應用概覽
登入ARMS控制台,在左側導覽列選擇 。
在應用列表頁面頂部選擇目標地區,然後單擊目標應用程式名稱。
說明語言列的表徵圖含義如下:
:接入應用監控的Java應用。
:接入應用監控的Golang應用。
:接入應用監控的Python應用。
-:接入Managed Service for OpenTelemetry的應用。
在上方導覽列單擊應用概覽。
大盤說明
應用概覽頁面會根據應用接入的資訊自動適配展示大盤,並針對ECS環境和容器環境對CPU資訊做區別展示。
在容器情境下,如果已經接入Managed Service for Prometheus,則優先以Managed Service for Prometheus資料作為容器資訊的展示。容器環境接入Managed Service for Prometheus的操作,請參見容器可觀測。
容器環境如果未接入Managed Service for Prometheus,需要確保應用監控探針版本在4.1.0以上,對應資料展示容器的基礎資訊。應用監控探針說明,請參見探針(Java Agent)版本說明。
ECS環境
面板 | 樣式 | 說明 |
請求數 | 翻牌器 | 應用在指定時間段的請求數總和。 日同比:應用在指定時間段的請求數同比前一日在相同時間段的請求數增減的百分比。 |
錯誤數 | 翻牌器 | 應用在指定時間段的錯誤數總和。 日同比:應用在指定時間段的錯誤數同比前一日在相同時間段的錯誤數增減的百分比。 |
平均耗時 | 翻牌器 | 應用在指定時間段的平均耗時。 日同比:應用在指定時間段的平均耗時同比前一日在相同時間段的平均耗時增減的百分比。 |
執行個體數 | 翻牌器 | 應用在指定時間段的執行個體數總和。 日同比:應用在指定時間段的執行個體數同比前一日在相同時間段的執行個體數增減的百分比。 |
請求數 | 柱狀圖 | 應用在指定時間段的請求數趨勢,按照調用類型分類做堆疊展示。 |
錯誤數 | 柱狀圖/趨勢圖 | 錯誤數:應用在指定時間段的錯誤數趨勢,以柱狀圖做展示,左側座標為錯誤數單位。 錯誤率:應用在指定時間段的錯誤率趨勢,右側座標為錯誤率單位。 |
耗時 | 趨勢圖 | 應用在指定時間段的耗時趨勢,提供平均耗時、P99、P90、P75趨勢。 |
CPU使用率峰值 | 蜂窩圖 | 應用在指定時間段的主機CPU使用率峰值。 狀態區分為:
|
請求數提供服務排行 | TOP 5 | 應用在指定時間段提供服務的介面請求總數TOP 5。 提供服務的調用類型包含:
|
錯誤數提供服務排行 | TOP 5 | 應用在指定時間段提供服務的介面錯誤總數TOP 5。 提供服務的調用類型包含:
|
平均耗時提供服務排行 | TOP 5 | 應用在指定時間段提供服務的介面平均耗時TOP 5。 提供服務的調用類型包含:
|
CPU使用率峰值執行個體排行 | TOP 5 | 應用在指定時間段CPU使用率最高的主機。 |
容器環境(Prometheus版)
面板 | 樣式 | 說明 |
請求數 | 翻牌器 | 應用在指定時間段的請求數總和。 日同比:應用在指定時間段的請求數同比前一日在相同時間段的請求數增減的百分比。 |
錯誤數 | 翻牌器 | 應用在指定時間段的錯誤數總和。 日同比:應用在指定時間段的錯誤數同比前一日在相同時間段的錯誤數增減的百分比。 |
平均耗時 | 翻牌器 | 應用在指定時間段的平均耗時。 日同比:應用在指定時間段的平均耗時同比前一日在相同時間段的平均耗時增減的百分比。 |
執行個體數 | 翻牌器 | 應用在指定時間段的執行個體數總和。 日同比:應用在指定時間段的執行個體數同比前一日在相同時間段的執行個體數增減的百分比。 |
請求數 | 柱狀圖 | 應用在指定時間段的請求數趨勢,按照調用類型分類做堆疊展示。 |
錯誤數 | 柱狀圖/趨勢圖 | 錯誤數:應用在指定時間段的錯誤數趨勢,以柱狀圖做展示,左側座標為錯誤數單位。 錯誤率:應用在指定時間段的錯誤率趨勢,右側座標為錯誤率單位。 |
耗時 | 趨勢圖 | 應用在指定時間段的耗時趨勢,提供平均耗時、P99、P90、P75趨勢。 |
CPU用量 | 蜂窩圖 | 應用在指定時間段的容器CPU使用量。多叢集的情況下只取最早有上報的一個叢集做展示。 |
請求數提供服務排行 | TOP 5 | 應用在指定時間段提供服務的介面請求總數TOP 5。 提供服務的調用類型包含:
|
錯誤數提供服務排行 | TOP 5 | 應用在指定時間段提供服務的介面錯誤總數TOP 5。 提供服務的調用類型包含:
|
平均耗時提供服務排行 | TOP 5 | 應用在指定時間段提供服務的介面平均耗時TOP 5。 提供服務的調用類型包含:
|
CPU使用量排行 | TOP 5 | 應用在指定時間段CPU使用量最多的容器。多叢集的情況下只取最早上報的一個叢集做展示。 |
容器環境(ARMS自採集版)
面板 | 樣式 | 說明 |
請求數 | 翻牌器 | 應用在指定時間段的請求數總和。 日同比:應用在指定時間段的請求數同比前一日在相同時間段的請求數增減的百分比。 |
錯誤數 | 翻牌器 | 應用在指定時間段的錯誤數總和。 日同比:應用在指定時間段的錯誤數同比前一日在相同時間段的錯誤數增減的百分比。 |
平均耗時 | 翻牌器 | 應用在指定時間段的平均耗時。 日同比:應用在指定時間段的平均耗時同比前一日在相同時間段的平均耗時增減的百分比。 |
執行個體數 | 翻牌器 | 應用在指定時間段的執行個體數總和。 日同比:應用在指定時間段的執行個體數同比前一日在相同時間段的執行個體數增減的百分比。 |
請求數 | 柱狀圖 | 應用在指定時間段的請求數趨勢,按照調用類型分類做堆疊展示。 |
錯誤數 | 柱狀圖/趨勢圖 | 錯誤數:應用在指定時間段的錯誤數趨勢,以柱狀圖做展示,左側座標為錯誤數單位。 錯誤率:應用在指定時間段的錯誤率趨勢,右側座標為錯誤率單位。 |
耗時 | 趨勢圖 | 應用在指定時間段的耗時趨勢,提供平均耗時、P99、P90、P75趨勢。 |
CPU用量 | 蜂窩圖 | 應用在指定時間段的容器CPU使用量。 |
請求數提供服務排行 | TOP 5 | 應用在指定時間段提供服務的介面請求總數TOP 5。 提供服務的調用類型包含:
|
錯誤數提供服務排行 | TOP 5 | 應用在指定時間段提供服務的介面錯誤總數TOP 5。 提供服務的調用類型包含:
|
平均耗時提供服務排行 | TOP 5 | 應用在指定時間段提供服務的介面平均耗時TOP 5。 提供服務的調用類型包含:
|
CPU使用量排行 | TOP 5 | 應用在指定時間段CPU使用量最多的容器。 |
面板功能說明
行動點
單擊趨勢圖面板上的表徵圖,可以查看分組對比以及歷史時間對比。
分組選項分為基礎欄位和執行個體標籤:
基礎欄位:所有指標裡公用的Label,目前主要透出serverIp用於分組對比。
執行個體標籤:除了預設執行個體標籤外,您可以添加自訂執行個體標籤擴充更多分組對比能力。具體操作,請參見添加並使用標籤。
對比時間:選擇對比時間段和目前時間段進行對比。
查詢語句
單擊面板上的表徵圖,可以查看對應面板的PromQL。您可以在Prometheus或Grafana中直接使用擷取到的PromQL,完成自訂配置。
常見問題
P99分位元耗時無資料
分位元指標預設關閉,如需查看分位元資料,請在自訂配置頁面開啟分位元統計功能,具體操作,請參見Java應用自訂配置。
舊版控制台應用概覽頁面總請求量與最近五分鐘資料加和不一致
ARMS頁面展示的資料一般要比使用者實際選擇的時間區間往前多取一分鐘的資料,最近五分鐘實機會展示6分鐘的資料,最近30分鐘實際會展示31分鐘的資料。
舊版控制台應用概覽頁面慢SQL數與通過POP介面查詢出的不一致
POP查詢慢SQL時,同時查詢了資料庫及NoSQL資料庫、緩衝相關的慢請求資料,但是控制台僅查詢了資料庫相關的慢請求資料,所以會有差異。
如需使pop查詢到的資料和控制台頁面展示的資料相同,可在查詢時添加rpcType相關的過濾條件。
樣本:
QueryMetricByPageRequest.Filters filters2 = QueryMetricByPageRequest
.Filters
.builder()
.key("rpcType")
.value("60|62|63|65|66|67|68|69|58|59")
.build();
執行個體數大於實際啟動並執行數量
如果查詢時間過長,則已經銷毀的執行個體也會被計算到執行個體數中。