本文詳細介紹了EMR Serverless StarRocks的CloudMonitor指標,涵蓋了多個關鍵績效參數。
可用性
指標名稱 | 類型 | 維度 | 描述 |
| 瞬時值 | - | BE/CN 節點存活率(Alive),反映節點健康狀態。 |
| 瞬時值 | podName | 捕獲到 FE 進程開機記錄,值為 1 表示該時間段檢測到了進程啟動的特徵日誌。 |
| 瞬時值 | podName | 捕獲到 BE/CN 進程開機記錄,值為 1 表示該時間段檢測到了進程啟動的特徵日誌。 |
| 瞬時值 | podName | 請求節點 HTTP 介面的結果,1 表示請求成功,0 表示請求失敗,可用於表明 FE 節點狀態。 |
| 瞬時值 | podName | 請求節點 HTTP 介面的結果,1 表示請求成功,0 表示請求失敗,可用於表明 BE/CN 節點狀態。 |
資源使用方式
指標名稱 | 類型 | 維度 | 描述 |
| 瞬時值 | podName | FE 節點的 CPU 使用率。 |
| 瞬時值 | warehouseName podName | BE 節點的 CPU 使用率。 |
| 瞬時值 | podName | FE JVM Heap 記憶體使用量率。 |
| 瞬時值 | podName | FE 記憶體使用量率。考慮到 JVM 特性,如需配置監控警示請使用 |
| 瞬時值 | warehouseName podName | BE 記憶體使用量率。 |
| 瞬時值 | warehouseName podName | BE節點已指派的記憶體大小。單位:Byte。 |
| 瞬時值 | warehouseName podName | 查詢執行過程中使用的總記憶體。 |
| 瞬時值 | warehouseName podName | 匯入任務使用的記憶體總量。 |
| 瞬時值 | warehouseName podName | 版本合并(Compaction)佔用的記憶體。 |
| 瞬時值 | warehouseName podName | Schema Change 任務使用的記憶體。 |
| 瞬時值 | warehouseName podName | column pool 記憶體池,用於加速儲存層資料讀取的 Column Cache。 |
| 瞬時值 | warehouseName podName | BE 儲存層 page 緩衝。 |
| 瞬時值 | warehouseName podName | BE jit 編譯函數的緩衝。 |
| 瞬時值 | warehouseName podName | CPU per core 緩衝,用於加速小塊記憶體申請的 Cache。 |
| 瞬時值 | warehouseName podName | 定期一致性校正使用的記憶體。 |
| 瞬時值 | warehouseName podName | 快取資料佔用的記憶體。 |
| 瞬時值 | warehouseName podName | Tablet Clone 任務使用的總記憶體。 |
| 瞬時值 | warehouseName podName | 中繼資料佔用的記憶體。 |
| 瞬時值 | podName | BE節點磁碟容量使用率。 |
| 瞬時值 | warehouseName podName | 磁碟IO最大使用率。 |
| 瞬時值 | podName | FE節點的總串連數量。 |
| 累計值 | warehouseName podName device | 網路發送的資料總量。單位:Byte。 |
| 累計值 | warehouseName podName device | 網路接收的資料總量。單位:Byte。 |
查詢效能
指標名稱 | 類型 | 維度 | 描述 |
| 瞬時值 | podName | 查詢延遲的百分位統計(如 P75/P95/P99),通過 |
| 瞬時值 | podName name type | 資源群組查詢的延時統計資訊。 |
| 瞬時值 | podName | 每秒執行的Query數。 |
| 瞬時值 | podName | 每分鐘查詢失敗數。 |
| 瞬時值 | podName | 每分鐘慢查詢數統計。 |
| 累計值 | podName | 查詢請求累計總數。 |
| 累計值 | podName | 錯誤請求的累計總數。 |
| 累計值 | podName | 查詢逾時統計的累計個數。 |
| 瞬時值 | podName | 當前正在隊列中的查詢數量。 |
| 瞬時值 | podName | 歷史排隊過的查詢數量(包括正在啟動並執行查詢)。 |
| 瞬時值 | podName | 排隊逾時的查詢總數量。 |
交易管理
指標名稱 | 類型 | 維度 | 描述 |
| 瞬時值 | db | 當前正在啟動並執行事務數量。 |
物化視圖(MV)
指標名稱 | 類型 | 維度 | 描述 |
| 瞬時值 | dbName mvId mvName | 物化視圖的狀態。有效值: |
| 瞬時值 | dbName mvId mvName | 物化視圖當前正在執行的重新整理作業數量。 |
| 瞬時值 | dbName mvName | MV 每分鐘重新整理失敗任務數 |
| 瞬時值 | dbName mvName | 執行失敗的物化視圖重新整理作業的數量。 |
| 累計值 | dbName mvId mvName | 物化視圖當前等待執行的重新整理作業數量。 |
其他關鍵計量
指標名稱 | 類型 | 維度 | 描述 |
| 瞬時值 | podName exportedJob type state | 當前作業數。 |
| 瞬時值 | podName | FE 的 BDB 中繼資料 Log 個數。 |
| 瞬時值 | podName | BE 中 Tablet 的最大版本數,過高可能影響效能。 |
| 瞬時值 | podName type | Slow DB Lock 時間長度。 |
| 瞬時值 | warehouseName podName | Publish Version 任務的 P99 分位元延遲。 |
| 瞬時值 | - | BE 節點上最高的 Compaction Score。反映合并壓力。 |