通過EMR Serverless StarRocks提供的監控報表功能,您可以即時擷取並查看執行個體的運行狀態及各項關鍵效能指標,從而實現快速問題定位。
使用限制
僅儲存最近30天內的報表資料,超出此期限的資料將不再保留。
注意事項
監控指標中包含了root帳號相關的資訊,例如每分鐘查詢數等。root帳號是阿里雲EMR Serverless StarRocks控制台用於管理叢集的專用帳號,該帳號對客戶不可見,並且不能直接使用。
操作步驟
進入EMR Serverless StarRocks執行個體列表頁面。
在左側導覽列,選擇。
在頂部功能表列處,根據實際情況選擇地區。
單擊目標執行個體ID。
單擊監控警示頁簽。
在監控警示頁簽,您可以根據資源群組和時間條件進行篩選來查看當前的指標。
支援以下資源群組:
default_wg:查詢任務預設資源群組。
default_mv_wg:物化視圖預設資源群組。
監控指標說明
執行個體
概況
指標名稱
描述
FE可用性
FE節點的可用性。
BE/CN可用性
BE或CN節點的可用性。
FE節點數
FE節點數量。
BE/CN節點數
BE或CN節點數量。
Disk使用率(Avg)
叢集所有BE節點資料盤的平均使用量百分比。
儲存量
StarRocks實際使用的儲存空間大小。該指標適用於存算分離情境,儲存量資料更新約有1小時延遲。
Compaction Score(Max)
指每個FE節點上最高的Compaction Score,僅適用於存算一體的情境。
FE節點探測狀態
平台通過HTTP調用探測節點狀態,On表示探測結果正常,Off表示探測失敗。
BE/CN節點狀態
FE上報的BE/CN節點狀態。若Alive節點數異常,請通過SHOW COMPUTE NODES查看節點詳情。
Query
指標名稱
描述
每分鐘查詢數
每分鐘查詢任務數量。
每分鐘查詢錯誤數
每分鐘出現的查詢錯誤數。
查詢延遲
查詢請求的延遲時間。
每分鐘慢查詢數
每分鐘慢查詢數。
FE
指標名稱
描述
FE事務狀態統計
FE每分鐘事務狀態統計。
FE資料盤使用量
FE資料盤使用量,每小時採集一次。
FE CPU
指標名稱
描述
FE CPU使用率
FE CPU的當前使用率。
FE CPU Load 1min
最近1分鐘內CPU負載的平均值。
FE Mem
指標名稱
描述
JVM Heap使用率
顯示JVM堆的已用記憶體與最大記憶體的比例。
JVM Young GC
監控年輕代記憶體回收的次數和時間。
JVM Heap使用量
監控JVM堆的使用方式。
JVM Old GC
監控JVM堆中老年代記憶體回收的次數和時間。
FE Net
指標名稱
描述
網路接收速率
網路接收速率。
網路發送速率
網路發送速率。
FE串連數
每個FE的當前串連數。
資源群組
指標名稱
描述
每分鐘查詢數
指定資源群組每分鐘查詢任務數。
查詢延遲P99
查詢請求的延遲時間。
每分鐘查詢數(資源群組)
資源群組每分鐘查詢任務數。
物化視圖
指標名稱
描述
MV狀態
物化視圖的狀態。取值為0(active)和 1(inactive)。
重新整理作業已耗用時間P99
執行成功的物化視圖重新整理作業的期間。
重新整理作業總數
物化視圖重新整理作業的總數。
重新整理作業Success
執行成功的物化視圖重新整理作業的數量。
重新整理作業Failed
執行失敗的物化視圖重新整理作業的數量。
重新整理作業Empty
因重新整理資料為空白而取消的物化視圖重新整理作業的數量。
重新整理作業Running
物化視圖當前正在執行的重新整理作業數量。
重新整理作業Pending
物化視圖當前等待執行的重新整理作業數量。
MV改寫次數
物化視圖改寫查詢的次數(不包括直接針對物化視圖的查詢)。
MV查詢次數
物化視圖改寫查詢的次數,包括直接查詢與查詢改寫。
庫表資訊
指標名稱
描述
庫表數量分布
執行個體各資料庫的表數量分布情況。
Table數量
執行個體的表數量。
Tablet數量
執行個體的Tablet數量。
Table掃描資料量
非系統資料表的掃描的總位元組數。
Table匯入資料量
非系統資料表的匯入的總位元組數。
其他
指標名稱
描述
【遷移工具】表遷移進度
僅適用於遷移叢集情境。
計算群組
概況
指標名稱
描述
CPU使用率(Avg)
所有BE或CN節點的平均CPU使用率。
Mem使用率(Avg)
所有BE或CN節點的平均記憶體使用量率。
Disk使用率(Max)
所有BE或CN節點的多塊資料盤的最大使用率。
BE/CN節點狀態
平台通過HTTP調用探測節點狀態,On表示探測結果正常,Off表示探測失敗。
Compaction
指標名稱
描述
Compaction Score最大值
所有FE節點上最大的Compaction Score。
Compaction Mem佔用量
Compaction使用的記憶體。
每分鐘Compaction資料量
Base Compaction和Cumulative Compaction中合并的總位元組數。
每分鐘Compaction Rowset數量
Base Compaction和Cumulative Compaction中合并的Rowset的總數。
BE/CN
指標名稱
描述
查詢掃描資料量
處理查詢時讀取位元組數。
查詢掃描行數
處理查詢時讀取行數。
各類請求統計
各種請求的總數,包括CREATE TABLE、Publish Version和Tablet Clone等。
失敗請求統計
BE各種請求失敗的數量,包括CREATE TABLE、Publish Version和Tablet Clone等。
事務階段統計
每分鐘事務階段統計。
BE/CN CPU
指標名稱
描述
CPU使用率
CPU使用率。
BE/CN CPU Load 1min
最近1分鐘內CPU負載的平均值。
BE/CN Mem
指標名稱
描述
節點記憶體使用量率
節點記憶體使用量率,包含BE/CN進程記憶體、UDF佔用記憶體、BE/CN預留記憶體等。
BE/CN進程記憶體
BE/CN進程的記憶體使用量量。
進程記憶體
BE進程記憶體,取決於核心採集的記憶體項,非全量,不在採集範圍的記憶體項用 Other 表示。更多記憶體資訊,請參見Memory_management。
節點記憶體
分為剩餘可用記憶體(Pod Avail Mem)、BE/CN進程佔用的記憶體(Process Mem)、其他佔用記憶體 (Non Process Mem)三項。
節點記憶體
BE/CN節點的記憶體情況,分為節點記憶體、81%節點記憶體線、節點記憶體使用量量、進程記憶體使用量量。 BE/CN可用記憶體上限受SR代碼中0.9係數和mem_limit配置項(預設為0.9)共同限制,BE實際可用記憶體預設為節點記憶體的81%。
BE/CN Disk
指標名稱
描述
磁碟空間使用率
磁碟已使用空間佔總容量的比例,主要包括Data、Trash等。
磁碟空間使用量
磁碟已使用的絕對容量。
使用量(Data)
磁碟中Data檔案佔用的儲存空間情況。
使用率(Data)
磁碟中Data檔案佔用儲存空間百分比情況。
BE/CN Disk IO
指標名稱
描述
讀流量(SUM)
所有磁碟每秒讀取流量。
寫流量(SUM)
所有磁碟每秒寫入流量。
讀IOPS(SUM)
所有磁碟每秒讀取次數。
寫IOPS(SUM)
所有磁碟每秒寫入次數。
讀延遲(AVG)
所有磁碟平均讀延遲。
寫延遲(AVG)
所有磁碟平均寫入延遲。
IO Util(Max)
表示在一段時間內 I/O 裝置(如磁碟、網路介面等)處於忙碌狀態的時間比例,通常以百分比形式呈現,反映了裝置的繁忙程度。
BE/CN Net
指標名稱
描述
網路接收速率
網路接收速率。
網路發送速率
網路發送速率。
TCP串連數
TCP串連數。
Cache
說明以下指標僅適用於存算分離情境。
指標名稱
描述
FSLIB Cache命中率
每分鐘的快取命中率。
FSLIB Cache叫用次數
每分鐘的快取命中次數。
全託管儲存
說明以下指標僅適用於存算分離全託管儲存情境。
指標名稱
描述
儲存量趨勢
全管理的資料儲存量,單位為GiB。
讀寫流量
全託管儲存讀寫流量。
資源群組
指標名稱
描述
CPU使用核心數
當前資源群組正在使用的CPU核心數,該值為一個估計值。統計的是兩次擷取Metric時間間隔內的平均值。該指標自v3.1.4起支援。
CPU使用佔比v2.x
當前資源群組CPU使用時間佔總CPU時間的百分比。
Mem使用量
當前資源群組使用的記憶體。
Running任務數
當前資源群組Running狀態的查詢任務數量。
觸發並發限制次數
當前資源群組觸發並發限制的查詢數量。
觸發大查詢限制次數
當前資源群組觸發大查詢限制次數。
其他
指標名稱
描述
Page Cache命中率
從頁緩衝中命中的請求數。
Publish Version Latency P99
StarRocks寫資料時發布版本的耗時。
儲存
資料存放區
指標名稱
描述
儲存量趨勢
全管理的資料儲存量,單位為GiB。該指標適用於存算分離全管理的資料儲存情境,儲存量資料更新有約1小時延遲。
讀寫流量
全託管儲存讀寫流量。該指標適用於存算分離全託管儲存情境。
Disk Usage
存算分離
指標名稱
描述
磁碟空間使用率
磁碟空間的使用佔比。
磁碟空間使用量
磁碟空間的使用量。
存算一體
指標名稱
描述
剩餘空間百分比
磁碟剩餘可用容量百分比。
剩餘空間
磁碟剩餘可用容量。
使用量(Data)
磁碟中Data檔案佔用儲存空間情況。
使用率(Data)
磁碟中Data檔案佔用儲存空間百分比情況。
使用量餅圖(SUM)
磁碟中Avail、Cache、Data檔案的使用量。
使用量折線圖(SUM)
Disk IO
指標名稱
描述
讀流量(SUM)
所有磁碟每秒讀取流量。
寫流量(SUM)
所有磁碟每秒寫入流量。
讀IOPS(SUM)
所有磁碟每秒讀取次數。
寫IOPS(SUM)
所有磁碟每秒寫入次數。
讀延遲(AVG)
所有磁碟平均讀延遲。
寫延遲(AVG)
所有磁碟平均寫入延遲。
IO Util(Max)
表示在一段時間內 I/O 裝置(如磁碟、網路介面等)處於忙碌狀態的時間比例,通常以百分比形式呈現,反映了裝置的繁忙程度。