可觀測監控 Prometheus 版可以通過智能檢測運算元演算法自動地發現KPI時間序列資料中的異常波動,實現時間序列的異常檢測,為後續的警示、自動止損、根因分析等提供決策依據,本文介紹使用智能檢測運算元發現異常資料波動的操作方法。
檢測Prometheus執行個體的異常資料波動
登入ARMS控制台。
在左側導覽列選擇 ,進入可觀測監控 Prometheus 版的執行個體列表頁面。
在單擊目標執行個體名稱對應的grafana工作區。
在左側導覽列單擊表徵圖(Explore),然後在左上方的Explore右側下拉式清單選擇對應的資料來源。
在Metrics下拉式清單中選擇目標指標,可查看當前指標正常的時序資料,例如目標指標為:
arms_cms_collector_duration_seconds
在Metrics右側文字框輸入以下PromQL查詢語句樣本,即異常檢測運算元。可檢測出當前指標在某些時段的資料異常波動情況。
anomaly_detect(arms_cms_collector_duration_seconds[180m],3)
說明arms_cms_collector_duration_seconds:為上一步驟中的目標指標名稱,請根據實際情況替換。
輸入的PromQL查詢語句資料類型必須是Range vector類型,因此需要在指標名稱後增加時間範圍“[180m]”,其中時間範圍預設選擇“[180m]”,參數預設選擇“3”。如果提前執行了其他彙總函式操作,則需要將預設的時間範圍選擇變更為“[180m:]”,使其資料類型變為Range vector類型,例如:anomaly_detect(sum(node_memory_free_bytes)[180m:],3)。