全部產品
Search
文件中心

Managed Service for Prometheus:使用智能檢測運算元發現異常資料

更新時間:Jul 06, 2024

可觀測監控 Prometheus 版可以通過智能檢測運算元演算法自動地發現KPI時間序列資料中的異常波動,實現時間序列的異常檢測,為後續的警示、自動止損、根因分析等提供決策依據,本文介紹使用智能檢測運算元發現異常資料波動的操作方法。

檢測Prometheus執行個體的異常資料波動

  1. 登入ARMS控制台

  2. 登入Prometheus控制台

  3. 在左側導覽列單擊執行個體列表,進入可觀測監控 Prometheus 版的執行個體列表頁面。

  4. 在單擊目標執行個體名稱對應的grafana工作區

  5. 在左側導覽列單擊ert表徵圖(Explore),然後在左上方的Explore右側下拉式清單選擇對應的資料來源。

  6. Metrics下拉式清單中選擇目標指標,可查看當前指標正常的時序資料,例如目標指標為:

    arms_cms_collector_duration_seconds
  7. Metrics右側文字框輸入以下PromQL查詢語句樣本,即異常檢測運算元。可檢測出當前指標在某些時段的資料異常波動情況。

    anomaly_detect(arms_cms_collector_duration_seconds[180m],3)
    說明
    • arms_cms_collector_duration_seconds:為上一步驟中的目標指標名稱,請根據實際情況替換。

    • 輸入的PromQL查詢語句資料類型必須是Range vector類型,因此需要在指標名稱後增加時間範圍“[180m]”,其中時間範圍預設選擇“[180m]”,參數預設選擇“3”。如果提前執行了其他彙總函式操作,則需要將預設的時間範圍選擇變更為“[180m:]”,使其資料類型變為Range vector類型,例如:anomaly_detect(sum(node_memory_free_bytes)[180m:],3)。