您可以為Container ServiceKubernetes版的叢集、節點或容器組(pod)建立警示規則。當符合警示規則時,CloudMonitor自動發送警示通知,便於您及時瞭解Container Service的異常並快速進行處理。本文為您介紹建立、查看、修改、刪除、暫停和啟用警示規則的操作方法。
前提條件
請您確保已開通Container ServiceKubernetes版,且已建立叢集。具體操作,請參見首次使用Container ServiceKubernetes版。
請您確保Container ServiceKubernetes版叢集的metrics-server組件已升級到V0.3.8.5及以上版本。具體操作,請參見升級叢集至v1.12版本前升級metrics-server組件。
對於2024年04月25日10:00:00以後建立的Container ServiceKubernetes版叢集,請您確保已手動開啟metrics-server組件的CloudMonitor功能。具體操作,請參見開啟Container ServiceKubernetes版叢集的CloudMonitor功能。
建立警示規則
在左側導覽列,選擇
。在容器監控頁面,單擊目的地組群對應操作列的警示規則。
在警示規則頁面,單擊建立警示規則。
在建立警示規則面板,設定警示規則相關參數。
參數
描述
資源範圍
警示規則的作用範圍。取值:
叢集:警示規則作用於目的地組群。您需要選擇叢集名稱。
節點:警示規則作用於目的地組群的全部節點或指定節點。您需要選擇叢集及其節點。
容器組(pod):警示規則作用於目的地組群的指定命名空間下應用中的全部容器組或指定容器組。您需要先選擇叢集及其命名空間,再從無狀態、有狀態、守護進程集、任務或定時任務頁簽中選擇部署應用和容器組(pod)。
說明在容器組頁簽,您僅需選擇容器組(pod)。
規則描述
警示規則的主體。當監控資料滿足指定條件時,觸發警示規則。
通道沉默周期
警示發生後未恢複正常,間隔多久重複發送一次警示通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時和24小時。
某監控指標達到警示閾值時發送警示,如果監控指標在通道沉默周期內持續超過警示閾值,在通道沉默周期內不會重複發送警示通知;如果監控指標在通道沉默周期後仍未恢複正常,則CloudMonitor再次發送警示通知。
生效時間
警示規則的生效時間。警示規則只在生效時間內才會檢查監控資料是否需要警示。
警示回調
公網可訪問的URL,用於接收CloudMonitor通過POST請求推送的警示資訊。目前僅支援HTTP協議。關於如何設定警示回調,請參見使用閾值警示回調。
警示聯絡組
發送警示的連絡人群組。
應用分組的警示通知會發送給該警示連絡人群組中的警示連絡人。警示連絡人群組是一組警示連絡人,可以包含一個或多個警示連絡人。
關於如何建立警示連絡人和警示連絡人群組,請參見建立警示連絡人或警示連絡人群組。
單擊確定。
查看警示規則
在左側導覽列,選擇
。在容器監控頁面,單擊目的地組群對應操作列的警示規則。
在警示規則頁面,單擊目標警示規則對應操作列的詳情或警示歷史。
查看警示規則的詳細資料、警示歷史和故障資源。
修改警示規則
在左側導覽列,選擇
。在容器監控頁面,單擊目的地組群對應操作列的警示規則。
在警示規則頁面,單擊目標警示規則對應操作列的修改。
在修改警示規則面板,修改警示規則相關參數。
單擊確定。
刪除警示規則
在左側導覽列,選擇
。在容器監控頁面,單擊目的地組群對應操作列的警示規則。
在警示規則頁面,先單擊目標警示規則對應操作列的表徵圖,再單擊刪除。
在刪除警示確認對話方塊,單擊確認。
禁用警示規則
建立的警示規則預設處於正常狀態。
在左側導覽列,選擇
。在容器監控頁面,單擊目的地組群對應操作列的警示規則。
在警示規則頁面,先單擊目標警示規則對應操作列的表徵圖,再單擊禁用。
在禁用警示規則確認對話方塊,單擊確認。
啟用警示規則
當警示規則狀態為已禁用時,您可以對其執行啟用操作。
在左側導覽列,選擇
。在容器監控頁面,單擊目的地組群對應操作列的警示規則。
在警示規則頁面,先單擊目標警示規則對應操作列的表徵圖,再單擊啟用。
在啟用警示規則確認對話方塊,單擊確認。