ACK One的艦隊監控基於可觀測監控Prometheus版的監控指標,提供了艦隊自身的監控大盤,您可以根據自身需求自訂警示規則,即時監控相關指標。本文介紹如何配置ACK One ArgoCD警示。
前提條件
配置ACK One ArgoCD警示
登入ACK One控制台,在左側導覽列選擇 。
在艦隊監控頁面右上方,單擊警示設定,進入Prometheus警示規則頁面。
單擊建立Prometheus警示規則,完成下列配置後單擊完成。更多詳細資料,請參見Prometheus警示規則模板。
配置資訊
說明
樣本
警示名稱
自訂警示的名稱。
ACK One ArgoCD Pod記憶體警示。
檢測類型
可選靜態閾值、自訂PromQL。
選擇靜態閾值。
Prometheus執行個體
填入您的ACK One艦隊名稱。
text-XXXX。
警示分組
您環境所需監控的Kubernetes分組。
Kubernetes負載。
警示指標
請根據實際需求選擇。重點關注容器記憶體使用量率和容器CPU使用率。
容器記憶體使用量率。
警示條件
基於警示指標預置內容設定警示事件產生條件。
當容器CPU使用率
大於
80%時,滿足警示條件。篩選條件
根據警示指標,設定當前配置的警示規則所適用的範圍,即所有符合篩選條件的資源滿足此條警示規則時,均會產生警示事件。
可選篩選條件包括:
遍曆:警示規則適用於當前Prometheus執行個體下的所有資源。篩選條件預設為遍曆。
等於:選擇該條件後,需繼續輸入具體資源名稱。所建立的警示規則將僅適用於對應資源。不支援同時填寫多個資源。
不等於:選擇該條件後,需繼續輸入具體資源名稱。所建立的警示規則將適用於除該資源之外的其他資源。不支援同時填寫多個資源。
正則匹配:選擇該條件後,按需輸入Regex匹配相應的資源名稱。所建立的警示規則將適用於符合該Regex的所有資源。
正則不匹配:選擇該條件後,按需輸入Regex匹配相應的資源名稱。所建立的警示規則將過濾符合該Regex的所有資源。
命名空間等於argocd,Pod:遍曆,容器:遍曆。
期間
當警示條件滿足時,直接產生警示事件:任何一個資料點滿足閾值,就會產生警示事件。
當警示條件滿足持續N分鐘時,才產生警示事件:即只有當滿足閾值的時間大於等於N分鐘時,才產生警示事件。
當警示條件滿足持續1分鐘時,才產生警示事件。
警示等級
自訂警示等級。預設警示等級為預設,警示嚴重程度從預設、P4、P3、P2、P1逐級上升。
P1。
警示內容
使用者收到的警示資訊。您可以使用Go template文法在警示內容中自訂警示參數變數。
命名空間:{{$labels.namespace}} / Pod: {{$labels.pod_name}} / 容器:{{$labels.container}} CPU使用率{{$labels.metrics_params_opt_label_value}} {{$labels.metrics_params_value}}%, 當前值{{ printf "%.2f" $value }}%
警示通知
可選極簡模式或普通模式。
選擇極簡模式。
通知對象
請根據實際需求選擇警示通知對象。
DingTalk警示。
通知時段
請根據實際需求填寫警示通知時間段。
23:00至01:00。
重複策略
請根據實際需求填寫每隔幾分鐘,進行警示週期性通知。
警示每隔10分鐘週期性通知。
配置完成後,觸發警示條件,可在警示通知對象側查看警示資訊。
說明可通過Prometheus控制台查看警示發送歷史,具體資訊,請參見查看警示發送歷史。