在密集監控情境中,您可以開啟恢複通知功能,便於及時感知異常恢複情況。即監控對象恢複正常時,Log Service將以警示通知形式發送一條恢複通知。
例如您建立了一個警示監控規則,用於監控各個主機的CPU指標,當CPU使用率超過95%時觸發警示,主機CPU使用率下降為正常值(低於等於95%)後發送一條恢複通知。具體配置如下圖所示,更多參數說明,請參見建立日誌警示監控規則。
具體配置如下:
查詢統計:
* | select promql_query_range('cpu_util') from metrics limit 1000
該查詢和分析語句用於統計CPU的使用率。
分組評估:標籤自動
時序資料的查詢和分析結果支援自動分組。
觸發條件:有資料匹配,value > 95,嚴重度:高
當查詢和分析結果中存在value的值大於95時,觸發進階別的警示。
添加標註:配置警示事件的標題和描述等標註資訊,您可以在標註資訊中引用欄位變數(例如${host})。更多資訊,請參見添加標籤和標註。
恢複通知:開啟恢複通知開關。
恢複通知是特殊的警示通知,其警示狀態為恢複,普通警示的狀態為觸發。當您開啟該功能後,如果警示監控系統上次執行檢查時查詢和分析結果觸發了警示,而本次檢查時查詢和分析結果不滿足觸發條件,則會發送一條恢複通知。
Log Service以警示通知形式發送恢複通知,恢複通知中將標明警示狀態為恢複。