全部產品
Search
文件中心

Simple Log Service:設定恢複通知

更新時間:Aug 10, 2024

在密集監控情境中,您可以開啟恢複通知功能,便於及時感知異常恢複情況。即監控對象恢複正常時,Log Service將以警示通知形式發送一條恢複通知。

例如您建立了一個警示監控規則,用於監控各個主機的CPU指標,當CPU使用率超過95%時觸發警示,主機CPU使用率下降為正常值(低於等於95%)後發送一條恢複通知。具體配置如下圖所示,更多參數說明,請參見建立日誌警示監控規則

具體配置如下:

恢複通知

  • 查詢統計* | select promql_query_range('cpu_util') from metrics limit 1000

    該查詢和分析語句用於統計CPU的使用率。

  • 分組評估標籤自動

    時序資料的查詢和分析結果支援自動分組。

  • 觸發條件有資料匹配value > 95嚴重度:高

    當查詢和分析結果中存在value的值大於95時,觸發進階別的警示。

  • 添加標註:配置警示事件的標題和描述等標註資訊,您可以在標註資訊中引用欄位變數(例如${host})。更多資訊,請參見添加標籤和標註

  • 恢複通知:開啟恢複通知開關。

    恢複通知是特殊的警示通知,其警示狀態為恢複,普通警示的狀態為觸發。當您開啟該功能後,如果警示監控系統上次執行檢查時查詢和分析結果觸發了警示,而本次檢查時查詢和分析結果不滿足觸發條件,則會發送一條恢複通知。

Log Service以警示通知形式發送恢複通知,恢複通知中將標明警示狀態恢複