全部產品
Search
文件中心

Simple Log Service:建立警示監控規則

更新時間:Nov 22, 2024

建立日誌警示監控規則後,Log Service根據您定義的檢查頻率、觸發條件等配置產生警示,並根據您所選擇的警示策略和行動策略進行警示降噪和通知。

前提條件

  • 已採集資料。

    支援採集日誌時序資料

    重要

    基於查詢和分析語句建立警示監控規則前,需要先將日誌採集到Standard Logstore中。更多資訊,請參見管理Logstore

  • 如果採集的是日誌,需要建立索引。具體操作,請參見建立索引

操作步驟

  1. 登入Log Service控制台

  2. 在Project列表地區,單擊目標Project。

    image

  3. 日誌儲存 > 日誌庫頁簽中,單擊目標Logstore。

    image

  4. 查詢/分析頁面,單擊警示表徵圖表徵圖。

    image

  5. 警示監控規則面板中,配置如下參數,單擊確定

    參數

    說明

    規則名稱

    警示監控規則的名稱。

    檢查頻率

    Log Service根據您配置的頻率對查詢和分析結果進行檢查。

    • 每小時:每小時檢查一次查詢和分析結果。

    • 每天:在每天的某個固定時間點檢查一次查詢和分析結果。

    • 每周:在周幾的某個固定時間點檢查一次查詢和分析結果。

    • 固定間隔:按照固定間隔檢查查詢和分析結果。

    • Cron:通過Cron運算式指定時間間隔,按照指定的時間間隔檢查查詢和分析結果。

      說明

      Cron運算式在Log Service的警示規則裡最小精度為分鐘,格式為24小時制。例如:

      • 0/5 * * * *從0分鐘開始,每隔5分鐘檢查一次

      • 0 0/1 * * *從0點0分開始,每隔1小時檢查一次

      • 0 18 * * *每天18點0分檢查一次

      • 0 0 1 * *每月1日0點0分檢查一次

      Cron運算式文法,可參見Cron定時任務

    查詢統計

    單擊輸入框,在查詢統計對話方塊中,設定查詢和分析語句。

    • 關聯報表頁簽:選擇監控儀錶盤。

    • 進階配置頁簽:

      • 類型列表選擇:

      • 選擇類型日誌庫指標庫,且設定了查詢和分析語句時,您可以選擇是否開啟獨享SQL。更多資訊,請參見開啟SQL獨享版

        • 自動:預設不使用獨享SQL。當遇到查詢並發限制或者查詢結果不精確時,自動嘗試使用獨享SQL重新查詢。

        • 啟用:始終使用獨享SQL進行查詢和分析。

        • 關閉:關閉獨享SQL。

    配置多個查詢統計時,您可以指定集合操作關聯多個查詢結果。更多資訊,請參見設定查詢統計語句

    分組評估

    Log Service支援對查詢和分析結果進行分組。更多資訊,請參見設定分組評估

    • 標籤自訂:Log Service根據您配置的欄位對查詢和分析結果進行分組。分組後,每個組單獨評估觸發條件。在每個檢查周期內,查詢和分析結果滿足觸發條件時,各個分組各自產生一條警示。

      支援設定多個欄位。

    • 不分組:在每個檢查周期內,滿足觸發條件時,只產生一條警示。

    • 標籤自動:當您在查詢統計中選擇指標庫(即監控時序資料的查詢和分析結果)時 ,Log Service支援標籤自動分組。

      分組後,每個組單獨評估觸發條件。在每個檢查周期內,查詢和分析結果滿足觸發條件時,各個分組各自產生一條警示。

    觸發條件

    配置觸發條件及嚴重度。

    • 觸發條件

      • 有資料:當查詢和分析結果中存在資料時,觸發警示。

      • 有特定條資料:當查詢和分析結果中存在N條資料時,觸發警示。

      • 有資料匹配:當查詢和分析結果中存在資料滿足警示運算式時,觸發警示。

      • 有特定條資料匹配:當查詢和分析結果中存在N條資料滿足警示運算式時,觸發警示。

    • 嚴重度

      主要用於警示降噪控制和警示通知控制,即您在建立警示策略或行動策略時,可添加關於警示嚴重度的判斷條件。更多資訊,請參見設定警示嚴重度

      • 簡單配置:直接選擇警示嚴重度,則表示通過該規則產生的警示都為同一嚴重度。

      • 分條件配置:單擊添加,分條件設定警示嚴重度。

    警示條件運算式的相關文法,請參見警示條件運算式文法

    添加標籤

    Log Service允許您給產生的警示添加標識性屬性,索引值對格式。主要用於警示降噪控制和警示通知控制,即您在建立警示策略或行動策略時,可添加關於標籤的判斷條件。更多資訊,請參見添加標籤和標註

    添加標註

    Log Service允許您給產生的警示添加非標識性屬性,索引值對格式。主要用於警示降噪控制和警示通知控制,即您在建立警示策略或行動策略時,可添加關於標註的判斷條件。更多資訊,請參見添加標籤和標註

    您還可以開啟自動添加標註開關,系統自動在警示中添加__count__等資訊。更多資訊,請參見自動標註

    恢複通知

    開啟恢複通知開關後,警示恢複時觸發一條恢複警示。例如您建立了一個警示監控規則,用於監控各個主機的CPU指標,當CPU使用率超過95%時觸發警示,主機CPU使用率下降為正常值(低於等於95%)後發送一條恢複通知。更多資訊,請參見設定恢複通知

    進階配置>連續觸發閾值

    連續多少次執行檢查評估都滿足觸發條件時,才會觸發一次警示。不滿足觸發條件時不計入統計。

    進階配置>無資料警示

    開啟無資料警示開關後,如果查詢和分析的結果(有多個時,進行集合操作後的結果)為無資料的次數超過連續觸發閾值,則產生一條警示。更多資訊,請參見無資料警示

    輸出目標

    輸出目標用於配置警示事件的輸出位置,可以配置一個或多個輸出目標。

    • 事件庫:將警示事件寫入到EventStore。

    • CloudMonitor事件中心:將警示事件寫入到CloudMonitor系統事件中心,通過CloudMonitor對警示進行管理和通知。

    • SLS通知:將警示事件輸出到SLS的通知服務,通過警示策略、行動策略等對警示進行管理和通知。

    輸出目標-事件庫

    • 開啟:開啟事件庫開啟開關後,警示將寫入到EventStore中。

    • 地區:警示寫入的EventStore所屬地區。

    • Project:警示寫入的EventStore所屬專案。

    • 事件庫:警示寫入的EventStore。

    • 授權方式

      • 預設角色:單擊前往授權,根據介面提示完成授權,並扮演阿里雲系統角色AliyunLogETLRole將警示寫入目標EventStore。具體操作,請參見預設角色授權

      • 自訂角色:扮演自訂角色將警示寫入目標EventStore,填寫角色ARN。具體操作,請參見自訂角色授權

    輸出目標-CloudMonitor事件中心

    • 開啟:開啟CloudMonitor事件中心開啟開關後,警示將發送到CloudMonitor事件中心。更多資訊,請參見查看系統事件

    輸出目標-SLS通知

    • 開啟:開啟SLS通知開關後,警示將發送到SLS通知服務進行後續的管理和通知。

    • 警示策略

      極簡模式

      • Log Service預設使用SLS內建動態警示策略(sls.builtin.dynamic)進行警示管理。

      • 只需配置行動組。

        您配置行動組後,Log Service自動為您建立一個名為規則名稱-行動策略的行動策略。由該警示監控規則引發的所有警示都通過該行動策略發送通知。如何配置,請參見通知渠道說明

        重要

        您可以在行動策略管理頁面,修改該行動策略。具體操作,請參見建立行動策略。如果您在修改行動策略時添加了判斷條件,則此處的警示策略將自動變更為普通模式

      普通模式

      • Log Service預設使用SLS內建動態警示策略(sls.builtin.dynamic)進行警示管理。

      • 選擇內建的或自訂的行動策略進行警示通知。如何建立行動策略,請參見建立行動策略

      • 重複等待:在重複等待時間內,重複的警示只觸發一次行動策略,即只發送一次警示通知。

      進階模式

      • 選擇內建的或自訂的警示策略進行警示管理。如何建立警示策略,請參見建立警示策略

      • 選擇內建的或自訂的行動策略進行警示通知。如何建立行動策略,請參見建立行動策略。還可以開啟或關閉自訂行動策略。更多資訊,請參見動態行動策略機制

      • 重複等待:在重複等待時間內,重複的警示只觸發一次行動策略,即只發送一次警示通知。