回復通知機能を使用して、監視対象オブジェクトが回復するかどうかを確認できます。 復旧通知機能を有効にすると、監視対象オブジェクトが復旧すると、Simple Log Serviceは復旧通知を送信します。
たとえば、アラートモニタリングルールは、各ホストのCPUメトリックを監視するために作成されます。 ホストの CPU 使用率が 95% を超えた場合、アラートがトリガーされます。 そして、CPU使用率が95% 以下に低下した場合には、復旧通知を送信する。 次の図は、設定を示しています。 アラートモニタリングルールのパラメーターの詳細については、「ログのアラートモニタリングルールの作成」をご参照ください。
クエリ統計:
* | select promql_query_range('cpu_util') from metrics limit 1000
を指定します。このクエリ文を使用して、各ホストの CPU 使用率を計算します。
グループ評価: [自動タグ] を選択します。
時系列データのクエリと分析結果を自動的にグループ化することを指定します。
トリガー条件: [data matches the expression] を選択し、value > 95を入力し、[Severity: High] を選択します。
クエリおよび分析結果のvalueフィールドが95より大きい場合、高重大度のアラートがトリガーされます。
注釈の追加: アラートのタイトルや説明などの注釈を指定します。 注釈で ${host} などのフィールド変数を参照できます。 詳細については、「ラベルと注釈」をご参照ください。
リカバリ通知: リカバリ通知をオンにします。
回復通知は特別なアラート通知です。 回復通知では、アラートステータスは解決済みです。 通常のアラート通知では、アラートステータスは発火です。 たとえば、アラートモニタリングルールで回復通知機能が有効化されている場合、 前回のチェックでアラートがトリガーされ、現在のチェックでトリガー条件が満たされていない場合、リカバリ通知が送信されます。
Simple Log Serviceは、アラート通知の形式でリカバリ通知を送信します。 リカバリ通知では、[アラートステータス] フィールドに [解決済み] が表示されます。