在密集监控场景中,您可以开启恢复通知功能,便于及时感知异常恢复情况。即监控对象恢复正常时,日志服务将以告警通知形式发送一条恢复通知。
例如您创建了一个告警监控规则,用于监控各个主机的CPU指标,当CPU使用率超过95%时触发告警,主机CPU使用率下降为正常值(低于等于95%)后发送一条恢复通知。具体配置如下图所示,更多参数说明,请参见创建日志告警监控规则。
具体配置如下:
查询统计:
* | select promql_query_range('cpu_util') from metrics limit 1000
该查询和分析语句用于统计CPU的使用率。
分组评估:标签自动
时序数据的查询和分析结果支持自动分组。
触发条件:有数据匹配,value > 95,严重度:高
当查询和分析结果中存在value的值大于95时,触发高级别的告警。
添加标注:配置告警事件的标题和描述等标注信息,您可以在标注信息中引用字段变量(例如${host})。更多信息,请参见添加标签和标注。
恢复通知:打开恢复通知开关。
恢复通知是特殊的告警通知,其告警状态为恢复,普通告警的状态为触发。当您开启该功能后,如果告警监控系统上次执行检查时查询和分析结果触发了告警,而本次检查时查询和分析结果不满足触发条件,则会发送一条恢复通知。
日志服务以告警通知形式发送恢复通知,恢复通知中将标明告警状态为恢复。