本文以ARMS产品上报告警,并发送告警通知到钉钉群为例,帮助您快速使用告警管理功能,从创建告警、配置联系人到接收到第一张告警卡片。
操作流程
步骤一:集成监控产品
此处以ARMS产品为例,告警管理默认集成ARMS监控产品。其他监控产品集成到告警管理的操作,请参见集成概述。
步骤二:创建通知对象
告警管理支持将告警通知通过短信、电话、邮件、钉钉等方式发送给通知对象。此处以创建钉群为例,展示如何通过告警管理中的钉钉机器人向您指定的钉钉群发送告警通知。创建其他通知对象的操作,请参见通知对象概述。
- 登录ARMS控制台,在左侧导航栏选择 。
- 单击 钉钉/飞书/企微页签,然后单击钉钉。
- 在新建机器人面板设置以下参数,然后单击确定。
参数 说明 名称 自定义钉钉机器人的名称。 签名密钥 可选,如配置了密钥则会通过加签的方式进行钉钉认证。如果没有配置密钥,默认使用关键字白名单的方式进行认证,白名单关键字为告警。 机器人地址 输入钉钉机器人的Webhook地址。 机器人是否发送每日统计 选中后,需要输入每日统计信息发送的时间点,使用英文逗号(,)分隔多个发送时间点,时间点格式为 HH:SS
。ARMS告警管理将在设置的时间点发送今日产生告警的总数、解决数和待解决数。卡片内容配置 自定义告警通知卡片样式和内容。
步骤三:创建通知策略
此处展示如何将所有告警事件中告警等级为P1的告警事件合并为一条告警通知发送至钉钉群中。更多信息,请参见通知策略。
- 登录ARMS控制台,在左侧导航栏选择 。
- 在通知策略页面单击新建通知策略。
- 在新建通知策略页面设置通知策略名称。
在匹配规则区域设置告警事件的匹配规则。
重要静默策略优先于通知策略,即已被静默策略匹配到的告警事件将会被静默,无法再进行通知策略的事件匹配。
选择无预设来源。通知策略会针对所有告警事件进行匹配规则过滤并发送通知。
设置匹配规则表达式,您可以自定义标签或选择已有的标签。例如:_aliyun_arms_alert_level等于P1。
单击下一步。
在事件分组区域,设置告警事件不需要分组,然后单击下一步。
在通知对象区域,设置以下参数。
选择通知对象为钉钉/飞书/企微,并选择上文步骤二创建的钉钉机器人。
选择告警恢复后是否发送恢复通知。
发送恢复通知:当告警下面全部事件都恢复时,告警状态是否自动恢复为已解决。当告警恢复时,系统将会发送通知给告警处理人。
设置通知模板,更多信息,请参见配置通知模板和Webhook模板。
设置通知时段,告警会在设置的通知时段内发送告警通知。例如:通知时段为
00:00-23:59
。可选:选择告警需要推送到的工单系统。集成工单系统的操作,请参见通知集成。
单击下一步。
在重复/升级策略区域设置告警是否需要重复通知或使用升级策略。
不需要升级策略,告警未恢复状态下只发送一次。
重复通知:设置重复频率。当告警未恢复时,告警会以设置的重复频率循环发送告警信息直至告警恢复。
升级策略:选择升级策略,告警未恢复状态下,告警通知将会根据升级策略发送通知给其他通知对象。
设置完成后,单击保存。
步骤四:创建告警
不同的监控创建方法不同,ARMS各子产品创建告警的方法,请参见:
应用监控创建告警的操作,请参见应用监控告警规则(新版)。
前端监控创建告警的操作,请参见前端监控告警规则(新版)。
Prometheus监控创建告警的操作,请参见创建报警。
步骤五:查看和管理告警卡片
钉钉群中的告警卡片显示了告警的基本信息,您可以在通知策略中通过编辑告警通知模板来修改告警卡片的显示内容。更多信息,请参见在告警通知群中处理告警。