如果您想监控目标事件流的各个指标,可以设置报警规则,当事件流的监控指标达到报警条件,会自动发送报警通知,帮助您及时得知异常监控数据并快速处理。
前提条件
操作步骤
- 登录事件总线EventBridge控制台,在左侧导航栏,单击事件流。
在顶部菜单栏,选择目标地域,然后在事件流页面,单击目标事件流名称。
进入目标事件流的概览页面,在左侧导航栏,单击指标监控。
在指标监控页面,单击右上角的
图标,单击设置报警规则,即可跳转至云监控控制台的报警规则页面,然后单击创建报警规则。
在创建报警规则面板,配置以下信息,然后单击确认。
配置项
示例
说明
配置项
示例
说明
产品
事件总线 - EventStreaming
在下拉列表中选择事件总线 - EventStreaming。
资源范围
全部资源
选择全部资源。
规则描述
规则名称:demo
指标类型:简单指标
监控指标:事件流流入事件量
告警级别:警告(Warn)
阈值:1000 count
单击添加规则,在下拉菜单中选择合适的指标类型。
在设置规则描述面板,先输入规则名称,再设置规则条件。
简单指标:先选择监控指标,再为其设置阈值和报警级别。
组合指标:先选择报警级别,再配置多指标报警描述。
如果您配置了多条报警规则,需要选择多指标关系。具体如下:
当所有指标都符合条件的时候则报警:当所有配置的报警规则都满足后,才会触发报警。
有一个满足条件就报警:当满足所有配置的告警规则中的任何一条,则直接触发报警。
表达式:先选择报警级别,再配置报警表达式。
智能阈值:关于智能阈值的更多信息,请参见概览和创建智能阈值报警规则。
单击确定。
关于如何设置复杂的表达式报警条件,请参见报警规则表达式说明。
通道沉默周期
15分钟
报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:1分钟、5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
生效时间
开始时间:00:00
结束时间:23:59
周期:周一至周日
报警规则的生效时间。报警规则仅在生效期内才会发送报警通知。
当报警规则不在生效期时,不会发送报警通知,但是报警历史记录仍然会显示在报警历史列表中。
标签
标签键:key
标签值:value
报警规则的标签。包括标签名称和标签值。
您最多可设置6组标签。
报警联系人组
test
发送报警的联系人组。
应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。
关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组。
报警回调
http://alert.aliyun.com:8080/callback
公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调。
当您需要测试报警回调地址的连通性时,可以执行以下操作。
单击回调地址正后方的测试。
在WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
您还可以设置Webhook的回调模板类型和语言,再次单击测试,获取对应的测试结果详情。
单击关闭。
单击高级设置,可设置该参数。
推送渠道
弹性策略
支持以下四个推送渠道,请按需打开相应开关并进行配置:
无数据处理方法
不做任何处理
无监控数据时报警的处理方式。取值:
不做任何处理(默认值)
发送无数据报警
视为恢复
单击高级设置,可设置该参数。