您可以为AnalyticDB for MySQL集群设置报警规则,实时监控集群CPU使用率、磁盘使用率、IOPS使用率、查询耗时以及数据库连接数。系统在监控数据满足条件时,会通知报警联系组中的所有联系人。
背景信息
云原生数据仓库 AnalyticDB MySQL 版支持监控报警,监控报警是通过阿里云云监控实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系组,以便发生报警时,能及时通知到相关联系人。
监控项包括集群CPU使用率、磁盘使用率、IOPS使用率、查询耗时以及数据库连接数等指标,详情请参见云原生数据仓库AnalyticDB MySQL版3.0。例如,您可以配置磁盘监控告警,当磁盘水位(磁盘使用率)>=80%时,系统将发出报警通知;当磁盘水位(磁盘使用率)>=90%时,集群将被锁定,系统会发出报警通知并拒绝您的写数据请求,即写入数据会报错,读数据不受影响。一旦发生磁盘异常立刻为您发出报警通知,让您及时知晓磁盘水位并管理磁盘空间,但每个报警联系人一天最多被通知4次磁盘报警,收到报警时,请及时处理保证业务正常运行。
操作步骤
登录云原生数据仓库AnalyticDB MySQL控制台,在左上角选择集群所在地域。在左侧导航栏,单击集群列表。在集群列表上方,选择产品系列,然后单击目标集群ID。
在左侧导航栏单击监控报警。
单击报警页签,在报警页面,单击创建报警规则。
在创建报警规则页面,按照页面提示进行参数配置。
参数
说明
资源范围
报警规则的作用范围,取值说明:
全部资源:表示该规则作用在用户名下对应产品的全部实例上。例如:您设置了全部资源粒度的云原生数据仓库 AnalyticDB MySQL 版磁盘使用率大于或等于80%报警,则只要用户名下有云原生数据仓库 AnalyticDB MySQL 版资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。
应用分组:报警规则作用于指定云产品的指定应用分组内的全部资源上。
实例:表示该规则只作用于指定云产品的指定实例上。例如您如果设置了实例粒度的磁盘使用率大于或等于80%报警,则当该实例磁盘使用率大于或者等于80%时,会发送报警通知。
规则描述
报警规则的主体。当监控数据满足报警条件时,触发报警规则。 规则描述的设置方法如下:
单击添加规则。
在添加规则描述面板,设置规则名称、指标类型、监控指标、阈值及报警级别和监控图表预览等。
单击确定。
通道沉默周期
报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
生效时间
报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
重要磁盘水位报警每个报警联系人一天最多被通知4次,超过4次将被静默。
报警联系人组
发送报警的联系人组。
应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组。
报警回调
填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调。
说明单击高级设置,可设置该参数。
弹性伸缩
如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域、弹性伸缩组和弹性伸缩规则。
说明单击高级设置,可设置该参数。
日志服务
如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务。您需要设置日志服务的地域、Project和Logstore。
关于如何创建Project和Logstore,请参见快速入门。
说明单击高级设置,可设置该参数。
轻量消息队列(原 MNS)— topic
如果您打开轻量消息队列(原 MNS)— topic开关,当报警发生时,会将报警信息发送至消息服务的主题。您需要设置消息服务的地域和主题。
关于如何创建主题,请参见创建主题。
无数据报警处理方法
无监控数据时报警的处理方式。取值:
不做任何处理(默认值)
发送无数据报警
视为恢复
说明单击高级设置,可设置该参数。
标签
报警标签会添加到报警内容中。标签名称和标签值是一一对应的,可以设置多对标签。
完成上述参数配置后,单击确认即可。