全部产品
Search
文档中心

文件存储 CPFS:配置基础告警规则

更新时间:Nov 14, 2024

当您需要监控文件存储CPFS文件系统资源的使用情况时,可以创建报警规则。如果资源的监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据,并快速处理。

前提条件

基础告警配置

  1. 登录云监控控制台

  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 报警规则页面,单击创建报警规则

  4. 创建报警规则面板,设置报警规则相关参数。

    1. 按如下说明填写基础配置中涉及的各项参数。

      配置项

      说明

      产品

      • 如果您是监测文件系统的容量,请选择文件存储CPFS

      • 如果您是监测文件系统的性能,请选择文件存储NAS

      资源范围

      报警规则作用的资源范围。取值:

      • 全部资源:报警规则作用于文件存储CPFS的全部资源上。

      • 应用分组:报警规则作用于文件存储CPFS的指定应用分组内的全部资源上。

      • 实例:报警规则作用于文件存储CPFS的指定资源上。

      关联资源

      当资源范围为应用分组实例时,请在下拉列表中选择需要配置的关联资源。

      规则描述

      报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:

      1. 单击添加规则

      2. 设置规则描述面板,先输入规则名称,再设置规则条件。

        • 简单指标:先选择监控指标,再为其设置阈值和报警级别。

        • 组合指标:先选择报警级别,再为两个或两个以上的监控指标设置报警条件。

        • 表达式:先选择报警级别,再为其设置报警条件。关于如何设置复杂的报警条件,请参见报警规则表达式说明

        • 智能阈值:关于智能阈值的更多信息,请参见概览创建智能阈值报警规则

          说明

          智能阈值功能处于邀测阶段,您需要提交工单申请。

      3. 单击确定

      关于文件存储CPFS支持的监控指标,请参见监控项

      配置示例

      例如:配置文件系统数据量连续3个周期大于或等于4,155,796,933,836字节时,触发紧急级别的报警。报警规则

      说明

      当文件系统进行扩容操作后,由于总存储空间发生了变化,您需要修改报警规则,重新设置阈值。

      如果需要监控文件系统的多个性能指标,您可以选择组合指标配置多个监控指标项。

      通道沉默周期

      报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

      某监控指标达到报警阈值时发送报警。

      • 如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知。

      • 如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

      例如:当通道沉默周期选择12小时时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。

      生效时间

      报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。

      报警联系人组

      发送报警的联系人组。

      应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。

      关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系组

      标签

      报警规则的标签。包括标签名称和标签值。

      说明

      您最多可设置6组标签。

    2. (可选)单击高级设置并按如下说明配置各项参数。

      配置项

      说明

      报警回调

      公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调

      当您需要测试报警回调地址的连通性时,可以执行以下操作。

      1. 单击回调地址正后方的测试

        WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。

        说明

        您还可以设置Webhook的回调模板类型语言,再次单击测试,获取对应的测试结果详情。

      2. 单击关闭

      弹性伸缩

      如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域弹性伸缩组弹性伸缩规则

      日志服务

      如果您打开日志服务开关,当报警发生时,会将报警信息发送至日志服务的日志库。您需要设置日志服务的地域ProjectNameLogstore

      关于如何创建Project和Logstore,请参见快速入门

      轻量消息队列(原MNS)— topic

      如果您打开轻量消息队列(原 MNS)— topic开关,当报警发生时,会将报警信息发送至轻量消息队列的主题。您需要设置轻量消息队列的地域和主题。

      关于如何创建主题,请参见创建主题

      函数计算

      如果您打开函数计算开关,当报警发生时,会将报警通知发送至函数计算进行格式处理。您需要设置函数计算的地域、服务和函数。

      关于如何设置服务和函数,请参见通过控制台创建函数应用

      无数据处理方法

      监控数据时报警的处理方式。取值:

      • 不做任何处理(默认值)

      • 发送无数据报警

      • 视为恢复

  5. 单击确认,完成报警规则的设置。

    当文件系统的监控项超过设定阈值后会自动发送报警通知,使您及时获取监控数据异常。

相关文档