云监控会自动获取您当前阿里云账号下的云产品资源,您可以在云监控控制台查看ECI实例的监控图表,了解ECI实例运行状况,也可以设置报警规则,以便及时得知异常监控数据,并进行处理。
监控指标说明
云监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。对于ECI实例,云监控支持以下监控指标:
类别 | 指标 | 说明 |
实例 | instance_cpu_utilization | CPU利用率 |
instance_memory_utilization | 内存利用率 | |
GPU | gpu_memory_used | GPU显存使用量 |
gpu_memory_utilization | GPU显存利用率 | |
gpu_utilization | GPU利用率 | |
Volume | volume_space_total | 存储空间的总容量 |
volume_space_used | 存储空间的已使用容量 | |
volume_space_utilization | 存储空间的利用率 | |
volume_inode_total | Inode可用容量 | |
volume_inode_used | Inode使用量 | |
volume_inode_utilization | Inode利用率 |
Volume类别的指标仅支持临时存储空间和挂载的云盘数据卷,不支持其他类型的数据卷。
Linux的Inode节点中记录了文件的类型、大小、权限、所有者、文件连接的数目、创建时间与更新时间等重要信息,以及指向数据块的指针信息。Inode利用率达到100%会造成无法继续新建目录或者文件。
更多信息,请参见ECI监控指标。
查看监控数据
您可以在云监控控制台查看ECI实例的运行状态和各个指标的监控数据。
在页面上方,选择地域。
在实例列表中,单击要查看监控数据的ECI实例。
选择想要查看的监控指标类别。
默认分组:CPU和内存指标。
GPU:GPU相关指标。
仅指定GPU实例规格(例如gn7等规格族)创建的ECI GPU实例,可以查看GPU的指标数据。
选择该类别后,可进一步选择查看某一GPU的数据。
Volume:存储相关指标。
该类别指标仅支持临时存储空间和挂载的云盘数据卷,不支持其他类型的数据卷。
择该类别后,可进一步选择查看临时存储空间(EphemeralVolume)或者某个数据卷的数据。
根据需要选择或自定义设置时间段,查看监控数据。
说明一次最多可查看连续30天的监控数据。
默认分组
GPU
Volume
后续操作
您可以针对ECI实例的一个或多个监控指标设置报警规则(例如CPU利用率高于80%),当监控数据符合报警规则时,云监控会自动发送报警通知,便于您及时了解资源运行状态,处理异常情况。
教程示例:通过云监控及时获取存储空间不足的实例信息。