通过本文您可以了解容器服务Kubernetes版的集群、节点和容器组的监控项。
容器服务Kubernetes版集群的metrics-server组件必须升级到V0.3.8.5及以上版本。具体操作,请参见升级集群至v1.12版本前升级metrics-server组件。
对于2024年04月25日10:00:00以后创建的容器服务Kubernetes版集群,您必须手动开启metrics-server组件的云监控功能,才能通过云监控对其进行监控。具体操作,请参见开启容器服务Kubernetes版集群的云监控功能。
当您调用云监控的API接口时,需要获取当前云产品的Namespace和Period,具体取值如下:
Namespace为acs_k8s。
Period默认为60秒,也可以为60的整数倍。
当前云产品的MetricName和Dimensions的取值如下表所示。
监控项 | 单位 | MetricName | Dimensions | Statistics |
集群CPU分配上限 | Core | cluster.cpu.limit | userId、cluster | Value |
集群CPU资源分配最小需求 | Core | cluster.cpu.request | userId、cluster | Value |
集群CPU使用量 | Core | cluster.cpu.usage_rate | userId、cluster | Value |
集群CPU使用率 | % | cluster.cpu.utilization | userId、cluster | Value |
集群内存分配上限 | Byte | cluster.memory.limit | userId、cluster | Value |
集群内存最小分配 | Byte | cluster.memory.request | userId、cluster | Value |
集群内存使用率 | % | cluster.memory.utilization | userId、cluster | Value |
节点CPU可分配配额 | Core | node.cpu.allocatable | userId、cluster、node | Value |
节点CPU总量 | Core | node.cpu.capacity | userId、cluster、node | Value |
节点CPU配额限制 | Core | node.cpu.limit | userId、cluster、node | Value |
Node_CPU资源超卖率(usage/request) | % | node.cpu.oversale_rate | userId、cluster、node | Value |
节点CPU资源分配最小需求 | Core | node.cpu.request | userId、cluster、node | Value |
节点CPU使用量 | Core | node.cpu.usage_rate | userId、cluster、node | Value |
节点CPU使用率 | % | node.cpu.utilization | userId、cluster、node | Value |
节点文件系统可用大小 | Byte | node.filesystem.available | userId、cluster、node | Value |
节点文件系统Inodes | Count | node.filesystem.inodes | userId、cluster、node | Value |
节点文件系统配额 | Count | node.filesystem.limit | userId、cluster、node | Value |
节点文件系统使用 | Count | node.filesystem.usage | userId、cluster、node | Value |
节点内存可分配额 | Byte | node.memory.allocatable | userId、cluster、node | Value |
节点缓存内存使用量 | Count | node.memory.cache | userId、cluster、node | Value |
节点内存使用限制 | Byte | node.memory.limit | userId、cluster、node | Value |
Node_内存资源超卖率(usage/request) | % | node.memory.oversale_rate | userId、cluster、node | Value |
节点内存资源分配最小需求 | Count | node.memory.request | userId、cluster、node | Value |
节点内存使用量 | Count | node.memory.usage | userId、cluster、node | Value |
节点内存使用率 | % | node.memory.utilization | userId、cluster、node | Value |
节点工作内存使用量 | Byte | node.memory.working_set | userId、cluster、node | Value |
节点网络错误数 | Count | node.network.rx_errors | userId、cluster、node | Value |
节点网络接收错误率 | % | node.network.rx_errors_rate | userId、cluster、node | Value |
节点网络接收速率 | Byte/s | node.network.rx_rate | userId、cluster、node | Value |
节点网络流出错误比例 | % | node.network.tx_errors_rate | userId、cluster、node | Value |
节点网络发送速率 | Byte/s | node.network.tx_rate | userId、cluster、node | Value |
命名空间CPU资源分配上限 | Core | ns.cpu.limit | userId、cluster、namespace | Sum |
容器组CPU资源分配上限 | Core | pod.cpu.limit | userId、cluster、namespace、type、app、pod | Value |
Pod_CPU资源超卖率(usage/request) | % | pod.cpu.oversale_rate | userId、cluster、namespace、type、app、pod | Value |
容器组CPU资源分配最小需求 | Core | pod.cpu.request | userId、cluster、namespace、type、app、pod | Value |
容器组CPU使用量 | Core | pod.cpu.usage_rate | userId、cluster、namespace、type、app、pod | Value |
容器组CPU使用率(usage/limit) | % | pod.cpu.utilization | userId、cluster、namespace、type、app、pod | Value |
容器组内存资源Cache | Byte | pod.memory.cache | userId、cluster、namespace、type、app、pod | Value |
容器组内存资源分配上限 | Byte | pod.memory.limit | userId、cluster、namespace、type、app、pod | Value |
Pod_内存资源超卖率(usage/request) | % | pod.memory.oversale_rate | userId、cluster、namespace、type、app、pod | Value |
容器组内存资源分配最小需求 | Byte | pod.memory.request | userId、cluster、namespace、type、app、pod | Value |
容器组内存资源Rss | Byte | pod.memory.rss | userId、cluster、namespace、type、app、pod | Value |
容器组内存使用率(working_set/limit) | % | pod.memory.utilization | userId、cluster、namespace、type、app、pod | Value |
容器组工作内存使用量 | Byte | pod.memory.working_set | userId、cluster、namespace、type、app、pod | Value |
容器组网络接收错误速率 | Byte/s | pod.network.rx_errors_rate | userId、cluster、namespace、type、app、pod | Value |
容器组网络接受速率 | Byte/s | pod.network.rx_rate | userId、cluster、namespace、type、app、pod | Value |
容器组网络发送错误速率 | Byte/s | pod.network.tx_errors_rate | userId、cluster、namespace、type、app、pod | Value |
容器组网络发送速率 | Byte/s | pod.network.tx_rate | userId、cluster、namespace、type、app、pod | Value |
部署应用文件系统可用大小 | Byte | deployment.filesystem.available | userId、cluster、namespace、type、app | Sum |
部署应用文件系统上限 | Byte | deployment.filesystem.limit | userId、cluster、namespace、type、app | Sum |
容器组文件系统可用大小 | Byte | pod.filesystem.available | userId、cluster、namespace、type、app、pod | Value |
容器组文件系统上限 | Byte | pod.filesystem.limit | userId、cluster、namespace、type、app、pod | Value |
集群文件系统可用大小 | Byte | cluster.filesystem.available | userId、cluster | Value |
集群文件系统上限 | Byte | cluster.filesystem.limit | userId、cluster | Value |
部署应用CPU资源分配上限 | Core | deployment.cpu.limit | userId、cluster、namespace、type、app | Sum |
部署应用CPU资源分配最小需求 | Core | deployment.cpu.request | userId、cluster、namespace、type、app | Sum |
部署应用CPU使用量 | Core | deployment.cpu.usage_rate | userId、cluster、namespace、type、app | Sum |
部署应用内存资源分配上限 | Byte | deployment.memory.limit | userId、cluster、namespace、type、app | Sum |
部署应用内存资源分配最小需求 | Byte | deployment.memory.request | userId、cluster、namespace、type、app | Sum |
部署应用工作内存使用量 | Byte | deployment.memory.working_set | userId、cluster、namespace、type、app | Sum |
部署应用网络接收错误速率 | Byte/s | deployment.network.rx_errors_rate | userId、cluster、namespace、type、app | Sum |
部署应用网络接收速率 | Byte/s | deployment.network.rx_rate | userId、cluster、namespace、type、app | Sum |
部署应用网络发送错误速率 | Byte/s | deployment.network.tx_errors_rate | userId、cluster、namespace、type、app | Sum |
部署应用网络发送速率 | Byte/s | deployment.network.tx_rate | userId、cluster、namespace、type、app | Sum |
节点CPU软限制资源量(reservation) | Core | node.cpu.reservation | userId、cluster、node | Value |
节点内存总容量 | Byte | node.memory.capacity | userId、cluster、node | Value |
节点内存主页错误数(major page fault) | Count | node.memory.major_page_faults | userId、cluster、node | Value |
节点内存主页错误率(major page fault rate) | % | node.memory.major_page_faults_rate | userId、cluster、node | Value |
节点内存页错误数(page fault) | Count | node.memory.page_faults | userId、cluster、node | Value |
节点内存页错误率(page fault rate) | % | node.memory.page_faults_rate | userId、cluster、node | Value |
节点内存软限制资源量(reservation) | Byte | node.memory.reservation | userId、cluster、node | Value |
节点常驻内存使用量 | Byte | node.memory.rss | userId、cluster、node | Value |
命名空间CPU资源超卖率(usage/request) | % | ns.cpu.oversale_rate | userId、cluster、namespace | Value |
命名空间CPU资源分配最小需求 | Core | ns.cpu.request | userId、cluster、namespace | Sum |
命名空间CPU资源使用量 | Core | ns.cpu.usage_rate | userId、cluster、namespace | Sum |
命名空间所有pod内存限制(limit) | Byte | ns.memory.limit | userId、cluster、namespace | Sum |
命名空间内存资源超卖率(usage/request) | % | ns.memory.oversale_rate | userId、cluster、namespace | Value |
命名空间所有pod内存请求量(request) | Byte | ns.memory.request | userId、cluster、namespace | Sum |
命名空间工作内存使用量 | Byte | ns.memory.working_set | userId、cluster、namespace | Sum |