阿里云容器计算服务ACS使用容器智能运维平台提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。
诊断功能介绍
容器智能运维平台提供的诊断功能如下表所示。
诊断项 | 说明 |
诊断K8s Pod状态异常相关的问题,例如Pod启动失败,Pod频繁重启等 。 | |
诊断Service相关的问题,例如Service配置、资源配额、异常事件信息等。 | |
诊断Ingress相关的流量配置等问题。 |
配置故障诊断
使用故障诊断功能时,系统将在您的集群上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。
配置Pod诊断与配置Service、Ingress等诊断操作类似。这里以配置Pod诊断为例,介绍如何配置故障诊断功能。
登录容器计算服务控制台,在左侧导航栏选择集群。
在集群列表页面,单击目标集群名称,然后在左侧导航栏,选择
,并按照对话框提示进行授权。在故障诊断页面,单击Pod诊断。
在Pod诊断页面,单击诊断。
在选择Pod面板,选择Pod命名空间和Pod名称,仔细阅读注意事项后选中我已知晓并同意,然后单击发起诊断。
说明您可以根据页面提示查看诊断进展。诊断完成后,诊断页面将显示诊断结果和诊断项,供您查看异常原因并修复问题。
看诊断结果
在故障诊断页面诊断列表的操作列,单击目标诊断报告对应的诊断详情,在诊断详情页面查看详细诊断结果。
根据集群配置,具体检查项可能稍有不同。实际结果请以诊断页面结果为准。
诊断项 | 对应的检查项状态 | 说明 |
Pod诊断 |
| Pod诊断包括Pod、ClusterComponent检查项。通过Pod状态、集群组件状态综合判定Pod异常原因。在诊断详情页面,可以看到Pod的诊断结果、修复建议及具体的诊断项列表。 鼠标悬浮在检查项右侧图标上,即可查看检查项说明。 如果有异常或警告类的检查项,会显示在待处理页签中。 检查项状态为异常时,可以在目标检查项右侧状态中的查看详情的Tips中查看异常。 |
Service诊断 | Service诊断包括Service和ResourceQuotas检查项。通过检查CLB计费类型、证书、配额、异常Event等检查项判定Service异常原因。 鼠标悬浮在检查项右侧图标上,即可查看检查项说明。 如果有异常或警告类的检查项,会显示在待处理页签中。 检查项状态为异常时,可以在目标检查项右侧状态中的查看详情的Tips中查看异常。 | |
Ingress诊断 | Ingress诊断包括Ingress、Addon、SLB检查项。通过Ingress状态、Ingress插件状态和SLB状态综合判定Ingress异常原因。 鼠标悬浮在检查项右侧图标上,即可查看检查项说明。 如果有异常或警告类的检查项,会显示在待处理页签中。 检查项状态为异常时,可以在目标检查项右侧状态中的查看详情的Tips中查看异常。 |