实例健康状态表示实例操作系统的运行状态,通过实例健康状态,您可以快速确定ECS实例是否真正可用(例如是否可以通过SSH、RDP等访问)。本文介绍实例健康状态与生命周期状态的区别和关系,以及如何通过ECS控制台或API查看实例健康状态。
实例健康状态说明
实例健康状态关注的是实例操作系统的运行状态,包括操作系统是否正常运行,实例的网络是否连通,CPU或磁盘等性能是否受到影响等。
通过监控实例健康可以及时发现实例操作系统运行状态是否正常。
例如,实例的生命周期状态为Running,并不意味着实例的操作系统已经运行起来了;只有当实例健康状态为OK时,表示实例的操作系统已经运行起来,才可以通过SSH或RDP进行访问。
实例健康状态每分钟更新一次,您可以根据实例健康状态来识别实例是否存在问题,以便及时处理相应问题。
您可以通过实例健康状态改变通知事件报警规则,及时了解实例健康状态。更多信息,请参见创建系统事件报警规则。
实例健康状态与实例生命周期状态之间的区别和对应的场景说明,如下表所示。
实例生命周期状态(Lifecycle Status)
实例健康状态(HealthStatus)
实例健康状态中文描述
实例真正状态说明
修复方案
Starting
Initializing
初始化中
实例正处于初始化阶段。
等待实例启动。
Running
实例操作系统正在启动中。
等待实例启动。
Running
Impaired
操作系统运行存在异常
实例操作系统正在运行中,但是实例可能受到底层宿主机、存储、网络等限制,导致性能受到影响或降级。
实例操作系统正在运行中,但是遭到OOM出现了蓝屏、夯住(Hang)等问题。
通过启动/重启实例,响应对应实例因操作系统错误需重启事件。
上报故障,等待阿里云处理。
Running
OK
正常
实例操作系统正在运行中,且实例未受任何外部因素影响。
无
Stopping/Stopped
InsufficientData
数据不足
实例处于关机中或已关机状态。
启动实例。
Deleted
NotApplicable
不适用
实例当前生命周期状态无效。
无
查看ECS实例健康状态
在ECS控制台查看实例健康状态
登录ECS管理控制台。
在左侧导航栏,选择 。
在页面左侧顶部,选择目标资源所在的资源组和地域。
添加健康状态显示列。
在实例列表的右上角,单击图标。
在实例列表设置对话框里,单击未显示区域中健康状态右侧的图标,然后单击继续。
找到目标实例,在健康状态列,查看实例健康状态。
通过阿里云CLI查看实例健康状态
执行以下命令,调用DescribeInstances和DescribeInstancesFullStatus查看特定实例的健康状态。
aliyun ecs DescribeInstances --RegionId TheRegionId --output cols=InstanceId,InstanceName rows=Instances.Instance[] aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --InstanceId.1 i-bp1afnc98r8k69****** --output cols=HealthStatus rows=InstanceFullStatusSet.InstanceFullStatusType[]
执行以下命令,调用DescribeInstancesFullStatus查看指定地域下所有实例的健康状态。
详细的地域ID列表,请参见地域和可用区。
aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --output cols=HealthStatus rows=InstanceFullStatusSet.InstanceFullStatusType[]
发起健康状态检查请求后,阿里云会为请求的每台实例返回健康状态。
返回信息中,HealthStatus表示实例的健康状态,Status表示实例的生命周期状态。
如果实例处于正常状态,则健康状态为OK。
如果实例处于异常状态,则健康状态会返回其他指标。
更多实例健康状态与生命周期状态区别与对应场景说明,请参见实例健康状态说明。