執行個體健康狀態表示執行個體作業系統的運行狀態,通過執行個體健康狀態,您可以快速確定ECS執行個體是否真正可用(例如是否可以通過SSH、RDP等訪問)。本文介紹執行個體健康狀態與生命週期狀態的區別和關係,以及如何通過ECS控制台或API查看執行個體健康狀態。
執行個體健康狀態說明
執行個體健康狀態關注的是執行個體作業系統的運行狀態,包括作業系統是否正常運行,執行個體的網路是否連通,CPU或磁碟等效能是否受到影響等。
通過監控執行個體健康可以及時發現執行個體作業系統運行狀態是否正常。
例如,執行個體的生命週期狀態為Running,並不意味著執行個體的作業系統已經運行起來了;只有當執行個體健康狀態為OK時,表示執行個體的作業系統已經運行起來,才可以通過SSH或RDP進行訪問。
執行個體健康狀態每分鐘更新一次,您可以根據執行個體健康狀態來識別執行個體是否存在問題,以便及時處理相應問題。
您可以通過執行個體健康狀態改變通知事件警示規則,及時瞭解執行個體健康狀態。更多資訊,請參見建立系統事件警示規則。
執行個體健康狀態與執行個體生命週期狀態之間的區別和對應的情境說明,如下表所示。
執行個體生命週期狀態(Lifecycle Status)
執行個體健康狀態(HealthStatus)
執行個體健康狀態中文描述
執行個體真正狀態說明
修複方案
Starting
Initializing
初始化中
執行個體正處於初始化階段。
等待執行個體啟動。
Running
執行個體作業系統正在啟動中。
等待執行個體啟動。
Running
Impaired
作業系統運行存在異常
執行個體作業系統正在運行中,但是執行個體可能受到底層宿主機、儲存、網路等限制,導致效能受到影響或降級。
執行個體作業系統正在運行中,但是遭到OOM出現了藍屏、夯住(Hang)等問題。
通過啟動/重啟執行個體,響應對應執行個體因作業系統錯誤需重啟事件。
上報故障,等待阿里雲處理。
Running
OK
正常
執行個體作業系統正在運行中,且執行個體未受任何外部因素影響。
無
Stopping/Stopped
InsufficientData
資料不足
執行個體處於關機中或已關機狀態。
啟動執行個體。
Deleted
NotApplicable
不適用
執行個體當前生命週期狀態無效。
無
查看ECS執行個體健康狀態
在ECS控制台查看執行個體健康狀態
登入ECS管理主控台。
在左側導覽列,選擇 。
在頁面左側頂部,選擇目標資源所在的資源群組和地區。
添加健康狀態顯示列。
在執行個體列表的右上方,單擊表徵圖。
在執行個體列表設定對話方塊裡,單擊未顯示地區中健康狀態右側的表徵圖,然後單擊繼續。
找到目標執行個體,在健康狀態列,查看執行個體健康狀態。
通過阿里雲CLI查看執行個體健康狀態
執行以下命令,調用DescribeInstances和DescribeInstancesFullStatus查看特定執行個體的健康狀態。
aliyun ecs DescribeInstances --RegionId TheRegionId --output cols=InstanceId,InstanceName rows=Instances.Instance[] aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --InstanceId.1 i-bp1afnc98r8k69****** --output cols=HealthStatus rows=InstanceFullStatusSet.InstanceFullStatusType[]
執行以下命令,調用DescribeInstancesFullStatus查看指定地區下所有執行個體的健康狀態。
詳細的地區ID列表,請參見地區和可用性區域。
aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --output cols=HealthStatus rows=InstanceFullStatusSet.InstanceFullStatusType[]
發起健康狀態檢查請求後,阿里雲會為請求的每台執行個體返回健康狀態。
返回資訊中,HealthStatus表示執行個體的健康狀態,Status表示執行個體的生命週期狀態。
如果執行個體處於正常狀態,則健康狀態為OK。
如果執行個體處於異常狀態,則健康狀態會返回其他指標。
更多執行個體健康狀態與生命週期狀態區別與對應情境說明,請參見執行個體健康狀態說明。