ACK叢集的生命週期涉及多個階段和狀態,從叢集的建立部署、運行維護(擴容縮容、更新升級、排水移除等),到最終的刪除。本文介紹ACK叢集的全生命週期,協助您更好地理解和管理叢集。
叢集生命週期
ACK叢集在不同狀態下的含義和叢集的狀態流轉圖如下。
ACK會定時檢測叢集運行狀態。如果叢集符合特定的異常條件,叢集將自動變更為不活躍(inactive)或不可用(unavailable)的異常狀態。屆時,ACK會通過郵件、站內信的方式向您發送相關通知。
對於ACK託管叢集Pro版,狀態為運行中(running)、升級中(upgrading)、節點排水中(draining)、節點移除中(removing)和配置變更中(updating)時,會收取叢集管理費用。更多資訊,請參見計費概述。
階段 | 叢集狀態 | 說明 |
建立部署 | 初始化中(initial) | 正在建立叢集。 |
建立失敗(failed) | 叢集建立失敗。 | |
運行維護 | 運行中(running) | 叢集成功建立,運行中。 |
升級中(upgrading) | 叢集升級中。 | |
節點排水中(draining) | 正在驅逐節點中的Pod資源到其他節點中重新建立,之後該節點將不可調度。 | |
節點移除中(removing) | 正在移除叢集中的節點。 | |
配置變更中(updating) | 正在更新叢集元資訊。 | |
不活躍(inactive) | 特定異常條件下,叢集暫時無法使用。更多資訊,請參見不活躍(inactive)。 | |
不可用(unavailable) | 叢集基礎雲資源異常,叢集不再可用。更多資訊,請參見不可用(unavailable)。 | |
刪除釋放 | 刪除中(deleting) | 正在刪除叢集。 |
刪除失敗(delete_failed) | 刪除叢集失敗。 | |
已刪除(deleted) | 成功刪除叢集,該狀態下叢集不再可見。 |
叢集異常狀態說明
不活躍(inactive)
不活躍(inactive)狀態可能由不同原因導致,您可以通過狀態代碼判斷具體的異常原因。
狀態代碼 | 異常狀態 | 解決方案 |
KMSUnhealthy | 叢集開啟了使用阿里雲Key Management Service進行Secret的落盤加密功能,且由於阿里雲帳號欠費或其他原因導致KMS服務暫停,使得叢集控制面無法正常運行。 |
|
NoNodeForLongTime | ACK託管叢集基礎版中沒有節點,且叢集中連續14天沒有節點。 | 提交工單恢複叢集的狀態,恢複後將叢集升級為ACK託管叢集Pro版。 |
AssumeRoleNotFound | 系統無法找到Container Service for Kubernetes的服務角色,導致叢集控制面異常。 |
|
AssumeUserNotFound | 系統無法找到Container Service for Kubernetes對應的RAM使用者,導致叢集控制面異常。 | 提交工單擷取支援人員。 |
SecurityGroupNotFound | 系統無法找到Container Service for Kubernetes的安全性群組,導致叢集控制面異常。 | 提交工單擷取支援人員。 |
UnderMaintenance | 叢集控制面處於後台維護中。 | 提交工單擷取支援人員。 |
ServiceInDebt | 當帳號可用額度(含阿里雲賬戶餘額和代金券)小於待結算的賬單時,會被判斷為帳號欠費。欠費後,您的ACK託管叢集Pro版會處於不活躍狀態,您將無法訪問叢集的API Server,且涉及API Server訪問的操作都將無法進行。 如果超過15天仍處於欠費狀態,Container Service for Kubernetes將暫停為您提供服務,並刪除叢集的控制面資源。但ACK不會主動釋放叢集關聯的其他雲產品資源執行個體(包括但不限於NAT Gateway、SLB執行個體、ECS執行個體、ESS伸縮組等)。屆時,關聯雲產品資源可能產生非預期行為,請及時處理。 | 請您及時儲值,並結清賬單。欠費結清後,叢集將自動回復正常狀態。 |
不可用(unavailable)
異常原因 | 解決方案 |
叢集API Server的CLB執行個體被釋放,可能包括以下情況:
|
異常狀態的影響
計費影響
叢集處於不活躍(inactive)或不可用(unavailable)狀態時,叢集控制面會進行縮容。縮容後,不再收取叢集管理費用,但仍會繼續收取關聯的雲產品資源費用。
叢集操作限制
叢集處於不活躍(inactive)或不可用(unavailable)狀態時,僅允許執行以下叢集管理操作:
變更集群刪除保護狀態
刪除叢集
其他影響
叢集處於不活躍(inactive)或不可用(unavailable)狀態時,為了避免彈出新的ECS執行個體,產生預期外的費用,ACK會停用叢集關聯的伸縮組。待叢集狀態恢複正常後,如果叢集關聯的伸縮組仍處於停用狀態,您可以在Auto Scaling控制台手動啟用伸縮組。