全部產品
Search
文件中心

Container Service for Kubernetes:ACK叢集生命週期及異常狀態說明

更新時間:Dec 07, 2024

ACK叢集的生命週期涉及多個階段和狀態,從叢集的建立部署、運行維護(擴容縮容、更新升級、排水移除等),到最終的刪除。本文介紹ACK叢集的全生命週期,協助您更好地理解和管理叢集。

叢集生命週期

ACK叢集在不同狀態下的含義和叢集的狀態流轉圖如下。

說明
  • ACK會定時檢測叢集運行狀態。如果叢集符合特定的異常條件,叢集將自動變更為不活躍(inactive)不可用(unavailable)的異常狀態。屆時,ACK會通過郵件、站內信的方式向您發送相關通知。

  • 對於ACK託管叢集Pro版,狀態為運行中(running)升級中(upgrading)節點排水中(draining)節點移除中(removing)配置變更中(updating)時,會收取叢集管理費用。更多資訊,請參見計費概述

階段

叢集狀態

說明

建立部署

初始化中(initial)

正在建立叢集。

建立失敗(failed)

叢集建立失敗。

運行維護

運行中(running)

叢集成功建立,運行中。

升級中(upgrading)

叢集升級中。

節點排水中(draining)

正在驅逐節點中的Pod資源到其他節點中重新建立,之後該節點將不可調度。

節點移除中(removing)

正在移除叢集中的節點。

配置變更中(updating)

正在更新叢集元資訊。

不活躍(inactive)

特定異常條件下,叢集暫時無法使用。更多資訊,請參見不活躍(inactive)

不可用(unavailable)

叢集基礎雲資源異常,叢集不再可用。更多資訊,請參見不可用(unavailable)

刪除釋放

刪除中(deleting)

正在刪除叢集。

刪除失敗(delete_failed)

刪除叢集失敗。

已刪除(deleted)

成功刪除叢集,該狀態下叢集不再可見。

叢集異常狀態說明

不活躍(inactive)

不活躍(inactive)狀態可能由不同原因導致,您可以通過狀態代碼判斷具體的異常原因。

狀態代碼

異常狀態

解決方案

KMSUnhealthy

叢集開啟了使用阿里雲Key Management Service進行Secret的落盤加密功能,且由於阿里雲帳號欠費或其他原因導致KMS服務暫停,使得叢集控制面無法正常運行。

  1. 登入Key Management Service控制台

  2. 查看KMS服務暫停原因,並恢複KMS服務。

  3. 提交工單,聯絡技術支援人員恢複叢集狀態。

NoNodeForLongTime

ACK託管叢集基礎版中沒有節點,且叢集中連續14天沒有節點。

提交工單恢複叢集的狀態,恢複後將叢集升級為ACK託管叢集Pro版

AssumeRoleNotFound

系統無法找到Container Service for Kubernetes的服務角色,導致叢集控制面異常。

  1. 參見Container ServiceACK服務角色排查Container Service for Kubernetes所需的角色。

  2. 提交工單,聯絡技術支援人員恢複叢集狀態。

AssumeUserNotFound

系統無法找到Container Service for Kubernetes對應的RAM使用者,導致叢集控制面異常。

提交工單擷取支援人員。

SecurityGroupNotFound

系統無法找到Container Service for Kubernetes的安全性群組,導致叢集控制面異常。

提交工單擷取支援人員。

UnderMaintenance

叢集控制面處於後台維護中。

提交工單擷取支援人員。

ServiceInDebt

當帳號可用額度(含阿里雲賬戶餘額和代金券)小於待結算的賬單時,會被判斷為帳號欠費。欠費後,您的ACK託管叢集Pro版會處於不活躍狀態,您將無法訪問叢集的API Server,且涉及API Server訪問的操作都將無法進行。

如果超過15天仍處於欠費狀態,Container Service for Kubernetes將暫停為您提供服務,並刪除叢集的控制面資源。但ACK不會主動釋放叢集關聯的其他雲產品資源執行個體(包括但不限於NAT Gateway、SLB執行個體、ECS執行個體、ESS伸縮組等)。屆時,關聯雲產品資源可能產生非預期行為,請及時處理。

請您及時儲值,並結清賬單。欠費結清後,叢集將自動回復正常狀態。

不可用(unavailable)

異常原因

解決方案

叢集API Server的CLB執行個體被釋放,可能包括以下情況:

  • 執行個體被手動釋放

  • 訂用帳戶執行個體到期自動釋放

    重要

    自2024年12月01日起,新建立的CLB執行個體將新增收取執行個體費。詳細資料請參見傳統型負載平衡CLB計費項目調整公告

  • 阿里雲帳號欠費導致隨用隨付執行個體被釋放

叢集已無法恢複,請刪除叢集或重新建立叢集。具體操作,請參見刪除叢集建立ACK託管叢集

異常狀態的影響

  • 計費影響

    叢集處於不活躍(inactive)不可用(unavailable)狀態時,叢集控制面會進行縮容。縮容後,不再收取叢集管理費用,但仍會繼續收取關聯的雲產品資源費用。

  • 叢集操作限制

    叢集處於不活躍(inactive)不可用(unavailable)狀態時,僅允許執行以下叢集管理操作:

    • 變更集群刪除保護狀態

    • 刪除叢集

  • 其他影響

    叢集處於不活躍(inactive)不可用(unavailable)狀態時,為了避免彈出新的ECS執行個體,產生預期外的費用,ACK會停用叢集關聯的伸縮組。待叢集狀態恢複正常後,如果叢集關聯的伸縮組仍處於停用狀態,您可以在Auto Scaling控制台手動啟用伸縮組。