全部產品
Search
文件中心

Container Service for Kubernetes:節點操作概述

更新時間:Jan 28, 2025

本文匯總Container Service管理主控台支援的管理Worker節點的常見操作。您可以參見本文瞭解操作方式及相關注意事項。

大部分操作可在節點頁面執行。

  1. 登入Container Service管理主控台,在左側導覽列選擇叢集列表

  2. 叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇節點管理 > 節點

節點登入

在節點故障排除、節點效能監控、執行自訂指令碼等情境下,您可以登入節點對應的ECS執行個體。

  • Workbench串連:在節點列表的操作列,選擇更多 > Workbench 遠端連線

  • VNC串連:在節點列表的操作列,選擇更多 > VNC 遠端連線

更多ECS執行個體遠端連線的方式,請參見ECS遠端連線方式概述

說明

如果您的作業系統為ContainerOS,為了減少潛在的安全風險,ContainerOS原則上不支援任何使用者直接登入到系統進行一系列可能無法追溯的操作,也不提供SSH登入功能。若您仍然有登入執行個體進行營運操作的需求,請參見ContainerOS營運容器使用指導

節點排水和調度狀態

節點排水

在節點列表的操作列,選擇更多 > 節點排水,按照頁面提示完成節點排水,即排空節點上的已有Pod,然後將節點標識為不可調度狀態, 後續建立Pod不會再調度到該節點。

請關注以下注意事項。

  • 確保叢集其他節點的資源充足,以避免業務Pod無法調度。

  • 檢查待移除節點上的Pod的節點親和性規則和調度策略,確保Pod不會因為節點移除而無法調度到其他節點。

  • 由DaemonSet控制的Pod不會被排空。

更改節點調度狀態

在節點列表,勾選目標節點, 然後單擊頁面下面的設定調度狀態,仔細閱讀對話方塊的注意事項後,按照頁面提示完成操作。

請關注以下注意事項。

  • 此操作可能會對業務產生影響,建議在業務低峰期進行。

  • 將節點設定為不可調度後,節點會被標識為SchedulingDisabled。節點上已有的Pod繼續對外提供服務,但後續建立的Pod不會再調度到該節點。

  • 由DaemonSet控制的Pod不會被排空。

節點移除

當您不再需要某Worker節點繼續工作時,可以在業務低峰期通過Container Service管理主控台將節點從節點池或叢集中移除。在節點列表的操作列,選擇更多 > 移除或勾選節點後在頁面下方單擊大量移除,並按照頁面提示完成操作。

相關注意事項和功能介紹,請參見移除節點

節點監控

在節點列表的操作列,單擊監控,按照頁面提示安裝組件並啟用阿里雲Prometheus,查看節點資源監控大盤。關於基於阿里雲Prometheus監控配置監控警示的更多資訊,請參見(可選)步驟三:配置Prometheus監控警示

關於如何?在節點狀態異常時自訂PromQL來建立警示規則,請參見節點狀態異常

節點故障診斷

在節點列表的操作列,單擊異常節點對應的故障診斷,進行節點檢查並擷取對應的修複方案。關於支援診斷的異常情境、診斷的檢查項及其修複方案,請參見節點診斷

管理節點標籤和汙點

如需通過標籤(Labels) 和汙點(Taints) 管理和調度叢集中的資源,可在節點頁面,單擊標籤與汙點管理,然後按照頁面指引完成標籤名稱和值的配置,請參見管理節點標籤和汙點

節點批量營運

如需批量營運ACK叢集中的Worker節點,例如安全更新作業系統核心,安裝自訂的監控、安全、審計軟體包等,可在節點列表勾選需要批量營運的節點,在頁面下方單擊批量營運,然後按照控制台指引完成操作。詳細資料,請參見批量營運節點

查看節點資訊

在節點列表的操作列,選擇更多 > 查看YAML,查看節點YAML資訊。

在節點列表的操作列,選擇更多 > 詳情,查看節點資訊。

  • CPU和記憶體使用量量

    • CPU請求量 = SUM(當前節點上所有Pod的CPU請求值)/ 節點可分配的CPU

    • CPU使用量 = SUM(當前節點上所有Pod的CPU實際使用量)/ 節點可分配的CPU

    • 記憶體請求量= SUM(當前節點上所有Pod的記憶體請求值)/ 節點可分配的記憶體

    • 記憶體使用量量 = SUM(當前節點上所有Pod的記憶體實際使用量)/ 節點可分配的記憶體

    說明

    節點可分配資源(Allocatable) = 總資源(Capacity)-預留資源(Reserved)-驅逐閾值(Eviction-Threshold)。更多資訊,請參見節點資源預留策略

  • 節點基本資料

    節點名稱、IP地址、執行個體ID、容器運行時版本、作業系統及核心等。

  • 其他

    節點CPU和記憶體資源的分配情況(Request和Limit)、節點狀態、Pod列表、節點Event等。

相關文檔

  • 您可以使用ACK提供的資源畫像功能,基於資源使用量的歷史資料獲得容器粒度的資源規格推薦,簡化為容器配置Request和Limit的複雜度。更多資訊,請參見資源畫像

    關於如何配置業務Pod所需資源的具體操作,請參見建立無狀態工作負載Deployment

  • 通過設定節點標籤和nodeSelector策略,您可以將應用調度到指定節點上。詳細資料,請參見調度應用至指定節點

  • 關於如何升降配Worker節點資源,請參見升降配節點資源

  • 關於如何為節點添加資料盤,儲存容器運行時、kubelet等資源,請參見為節點添加資料盤

  • 關於如何?資料盤、系統硬碟的擴容,請參見擴容節點系統硬碟或資料盤

  • 節點的升級(kubelet版本和運行時版本)在節點池維度進行,請參見升級節點池