全部產品
Search
文件中心

Container Service for Kubernetes:CoreDNS自動升級

更新時間:Jun 19, 2024

本文介紹CoreDNS升級前的檢查和最佳化操作,以及自動升級的步驟。

前提條件

已通過kubectl工具串連叢集。具體操作,請參見擷取叢集KubeConfig並通過kubectl工具串連叢集

升級CoreDNS過程說明

  • CoreDNS升級過程中,ACK會用新版本的YAML模板覆蓋您叢集中舊版本的CoreDNS YAML模板,其中CoreDNS的設定檔會被自動升級,但CoreDNS的副本數不會變化。

  • 若您此前對YAML模板進行手動自訂變更,修改了容忍Toleration、記憶體和CPU的資源請求和限制等欄位,將會被覆蓋。針對這種情況,您可以手動升級CoreDNS,或者在自動升級CoreDNS後再次更新YAML模板內容。關於如何手動升級,請參見CoreDNS手動升級

  • 如果您使用了IPVS作為kube-proxy負載平衡模式,在CoreDNS升級完成後,您可能會遇到五分鐘內全叢集範圍內的解析逾時或失敗的情況,通過以下任意方式可以降低IPVS缺陷的影響:

  • 升級過程約2分鐘,實際耗時可能和叢集中CoreDNS副本數相關。如果遇到新副本無法調度或啟動的情況,可提交工單諮詢。但舊的副本不會被停止,因此不影響業務解析,升級十分鐘內系統會自動復原。

開啟ready外掛程式

如果您之前有手動升級CoreDNS且當前CoreDNS版本大於1.5.0,那您在自動升級CoreDNS之前,需要檢查CoreDNS設定檔是否已經開啟ready外掛程式。如果設定檔中沒有ready外掛程式,您需要開啟ready外掛程式,然後再進行自動升級CoreDNS操作,否則CoreDNS將無法正常啟動。

  1. 登入Container Service管理主控台

  2. 在控制台左側導覽列,單擊叢集

  3. 叢集列表頁面,單擊目的地組群名稱或者目的地組群右側操作列下的詳情

  4. 在叢集管理頁左側導覽列,選擇組態管理 > 配置項

  5. 配置項頁面頂部設定命名空間為kube-system,然後單擊coredns右側操作列下的YAML編輯

  6. 查看YAML面板檢查是否有ready欄位,如果沒有,請添加ready欄位,然後單擊確定

    apiVersion: v1
    data:
     Corefile: |
      .:53 {
        errors
        health {
          lameduck 15s
        }
        ready #如果沒有這一行,請增加本行,注意縮排與kubernetes保持一致。
        kubernetes cluster.local in-addr.arpa ip6.arpa {
          pods verified
          fallthrough in-addr.arpa ip6.arpa
        }
        prometheus :9153
        forward . /etc/resolv.conf {
          max_concurrent 1000
        }
        cache 30
        loop
        log
        reload
        loadbalance
      }
  7. 執行以下命令,檢查CoreDNS Pod的標準輸出是否載入了CoreDNS配置。熱載入新配置一般需要30s。

    kubectl logs coredns-78d4b8bd88-n6wjm -n kube-system

    預期輸出中包含plugin/reload資訊,說明載入了CoreDNS配置。

開始升級

您可以通過控制台的組件管理入口進行CoreDNS的版本升級。

  1. 登入Container Service管理主控台,在左側導覽列選擇叢集

  2. 叢集列表頁面,單擊目的地組群名稱,然後在左側導覽列,選擇營運管理 > 組件管理

  3. 組件管理頁面,搜尋CoreDNS,然後單擊升級

配置IPVS類型叢集的UDP逾時時間

如果您的ACK叢集使用了kube-proxy IPVS模式,IPVS的會話保持策略會導致整個叢集在升級完成後五分鐘內出現機率性解析失敗的問題。您可以按以下方式降低IPVS UDP類型的會話保持逾時時間至10秒,以減少解析失敗的次數。如果您ACK叢集中包含UDP類型的業務,需要您提前評估該操作是否有影響再執行該操作。如果您無法評估,您可以提交工單諮詢。

說明

如果您的叢集不是IPVS類型,請忽略配置IPVS類型叢集的UDP逾時時間的操作。關於如何查看kube-proxy代理模式,請參見查看叢集資訊

K8s 1.18及以上版本叢集

控制台操作方式

  1. 登入Container Service管理主控台

  2. 在控制台左側導覽列,單擊叢集

  3. 叢集列表頁面,單擊目的地組群名稱或者目的地組群右側操作列下的詳情

  4. 在叢集管理頁左側導覽列,選擇組態管理 > 配置項

  5. 在頂部選擇kube-system命名空間,然後單擊配置項kube-proxy-worker右側的YAML編輯

  6. 查看YAML面板中的ipvs欄位下,添加udpTimeout: 10s,然後單擊確定

    apiVersion: v1
    data:
      config.conf: |
        apiVersion: kubeproxy.config.k8s.io/v1alpha1
        kind: KubeProxyConfiguration
        # 其它不相關欄位已省略。
        mode: ipvs
        # 如果ipvs鍵不存在,需要添加此鍵。
        ipvs:
          udpTimeout: 10s
  7. 重建所有名為kube-proxy-worker的容器。

    1. 在叢集管理頁左側導覽列中,選擇工作負載 > 守護進程集

    2. 在守護進程集列表中,找到並單擊kube-proxy-worker

    3. kube-proxy-worker頁面中的容器組頁簽下對應容器組右側,選擇更多 > 刪除,然後單擊確定

      重複操作刪除所有容器組。刪除容器組後,系統會自動重建所有容器。

  8. 驗證UDP逾時時間的配置是否成功。

    1. 執行以下命令安裝ipvsadm

      ipvsadm是IPVS模組的管理工具。更多資訊,請參見ipvsadm

      sudo yum install -y ipvsadm
    2. 在叢集任意一台ECS節點中執行以下命令查看第三個數字。

      sudo ipvsadm -L --timeout

      如果輸出結果中第三個數字是10,則說明IPVS類型叢集的UDP逾時時間變更成功。

      說明

      變更成功後,請觀察至少五分鐘後再進行下一步操作。

命令列操作方式

  1. 執行以下命令修改kube-proxy的設定檔kube-proxy-worker

    kubectl -n kube-system edit configmap kube-proxy-worker
  2. 在kube-proxy設定檔中的ipvs欄位下,添加udpTimeout: 10s並儲存退出。

    apiVersion: v1
    data:
      config.conf: |
        apiVersion: kubeproxy.config.k8s.io/v1alpha1
        kind: KubeProxyConfiguration
        # 其它不相關欄位已省略。
        mode: ipvs
        # 如果ipvs鍵不存在,需要添加此鍵。
        ipvs:
          udpTimeout: 10s
  3. 執行以下命令重建所有名為kube-proxy-worker的容器。

    1. 執行以下命令查看存在的容器組資訊。

      kubectl -n kube-system get pod -o wide | grep kube-proxy-worker
    2. 執行以下命令刪除上步驟中查看所有容器,系統將會自動重建名為kube-proxy-worker容器。

      kubectl -n kube-system delete pod <kube-proxy-worker-****>
      說明

      將<kube-proxy-worker-****>替換為上述列印的所有容器組名稱。

  4. 驗證UDP逾時時間的配置是否成功。

    1. 執行以下命令安裝ipvsadm

      ipvsadm是IPVS模組的管理工具。更多資訊,請參見ipvsadm

      sudo yum install -y ipvsadm
    2. 在叢集任意一台ECS節點中執行以下命令查看第三個數字。

      sudo ipvsadm -L --timeout

      如果輸出結果中第三個數字是10,則說明IPVS類型叢集的UDP逾時時間變更成功。

      說明

      變更成功後,請觀察至少五分鐘後再進行下一步操作。

K8s 1.16及以下版本叢集

此類版本叢集的kube-proxy不支援udpTimeout參數,推薦使用OOS服務批量在所有叢集機器上執行ipvsadm命令以調整UDP逾時時間配置。命令如下:

sudo yum install -y ipvsadm
sudo ipvsadm -L --timeout > /tmp/ipvsadm_timeout_old
sudo ipvsadm --set 900 120 10
sudo ipvsadm -L --timeout > /tmp/ipvsadm_timeout_new
diff /tmp/ipvsadm_timeout_old /tmp/ipvsadm_timeout_new

關於OOS的大量操作執行個體介紹,請參見大量操作執行個體

後續步驟

升級完成後,您可以對CoreDNS進行最佳化,合理配置CoreDNS。具體操作,請參見合理配置CoreDNS