ノードの自動スケーリングに関する FAQ

このトピックでは、ノード自動スケーリングについてよく寄せられる質問への回答を提供します。

カテゴリ	サブカテゴリ	問題
ノード自動スケーリングのスケーリング動作	制限
	スケールアウトの動作	Cluster Autoscaler は、スケジューリング不可能なポッドをノード自動スケーリングが有効になっているノードプールにスケジューリングできるかどうかを判断するために、どのようなスケジューリングポリシーを使用しますか? Cluster Autoscaler はどのようなリソースをシミュレートできますか? スケールアウトアクティビティがトリガーされた後、Cluster Autoscaler がノードの追加に失敗するのはなぜですか? Cluster Autoscaler は、複数のタイプのインスタンスを使用するスケーリンググループのリソース容量をどのように評価しますか? スケーリングアクティビティを実行するときに、自動スケーリングが有効になっている複数のノードプールからどのように選択しますか? 自動スケーリングが有効になっているノードプールにカスタムリソースを追加するにはどうすればよいですか? ノードプールの自動スケーリングの構成が失敗するのはなぜですか?
	スケールインの動作	スケールインアクティビティがトリガーされた後、Cluster Autoscaler がノードの削除に失敗するのはなぜですか? DaemonSet ポッドのエヴィクションを有効または無効にするにはどうすればよいですか? どのようなタイプのポッドが Cluster Autoscaler によるノードの削除を妨げる可能性がありますか?
	拡張サポート	Cluster Autoscaler は CRD をサポートしていますか?
カスタムスケーリング動作	ポッドを使用してスケーリングを管理する	スケジューリング不可能なポッドに対して Cluster Autoscaler でスケールアウトの遅延を設定するにはどうすればよいですか?
カスタムスケーリング動作	ノードを使用してスケーリングを管理する	Cluster Autoscaler がノードを削除しないようにするにはどうすればよいですか? ポッドアノテーションを使用して、Cluster Autoscaler がポッドをホストするノードを削除できるようにしたり、ポッドをホストするノードを削除できないようにしたりするにはどうすればよいですか?
Cluster Autoscaler に関する質問		Cluster Autoscaler を最新バージョンに更新するにはどうすればよいですか? どのような操作でシステムが Cluster Autoscaler を自動的に更新するようになりますか? ACK マネージドクラスターでロールの承認を完了した後も、ノードのスケーリングが失敗するのはなぜですか?

制限

ノードの利用可能なリソースを正確に見積もることができない

基盤となるシステムが一部のリソースを消費するため、Elastic Compute Service (ECS) インスタンスの利用可能なメモリは、インスタンスタイプで定義されているメモリサイズよりも少なくなります。詳細については、「購入したインスタンスのメモリサイズが、インスタンスタイプで定義されているメモリサイズと異なるのはなぜですか?」をご参照ください。この制約により、Cluster Autoscaler の見積もりスケジューリング可能リソースは、実際のノードのスケジューリング可能リソースよりも大きくなる可能性があり、正確に見積もることができません。ポッドのリソースリクエストを構成する際には、以下の項目に注意してください。

ポッドによってリクエストされるリソースは、インスタンスタイプで定義されているリソース (CPU、メモリ、ディスクを含む) よりも少なくなければなりません。ポッドによってリクエストされるリソースは、ノードによって提供される計算リソースの 70% を超えないようにすることをお勧めします。
Cluster Autoscaler は、クラスター内のノードがポッドのスケジューリングに十分なリソースを提供できるかどうかを判断する際に、保留中のポッドと DaemonSet によって作成されたポッドのリソースリクエストのみをチェックします。クラスター内のノードに DaemonSet によって作成されていない静的ポッドがある場合は、ポッドのリソースを予約することをお勧めします。
ノード上のポッドによってリクエストされるリソースが、ノードによって提供される計算リソースの 70% を超える場合は、ポッドを同じインスタンスタイプの別のノードにスケジューリングできるかどうかを確認することをお勧めします。

サポートされるスケジューリングポリシーが限られている

Cluster Autoscaler は、スケジューリング不可能なポッドを自動スケーリングが有効になっているノードプールにスケジューリングできるかどうかを判断するために、限られた数のスケジューリングポリシーのみをサポートしています。詳細については、「Cluster Autoscaler は、スケジューリング不可能なポッドをノード自動スケーリングが有効になっているノードプールにスケジューリングできるかどうかを判断するために、どのようなスケジューリングポリシーを使用しますか?」をご参照ください。

リソースタイプのリソースポリシーのみがサポートされている

リソースポリシーを使用して弾性リソースの優先順位をカスタマイズする場合、リソースベースのポリシーのみが許可されます。

apiVersion: scheduling.alibabacloud.com/v1alpha1
kind: ResourcePolicy
metadata:
  name: nginx
  namespace: default
spec:
  selector:
    app: nginx 
  units:
  - resource: ecs
  - resource: eci

複数のインスタンスタイプを持つノードプールに対して、指定されたインスタンスタイプをスケールアウトできない

ノードプールに複数のインスタンスタイプが構成されている場合、スケーリング用のインスタンスタイプを指定することはできません。Cluster Autoscaler は、スケーリンググループが提供できる最小限のリソースに基づいて、スケーリンググループのリソース容量を評価します。詳細については、「Cluster Autoscaler は、複数のタイプのインスタンスを使用するスケーリンググループのリソース容量をどのように評価しますか?」をご参照ください。

マルチゾーンノードプールでは、特定のゾーンに依存するポッドをスケールアウトできない

ノードプールが複数のゾーンで構成されており、ポッドが特定のゾーンで実行されている場合。たとえば、ポッドが特定のゾーンにあるボリュームを指定する PVC を使用している場合、またはポッドが特定のゾーンにある nodeSelector を持っている場合、Cluster Autoscaler は指定されたゾーンにノードを作成できない場合があります。Cluster Autoscaler がノードの追加に失敗する理由の詳細については、「スケールアウトアクティビティがトリガーされた後、Cluster Autoscaler がノードの追加に失敗するのはなぜですか?」をご参照ください。

スケールアウトの動作

どのようなスケジューリングポリシーがクラスターオートスケーラースケジューリングできないポッドを、ノードの自動スケーリングが有効になっているノードプールにスケジューリングできるかどうかを判断するために使用しますか？

Cluster Autoscaler で使用されるスケジューリングポリシーを以下に示します。

PodFitsResources
GeneralPredicates
PodToleratesNodeTaints
MaxGCEPDVolumeCount
NoDiskConflict
CheckNodeCondition
CheckNodeDiskPressure
CheckNodeMemoryPressure
CheckNodePIDPressure
CheckVolumeBinding
MaxAzureDiskVolumeCount
MaxEBSVolumeCount
ready
NoVolumeZoneConflict

どのようなリソースをクラスターオートスケーラーシミュレートしますか?

Cluster Autoscaler は、次のリソースをシミュレートおよび評価できます。

cpu
memory
sigma/eni
ephemeral-storage
aliyun.com/gpu-mem (shared GPUs only)
nvidia.com/gpu

詳細については、このトピックの「自動スケーリングが有効になっているノードプールにカスタムリソースを追加するにはどうすればよいですか?」セクションをご参照ください。

スケールアウトアクティビティがトリガーされた後、Cluster Autoscaler がノードの追加に失敗するのはなぜですか?

次のシナリオが存在するかどうかを確認します。

ノード自動スケーリング機能は、自動スケーリングが有効になっているノードプールにのみ適用されます。ノード自動スケーリングが有効になっており、ノードプールのスケーリングモードが [自動] に設定されていることを確認してください。詳細については、「ノード自動スケーリングを有効にする」をご参照ください。
スケーリンググループのインスタンスタイプが、ポッドのリソースリクエストを満たすことができません。ECS インスタンスタイプによって提供されるリソースは、ECS の仕様に準拠しています。ACK は、Kubernetes コンポーネントとシステムプロセスを実行するために、一定量のノードリソースを予約します。これにより、OS カーネル、システムサービス、および Kubernetes デーモンが想定どおりに実行されるようになります。ただし、これにより、ノードの割り当て可能なリソースの量がノードのリソース容量と異なる場合があります。詳細については、「リソース予約ポリシー」をご参照ください。
- インスタンスの作成中に、リソースが仮想化に使用されるか、オペレーティングシステムによって消費されます。詳細については、「購入したインスタンスのメモリサイズが、インスタンスタイプで定義されているメモリサイズと異なるのはなぜですか?」をご参照ください。
- kubelet、kube-proxy、Terway、コンテナーランタイムなどのコンポーネントを実行するためにリソースが消費されます。詳細については、「リソース予約ポリシー」をご参照ください。
- デフォルトでは、システムコンポーネントは各ノードにインストールされます。したがって、リクエストされたポッドリソースは、インスタンスタイプのリソース容量よりも少なくなければなりません。
ゾーンに制限があるポッドに対して、ゾーン間のスケールアウトアクティビティをトリガーすることはできません。
Resource Access Management (RAM) ロールには、Kubernetes クラスターを管理する権限がありません。スケールアウトアクティビティに関連する Kubernetes クラスターごとに RAM ロールを設定する必要があります。RAM ロールの詳細については、「前提条件」をご参照ください。
ノード自動スケーリングを有効にすると、次の問題が発生します。
- インスタンスがクラスターに追加されず、タイムアウトエラーが発生します。
- ノードが NotReady で、タイムアウトエラーが発生します。
ノードを正しくスケーリングできるように、Cluster Autoscaler は異常なノードを修正するまでスケーリングアクティビティを実行しません。
クラスターにノードがない場合、Cluster Autoscaler コンポーネントは機能しません。クラスターコンポーネントの安定性を確保するために、ノードプールの作成中に少なくとも 2 つのノードを構成することをお勧めします。
シナリオでゼロノードからのスケールアウトまたはゼロノードへのスケールインが必要な場合は、ノードインスタントスケーリングを有効にすることができます。

Cluster Autoscaler は、複数のタイプのインスタンスを使用するスケーリンググループのリソース容量をどのように評価しますか?

複数のタイプのインスタンスを使用するスケーリンググループの場合、Auto Scaling は、スケーリンググループが提供できる最小限のリソースに基づいて、スケーリンググループのリソース容量を評価します。

たとえば、スケーリンググループが 2 つのタイプのインスタンスを使用しているとします。1 つのインスタンスタイプは 4 vCPU と 32 GB のメモリを提供し、もう 1 つのインスタンスタイプは 8 vCPU と 16 GB のメモリを提供します。このシナリオでは、Auto Scaling は、スケーリンググループがそれぞれ 4 vCPU と 16 GB のメモリを提供するインスタンスを追加できると見なします。保留中のポッドが 4 vCPU と 16 GB のメモリよりも多くのリソースを リクエスト する場合、ポッドはスケジューリングされません。

スケーリンググループに複数のインスタンスタイプを指定した後も、リソースの予約を考慮する必要があります。詳細については、「スケールアウトアクティビティがトリガーされた後、Cluster Autoscaler がノードの追加に失敗するのはなぜですか?」をご参照ください。

スケーリングアクティビティを実行するときに、自動スケーリングが有効になっている複数のノードプールからどのように選択しますか?

ポッドをノードにスケジューリングできない場合、自動スケーリングコンポーネントは、スケーリンググループの構成 (ラベル、テイント、インスタンスの仕様を含む) に基づいてポッドのスケジューリングをシミュレートします。スケーリンググループが要件を満たしている場合、このスケーリンググループがスケールアウトアクティビティに選択されます。シミュレーション中に、自動スケーリングが有効になっている複数のノードプールがスケジューリング条件を満たしている場合、Cluster Autoscaler は最小浪費原則を適用します。ノードがクラスターに追加された後、残りのリソースが最も少ないノードプールが選択されます。

自動スケーリングが有効になっているノードプールにカスタムリソースを追加するにはどうすればよいですか?

Cluster Autoscaler が、自動スケーリングが有効になっているノードプールによって提供されるカスタムリソースを識別できるようにするには、またはノードプールによって提供される特定のリソースタイプの量を識別できるようにするには、次のプレフィックスを持つ ECS タグをノードプールに追加する必要があります。

k8s.io/cluster-autoscaler/node-template/resource/{リソース名}:{リソース量}

例:

k8s.io/cluster-autoscaler/node-template/resource/enormouspages-1Gi:2Gi

ノードプールの自動スケーリングの構成が失敗するのはなぜですか?

この問題は、次の原因によって発生する可能性があります。

ノードプールはデフォルトのノードプールであり、ノード自動スケーリング機能をサポートしていません。
手動で追加されたノードが既にノードプールに存在します。最初にこれらのノードを削除するか、または自動スケーリングが有効になっている新しいノードプールを作成することをお勧めします。
ノードプールには、ノード自動スケーリング機能と互換性のないサブスクリプション課金方法のインスタンスが含まれています。

スケールインの動作

なぜクラスターオートスケーラースケールインアクティビティがトリガーされた後にノードを削除できない場合

次のシナリオが存在するかどうかを確認します。

各ポッドのリクエストされたリソースのしきい値が、指定されたスケールインのしきい値よりも高い。
ノード上で kube-system 名前空間を実行するポッド。
スケジューリングポリシーにより、ポッドが現在のノードで実行されるように強制されている。この場合、ポッドを他のノードにスケジューリングすることはできません。
PodDisruptionBudget がノード上のポッドに設定されており、PodDisruptionBudget の最小値に達している。

FAQ の詳細については、「autoscaler」をご参照ください。

DaemonSet ポッドのエヴィクションを有効または無効にするにはどうすればよいですか?

cluster-autoscaler は、[daemonset ポッドのエビクション] 設定に基づいて、DaemonSet ポッドをエビクションするかどうかを決定します。この設定は、クラスター内のすべての DaemonSet ポッドに有効です。詳細については、「ステップ 1: ノードの自動スケーリングを有効にする」をご参照ください。DaemonSet ポッドのポッドエビクションを有効にする場合は、ポッドの構成に "cluster-autoscaler.kubernetes.io/enable-ds-eviction":"true" アノテーションを追加します。

DaemonSet ポッドのエヴィクションを無効にする場合は、アノテーション "cluster-autoscaler.kubernetes.io/enable-ds-eviction":"false" をポッドの構成に追加します。

説明

DaemonSet ポッドのエヴィクション機能が無効になっている場合、アノテーションを持つ DaemonSet ポッドは、ノードが DaemonSet ポッド以外のポッドをホストしている場合にのみエビクトされます。アノテーションを使用して DaemonSet ポッドのみをホストするノードをエビクトする場合は、最初に DaemonSet ポッドのエヴィクション機能を有効にする必要があります。
上記の注釈は、DaemonSet ではなく DaemonSet ポッドに追加する必要があります。
このアノテーションは、DaemonSet によって作成されていないポッドには影響しません。
デフォルトでは、Cluster Autoscaler は DaemonSet ポッドをエビクトする際に他のタスクを遅延させません。DaemonSet ポッドのエヴィクションは、他のタスクと同時に実行されます。Cluster Autoscaler がすべての DaemonSet ポッドがエビクトされるまで待機するようにするには、"cluster-autoscaler.kubernetes.io/wait-until-evicted":"true" アノテーションをポッド構成に追加する必要があります。

どの種類のポッドがクラスターオートスケーラーノードの削除から？

ポッドが Deployment、ReplicaSet、Job、StatefulSet などのネイティブ Kubernetes コントローラーによって作成されていない場合、またはノード上のポッドを安全に終了または移行できない場合、Cluster Autoscaler はノードの削除を妨げる可能性があります。詳細については、「どのようなタイプのポッドが CA によるノードの削除を妨げる可能性がありますか?」をご参照ください。

拡張サポート

しますクラスターオートスケーラー CRD をサポートしていますか?

Cluster Autoscaler は標準の Kubernetes オブジェクトのみをサポートし、Kubernetes CustomResourceDefinitions (CRD) はサポートしていません。

ポッドを使用してスケーリングを管理する

スケールアウトの遅延を設定するにはどうすればよいですか？クラスターオートスケーラースケジュールできないポッドの場合?

cluster-autoscaler.kubernetes.io/pod-scale-up-delay アノテーションを追加して、すべてのポッドのスケールアウト遅延を設定できます。遅延が終了した後もポッドがスケジューリング不可能な場合、Cluster Autoscaler はポッドをスケジューリングするためにノードを追加する可能性があります。例: "cluster-autoscaler.kubernetes.io/pod-scale-up-delay": "600s"。

ポッドアノテーションを使用してどのようにcluster-autoscalerポッドをホストするノードを削除するか、クラスターオートスケーラーがポッドをホストするノードを削除するのを防ぐにはどうすればよいですか？

Cluster Autoscaler がポッドをホストするノードを削除できるようにするか、またはポッドをホストするノードを削除できないようにするために、ポッドを構成できます。

Cluster Autoscaler がポッドをホストするノードを削除できないようにポッドを構成するには、"cluster-autoscaler.kubernetes.io/safe-to-evict": "false" アノテーションをポッド構成に追加します。
Cluster Autoscaler がポッドをホストするノードを削除できるようにポッドを構成するには、"cluster-autoscaler.kubernetes.io/safe-to-evict": "true" アノテーションをポッド構成に追加します。

ノードを使用してスケーリングを管理する

どうすればクラスターオートスケーラーノードの削除から？

Cluster Autoscaler によってノードが削除されないようにするには、"cluster-autoscaler.kubernetes.io/scale-down-disabled": "true" アノテーションをノード構成に追加します。アノテーションを追加するには、次のコマンドを実行します。

kubectl annotate node <ノード名> cluster-autoscaler.kubernetes.io/scale-down-disabled=true

目次

制限

ノードの利用可能なリソースを正確に見積もることができない

サポートされるスケジューリングポリシーが限られている

リソースタイプのリソースポリシーのみがサポートされている

複数のインスタンスタイプを持つノードプールに対して、指定されたインスタンスタイプをスケールアウトできない

マルチゾーンノードプールでは、特定のゾーンに依存するポッドをスケールアウトできない

スケールアウトの動作

どのようなリソースをクラスターオートスケーラーシミュレートしますか?

スケールアウトアクティビティがトリガーされた後、Cluster Autoscaler がノードの追加に失敗するのはなぜですか?

Cluster Autoscaler は、複数のタイプのインスタンスを使用するスケーリンググループのリソース容量をどのように評価しますか?

スケーリングアクティビティを実行するときに、自動スケーリングが有効になっている複数のノードプールからどのように選択しますか?

自動スケーリングが有効になっているノードプールにカスタムリソースを追加するにはどうすればよいですか?

ノードプールの自動スケーリングの構成が失敗するのはなぜですか?

スケールインの動作

なぜクラスターオートスケーラースケールインアクティビティがトリガーされた後にノードを削除できない場合

DaemonSet ポッドのエヴィクションを有効または無効にするにはどうすればよいですか?

どの種類のポッドがクラスターオートスケーラーノードの削除から？

拡張サポート

しますクラスターオートスケーラー CRD をサポートしていますか?

ポッドを使用してスケーリングを管理する

スケールアウトの遅延を設定するにはどうすればよいですか？クラスターオートスケーラースケジュールできないポッドの場合?

ポッドアノテーションを使用してどのようにcluster-autoscalerポッドをホストするノードを削除するか、クラスターオートスケーラーがポッドをホストするノードを削除するのを防ぐにはどうすればよいですか？

ノードを使用してスケーリングを管理する

どうすればクラスターオートスケーラーノードの削除から？

関連する質問クラスターオートスケーラー

更新方法クラスターオートスケーラー最新バージョンに更新するにはどうすればよいですか？

どのような操作がシステムの自動更新をトリガーしますかクラスターオートスケーラー？

なぜノードスケーリングロール権限付与を完了した後も失敗する ACK マネージドクラスター？

セールスサポート

技術サポート

ご意見 & 不正使用を報告する

Alibaba Cloud について

Alibaba Cloud のグローバルネットワーク

クイックスタート

グローバルオフィス

パリ 2024 オリンピック競技大会 New

スタッド・ローラン・ギャロス - よみがえる栄光 New

コンコルド広場 - 障壁を破る New

ヴェール・シュル・マルヌ・ノーティカル・スタジアム - 持続可能なスポー New

国際放送センター - 数十億の人々を魅了する画像、サウンド、データ New

お客様事例 New

Trust Center

セキュリティ &プライバシーコンプライアンス

クラウドコンプライアンスリソース

セキュリティコンプライアンスに関する FAQ

プロダクトと機能のアップデート情報 New

Cloud Forward

プレスルーム

Alibaba Cloud電子ジャーナル New

アナリストレポート (業界分析)

お知らせ

Go Global サービス New

Alibaba Cloud とのグローバルアライアンスを推進

Asia Accelerator Hot

情報セキュリティとコンプライアンス

中国ビジネス - MLPS 2.0 コンプライアンス New

中国ビジネス - ネットワーク

中国ビジネス - グローバルアプリケーションの高速化 New

中国ビジネス - セキュリティ

中国ビジネス - データセキュリティ New

ICP サポート Hot

中国ビジネス - オムニチャネルデータミッドエンド New

中国ビジネス - 組織データミッドエンド New

中国ビジネス - ビジネスミッドエンド New

中国ビジネス - 会話型チャットボットのための人工知能サービス New

中国ビジネス - オンライン教育

中国ビジネス - ドメイン登録

Alibaba Cloud で働く

経験豊富なプロフェッショナル

学生と卒業生

無料トライアル

料金

ディスカウントセンター

値下げ

より低価格でより多くのデプロイ

FinOps

Elastic Compute Service (ECS)

Simple Application Server (SAS)

Elastic GPU Service

Elastic Desktop Service (EDS)

Object Storage Service (OSS)

Cloud Enterprise Network (CEN)

Web Application Firewall (WAF)

Domain Names

Lingma

Container Compute Service (ACS)

Secure Access Service Edge (SASE)

Intelligent Media Services(IMS)

Edge Security Acceleration (ESA)(Original DCDN)

Intelligent Media Management

DingTalk Enterprise

YiDA

Alibaba Cloud Model Studio

Apsara Prime - クラウドプロダクトを簡単に選択

Alibaba Cloud ECS - すべてのあなたのクラウドホスティングニーズを満たす

1 TB CDN：今なら 1 TB のアウトバウンドトラフィックプランが無料

セキュリティ：攻撃に備える無料のセキュリティサポート

Short Message Service - 無料のテストが利用可能

Elastic Compute Service (ECS) Hot

CloudBox

Compute Nest

Dedicated Host Hot

ECS Bare Metal Instance

Elastic GPU Service Featured

Simple Application Server (SAS) Hot

Auto Scaling

Cloud Phone Beta

Elastic Desktop Service (EDS) Featured

Batch Compute

Elastic High Performance Computing (E-HPC)

Super Computing Cluster(SCC)