すべてのプロダクト
Search
ドキュメントセンター

Container Service for Kubernetes:Container Service for Kubernetes (ACK) 2025 リリースノート

最終更新日:Feb 10, 2026

本トピックでは、Container Service for Kubernetes (ACK) の最新の機能リリースについて説明します。

背景情報

  • Container Service for Kubernetes (ACK) でサポートされる Kubernetes (K8s) のバージョンについては、「バージョンガイド」をご参照ください。

  • Container Service for Kubernetes (ACK) は、ContainerOS、Alibaba Cloud Linux 3 Container-Optimized Edition、Alibaba Cloud Linux 3、Alibaba Cloud Linux 3 Arm Edition、Alibaba Cloud Linux UEFI 3、Red Hat、Ubuntu、Windows などのオペレーティングシステムをサポートしています。詳細については、「オペレーティングシステム」をご参照ください。

2025 年 12 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

ノードプールがセキュリティセンターの 脆弱性修正の購入(従量課金) をサポート

OS の CVE 脆弱性修正機能を有効化することで、ノード上のセキュリティ脆弱性をスキャンし、修復のための推奨事項と方法を取得して、コンソール上で迅速に修正できます。本機能を利用する前に、セキュリティセンター」の Ultimate を有効化するか、または「脆弱性修正(従量課金)」を購入してください。

すべてのリージョン

ノードプール OS の CVE 脆弱性の修正

APIG Ingress のサポート

クラウドネイティブ API ゲートウェイ(APIG Ingress)は、オープンソースの Higress ゲートウェイを基盤としたエンタープライズエディションのゲートウェイです。Nginx Ingress と互換があり、API 管理およびマイクロサービスのユースケースに適しています。

すべてのリージョン

APIG Ingress の管理

Kagent の新規サポート

Kagent は、Kubernetes 上で AI アプリケーションを構築、デプロイ、実行するためのフレームワークです。Kagent をデプロイ後、宣言型 API を使用してエージェントおよび MCP Server を作成し、複数の大規模言語モデル(LLM)に接続できます。

すべて

Kagent

CNFS を使用した NAS、OSS、CPFS のタグ管理

CNFS を使用すると、NAS、OSS、CPFS のクラウドストレージリソースにタグを追加できます。これにより、細かい粒度での分類および権限管理が可能になり、リソースガバナンスの効率が向上します。

すべて

NAS、OSS、CPFS のタグ管理

Kyverno をポリシーガバナンスエンジンとして使用

Kyverno は、Kubernetes ネイティブのポリシー エンジンであり、コードによるポリシー(Policy-as-Code)を用いてセキュリティ、コンプライアンス、自動化ポリシーを定義および適用します。デフォルトでクラスターに統合されている OPA Gatekeeper と比較して、Kyverno は YAML 定義を使用するため Rego の学習が不要であり、承認段階での変更(mutating)および生成(generating)をサポートします。これは、高度にカスタマイズされたポリシー、運用の自動化、またはマルチクラスターにおけるポリシー ガバナンスを必要とするユースケースに適しています。

すべてのリージョン

Kyverno をポリシーガバナンスエンジンとして使用

リモートアテステーションを用いた機密コンテナーの信頼性保証

PeerPod リモートアテステーションにより、機密コンテナーは Intel TDX などの真正かつ改ざんされていない機密コンピューティング環境で常に実行されることを保証します。コンテナーのデプロイ前にノードを自動的に検証し、実行時にアプリケーションが環境証明をオンデマンドで取得できるようにすることで、機密ワークロードに対してエンドツーエンドのセキュリティを提供します。

すべて

リモートアテステーションを用いた機密コンテナーの信頼性保証

Knative が A2A プロトコルサーバーをサポート

Agent2Agent(A2A)は、AI エージェント間のシームレスな通信および協調のためのオープン標準です。Knative に A2A サーバーをデプロイすることで、ゼロスケールを含む自動スケーリングを活用し、必要に応じてリソースを活用しながら素早くバージョンを反復できます。

すべて

Knative への A2A のデプロイ

新しい ack-agent-gateway 実践

  • A2A トラフィックガバナンスおよび認証のサポート:AI エージェントアプリケーションが外部にサービスを迅速に公開できるよう、Gateway API をベースとした ack-agent-gateway 拡張機能をインストールして、A2A プロトコルトラフィックを正確に管理します。

  • MCP サービスゲートウェイのサポート:ACK クラスター内の MCP サービスを外部の LLM に公開するために、Gateway API をベースとした ack-agent-gateway 拡張機能をインストールして、MCP トラフィックの高速かつ安全なルーティングを実現します。

すべて

Distributed Cloud Container Platform for Kubernetes

vLLM カスタムメトリクスを用いたマルチクラスター HPA 実践

大規模言語モデル(LLM)のオンラインサービスでは、トラフィックの変動に応じてマルチクラスター構成を採用することが一般的です。ACK One が提供するマルチクラスター解決策は、このようなシナリオに対応しています。本実践では、ACK One フリートを用いてクラウド環境に vLLM 推論サービスをデプロイし、フェデレーテッド HPA(FederatedHPA)を活用して、クラスター間のエラスティックスケーリングを行う方法を示します。

すべて

vLLM カスタムメトリクスを用いたマルチクラスター HPA 実践

2025 年 11 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

インテリジェントマネージドモードが GPU ワークロードのデプロイおよび運用をサポート

クラスターに対してインテリジェントマネージドモードを有効化すると、インテリジェントマネージドノードプールを用いて GPU リソースを動的にスケールできます。これにより、オンライン推論など、ピーク時とオフピーク時のパターンが明確な GPU ワークロードのコストを大幅に削減できます。

すべて

GPU ワークロードのデプロイおよび実行

新しい servicemesh-operator コンポーネント

servicemesh-operator コンポーネントは、ACK クラスター内でのサービスメッシュ(ASM)のデプロイ、アップグレード、構成管理を簡素化します。これにより、トラフィック管理、セキュリティ、可観測性などの強力な ASM 機能を迅速に有効化できます。

すべてのリージョン

servicemesh-operator

新しい組み込み FinOps ルールライブラリ

Pod のデプロイおよび更新要求がセキュアであるかを検証するため、Pod のセキュリティポリシーを設定できます。ACK クラスターポリシー管理には、コンプライアンス、Infra、K8s-general、PSP、FinOps を含む複数の組み込みルールライブラリが提供されています。

すべて

コンテナセキュリティポリシールールライブラリの概要

Knative における MCP Server のデプロイをサポート

MCP Server を Knative でホストすることで、そのサーバーレスアーキテクチャの利点を活用し、オンデマンドのスケーリングおよびイベント駆動型の AI サービスを実現できます。

すべて

Knative への MCP Server のデプロイ

ローリングアップデートおよびグレースフルシャットダウンの構成実践

ACK クラスターにおけるアプリケーションのアップデート時にダウンタイムをゼロにするため、readiness プローブ、readiness ゲート、preStop フック、SLB のグレースフル終了をデプロイメントに構成します。これにより、スムーズなトラフィック移行を実現し、高可用性を確保します。

すべて

ダウンタイムゼロのローリングデプロイの実現

Distributed Cloud Container Platform for Kubernetes

クラスター単位のマルチクラスター優先順位付きエラスティックスケジューリング実践

ACK One フリートは AI 推論サービスをサポートしています。マルチリージョンのマルチ ACK クラスターおよびハイブリッドクラウドのマルチクラスターのシナリオにおいて、クラスターの優先順位を定義することで、IDC またはプライマリリージョンのリソースを優先的に使用しつつ、Alibaba Cloud またはバックアップリージョンのリソースで計算能力を補完できます。在庫認識型スケジューリングと組み合わせることで、業務継続性を確保できます。

すべて

クラスター単位のマルチクラスター優先順位付きエラスティックスケジューリング

2025 年 10 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

DRA ベースの GPU スケジューリングをサポート

AI トレーニングおよび推論のシナリオにおいて、複数のアプリケーションが GPU リソースを共有する場合、ACK クラスターに NVIDIA DRA ドライバーをデプロイすることで、従来のデバイスプラグインによるスケジューリング制限を克服できます。Kubernetes DRA API を使用して、Pod 間で GPU を動的に割り当て、細かい粒度でリソースを制御することで、GPU の利用率を向上させ、コストを削減できます。

すべて

DRA を用いた GPU のスケジューリング

Distributed Cloud Container Platform for Kubernetes

登録済みクラスターが ACS GPU-HPN のキャパシティ予約をサポート

オンプレミスの Kubernetes クラスターをクラウドに登録し、GPU-HPN のキャパシティ予約と組み合わせることで、企業はオンプレミスおよびクラウド環境にまたがる GPU リソースを集中管理およびインテリジェントにスケジュールできます。これにより、AI トレーニングおよび推論などの重要なワークロードに対して、安定的かつ高性能なコンピューティングを提供できます。

すべて

例:ACK One 登録済みクラスターで ACS GPU HPN の計算能力を使用

自己管理型 Prometheus を用いたコントロールプレーンコンポーネントのメトリクス収集をサポート

自己管理型 Prometheus モニタリングシステムを用いるハイブリッドクラウド環境において、Metrics Aggregator コンポーネントをインストールし、ServiceMonitor を構成することで、ACK One 登録済みクラスターのコアコンポーネントのメトリクスを収集できます。これにより、既存のモニタリングシステムにメトリクスを統合し、統一されたアラートおよび可観測性を実現できます。

すべて

自己管理型 Prometheus を用いたコントロールプレーンコンポーネントのメトリクス収集

Cloud-native AI Suite

Arena を用いた eRDMA 加速 PyTorch 分散トレーニングジョブの送信

マルチノード GPU トレーニングでは、ネットワーク通信のレイテンシーが全体のパフォーマンスを低下させる原因となることがあります。モデルのトレーニング時間を短縮するため、Arena を用いて PyTorch 分散ジョブを送信し、eRDMA ネットワーク加速を構成します。これにより、ノード間の低レイテンシー・高スループットな通信を実現し、トレーニング効率およびクラスター利用率を向上させます。

すべて

Arena を用いた eRDMA 加速 PyTorch 分散トレーニングジョブの送信

2025 年 9 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

Kubernetes 1.34 のサポート

Kubernetes 1.33 をサポートしています。クラスター作成時に直接 1.34 のクラスターを作成したり、下位バージョンのクラスターを 1.34 にアップグレードしたりできます。

すべて

Kubernetes 1.34

ハイブリッドクラウドノードプールのサポート

ACK クラスターの管理にオンプレミスのサーバーリソースを含めるために、ACK マネージドクラスター Pro エディションを使用してハイブリッドクラウドノードプールを作成します。既存のハイブリッドクラウドノードをクラスターに追加することで、クラウドおよびオンプレミスのリソースにまたがるエラスティックスケジューリングおよびコスト最適化を実現し、統一されたオーケストレーションを維持するとともに、既存の IT 資産を活用できます。

すべて

ハイブリッドクラウドノードプールの作成および管理

ハイブリッドクラウドノードプールの DNS 解決の構成をサポート

ハイブリッドクラウドノードプールがクラウドの CoreDNS を使用してドメイン名解決を行う場合、頻繁なアクセスによって専用回線の負荷が増加し、専用回線の不安定性により解決失敗が発生する可能性があります。NodeLocal DNSCache を構成することで、これらの問題を軽減できます。

すべて

ハイブリッドクラウドノードプール向け NodeLocal DNSCache の構成

Terway Hybrid CNI プラグインのサポート

オンプレミスの IDC に接続されたハイブリッドクラウドノードプールは、標準のコンテナーネットワークプラグインの機能を超える複雑なネットワークトポロジーおよびクロスドメインルーティング要件を持ちます。Terway Hybrid CNI プラグインは、ハイブリッドクラウドノードプールに特化して設計されており、IDC およびクラウド環境の両方における Pod 間のネットワーク接続を保証します。

すべて

Terway Hybrid CNI プラグインの使用

ossfs 2.0 が RRSA 認証をサポート

永続ストレージが必要なアプリケーションや、複数の Pod 間でデータを共有するアプリケーションの場合、OSS バケットを ossfs 2.0 動的 PV としてマウントします。より高いセキュリティ、一時的な資格情報の自動回転、Pod 単位の権限分離を実現する RRSA 認証の使用を推奨します。これは、セキュリティ要件の高い本番およびマルチテナント環境に適しています。

すべて

ossfs 2.0 動的ボリュームの使用

Distributed Cloud Container Platform for Kubernetes

クラウド GPU 計算能力へのアクセスをサポート

ACK One 登録済みクラスターは、異種計算リソースの統一されたスケジューリングおよび運用管理をサポートします。これにより、異種計算クラスターにおけるリソース利用率が大幅に向上します。

すべて

クラウド GPU 計算能力へのアクセス

シングルクラスターアプリケーションをフリートに移行し、複数のクラスターに分散するサポート

マルチクラスターでのアプリケーションデプロイにおける繰り返し操作、エラー、同期の困難さといった課題を解決するため、AMC コマンドラインツールを使用して、複数のクラスターにアプリケーションを迅速にデプロイできます。これにより、統合された管理および更新の自動同期が可能になります。

すべて

シングルクラスターアプリケーションをフリートに移行し、複数のクラスターに分散

2025 年 8 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

KV キャッシュ認識型のインテリジェント推論ルーティングをサポート

KV キャッシュ認識型ロードバランシングは、生成 AI 推論のために設計されています。最適なコンピュートノードにリクエストを動的にルーティングすることで、大規模言語モデル(LLM)サービスの効率を大幅に向上させます。

すべて

プレフィックスキャッシュ認識型ルーティングを精密モードで使用

カスタム CNI プラグインのサポート

ACK のデフォルトの Terway および Flannel CNI プラグインは、ほとんどのコンテナーネットワーキング要件を満たします。ただし、他の CNI プラグインの特定の機能が必要な場合は、Bring Your Own Container Network Interface(BYOCNI)モデルを使用して、カスタム CNI プラグインをインストールできます。

すべて

ACK クラスターでのカスタム CNI プラグインの使用

インテリジェントマネージドモードクラスターがマネージドポリシーガバナンスコンポーネントをサポート

クラスターのコンプライアンス要件を満たし、セキュリティを向上させるため、セキュリティポリシー管理を有効化します。セキュリティポリシールールには、Infra、コンプライアンス、PSP、K8s-general が含まれます。

すべて

セキュリティポリシー管理の有効化

Knative が ACS 計算能力をサポート

Knative Service は、コンテナー計算サービス(ACS)の計算能力を構成することをサポートしています。多様な計算タイプおよび品質により、さまざまなワークロード要件に対応し、コストを最適化できます。

すべて

ACS リソースの使用

推論拡張機能付きゲートウェイがより柔軟な構成をサポート

  • 推論拡張機能のカスタム構成のサポート:アノテーションを使用してルーティングポリシーを調整するか、ConfigMap を使用して拡張機能のデプロイ構成を変更または上書きします。

  • ゲートウェイのカスタム構成のサポート:EnvoyProxy リソース構成を変更して、サービスタイプ、デプロイのレプリカ数、リソースなど、実際のゲートウェイパラメーターを調整します。

すべてのリージョン

ACK 異種機密コンピューティングクラスターにおける vLLM 推論サービスの安全なデプロイをサポート

大規模言語モデル(LLM)推論には、機密データおよびコアモデル資産が関与します。信頼できない環境で実行すると、データおよびモデルの漏洩リスクが生じます。ACK の機密 AI ソリューション(ACK-CAI)は、Intel TDX や GPU TEE などのハードウェア機密コンピューティング技術を統合し、モデル推論に対してエンドツーエンドのセキュリティを提供します。

すべて

ACK 異種機密コンピューティングクラスターにおける vLLM 推論サービスの安全なデプロイ

Cloud-native AI Suite

AI 推論スイートの起動

大規模言語モデル(LLM)の普及に伴い、企業にとって、それらを本番環境で効率的かつ安定的に大量にデプロイおよび運用することは、核心的な課題となっています。クラウドネイティブ AI 推論スイート(AI Serving Stack)は、Alibaba Cloud Container Service 上のクラウドネイティブ AI 推論を目的としたエンドツーエンドのソリューションです。LLM 推論のライフサイクル全体に対応し、デプロイ管理、インテリジェントルーティング、エラスティックスケーリング、深層可観測性を統合的に提供します。導入直後から大規模な AI ビジネスをすでに展開している企業まで、クラウドネイティブ AI 推論の複雑なシナリオを容易に処理できます。

すべて

AI 推論スイート

2025 年 7 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

ECS インスタンスメタデータへの強化モードのみアクセスをサポート

ECS インスタンス内のメタデータサービスを介して、ECS インスタンスのメタデータ(例:インスタンス ID、VPC 情報、NIC 情報)にアクセスできます。ACK クラスターでは、ノードインスタンスのメタデータアクセスは、標準モードおよび強化モードの両方をデフォルトでサポートしています。さらにメタデータサービスのセキュリティを強化するため、強化モード(IMDSv2)のみに切り替えることができます。

すべて

強化モードのみでの ECS インスタンスメタデータへのアクセス

海外ソースイメージのサブスクリプションをサポート

Docker Hub、GCR、Quay などの海外ソースイメージリポジトリからイメージを定期的に Enterprise インスタンスに同期するには、Enterprise インスタンスのアーティファクトサブスクリプション機能を使用します。

すべて

アーティファクトサブスクリプションを用いた海外ソースイメージの取得

CNFS を通じた EFC クライアントによる NAS のマウントをサポート

EFC は、File Storage NAS のアクセスパフォーマンスを向上させるための分散キャッシュなどの機能を提供します。大規模データセットに対する高同時実行性および並列アクセスをサポートしており、ビッグデータ分析、AI トレーニングおよび推論などのデータ集約型および高同時実行性のコンテナ化シナリオに適しています。デフォルトの NFS プロトコルを用いた NAS のマウントと比較して、EFC を使用するとファイルアクセスが高速化され、読み書きパフォーマンスが向上します。

すべて

CNFS を通じた EFC クライアントによる NAS のマウント

Distributed Cloud Container Platform for Kubernetes

GUI を備えた GitOps 機能

コンソールを使用して、GitOps 機能の有効化または無効化、パブリックネットワークアクセスおよび ACL の構成、ApplicationSet UI の使用、Argo CD ConfigMap の構成、コンポーネントの再起動、モニタリングおよびログの可観測性などの完全な GitOps 機能を管理できます。

すべて

GitOps のクイックスタート

マルチクラスター GitOps が Argo CD ConfigMap 構成をサポート

ACK One は、Argo CD の ConfigMap を構成することで、GitOps 関連の機能および権限を管理することをサポートしています。

すべて

Argo CD ConfigMap の構成

マルチクラスターフリート向け在庫認識型エラスティックスケジューリングの有効化をサポート

ACK One マルチクラスターフリートは、マルチリージョンアプリケーションサービスデプロイにおけるマルチリージョンリソース割り当ての課題に対応します。在庫認識型インテリジェントスケジューラを実装しています。即時エラスティシティと組み合わせることで、管理対象クラスターの既存リソースが不足している場合に、在庫のあるクラスターにアプリケーションサービスをルーティングできます。即時エラスティシティにより、必要なノードがそのクラスターでスケールアウトされ、アプリケーションサービスを処理できるようになります。これにより、スケジューリング成功率が向上し、リソースコストが削減されます。

すべて

在庫認識型クロスリージョンマルチクラスターエラスティックスケジューリング

Container Service for Kubernetes Edge Edition

専用回線を用いたプライベートネットワーク接続の構成をサポート

ACK Edge クラスターは、専用回線を用いたネットワークアクセスをサポートしています。これにより、ACK Edge クラスターのエッジノードから ACK や ACR などのクラウドサービスへの安全かつ効率的なアクセスが可能となり、ネットワークの競合および固定 IP アドレスの欠如という課題に対応できます。

すべて

専用回線を用いたプライベートネットワーク接続の構成

2025 年 6 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

コンソールでの AI Profiling の使用

AI Profiling は、eBPF および動的プロセス注入に基づく非侵入型のパフォーマンス分析ツールであり、Kubernetes コンテナーのシナリオにネイティブに設計されています。GPU タスクを実行するコンテナーのプロセスをオンラインで検出することをサポートし、複数のデータ収集機能を備えています。実行中の GPU タスクに対して、パフォーマンスデータ収集を動的に開始および停止できます。オンラインサービスでは、動的にアタッチおよびデタッチ可能なプロファイリングツールにより、ビジネスコードを変更せずにリアルタイムかつ詳細な分析が可能です。

すべて

AI Profiling

GPU ノードのセルフリカバリ

ノードのセルフリカバリは、GPU ソフトウェアおよびハードウェアの異常によって引き起こされるインスタンス障害の自動リカバリをサポートするようになりました。

ACK は、基盤となる EGS および Lingjun ノードにおける GPU ソフトウェアおよびハードウェアの異常に対して、Kubernetes 側のノードインスタンス障害のセルフリカバリを提供します。これには、障害の検出、通知およびアラート、自動隔離、ノードのドレイン、自動修復の全自動化が含まれます。また、修復を実行する前にユーザーの承認をサポートすることで、自動障害運用をさらに強化し、クラスターの運用保守コストを削減します。

すべて

ノードのセルフリカバリの有効化

Lingjun 向け CPFS の静的永続ボリューム

CPFS for Lingjun は、超高スループットおよび IOPS パフォーマンスを提供し、エンドツーエンドの RDMA ネットワーク加速をサポートします。AIGC や自動運転などのインテリジェントコンピューティングのシナリオに適しています。クラスター内で CPFS for Lingjun の静的永続ボリュームを作成し、ワークロードで使用できます。

すべて

CPFS for Lingjun の静的永続ボリュームの使用

ACK VPD CNI コンポーネント

ACK VPD CNI は、ACK マネージドクラスター Pro エディションの Lingjun ノード向けにコンテナーネットワーク管理を提供します。Lingjun ノードの CNI プラグインとして、ACK VPD CNI は Lingjun 接続を用いて Lingjun ノードのコンテナーネットワークリソースを割り当ておよび管理します。

すべて

ACK VPD CNI

ack-kms-agent-webhook-injector コンポーネント

ack-kms-agent-webhook-injector は、KMS Agent をサイドカーとして Pod に挿入します。ビジネスアプリケーションは、ローカル HTTP インターフェイスを用いて KMS Agent 経由で KMS インスタンスから資格情報を取得し、メモリ内にキャッシュできます。これにより、機密情報をハードコーディングすることを避け、データセキュリティを向上させます。

すべて

アプリケーション向け Alibaba Cloud KMS サービス資格情報のインポート

推論拡張機能付きゲートウェイのコンポーネント機能の拡張

推論拡張機能付きゲートウェイは、vLLM や SGLang などの複数の生成 AI 推論フレームワークをサポートしています。異なるフレームワークでデプロイされた生成 AI 推論サービスを、段階的リリース戦略、推論ロードバランシング、モデル名ベースのルーティング、レート制限、推論サービスのサーキットブレーキングなどの機能で強化します。

すべて

推論拡張機能付きゲートウェイ、トラフィック管理、および推論サービス管理

機密仮想マシンを活用した CAA 機密コンテナー ソリューション

金融リスク管理や医療などの機密コンピューティングを必要とするシナリオでは、Cloud API Adaptor(CAA)ソリューションを用いて ACK クラスターに機密コンピューティングワークロードをデプロイします。これにより、Intel® TDX 技術を用いて、外部からの攻撃や潜在的なクラウドプロバイダーの脅威から機密データを保護し、業界のコンプライアンス要件を満たします。

すべて

機密 VM および CAA を用いた機密 AI コンテナー ソリューション

Cloud-native AI Suite

XXL-JOB を用いた Dify ワークフローのスケジューリング

Dify ワークフローは、リスク監視、データ分析、コンテンツ生成、データ同期など多くのシナリオで、自動化されたタスクのスケジューリングを必要とします。しかし、Dify はネイティブでスケジューリングをサポートしていません。この課題を解決するため、本実践では、XXL-JOB 分散タスクスケジューラを統合してワークフローアプリケーションをスケジューリングし、そのステータスを監視することで、ワークフローの安定した運用を確保する方法を示します。

すべて

XXL-JOB を用いた Dify ワークフロー アプリケーションのスケジューリング

2025 年 5 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

Kubernetes 1.33 のサポート

Kubernetes 1.33 の新規サポートです。クラスター作成時に直接 1.33 のクラスターを作成したり、下位バージョンのクラスターを 1.33 にアップグレードしたりできます。

すべて

Kubernetes 1.33

ack-ram-authenticator コンポーネントのデフォルトインストール

Kubernetes 1.33 以降、新しく作成された ACK マネージドクラスター では、追加のクラスターノードリソースを消費せずに、最新バージョンのマネージド ack-ram-authenticator コンポーネントが自動的にインストールされます。

すべて

[サービスのお知らせ] Kubernetes 1.33 以降の ACK マネージドクラスターにおける ack-ram-authenticator コンポーネントのデフォルトインストール

containerd 2.1.1 のリリース

containerd 2.1.1 は、Node Resource Interface(NRI)、Container Device Interface(CDI)、Sandbox API をサポートしています。

すべて

containerd ランタイムのリリースノート

ossfs 2.0 のサポート

ossfs 2.0 は、Filesystem in Userspace(FUSE)を基盤とするクライアントです。Alibaba Cloud OSS をローカルファイルシステムとしてマウントすることで、ビジネスコンテナーが POSIX 操作を用いて OSS データにローカルファイルのようにアクセスできます。ossfs 1.0 と比較して、ossfs 2.0 は逐次読み書きおよび高同時実行性の小ファイル読み取りのパフォーマンスを向上させ、AI トレーニング、推論、ビッグデータ処理、自動運転など、ストレージアクセスパフォーマンス要件の高いシナリオに適しています。

すべてのリージョン

ossfs 2.0

Distributed Cloud Container Platform for Kubernetes

ApplicationSet を用いたマルチ環境デプロイおよびアプリケーション依存関係の調整

開発環境およびステージング環境間のマルチアプリケーション依存関係管理のための自動化デプロイシステムを構築する新しいベストプラクティスです。これは、Argo CD のプログレッシブ同期機能と ApplicationSet のマルチ環境リソースオーケストレーション機能を組み合わせたものです。

すべて

ApplicationSet を用いたマルチ環境デプロイおよびアプリケーション依存関係の調整

2025 年 4 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

Lingjun ノードプールの作成および管理

ACK マネージドクラスター Pro エディション で Lingjun ノードプールの作成および管理をサポートします。

すべて

Lingjun ノードプール

指定されたインスタンス属性を用いたノードプールの構成

vCPU やメモリなどの指定されたインスタンス属性を用いてノードプールのインスタンスタイプを構成します。ノードプールは、スケーリング時に一致するインスタンスタイプを自動的に選択し、スケーリング成功確率を向上させます。

すべて

指定されたインスタンス属性を用いたノードプールの構成

リアルタイム AI Profiling

Kubernetes コンテナーのシナリオにおいて、AI Profiling は、eBPF および動的プロセス注入に基づく非侵入型のパフォーマンス分析ツールです。GPU タスクを実行するコンテナーのプロセスをオンラインで検出することをサポートします。オンラインサービスでは、動的にアタッチおよびデタッチ可能なプロファイリングツールにより、ビジネスコードを変更せずにリアルタイムかつ詳細な分析が可能です。

すべて

コマンドラインから AI Profiling を使用

プリエンプションの有効化

クラスターのリソースが逼迫している場合、高優先度タスクがリソース不足により実行に失敗することがあります。プリエンプションを有効化すると、ACK スケジューラがリソース使用状況をシミュレートし、低優先度の Pod タスクを追い出し、高優先度タスクの迅速な起動を優先するためにコンピュートリソースを解放できます。

すべて

プリエンプションの有効化

推論拡張機能付きゲートウェイを用いたサービスへのアクセス

推論拡張機能付きゲートウェイ は、Envoy Gateway プロジェクトを基盤としており、完全な Gateway API 機能およびオープンソースの Envoy Gateway 拡張リソースをサポートしています。

すべて

推論拡張機能付きゲートウェイを用いたサービスへのアクセス

生成 AI サービスの強化

推論拡張機能付きゲートウェイコンポーネントを用いて、生成 AI 推論サービスのインテリジェントルーティングおよび効率的なトラフィック管理、段階的リリース、推論サービスのリクエストサーキットブレーキング、推論サービスのトラフィックミラーリングを実現します。

すべて

生成 AI サービスの強化

PVC-to-PVC ボリュームのバックアップおよびリストア

ACK クラスター内のクラウドディスクデータをクラウド内、同一リージョン内の ACK クラスター間、異なるリージョン間の ACK クラスター間でバックアップおよびリストアできます。ソースクラスターでバックアップを完了した後、バックアップセンターを用いて、現在のクラスターまたは別のクラスターに新しい永続ボリューム要求(PVC)および対応するボリュームをリストアできます。ワークロードの YAML 構成を変更する必要はありません。

すべて

バックアップセンター

alibabacloud-privateca-issuer のリリース

AlibabaCloud Private CA Issuer をリリースし、cert-manager を用いてクラスター内で Alibaba Cloud PCA 証明書の作成および管理をサポートします。現在、ACK App Market で利用可能です。

すべて

なし

ACK マネージドクラスター(インテリジェントマネージドモード)でのワークロードのデプロイおよびロードバランシングの有効化

ACK マネージドクラスター(インテリジェントマネージドモード)でワークロードをデプロイし、ALB Ingress を用いてパブリックネットワークアクセスを有効化する方法について学びます。完了後、構成されたドメイン名を用いてアプリケーションにアクセスすることで、外部トラフィックを効率的に管理し、ロードバランシングを有効化できます。

すべて

ワークロードのデプロイおよびロードバランシングの有効化

Datapath V2 のベストプラクティス

Terway CNI プラグインを用いるクラスターで Datapath V2 を有効化した後のクラスターネットワーク構成を最適化する方法について学びます。Conntrack パラメーターの構成や Identity リソースの管理などの例を含み、クラスターのパフォーマンスおよび安定性を向上させます。

すべて

Datapath V2 のベストプラクティス

Dify コンポーネントのアップグレードガイド

ack-dify を古いバージョンから v1.0.0 以降にアップグレードする新しいベストプラクティスです。手順には、データのバックアップ、プラグインシステムへのプラグイン移行ツールのインストール、新しいプラグインエコシステムの有効化が含まれます。

すべて

ACK クラスターにおける Dify コンポーネントのアップグレード

Distributed Cloud Container Platform for Kubernetes

PrivateLink を用いたデータセンター CIDR ブロックの競合の解決

専用回線を用いてオンプレミスの Kubernetes クラスターを ACK One 登録済みクラスター に接続した後、サーバーレスコンピュートリソースを使用する際に、内部ネットワークの他のサービスが同じ CIDR ブロックを使用しているために競合が発生する可能性があります。PrivateLink を用いることで、データセンター CIDR ブロックの競合を解決できます。

すべて

PrivateLink を用いたデータセンター CIDR ブロックの競合の解決

ACS Pod のクロスリージョンスケジューリング

ACK One 登録済みクラスター は、クロスリージョンのサーバーレスコンピュートリソースを Kubernetes クラスターにシームレスに統合することをサポートしています。これにより、クロスリージョンの GPU リソースの動的スケジューリングおよび統一管理が可能になります。

すべて

ACS Pod のクロスリージョンスケジューリング

ログ収集

Alibaba Cloud Simple Log Service(SLS)を用いたコンテナーログの自動収集を、SLS CRD または環境変数を用いて構成します。

すべて

Container Service for Kubernetes Edge Edition

バージョン 1.32 のリリース

バージョン 1.32 をサポートしており、最適化された CoreDNS、kube-proxy、kubelet の kube-apiserver へのリクエスト、およびクラウド・エッジ間の通信トラフィックの削減が含まれます。

すべて

ACK Edge Kubernetes 1.32 リリースノート

専用回線環境におけるネットワーク要素の構成

オンプレミスのデータセンター(IDC)サーバーデバイスをパブリックネットワークまたは専用回線を介してコンテナ化された管理に接続することをサポートします。専用回線を介して接続する場合、接続前にインフラストラクチャのネットワーク要素の構成を完了する必要があります。

すべて

専用回線環境におけるネットワーク要素の構成

Cloud-native AI Suite

HistoryServer コンポーネントのサポート

Ray ネイティブのダッシュボードは、クラスターの実行中にのみ利用可能です。クラスターが終了すると、ユーザーは過去のログやモニタリングデータにアクセスできなくなります。RayCluster HistoryServer を使用して、クラスターの運用中にノードのログをリアルタイムで収集し、OSS に永続化します。

すべて

ACK への HistoryServer コンポーネントのインストール

KubeRay コンポーネントのサポート

KubeRay Operator コンポーネントのデプロイをサポートし、Alibaba Cloud SLS および Prometheus モニタリングを統合して、ログ管理、システム可観測性、高可用性を強化します。

すべて

ACK への KubeRay コンポーネントのインストール

2025 年 3 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

ACK マネージドクラスター Pro エディション がインテリジェントマネージドモードをサポート

ACK マネージドクラスター を作成する際に、インテリジェントマネージドモードを有効化することで、ベストプラクティスに従った Kubernetes クラスターを迅速に作成できます。

クラスター作成後、デフォルトで スマートマネージドノードプール が作成されます。このノードプールは、ワークロードに基づいて動的にスケーリングします。ACK は、OS バージョンのアップグレード、ソフトウェアバージョンのアップグレード、セキュリティ脆弱性の修正を処理します。

すべて

クラスターのコントロールプレーンおよびデータプレーンコンポーネントのトレースを有効化

クラスターの API Server または kubelet のトレースを有効化すると、トレースデータが自動的に Managed Service for OpenTelemetry にレポートされ、可視化されたトレース詳細およびリアルタイムのトポロジーモニタリングデータが提供されます。

すべて

高リスク KubeConfig の SMS およびメール通知

アカウント下に高リスクの KubeConfig が存在する場合、たとえ削除済みであっても、ユーザーに SMS およびメールで通知を送信します。

すべて

なし

ACK Gateway with Inference Extension を用いたインテリジェントルーティングおよびトラフィック管理

ACK Gateway with Inference Extension コンポーネントを用いて、インテリジェントルーティングおよび効率的なトラフィック管理のための推論サービス拡張機能を構成します。

すべて

Gateway with Inference Extension を用いたインテリジェントルーティングおよびトラフィック管理

Distributed Cloud Container Platform for Kubernetes

統一されたマルチクラスターフリートコンポーネント管理

ACK One フリートは、クラスターの運用保守エンジニアに統一された自動化されたコンポーネント管理を提供します。複数のコンポーネントおよびバージョンを含むベースラインを定義し、複数のクラスターにデプロイし、コンポーネントの構成、デプロイバッチ、ロールバックをサポートして、システムの安定性を向上させます。

すべてのリージョン

マルチクラスターコンポーネント管理

動的配布およびデスケジューリングのサポート

ACK One フリートは、PropagationPolicy を用いて、利用可能なリソースに基づいてワークロードのレプリカを子クラスターに分割できます。ACK One フリートはデフォルトでデスケジューリングを有効にしており、2 分ごとにチェックします。Pod が 30 秒以上スケジューリング不可能な状態が続くと、そのレプリカに対してデスケジューリングがトリガーされます。

すべて

動的配布およびデスケジューリング

Cloud-native AI Suite

Slurm キューの優先度を設定できます。

Slurm 環境で適切なキューポリシーを構成して、ジョブの送信時やジョブの状態変更時にタスクスケジューリングを最大化し、最適なパフォーマンスを達成する方法を示す新しいベストプラクティスです。

すべて

ACK クラスターにおける Slurm キューの優先度の設定

2025 年 2 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

コントロールプレーンのセキュリティグループおよびタイムゾーンの変更

クラスター作成時に選択したセキュリティグループおよびタイムゾーンが要件を満たさなくなった場合、クラスターの基本情報でコントロールプレーンのセキュリティグループおよびクラスターのタイムゾーンを変更できます。

すべて

クラスター情報の表示

ノードプールがカスタム containerd 構成をサポート

ノードプール内のノードに対して、containerd パラメーター構成をカスタマイズできます。例えば、特定のイメージリポジトリに対して複数のミラーリポジトリを構成したり、特定のイメージリポジトリの証明書検証をスキップしたりできます。

すべて

ノードプールの containerd パラメーター構成のカスタマイズ

新しいノードプールの弾力性強度インジケーター

ノードプールのスケーリングは、インスタンスの在庫不足や指定されたゾーンでサポートされていない ECS インスタンスタイプが原因で失敗することがあります。弾力性強度を使用して、ノードプールの構成の可用性およびインスタンス供給の健全性を評価し、構成の推奨事項を取得します。

すべて

ノードプールの弾力性強度の表示

バッチタスクオーケストレーションの有効化

Argo Workflows は、Kubernetes ネイティブのワークフローエンジンで、YAML または Python を用いて並列タスクのオーケストレーションをサポートします。CI/CD パイプライン、データ処理、機械学習のためのコンテナ化されたアプリケーションの自動化および管理を簡素化します。Argo Workflows コンポーネントをインストールして、バッチタスクオーケストレーションを有効化できます。その後、Alibaba Cloud Argo CLI またはコンソールを使用して、ワークフロータスクを作成および管理します。

すべて

バッチタスクオーケストレーションの有効化

GPU 障害検出

ACK が提供する ack-node-problem-detector コンポーネントは、オープンソースの node-problem-detector プロジェクトに基づいて、クラスターノードの異常イベントモニタリングを強化します。GPU 固有の豊富な障害検出項目を含み、GPU シナリオにおける障害発見を向上させます。障害が検出されると、障害の種類に基づいて対応する Kubernetes Events または Kubernetes Node Conditions を生成します。

すべて

GPU 異常検出および自動隔離

Distributed Cloud Container Platform for Kubernetes

実際の残存リソースに基づくマルチクラスター Spark ジョブのスケジューリングおよび配布

この実践では、ACK One フリートおよび ACK Koordinator コンポーネントを用いて、クラスター間の実際の残存リソース(要求されたリソースではなく)に基づいてマルチクラスター Spark ジョブをスケジューリングおよび配布する方法を示します。これにより、マルチクラスター環境におけるアイドルリソースを最大限に活用し、優先度制御およびオフラインハイブリッドデプロイメントを通じてオンラインサービスの安定性を確保します。

すべて

実際の残存リソースに基づくマルチクラスター Spark ジョブのスケジューリングおよび配布

Container Service for Kubernetes Edge Edition

新しい Pod vSwitch のサポート

ACK Edge クラスター が ENS エッジシナリオで Terway Edge プラグインを使用する場合、既存の vSwitch の IP アドレスが不足している場合や、Pod CIDR ブロックを拡張する必要がある場合に、新しい Pod vSwitch を追加できます。これにより、クラスターで利用可能な IP アドレスリソースが増加します。

すべて

Pod vSwitch の追加

GPU リソースモニタリング

ACK Edge クラスター は、データセンターおよびエッジの GPU ノードを管理でき、複数のリージョンおよび環境にわたる異種計算能力の統一管理を提供します。Alibaba Cloud Prometheus モニタリングを ACK Edge クラスター に統合することで、データセンターおよびエッジコンピューティングの GPU ノードに、クラウドベースのリソースと同じ可観測性機能を提供できます。

すべてのリージョン

ACK Edge クラスターにおける GPU リソースモニタリングのベストプラクティス

Cloud-native AI Suite

ACK を用いた DeepSeek 蒸留モデル推論サービスのデプロイ

DeepSeek-R1-Distill-Qwen-7B モデルを例に、Alibaba Cloud Container Service for Kubernetes (ACK) で KServe を用いて、本番環境に対応した DeepSeek 蒸留モデル推論サービスをデプロイする方法を学びます。

すべて

ACK を用いた DeepSeek 蒸留モデル推論サービスのデプロイ

ACK を用いた DeepSeek フルバージョン推論サービスのマルチノード分散デプロイ

この実践では、ACK を用いた分散 DeepSeek-R1-671B 大規模モデル推論の実践的なソリューションを示します。ハイブリッド並列戦略と Alibaba Cloud Arena ツールを組み合わせて、2 つのノードにまたがる効率的な分散デプロイを実現します。また、デプロイされた DeepSeek-R1 を Dify プラットフォームに統合して、長文コンテキスト理解をサポートするエンタープライズグレードのインテリジェント Q&A システムを迅速に構築する方法もカバーしています。

すべて

ACK を用いた DeepSeek フルバージョン推論サービスのマルチノード分散デプロイ

2025 年 1 月

プロダクト

機能名

説明

利用可能なリージョン

関連ドキュメント

Container Service for Kubernetes

ノードプールがオンデマンドイメージ高速化をサポート

ACK は、DADI(Data Accelerator for Disaggregated Infrastructure)イメージ高速化技術を基盤としており、コンテナイメージのオンデマンドローディングをサポートします。これにより、完全なダウンロードが不要となり、オンラインでの展開が可能となり、アプリケーションの起動時間を大幅に短縮します。

すべて

オンデマンドコンテナイメージローディングを用いたコンテナ起動の高速化

Alibaba Cloud Linux 3 Container-Optimized Edition オペレーティングシステムの新規サポート

Alibaba Cloud Linux 3 Container-Optimized Edition(Alibaba Cloud Linux 3.2104 LTS 64 ビット Container-Optimized Edition)は、デフォルトの Alibaba Cloud Linux 標準イメージを基に、コンテナシナリオ向けに最適化されたイメージバージョンです。より高密度のビジネスデプロイ、高速な起動速度、強力なセキュリティ分離など、コンテナシナリオのより高い要件に対応するため、Alibaba Cloud は Container Service for Kubernetes での豊富な顧客経験を基に、このクラウドネイティブオペレーティングシステムを開発しました。

すべて

Kubernetes 1.32 のサポート

ACK は Kubernetes 1.32 をサポートするようになりました。クラスター作成時に直接 1.32 のクラスターを作成したり、下位バージョンのクラスターを 1.32 にアップグレードしたりできます。

すべて

Kubernetes 1.32

ElasticQuotaTree およびタスクキューを用いたリソース利用率の向上

異なるチームやタスクがクラスターの計算リソースを共有しつつ、公平な割り当てと分離を確保するために、ack-kube-queue、ElasticQuotaTree、ack-scheduler を用いて、柔軟かつ合理的なリソース割り当てが可能です。

すべて

なし

リソースグループを用いた詳細なリソース制御の新しいベストプラクティス

Container Service for Kubernetes のリソースをより効率的に管理するために、リソースグループを使用してリソースを整理できます。リソースグループを使用すると、部門、プロジェクト、環境、その他のディメンションでリソースをグループ化できます。Resource Access Management (RAM) と組み合わせることで、単一の Alibaba Cloud アカウント内でリソースの分離と詳細な権限管理が可能になります。

すべて

リソースグループを用いた詳細なリソース制御

Distributed Cloud Container Platform for Kubernetes

ACK One 登録済みクラスター が ACS 計算能力にアクセス

ACK One 登録済みクラスター で ACS が提供するコンテナ計算能力を使用できます。

すべて

仮想ノードを用いた ACS への Pod のスケジューリング

ネイティブ Service ドメイン名によるクラスター間サービスアクセスのサポート

ACK One マルチクラスター Service は、MultiClusterService を介してネイティブ Service ドメイン名を用いたクラスター間サービスアクセスをサポートします。ビジネスコード、ビジネス Pod の DNSConfig、または CoreDNS 構成を変更する必要はなく、ネイティブ Service を使用してクラスター間のトラフィックルーティングが可能です。

すべて

ネイティブ Service ドメイン名を用いたクラスター間サービスアクセス

Go SDK を用いたマルチクラスターリソースへのアクセスのサポート

ACK One フリートをプラットフォームに統合して子クラスターのリソースにアクセスしたい場合は、Go SDK を使用できます。

すべて

Go SDK を用いたマルチクラスターリソースへのアクセス

Container Service for Kubernetes Edge Edition

クラウドノードスケーリングのサポート

オンプレミスのノードリソースが不足している場合、自動ノードスケーリングにより ACK Edge クラスター にクラウドノードが追加され、スケジューリング容量が補完されます。

すべて

クラウド ECS ノードの弾力性

ハイブリッドクラウド LLM エラスティック推論サービスデプロイのサポート

ack-kserve コンポーネントをインストールし、ACK Edge クラスター のクラウド弾力性機能と組み合わせることで、ハイブリッドクラウド LLM エラスティック推論サービスをデプロイできます。これにより、クラウドおよびオンプレミスのリソースを柔軟にスケジューリングし、LLM 推論サービスの運用コストを削減できます。

すべて

共有 GPU スケジューリングのサポート

共有 GPU スケジューリングにより、複数の Pod を同じ GPU カードにスケジューリングして GPU 計算リソースを共有し、GPU 利用率を向上させ、コストを削減できます。

  • ACK Edge クラスター のクラウドノードプールは、共有 GPU スケジューリング、GPU メモリ隔離、計算能力隔離を完全にサポートしています。

  • ACK Edge クラスター のエッジノードプールは、共有 GPU スケジューリングのみをサポートし、GPU メモリ隔離や計算能力隔離はサポートしていません。

すべて

共有 GPU スケジューリングの使用

マルチリージョン ECS リソースの統一管理のサポート

この新しいベストプラクティスでは、ACK Edge クラスター を用いて、複数のリージョンに分散した計算リソースを統一管理する方法を示します。これにより、クラウドネイティブアプリケーションの完全なライフサイクル管理と効率的なリソーススケジューリングが可能になります。

すべて

マルチリージョン ECS リソースの統一管理

詳細情報

過去の ACK リリースノートについては、「過去のリリースノート (2025 年以前)」をご参照ください。