本トピックでは、Container Service for Kubernetes (ACK) の最新の機能リリースについて説明します。
背景情報
Container Service for Kubernetes (ACK) でサポートされる Kubernetes (K8s) のバージョンについては、「バージョンガイド」をご参照ください。
Container Service for Kubernetes (ACK) は、ContainerOS、Alibaba Cloud Linux 3 Container-Optimized Edition、Alibaba Cloud Linux 3、Alibaba Cloud Linux 3 Arm Edition、Alibaba Cloud Linux UEFI 3、Red Hat、Ubuntu、Windows などのオペレーティングシステムをサポートしています。詳細については、「オペレーティングシステム」をご参照ください。
2025 年 12 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | ノードプールがセキュリティセンターの 脆弱性修正の購入(従量課金) をサポート | OS の CVE 脆弱性修正機能を有効化することで、ノード上のセキュリティ脆弱性をスキャンし、修復のための推奨事項と方法を取得して、コンソール上で迅速に修正できます。本機能を利用する前に、「セキュリティセンター」の Ultimate を有効化するか、または「脆弱性修正(従量課金)」を購入してください。 | すべてのリージョン | |
APIG Ingress のサポート | クラウドネイティブ API ゲートウェイ(APIG Ingress)は、オープンソースの Higress ゲートウェイを基盤としたエンタープライズエディションのゲートウェイです。Nginx Ingress と互換があり、API 管理およびマイクロサービスのユースケースに適しています。 | すべてのリージョン | ||
Kagent の新規サポート | Kagent は、Kubernetes 上で AI アプリケーションを構築、デプロイ、実行するためのフレームワークです。Kagent をデプロイ後、宣言型 API を使用してエージェントおよび MCP Server を作成し、複数の大規模言語モデル(LLM)に接続できます。 | すべて | ||
CNFS を使用した NAS、OSS、CPFS のタグ管理 | CNFS を使用すると、NAS、OSS、CPFS のクラウドストレージリソースにタグを追加できます。これにより、細かい粒度での分類および権限管理が可能になり、リソースガバナンスの効率が向上します。 | すべて | ||
Kyverno をポリシーガバナンスエンジンとして使用 | Kyverno は、Kubernetes ネイティブのポリシー エンジンであり、コードによるポリシー(Policy-as-Code)を用いてセキュリティ、コンプライアンス、自動化ポリシーを定義および適用します。デフォルトでクラスターに統合されている OPA Gatekeeper と比較して、Kyverno は YAML 定義を使用するため Rego の学習が不要であり、承認段階での変更(mutating)および生成(generating)をサポートします。これは、高度にカスタマイズされたポリシー、運用の自動化、またはマルチクラスターにおけるポリシー ガバナンスを必要とするユースケースに適しています。 | すべてのリージョン | ||
リモートアテステーションを用いた機密コンテナーの信頼性保証 | PeerPod リモートアテステーションにより、機密コンテナーは Intel TDX などの真正かつ改ざんされていない機密コンピューティング環境で常に実行されることを保証します。コンテナーのデプロイ前にノードを自動的に検証し、実行時にアプリケーションが環境証明をオンデマンドで取得できるようにすることで、機密ワークロードに対してエンドツーエンドのセキュリティを提供します。 | すべて | ||
Knative が A2A プロトコルサーバーをサポート | Agent2Agent(A2A)は、AI エージェント間のシームレスな通信および協調のためのオープン標準です。Knative に A2A サーバーをデプロイすることで、ゼロスケールを含む自動スケーリングを活用し、必要に応じてリソースを活用しながら素早くバージョンを反復できます。 | すべて | ||
新しい ack-agent-gateway 実践 |
| すべて | ||
Distributed Cloud Container Platform for Kubernetes | vLLM カスタムメトリクスを用いたマルチクラスター HPA 実践 | 大規模言語モデル(LLM)のオンラインサービスでは、トラフィックの変動に応じてマルチクラスター構成を採用することが一般的です。ACK One が提供するマルチクラスター解決策は、このようなシナリオに対応しています。本実践では、ACK One フリートを用いてクラウド環境に vLLM 推論サービスをデプロイし、フェデレーテッド HPA(FederatedHPA)を活用して、クラスター間のエラスティックスケーリングを行う方法を示します。 | すべて |
2025 年 11 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | インテリジェントマネージドモードが GPU ワークロードのデプロイおよび運用をサポート | クラスターに対してインテリジェントマネージドモードを有効化すると、インテリジェントマネージドノードプールを用いて GPU リソースを動的にスケールできます。これにより、オンライン推論など、ピーク時とオフピーク時のパターンが明確な GPU ワークロードのコストを大幅に削減できます。 | すべて | |
新しい servicemesh-operator コンポーネント | servicemesh-operator コンポーネントは、ACK クラスター内でのサービスメッシュ(ASM)のデプロイ、アップグレード、構成管理を簡素化します。これにより、トラフィック管理、セキュリティ、可観測性などの強力な ASM 機能を迅速に有効化できます。 | すべてのリージョン | ||
新しい組み込み FinOps ルールライブラリ | Pod のデプロイおよび更新要求がセキュアであるかを検証するため、Pod のセキュリティポリシーを設定できます。ACK クラスターポリシー管理には、コンプライアンス、Infra、K8s-general、PSP、FinOps を含む複数の組み込みルールライブラリが提供されています。 | すべて | ||
Knative における MCP Server のデプロイをサポート | MCP Server を Knative でホストすることで、そのサーバーレスアーキテクチャの利点を活用し、オンデマンドのスケーリングおよびイベント駆動型の AI サービスを実現できます。 | すべて | ||
ローリングアップデートおよびグレースフルシャットダウンの構成実践 | ACK クラスターにおけるアプリケーションのアップデート時にダウンタイムをゼロにするため、readiness プローブ、readiness ゲート、preStop フック、SLB のグレースフル終了をデプロイメントに構成します。これにより、スムーズなトラフィック移行を実現し、高可用性を確保します。 | すべて | ||
Distributed Cloud Container Platform for Kubernetes | クラスター単位のマルチクラスター優先順位付きエラスティックスケジューリング実践 | ACK One フリートは AI 推論サービスをサポートしています。マルチリージョンのマルチ ACK クラスターおよびハイブリッドクラウドのマルチクラスターのシナリオにおいて、クラスターの優先順位を定義することで、IDC またはプライマリリージョンのリソースを優先的に使用しつつ、Alibaba Cloud またはバックアップリージョンのリソースで計算能力を補完できます。在庫認識型スケジューリングと組み合わせることで、業務継続性を確保できます。 | すべて |
2025 年 10 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
DRA ベースの GPU スケジューリングをサポート | AI トレーニングおよび推論のシナリオにおいて、複数のアプリケーションが GPU リソースを共有する場合、ACK クラスターに NVIDIA DRA ドライバーをデプロイすることで、従来のデバイスプラグインによるスケジューリング制限を克服できます。Kubernetes DRA API を使用して、Pod 間で GPU を動的に割り当て、細かい粒度でリソースを制御することで、GPU の利用率を向上させ、コストを削減できます。 | すべて | ||
Distributed Cloud Container Platform for Kubernetes | 登録済みクラスターが ACS GPU-HPN のキャパシティ予約をサポート | オンプレミスの Kubernetes クラスターをクラウドに登録し、GPU-HPN のキャパシティ予約と組み合わせることで、企業はオンプレミスおよびクラウド環境にまたがる GPU リソースを集中管理およびインテリジェントにスケジュールできます。これにより、AI トレーニングおよび推論などの重要なワークロードに対して、安定的かつ高性能なコンピューティングを提供できます。 | すべて | |
自己管理型 Prometheus を用いたコントロールプレーンコンポーネントのメトリクス収集をサポート | 自己管理型 Prometheus モニタリングシステムを用いるハイブリッドクラウド環境において、Metrics Aggregator コンポーネントをインストールし、ServiceMonitor を構成することで、ACK One 登録済みクラスターのコアコンポーネントのメトリクスを収集できます。これにより、既存のモニタリングシステムにメトリクスを統合し、統一されたアラートおよび可観測性を実現できます。 | すべて | ||
Cloud-native AI Suite | Arena を用いた eRDMA 加速 PyTorch 分散トレーニングジョブの送信 | マルチノード GPU トレーニングでは、ネットワーク通信のレイテンシーが全体のパフォーマンスを低下させる原因となることがあります。モデルのトレーニング時間を短縮するため、Arena を用いて PyTorch 分散ジョブを送信し、eRDMA ネットワーク加速を構成します。これにより、ノード間の低レイテンシー・高スループットな通信を実現し、トレーニング効率およびクラスター利用率を向上させます。 | すべて |
2025 年 9 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | Kubernetes 1.34 のサポート | Kubernetes 1.33 をサポートしています。クラスター作成時に直接 1.34 のクラスターを作成したり、下位バージョンのクラスターを 1.34 にアップグレードしたりできます。 | すべて | |
ハイブリッドクラウドノードプールのサポート | ACK クラスターの管理にオンプレミスのサーバーリソースを含めるために、ACK マネージドクラスター Pro エディションを使用してハイブリッドクラウドノードプールを作成します。既存のハイブリッドクラウドノードをクラスターに追加することで、クラウドおよびオンプレミスのリソースにまたがるエラスティックスケジューリングおよびコスト最適化を実現し、統一されたオーケストレーションを維持するとともに、既存の IT 資産を活用できます。 | すべて | ||
ハイブリッドクラウドノードプールの DNS 解決の構成をサポート | ハイブリッドクラウドノードプールがクラウドの CoreDNS を使用してドメイン名解決を行う場合、頻繁なアクセスによって専用回線の負荷が増加し、専用回線の不安定性により解決失敗が発生する可能性があります。NodeLocal DNSCache を構成することで、これらの問題を軽減できます。 | すべて | ||
Terway Hybrid CNI プラグインのサポート | オンプレミスの IDC に接続されたハイブリッドクラウドノードプールは、標準のコンテナーネットワークプラグインの機能を超える複雑なネットワークトポロジーおよびクロスドメインルーティング要件を持ちます。Terway Hybrid CNI プラグインは、ハイブリッドクラウドノードプールに特化して設計されており、IDC およびクラウド環境の両方における Pod 間のネットワーク接続を保証します。 | すべて | ||
ossfs 2.0 が RRSA 認証をサポート | 永続ストレージが必要なアプリケーションや、複数の Pod 間でデータを共有するアプリケーションの場合、OSS バケットを ossfs 2.0 動的 PV としてマウントします。より高いセキュリティ、一時的な資格情報の自動回転、Pod 単位の権限分離を実現する RRSA 認証の使用を推奨します。これは、セキュリティ要件の高い本番およびマルチテナント環境に適しています。 | すべて | ||
Distributed Cloud Container Platform for Kubernetes | クラウド GPU 計算能力へのアクセスをサポート | ACK One 登録済みクラスターは、異種計算リソースの統一されたスケジューリングおよび運用管理をサポートします。これにより、異種計算クラスターにおけるリソース利用率が大幅に向上します。 | すべて | |
シングルクラスターアプリケーションをフリートに移行し、複数のクラスターに分散するサポート | マルチクラスターでのアプリケーションデプロイにおける繰り返し操作、エラー、同期の困難さといった課題を解決するため、AMC コマンドラインツールを使用して、複数のクラスターにアプリケーションを迅速にデプロイできます。これにより、統合された管理および更新の自動同期が可能になります。 | すべて |
2025 年 8 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | KV キャッシュ認識型のインテリジェント推論ルーティングをサポート | KV キャッシュ認識型ロードバランシングは、生成 AI 推論のために設計されています。最適なコンピュートノードにリクエストを動的にルーティングすることで、大規模言語モデル(LLM)サービスの効率を大幅に向上させます。 | すべて | |
カスタム CNI プラグインのサポート | ACK のデフォルトの Terway および Flannel CNI プラグインは、ほとんどのコンテナーネットワーキング要件を満たします。ただし、他の CNI プラグインの特定の機能が必要な場合は、Bring Your Own Container Network Interface(BYOCNI)モデルを使用して、カスタム CNI プラグインをインストールできます。 | すべて | ||
インテリジェントマネージドモードクラスターがマネージドポリシーガバナンスコンポーネントをサポート | クラスターのコンプライアンス要件を満たし、セキュリティを向上させるため、セキュリティポリシー管理を有効化します。セキュリティポリシールールには、Infra、コンプライアンス、PSP、K8s-general が含まれます。 | すべて | ||
Knative が ACS 計算能力をサポート | Knative Service は、コンテナー計算サービス(ACS)の計算能力を構成することをサポートしています。多様な計算タイプおよび品質により、さまざまなワークロード要件に対応し、コストを最適化できます。 | すべて | ||
推論拡張機能付きゲートウェイがより柔軟な構成をサポート |
| すべてのリージョン | ||
ACK 異種機密コンピューティングクラスターにおける vLLM 推論サービスの安全なデプロイをサポート | 大規模言語モデル(LLM)推論には、機密データおよびコアモデル資産が関与します。信頼できない環境で実行すると、データおよびモデルの漏洩リスクが生じます。ACK の機密 AI ソリューション(ACK-CAI)は、Intel TDX や GPU TEE などのハードウェア機密コンピューティング技術を統合し、モデル推論に対してエンドツーエンドのセキュリティを提供します。 | すべて | ||
Cloud-native AI Suite | AI 推論スイートの起動 | 大規模言語モデル(LLM)の普及に伴い、企業にとって、それらを本番環境で効率的かつ安定的に大量にデプロイおよび運用することは、核心的な課題となっています。クラウドネイティブ AI 推論スイート(AI Serving Stack)は、Alibaba Cloud Container Service 上のクラウドネイティブ AI 推論を目的としたエンドツーエンドのソリューションです。LLM 推論のライフサイクル全体に対応し、デプロイ管理、インテリジェントルーティング、エラスティックスケーリング、深層可観測性を統合的に提供します。導入直後から大規模な AI ビジネスをすでに展開している企業まで、クラウドネイティブ AI 推論の複雑なシナリオを容易に処理できます。 | すべて |
2025 年 7 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | ECS インスタンスメタデータへの強化モードのみアクセスをサポート | ECS インスタンス内のメタデータサービスを介して、ECS インスタンスのメタデータ(例:インスタンス ID、VPC 情報、NIC 情報)にアクセスできます。ACK クラスターでは、ノードインスタンスのメタデータアクセスは、標準モードおよび強化モードの両方をデフォルトでサポートしています。さらにメタデータサービスのセキュリティを強化するため、強化モード(IMDSv2)のみに切り替えることができます。 | すべて | |
海外ソースイメージのサブスクリプションをサポート | Docker Hub、GCR、Quay などの海外ソースイメージリポジトリからイメージを定期的に Enterprise インスタンスに同期するには、Enterprise インスタンスのアーティファクトサブスクリプション機能を使用します。 | すべて | ||
CNFS を通じた EFC クライアントによる NAS のマウントをサポート | EFC は、File Storage NAS のアクセスパフォーマンスを向上させるための分散キャッシュなどの機能を提供します。大規模データセットに対する高同時実行性および並列アクセスをサポートしており、ビッグデータ分析、AI トレーニングおよび推論などのデータ集約型および高同時実行性のコンテナ化シナリオに適しています。デフォルトの NFS プロトコルを用いた NAS のマウントと比較して、EFC を使用するとファイルアクセスが高速化され、読み書きパフォーマンスが向上します。 | すべて | ||
Distributed Cloud Container Platform for Kubernetes | GUI を備えた GitOps 機能 | コンソールを使用して、GitOps 機能の有効化または無効化、パブリックネットワークアクセスおよび ACL の構成、ApplicationSet UI の使用、Argo CD ConfigMap の構成、コンポーネントの再起動、モニタリングおよびログの可観測性などの完全な GitOps 機能を管理できます。 | すべて | |
マルチクラスター GitOps が Argo CD ConfigMap 構成をサポート | ACK One は、Argo CD の ConfigMap を構成することで、GitOps 関連の機能および権限を管理することをサポートしています。 | すべて | ||
マルチクラスターフリート向け在庫認識型エラスティックスケジューリングの有効化をサポート | ACK One マルチクラスターフリートは、マルチリージョンアプリケーションサービスデプロイにおけるマルチリージョンリソース割り当ての課題に対応します。在庫認識型インテリジェントスケジューラを実装しています。即時エラスティシティと組み合わせることで、管理対象クラスターの既存リソースが不足している場合に、在庫のあるクラスターにアプリケーションサービスをルーティングできます。即時エラスティシティにより、必要なノードがそのクラスターでスケールアウトされ、アプリケーションサービスを処理できるようになります。これにより、スケジューリング成功率が向上し、リソースコストが削減されます。 | すべて | ||
Container Service for Kubernetes Edge Edition | 専用回線を用いたプライベートネットワーク接続の構成をサポート | ACK Edge クラスターは、専用回線を用いたネットワークアクセスをサポートしています。これにより、ACK Edge クラスターのエッジノードから ACK や ACR などのクラウドサービスへの安全かつ効率的なアクセスが可能となり、ネットワークの競合および固定 IP アドレスの欠如という課題に対応できます。 | すべて |
2025 年 6 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | コンソールでの AI Profiling の使用 | AI Profiling は、eBPF および動的プロセス注入に基づく非侵入型のパフォーマンス分析ツールであり、Kubernetes コンテナーのシナリオにネイティブに設計されています。GPU タスクを実行するコンテナーのプロセスをオンラインで検出することをサポートし、複数のデータ収集機能を備えています。実行中の GPU タスクに対して、パフォーマンスデータ収集を動的に開始および停止できます。オンラインサービスでは、動的にアタッチおよびデタッチ可能なプロファイリングツールにより、ビジネスコードを変更せずにリアルタイムかつ詳細な分析が可能です。 | すべて | |
GPU ノードのセルフリカバリ | ノードのセルフリカバリは、GPU ソフトウェアおよびハードウェアの異常によって引き起こされるインスタンス障害の自動リカバリをサポートするようになりました。 ACK は、基盤となる EGS および Lingjun ノードにおける GPU ソフトウェアおよびハードウェアの異常に対して、Kubernetes 側のノードインスタンス障害のセルフリカバリを提供します。これには、障害の検出、通知およびアラート、自動隔離、ノードのドレイン、自動修復の全自動化が含まれます。また、修復を実行する前にユーザーの承認をサポートすることで、自動障害運用をさらに強化し、クラスターの運用保守コストを削減します。 | すべて | ||
Lingjun 向け CPFS の静的永続ボリューム | CPFS for Lingjun は、超高スループットおよび IOPS パフォーマンスを提供し、エンドツーエンドの RDMA ネットワーク加速をサポートします。AIGC や自動運転などのインテリジェントコンピューティングのシナリオに適しています。クラスター内で CPFS for Lingjun の静的永続ボリュームを作成し、ワークロードで使用できます。 | すべて | ||
ACK VPD CNI コンポーネント | ACK VPD CNI は、ACK マネージドクラスター Pro エディションの Lingjun ノード向けにコンテナーネットワーク管理を提供します。Lingjun ノードの CNI プラグインとして、ACK VPD CNI は Lingjun 接続を用いて Lingjun ノードのコンテナーネットワークリソースを割り当ておよび管理します。 | すべて | ||
ack-kms-agent-webhook-injector コンポーネント | ack-kms-agent-webhook-injector は、KMS Agent をサイドカーとして Pod に挿入します。ビジネスアプリケーションは、ローカル HTTP インターフェイスを用いて KMS Agent 経由で KMS インスタンスから資格情報を取得し、メモリ内にキャッシュできます。これにより、機密情報をハードコーディングすることを避け、データセキュリティを向上させます。 | すべて | ||
推論拡張機能付きゲートウェイのコンポーネント機能の拡張 | 推論拡張機能付きゲートウェイは、vLLM や SGLang などの複数の生成 AI 推論フレームワークをサポートしています。異なるフレームワークでデプロイされた生成 AI 推論サービスを、段階的リリース戦略、推論ロードバランシング、モデル名ベースのルーティング、レート制限、推論サービスのサーキットブレーキングなどの機能で強化します。 | すべて | ||
機密仮想マシンを活用した CAA 機密コンテナー ソリューション | 金融リスク管理や医療などの機密コンピューティングを必要とするシナリオでは、Cloud API Adaptor(CAA)ソリューションを用いて ACK クラスターに機密コンピューティングワークロードをデプロイします。これにより、Intel® TDX 技術を用いて、外部からの攻撃や潜在的なクラウドプロバイダーの脅威から機密データを保護し、業界のコンプライアンス要件を満たします。 | すべて | ||
Cloud-native AI Suite | XXL-JOB を用いた Dify ワークフローのスケジューリング | Dify ワークフローは、リスク監視、データ分析、コンテンツ生成、データ同期など多くのシナリオで、自動化されたタスクのスケジューリングを必要とします。しかし、Dify はネイティブでスケジューリングをサポートしていません。この課題を解決するため、本実践では、XXL-JOB 分散タスクスケジューラを統合してワークフローアプリケーションをスケジューリングし、そのステータスを監視することで、ワークフローの安定した運用を確保する方法を示します。 | すべて |
2025 年 5 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | Kubernetes 1.33 のサポート | Kubernetes 1.33 の新規サポートです。クラスター作成時に直接 1.33 のクラスターを作成したり、下位バージョンのクラスターを 1.33 にアップグレードしたりできます。 | すべて | |
ack-ram-authenticator コンポーネントのデフォルトインストール | Kubernetes 1.33 以降、新しく作成された ACK マネージドクラスター では、追加のクラスターノードリソースを消費せずに、最新バージョンのマネージド ack-ram-authenticator コンポーネントが自動的にインストールされます。 | すべて | [サービスのお知らせ] Kubernetes 1.33 以降の ACK マネージドクラスターにおける ack-ram-authenticator コンポーネントのデフォルトインストール | |
containerd 2.1.1 のリリース | containerd 2.1.1 は、Node Resource Interface(NRI)、Container Device Interface(CDI)、Sandbox API をサポートしています。 | すべて | ||
ossfs 2.0 のサポート | ossfs 2.0 は、Filesystem in Userspace(FUSE)を基盤とするクライアントです。Alibaba Cloud OSS をローカルファイルシステムとしてマウントすることで、ビジネスコンテナーが POSIX 操作を用いて OSS データにローカルファイルのようにアクセスできます。ossfs 1.0 と比較して、ossfs 2.0 は逐次読み書きおよび高同時実行性の小ファイル読み取りのパフォーマンスを向上させ、AI トレーニング、推論、ビッグデータ処理、自動運転など、ストレージアクセスパフォーマンス要件の高いシナリオに適しています。 | すべてのリージョン | ||
Distributed Cloud Container Platform for Kubernetes | ApplicationSet を用いたマルチ環境デプロイおよびアプリケーション依存関係の調整 | 開発環境およびステージング環境間のマルチアプリケーション依存関係管理のための自動化デプロイシステムを構築する新しいベストプラクティスです。これは、Argo CD のプログレッシブ同期機能と ApplicationSet のマルチ環境リソースオーケストレーション機能を組み合わせたものです。 | すべて |
2025 年 4 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | Lingjun ノードプールの作成および管理 | ACK マネージドクラスター Pro エディション で Lingjun ノードプールの作成および管理をサポートします。 | すべて | |
指定されたインスタンス属性を用いたノードプールの構成 | vCPU やメモリなどの指定されたインスタンス属性を用いてノードプールのインスタンスタイプを構成します。ノードプールは、スケーリング時に一致するインスタンスタイプを自動的に選択し、スケーリング成功確率を向上させます。 | すべて | ||
リアルタイム AI Profiling | Kubernetes コンテナーのシナリオにおいて、AI Profiling は、eBPF および動的プロセス注入に基づく非侵入型のパフォーマンス分析ツールです。GPU タスクを実行するコンテナーのプロセスをオンラインで検出することをサポートします。オンラインサービスでは、動的にアタッチおよびデタッチ可能なプロファイリングツールにより、ビジネスコードを変更せずにリアルタイムかつ詳細な分析が可能です。 | すべて | ||
プリエンプションの有効化 | クラスターのリソースが逼迫している場合、高優先度タスクがリソース不足により実行に失敗することがあります。プリエンプションを有効化すると、ACK スケジューラがリソース使用状況をシミュレートし、低優先度の Pod タスクを追い出し、高優先度タスクの迅速な起動を優先するためにコンピュートリソースを解放できます。 | すべて | ||
推論拡張機能付きゲートウェイを用いたサービスへのアクセス | 推論拡張機能付きゲートウェイ は、Envoy Gateway プロジェクトを基盤としており、完全な Gateway API 機能およびオープンソースの Envoy Gateway 拡張リソースをサポートしています。 | すべて | ||
生成 AI サービスの強化 | 推論拡張機能付きゲートウェイコンポーネントを用いて、生成 AI 推論サービスのインテリジェントルーティングおよび効率的なトラフィック管理、段階的リリース、推論サービスのリクエストサーキットブレーキング、推論サービスのトラフィックミラーリングを実現します。 | すべて | ||
PVC-to-PVC ボリュームのバックアップおよびリストア | ACK クラスター内のクラウドディスクデータをクラウド内、同一リージョン内の ACK クラスター間、異なるリージョン間の ACK クラスター間でバックアップおよびリストアできます。ソースクラスターでバックアップを完了した後、バックアップセンターを用いて、現在のクラスターまたは別のクラスターに新しい永続ボリューム要求(PVC)および対応するボリュームをリストアできます。ワークロードの YAML 構成を変更する必要はありません。 | すべて | ||
alibabacloud-privateca-issuer のリリース | AlibabaCloud Private CA Issuer をリリースし、cert-manager を用いてクラスター内で Alibaba Cloud PCA 証明書の作成および管理をサポートします。現在、ACK App Market で利用可能です。 | すべて | なし | |
ACK マネージドクラスター(インテリジェントマネージドモード)でのワークロードのデプロイおよびロードバランシングの有効化 | ACK マネージドクラスター(インテリジェントマネージドモード)でワークロードをデプロイし、ALB Ingress を用いてパブリックネットワークアクセスを有効化する方法について学びます。完了後、構成されたドメイン名を用いてアプリケーションにアクセスすることで、外部トラフィックを効率的に管理し、ロードバランシングを有効化できます。 | すべて | ||
Datapath V2 のベストプラクティス | Terway CNI プラグインを用いるクラスターで Datapath V2 を有効化した後のクラスターネットワーク構成を最適化する方法について学びます。Conntrack パラメーターの構成や Identity リソースの管理などの例を含み、クラスターのパフォーマンスおよび安定性を向上させます。 | すべて | ||
Dify コンポーネントのアップグレードガイド | ack-dify を古いバージョンから v1.0.0 以降にアップグレードする新しいベストプラクティスです。手順には、データのバックアップ、プラグインシステムへのプラグイン移行ツールのインストール、新しいプラグインエコシステムの有効化が含まれます。 | すべて | ||
Distributed Cloud Container Platform for Kubernetes | PrivateLink を用いたデータセンター CIDR ブロックの競合の解決 | 専用回線を用いてオンプレミスの Kubernetes クラスターを ACK One 登録済みクラスター に接続した後、サーバーレスコンピュートリソースを使用する際に、内部ネットワークの他のサービスが同じ CIDR ブロックを使用しているために競合が発生する可能性があります。PrivateLink を用いることで、データセンター CIDR ブロックの競合を解決できます。 | すべて | |
ACS Pod のクロスリージョンスケジューリング | ACK One 登録済みクラスター は、クロスリージョンのサーバーレスコンピュートリソースを Kubernetes クラスターにシームレスに統合することをサポートしています。これにより、クロスリージョンの GPU リソースの動的スケジューリングおよび統一管理が可能になります。 | すべて | ||
ログ収集 | Alibaba Cloud Simple Log Service(SLS)を用いたコンテナーログの自動収集を、SLS CRD または環境変数を用いて構成します。 | すべて | ||
Container Service for Kubernetes Edge Edition | バージョン 1.32 のリリース | バージョン 1.32 をサポートしており、最適化された CoreDNS、kube-proxy、kubelet の kube-apiserver へのリクエスト、およびクラウド・エッジ間の通信トラフィックの削減が含まれます。 | すべて | |
専用回線環境におけるネットワーク要素の構成 | オンプレミスのデータセンター(IDC)サーバーデバイスをパブリックネットワークまたは専用回線を介してコンテナ化された管理に接続することをサポートします。専用回線を介して接続する場合、接続前にインフラストラクチャのネットワーク要素の構成を完了する必要があります。 | すべて | ||
Cloud-native AI Suite | HistoryServer コンポーネントのサポート | Ray ネイティブのダッシュボードは、クラスターの実行中にのみ利用可能です。クラスターが終了すると、ユーザーは過去のログやモニタリングデータにアクセスできなくなります。RayCluster HistoryServer を使用して、クラスターの運用中にノードのログをリアルタイムで収集し、OSS に永続化します。 | すべて | |
KubeRay コンポーネントのサポート | KubeRay Operator コンポーネントのデプロイをサポートし、Alibaba Cloud SLS および Prometheus モニタリングを統合して、ログ管理、システム可観測性、高可用性を強化します。 | すべて |
2025 年 3 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | ACK マネージドクラスター Pro エディション がインテリジェントマネージドモードをサポート | ACK マネージドクラスター を作成する際に、インテリジェントマネージドモードを有効化することで、ベストプラクティスに従った Kubernetes クラスターを迅速に作成できます。 クラスター作成後、デフォルトで スマートマネージドノードプール が作成されます。このノードプールは、ワークロードに基づいて動的にスケーリングします。ACK は、OS バージョンのアップグレード、ソフトウェアバージョンのアップグレード、セキュリティ脆弱性の修正を処理します。 | すべて | |
クラスターのコントロールプレーンおよびデータプレーンコンポーネントのトレースを有効化 | クラスターの API Server または kubelet のトレースを有効化すると、トレースデータが自動的に Managed Service for OpenTelemetry にレポートされ、可視化されたトレース詳細およびリアルタイムのトポロジーモニタリングデータが提供されます。 | すべて | ||
高リスク KubeConfig の SMS およびメール通知 | アカウント下に高リスクの KubeConfig が存在する場合、たとえ削除済みであっても、ユーザーに SMS およびメールで通知を送信します。 | すべて | なし | |
ACK Gateway with Inference Extension を用いたインテリジェントルーティングおよびトラフィック管理 | ACK Gateway with Inference Extension コンポーネントを用いて、インテリジェントルーティングおよび効率的なトラフィック管理のための推論サービス拡張機能を構成します。 | すべて | Gateway with Inference Extension を用いたインテリジェントルーティングおよびトラフィック管理 | |
Distributed Cloud Container Platform for Kubernetes | 統一されたマルチクラスターフリートコンポーネント管理 | ACK One フリートは、クラスターの運用保守エンジニアに統一された自動化されたコンポーネント管理を提供します。複数のコンポーネントおよびバージョンを含むベースラインを定義し、複数のクラスターにデプロイし、コンポーネントの構成、デプロイバッチ、ロールバックをサポートして、システムの安定性を向上させます。 | すべてのリージョン | |
動的配布およびデスケジューリングのサポート | ACK One フリートは、PropagationPolicy を用いて、利用可能なリソースに基づいてワークロードのレプリカを子クラスターに分割できます。ACK One フリートはデフォルトでデスケジューリングを有効にしており、2 分ごとにチェックします。Pod が 30 秒以上スケジューリング不可能な状態が続くと、そのレプリカに対してデスケジューリングがトリガーされます。 | すべて | ||
Cloud-native AI Suite | Slurm キューの優先度を設定できます。 | Slurm 環境で適切なキューポリシーを構成して、ジョブの送信時やジョブの状態変更時にタスクスケジューリングを最大化し、最適なパフォーマンスを達成する方法を示す新しいベストプラクティスです。 | すべて |
2025 年 2 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | コントロールプレーンのセキュリティグループおよびタイムゾーンの変更 | クラスター作成時に選択したセキュリティグループおよびタイムゾーンが要件を満たさなくなった場合、クラスターの基本情報でコントロールプレーンのセキュリティグループおよびクラスターのタイムゾーンを変更できます。 | すべて | |
ノードプールがカスタム containerd 構成をサポート | ノードプール内のノードに対して、containerd パラメーター構成をカスタマイズできます。例えば、特定のイメージリポジトリに対して複数のミラーリポジトリを構成したり、特定のイメージリポジトリの証明書検証をスキップしたりできます。 | すべて | ||
新しいノードプールの弾力性強度インジケーター | ノードプールのスケーリングは、インスタンスの在庫不足や指定されたゾーンでサポートされていない ECS インスタンスタイプが原因で失敗することがあります。弾力性強度を使用して、ノードプールの構成の可用性およびインスタンス供給の健全性を評価し、構成の推奨事項を取得します。 | すべて | ||
バッチタスクオーケストレーションの有効化 | Argo Workflows は、Kubernetes ネイティブのワークフローエンジンで、YAML または Python を用いて並列タスクのオーケストレーションをサポートします。CI/CD パイプライン、データ処理、機械学習のためのコンテナ化されたアプリケーションの自動化および管理を簡素化します。Argo Workflows コンポーネントをインストールして、バッチタスクオーケストレーションを有効化できます。その後、Alibaba Cloud Argo CLI またはコンソールを使用して、ワークフロータスクを作成および管理します。 | すべて | ||
GPU 障害検出 | ACK が提供する ack-node-problem-detector コンポーネントは、オープンソースの node-problem-detector プロジェクトに基づいて、クラスターノードの異常イベントモニタリングを強化します。GPU 固有の豊富な障害検出項目を含み、GPU シナリオにおける障害発見を向上させます。障害が検出されると、障害の種類に基づいて対応する Kubernetes Events または Kubernetes Node Conditions を生成します。 | すべて | ||
Distributed Cloud Container Platform for Kubernetes | 実際の残存リソースに基づくマルチクラスター Spark ジョブのスケジューリングおよび配布 | この実践では、ACK One フリートおよび ACK Koordinator コンポーネントを用いて、クラスター間の実際の残存リソース(要求されたリソースではなく)に基づいてマルチクラスター Spark ジョブをスケジューリングおよび配布する方法を示します。これにより、マルチクラスター環境におけるアイドルリソースを最大限に活用し、優先度制御およびオフラインハイブリッドデプロイメントを通じてオンラインサービスの安定性を確保します。 | すべて | |
Container Service for Kubernetes Edge Edition | 新しい Pod vSwitch のサポート | ACK Edge クラスター が ENS エッジシナリオで Terway Edge プラグインを使用する場合、既存の vSwitch の IP アドレスが不足している場合や、Pod CIDR ブロックを拡張する必要がある場合に、新しい Pod vSwitch を追加できます。これにより、クラスターで利用可能な IP アドレスリソースが増加します。 | すべて | |
GPU リソースモニタリング | ACK Edge クラスター は、データセンターおよびエッジの GPU ノードを管理でき、複数のリージョンおよび環境にわたる異種計算能力の統一管理を提供します。Alibaba Cloud Prometheus モニタリングを ACK Edge クラスター に統合することで、データセンターおよびエッジコンピューティングの GPU ノードに、クラウドベースのリソースと同じ可観測性機能を提供できます。 | すべてのリージョン | ||
Cloud-native AI Suite | ACK を用いた DeepSeek 蒸留モデル推論サービスのデプロイ | DeepSeek-R1-Distill-Qwen-7B モデルを例に、Alibaba Cloud Container Service for Kubernetes (ACK) で KServe を用いて、本番環境に対応した DeepSeek 蒸留モデル推論サービスをデプロイする方法を学びます。 | すべて | |
ACK を用いた DeepSeek フルバージョン推論サービスのマルチノード分散デプロイ | この実践では、ACK を用いた分散 DeepSeek-R1-671B 大規模モデル推論の実践的なソリューションを示します。ハイブリッド並列戦略と Alibaba Cloud Arena ツールを組み合わせて、2 つのノードにまたがる効率的な分散デプロイを実現します。また、デプロイされた DeepSeek-R1 を Dify プラットフォームに統合して、長文コンテキスト理解をサポートするエンタープライズグレードのインテリジェント Q&A システムを迅速に構築する方法もカバーしています。 | すべて |
2025 年 1 月
プロダクト | 機能名 | 説明 | 利用可能なリージョン | 関連ドキュメント |
Container Service for Kubernetes | ノードプールがオンデマンドイメージ高速化をサポート | ACK は、DADI(Data Accelerator for Disaggregated Infrastructure)イメージ高速化技術を基盤としており、コンテナイメージのオンデマンドローディングをサポートします。これにより、完全なダウンロードが不要となり、オンラインでの展開が可能となり、アプリケーションの起動時間を大幅に短縮します。 | すべて | |
Alibaba Cloud Linux 3 Container-Optimized Edition オペレーティングシステムの新規サポート | Alibaba Cloud Linux 3 Container-Optimized Edition(Alibaba Cloud Linux 3.2104 LTS 64 ビット Container-Optimized Edition)は、デフォルトの Alibaba Cloud Linux 標準イメージを基に、コンテナシナリオ向けに最適化されたイメージバージョンです。より高密度のビジネスデプロイ、高速な起動速度、強力なセキュリティ分離など、コンテナシナリオのより高い要件に対応するため、Alibaba Cloud は Container Service for Kubernetes での豊富な顧客経験を基に、このクラウドネイティブオペレーティングシステムを開発しました。 | すべて | ||
Kubernetes 1.32 のサポート | ACK は Kubernetes 1.32 をサポートするようになりました。クラスター作成時に直接 1.32 のクラスターを作成したり、下位バージョンのクラスターを 1.32 にアップグレードしたりできます。 | すべて | ||
ElasticQuotaTree およびタスクキューを用いたリソース利用率の向上 | 異なるチームやタスクがクラスターの計算リソースを共有しつつ、公平な割り当てと分離を確保するために、ack-kube-queue、ElasticQuotaTree、ack-scheduler を用いて、柔軟かつ合理的なリソース割り当てが可能です。 | すべて | なし | |
リソースグループを用いた詳細なリソース制御の新しいベストプラクティス | Container Service for Kubernetes のリソースをより効率的に管理するために、リソースグループを使用してリソースを整理できます。リソースグループを使用すると、部門、プロジェクト、環境、その他のディメンションでリソースをグループ化できます。Resource Access Management (RAM) と組み合わせることで、単一の Alibaba Cloud アカウント内でリソースの分離と詳細な権限管理が可能になります。 | すべて | ||
Distributed Cloud Container Platform for Kubernetes | ACK One 登録済みクラスター が ACS 計算能力にアクセス | ACK One 登録済みクラスター で ACS が提供するコンテナ計算能力を使用できます。 | すべて | |
ネイティブ Service ドメイン名によるクラスター間サービスアクセスのサポート | ACK One マルチクラスター Service は、MultiClusterService を介してネイティブ Service ドメイン名を用いたクラスター間サービスアクセスをサポートします。ビジネスコード、ビジネス Pod の DNSConfig、または CoreDNS 構成を変更する必要はなく、ネイティブ Service を使用してクラスター間のトラフィックルーティングが可能です。 | すべて | ||
Go SDK を用いたマルチクラスターリソースへのアクセスのサポート | ACK One フリートをプラットフォームに統合して子クラスターのリソースにアクセスしたい場合は、Go SDK を使用できます。 | すべて | ||
Container Service for Kubernetes Edge Edition | クラウドノードスケーリングのサポート | オンプレミスのノードリソースが不足している場合、自動ノードスケーリングにより ACK Edge クラスター にクラウドノードが追加され、スケジューリング容量が補完されます。 | すべて | |
ハイブリッドクラウド LLM エラスティック推論サービスデプロイのサポート | ack-kserve コンポーネントをインストールし、ACK Edge クラスター のクラウド弾力性機能と組み合わせることで、ハイブリッドクラウド LLM エラスティック推論サービスをデプロイできます。これにより、クラウドおよびオンプレミスのリソースを柔軟にスケジューリングし、LLM 推論サービスの運用コストを削減できます。 | すべて | ||
共有 GPU スケジューリングのサポート | 共有 GPU スケジューリングにより、複数の Pod を同じ GPU カードにスケジューリングして GPU 計算リソースを共有し、GPU 利用率を向上させ、コストを削減できます。
| すべて | ||
マルチリージョン ECS リソースの統一管理のサポート | この新しいベストプラクティスでは、ACK Edge クラスター を用いて、複数のリージョンに分散した計算リソースを統一管理する方法を示します。これにより、クラウドネイティブアプリケーションの完全なライフサイクル管理と効率的なリソーススケジューリングが可能になります。 | すべて |
詳細情報
過去の ACK リリースノートについては、「過去のリリースノート (2025 年以前)」をご参照ください。