ACK Lingjunは、Container Service for Kubernetes (ACK) 内のクラスタータイプで、Intelligent Computing LINGJUN用に特別に設計されています。 このタイプのクラスターは、フルマネージド型で高可用性の制御プレーンを提供します。 ACK Lingjun管理クラスターにLingjunコンピューティングノードをデプロイできます。 このトピックでは、ACK Lingjun管理クラスターについて説明し、ACK Lingjun管理クラスターの機能と利点について説明します。
目次
使用上の注意
ACK Lingjunマネージドクラスターを使用するには、まずIntelligent Computing LingjunコンソールでACKが有効化されたLINGJUNクラスターを作成する必要があります。
ACK Lingjun管理クラスターで実行できる操作とACK Lingjun管理クラスターの機能の詳細については、次のトピックを参照してください。
概要
ACK Lingjunマネージドクラスターは、フルマネージドおよび高可用性制御プレーンを提供し、効率的な異種リソース管理および異種タスクスケジューリングをサポートします。 このタイプのクラスターは、
cloud-nativeのベース Platform for AIは、AIおよびハイパフォーマンスコンピューティング (HPC) のシナリオに適した拡張されたクラウドネイティブ機能を提供します。 次の図は、ACK Lingjun管理クラスターのアーキテクチャを示しています。 このアーキテクチャは、ソフトウェアをハードウェアから切り離し、さまざまなAlibaba Cloudサービスと統合して、クラウドネイティブAIワークロードに安定し、信頼性が高く、効率的で安全なインフラストラクチャサービスを提供します。
特徴
クラスター管理
ACK Lingjun管理クラスターとACK Proクラスターは、同じクラスター管理機能を提供します。 ACKは、ACK Lingjun管理クラスターの制御プレーンを作成および管理します。 既定では、ACK Lingjun管理クラスターの制御プレーンは、高可用性を確保するために3つのゾーンに展開されます。 ACK Lingjun管理クラスターのライフサイクルを管理できます。 たとえば、クラスターに対する権限の付与、クラスターの監視、クラスターの更新、クラスター内のコンポーネントの管理ができます。
ノード管理
ACK Lingjunマネージドクラスターは、LingjunコンピューティングノードをデプロイできるLingjunノードプールを提供します。 Lingjunノードプールはライフサイクル管理をサポートし、Elastic Compute Service (ECS) ノードプールと同じ管理およびO&M機能を提供します。 たとえば、ノードをバッチで追加または削除したり、ノードを設定したり、ノードを維持したり、フルマネージドノードを使用したり、アプリケーションを指定されたノードにスケジュールしたり、ノードを監視したり、ノードを診断したり、自動ノードO&Mタスクを実行したりできます。
クラウドネイティブAI
デフォルトでは、ACK Lingjunマネージドクラスターは、クラウドネイティブ機能を強化するコンポーネントを提供します。 たとえば、ACK Lingjun管理クラスターはトポロジ認識マルチサポート
GPUスケジューリング、およびGPUであるeGPUに基づくGPUスケジューリングと分離の有効化 GPU高速化コンテナー用の仮想化コンポーネント。 ACK Lingjunマネージドクラスターは、ギャングスケジューリングと容量スケジューリングを提供し、binpackスケジューリングポリシーをサポートします。 さらに、ACK Lingjunマネージドクラスターは、データセットオーケストレーションとアクセスの高速化をサポートします。
競争上の利点
セキュリティと安定性
ACK Lingjunマネージドクラスターは、ACK Proクラスターと同じエンタープライズクラスの機能を提供し、可用性の高いマネージド制御プレーンを提供します。 これにより、クラスターを手動で構築および設定する必要がなくなります。 ACK Lingjunマネージドクラスターは、クラスターの安定性、信頼性、およびセキュリティを保証し、補償条項を含むサービスレベル契約 (SLA) をサポートします。 ACK Lingjun管理クラスターは、大規模な本番環境で企業の要件を満たすことができます。
簡単なO&M
ACK Lingjunマネージドクラスターは、Kubernetesネイティブサービスを提供し、Intelligent Computing LINGJUNおよび関連するAlibaba Cloudサービスと深く統合されています。 ACK Lingjunマネージドクラスターは、クラスターおよびLingjunコンピューティングノードの操作を簡素化し、O&Mを自動化し、ECSノードと同じ管理エクスペリエンスを提供し、適応およびO&Mコストを大幅に削減します。
効率と加速の改善
ACK Lingjunマネージドクラスターは、GPU共有、GPUスケジューリング、およびトポロジ認識GPUスケジューリングを提供し、異種リソースの効率とパフォーマンスを向上させます。 ACK Lingjunマネージドクラスターは、AIおよびHPCタスクの豊富なスケジューリングポリシーと優先度ベースのジョブキュー管理を提供します。 これらの機能は、AIトレーニングジョブと推論タスクの実行効率を向上させ、AIリソースとワークロードを管理および提供するための統一された標準的な方法を提供します。