全部產品
Search
文件中心

Container Service for Kubernetes:什麼是Container Service靈駿版

更新時間:Nov 09, 2024

阿里雲Container Service靈駿版Container Service for Kubernetes針對Intelligent Computing LINGJUN提供的叢集類型,提供全託管和高可用控制面的標準Kubernetes叢集服務,支援以靈駿計算節點作為Kubernetes叢集的工作節點。本文介紹阿里雲ACK靈駿託管版叢集的產品簡介、功能介紹和核心優勢等。

索引

使用說明

如需使用ACK靈駿託管版叢集,請先前往智能計算靈駿控制台,建立帶有ACK的靈駿叢集服務

產品簡介

ACK靈駿託管版叢集提供了全託管和高可用控制面的標準Kubernetes叢集服務,支援高效管理異構資源、調度異構任務,作為支撐人工智慧平台PAI的雲原生底座,並提供AI、HPC等高效能運算情境下的雲原生增強能力。下圖展示了ACK靈駿託管版叢集的產品架構,並體現出在整個軟硬分層、統一最佳化的整合產品方案中,ACK靈駿託管版叢集提供了穩定、可靠、高效、安全的雲原生AI基礎設施服務。

功能介紹

  • 叢集管理

    ACK靈駿託管版叢集的核心管理能力與ACK Pro託管版叢集一致。叢集控制面由ACK建立並託管,管控節點預設為3個可用性區域的高可用部署。提供叢集的生命週期管理,以及叢集授權、叢集監控、叢集升級、組件管理等叢集營運操作。

  • 節點管理

    ACK靈駿託管版叢集為靈駿計算節點提供靈駿節點池類型,支援節點池生命週期管理以及節點大量新增和移除,提供與ECS節點池一致的管理和營運,包括節點配置、節點營運、節點託管、調度應用至指定節點池等,以及監控診斷和自動化營運等能力。

  • 雲原生AI

    ACK靈駿託管版叢集預設提供雲原生AI增強組件,支援多GPU卡的拓撲感知調度,結合GPU容器虛擬化方案eGPU提供共用GPU調度和隔離;針對AI、HPC等任務特點,支援Gang、Capacity、Binpack等任務調度策略;還支援資料集編排和訪問加速。

核心優勢

  • 安全穩定

    ACK靈駿託管版叢集具備ACK Pro託管版叢集的企業級特性,提供控制面託管和高可用,免去了繁瑣的叢集搭建和配置工作;保障叢集的穩定性、可靠性、安全性,支援賠付標準的SLA,滿足企業級大規模生產環境的業務需求。

  • 簡化營運

    ACK靈駿託管版叢集提供標準的Kubernetes服務,並與智能計算靈駿以及其他相關雲產品進行深度整合。為叢集和靈駿計算節點提供了簡單的操作和自動化的營運,保持與ECS節點一致的管理體驗,減少了大量的適配和營運成本。

  • 提效加速

    ACK靈駿託管版叢集提供GPU的共用調度和拓撲感知調度等能力,最佳化異構資源的使用效率和效能;為AI、HPC等任務提供了豐富的調度策略、任務優先順序隊列,最佳化AI訓練和推理任務效率,統一AI資源和負載的標準化管理和交付。