全部產品
Search
文件中心

Platform For AI:建立資源群組併購買靈駿智算資源

更新時間:Jul 13, 2024

靈駿智算資源,作為阿里雲PAI AI計算引擎的核心組成部分,提供了大規模且高密度的計算資源。它旨在滿足高效能AI訓練和計算的異構算力需求,支援DSW、DLC和EAS模組,助力您的AI開發、訓練和服務部署操作。本文為您介紹如何建立資源群組併購買靈駿智算資源。

功能簡介

資源類型

靈駿智算類型的資源,是阿里雲自主研發的新一代智能計算資源,提供:

  • RDMA高速網路架構

  • 高效能通訊庫

  • 高效能加速軟體

  • GPU虛擬化的技術方案

可以更好地滿足高效能算力需求。

資源群組類型

阿里雲PAI為您提供全託管的靈駿智算資源,您可在PAI產品控制台便捷地完成購買、使用的全流程,如果您已購買單獨的靈駿硬體資源,也可將此類資源作為半託管的資源添加至PAI產品控制台,用於後續的訓練任務使用。

使用限制

  • 支援使用的地區

    當前僅支援華北6(烏蘭察布)新加坡地區。

  • 支援使用的使用者

    當前靈駿智算資源僅供白名單使用者受限申請使用,如果您希望使用靈駿智算資源提交訓練任務,您可先提交工單,申請添加靈駿智算使用白名單。

  • 支援的任務類型

    當前靈駿智算資源僅支援TensorFlow、PyTorch、ElasticBatch和MPIJob類型的訓練任務。

操作帳號和許可權要求

  • 阿里雲主帳號(推薦):使用主帳號可完成所有操作,無需額外授權。

  • RAM使用者:需要通過主帳號為RAM使用者授予管理資源集區許可權授予AliyunPAIFullAccess許可權

    重要

    AliyunPAIFullAccess擁有管理和操作PAI所有資源和功能的許可權,請謹慎授權。建議您直接使用主帳號進行操作。

依賴的雲產品

靈駿智算資源在建立、購買及後續使用的過程中,依賴以下其他雲產品,您在購買使用前需先瞭解依賴的雲產品,並根據實際需要提前準備好對應的雲產品。

(必選)VPC

分配靈駿智算資源時,您需綁定一個同地區的VPC,並配置交換器與安全性群組資訊,保障靈駿智算資源與各雲產品的網路是連通狀態。

(按需)公網NAT Gateway與EIP

如果後續您需要訪問公網環境,例如使用公網環境下的自訂鏡像等情境,您還需開通並配置公網NAT Gateway的SNAT功能,綁定EIP,實現靈駿智算資源訪問公網的能力。

配置公網NAT Gateway的SNAT功能操作詳情可參見使用公網NAT GatewaySNAT功能訪問互連網

(按需)OSS/NAS/智算CPFS

您後續使用靈駿智算資源提交DLC任務時,需先建立資料集,當前支援使用OSS、NAS、智算CPFS類型的資料集,因此您需根據資料集的應用需要提前準備好OSS或NAS或智算CPFS資源,並建立好對應的資料集。詳情請參見準備工作:準備資料集

建立資源群組併購買靈駿智算資源

建立靈駿資源群組

  1. 登入並進入PAI控制台的AI計算資源 > 資源集區頁面。

  2. 靈駿智算資源頁簽中,單擊建立資源群組

  3. 建立資源群組對話方塊中配置以下參數,完成後單擊確定

    參數

    說明

    類型

    選擇專有資源群組

    資源群組名稱

    根據介面提示設定滿足規則的資源群組名稱。

購買靈駿智算資源

您可以按照以下操作步驟為專有資源群組購買靈駿智算資源,關於靈駿智算資源的計費詳情,請參見靈駿智算資源Serverless版計費說明

  1. 靈駿智算資源頁簽的資源群組列表中,單擊資源群組名稱。

  2. 在資源群組詳情頁面右上方,單擊建立訂單

  3. 在購買頁面中根據實際業務需要選擇節點規格每一個訂單中的節點數量購買時間長度等必要參數,完成後單擊立即購買image

  4. 支付頁面完成支付後,在訂單列表頁面中會展示已購買的靈駿智算資源清單。image

相關文檔

資源群組建立成功併購買計算資源後,您可以進行以下操作:

  • 在資源群組頁面查看資源群組的基本資料,並對已購買的資源進行管理。具體操作,請參見管理資源

  • 通過配置資源配額,將這些資源分派給具體的訓練任務。具體操作,請參見靈駿智算資源配額