靈駿智算資源,作為阿里雲PAI AI計算引擎的核心組成部分,提供了大規模且高密度的計算資源。它旨在滿足高效能AI訓練和計算的異構算力需求,支援DSW、DLC和EAS模組,助力您的AI開發、訓練和服務部署操作。本文為您介紹如何建立資源群組併購買靈駿智算資源。
功能簡介
資源類型
靈駿智算類型的資源,是阿里雲自主研發的新一代智能計算資源,提供:
RDMA高速網路架構
高效能通訊庫
高效能加速軟體
GPU虛擬化的技術方案
可以更好地滿足高效能算力需求。
資源群組類型
阿里雲PAI為您提供全託管的靈駿智算資源,您可在PAI產品控制台便捷地完成購買、使用的全流程,如果您已購買單獨的靈駿硬體資源,也可將此類資源作為半託管的資源添加至PAI產品控制台,用於後續的訓練任務使用。
使用限制
支援使用的地區
當前僅支援華北6(烏蘭察布)和新加坡地區。
支援使用的使用者
當前靈駿智算資源僅供白名單使用者受限申請使用,如果您希望使用靈駿智算資源提交訓練任務,您可先提交工單,申請添加靈駿智算使用白名單。
支援的任務類型
當前靈駿智算資源僅支援TensorFlow、PyTorch、ElasticBatch和MPIJob類型的訓練任務。
操作帳號和許可權要求
阿里雲主帳號(推薦):使用主帳號可完成所有操作,無需額外授權。
RAM使用者:需要通過主帳號為RAM使用者授予管理資源集區許可權或授予AliyunPAIFullAccess許可權。
重要AliyunPAIFullAccess擁有管理和操作PAI所有資源和功能的許可權,請謹慎授權。建議您直接使用主帳號進行操作。
依賴的雲產品
靈駿智算資源在建立、購買及後續使用的過程中,依賴以下其他雲產品,您在購買使用前需先瞭解依賴的雲產品,並根據實際需要提前準備好對應的雲產品。
(必選)VPC
分配靈駿智算資源時,您需綁定一個同地區的VPC,並配置交換器與安全性群組資訊,保障靈駿智算資源與各雲產品的網路是連通狀態。
(按需)公網NAT Gateway與EIP
如果後續您需要訪問公網環境,例如使用公網環境下的自訂鏡像等情境,您還需開通並配置公網NAT Gateway的SNAT功能,綁定EIP,實現靈駿智算資源訪問公網的能力。
配置公網NAT Gateway的SNAT功能操作詳情可參見使用公網NAT GatewaySNAT功能訪問互連網。
(按需)OSS/NAS/智算CPFS
您後續使用靈駿智算資源提交DLC任務時,需先建立資料集,當前支援使用OSS、NAS、智算CPFS類型的資料集,因此您需根據資料集的應用需要提前準備好OSS或NAS或智算CPFS資源,並建立好對應的資料集。詳情請參見準備工作:準備資料集。
建立資源群組併購買靈駿智算資源
建立靈駿資源群組
登入並進入PAI控制台的AI計算資源 > 資源集區頁面。
在靈駿智算資源頁簽中,單擊建立資源群組。
在建立資源群組對話方塊中配置以下參數,完成後單擊確定。
參數
說明
類型
選擇專有資源群組。
資源群組名稱
根據介面提示設定滿足規則的資源群組名稱。
購買靈駿智算資源
您可以按照以下操作步驟為專有資源群組購買靈駿智算資源,關於靈駿智算資源的計費詳情,請參見靈駿智算資源Serverless版計費說明。
在靈駿智算資源頁簽的資源群組列表中,單擊資源群組名稱。
在資源群組詳情頁面右上方,單擊建立訂單。
在購買頁面中根據實際業務需要選擇節點規格、每一個訂單中的節點數量和購買時間長度等必要參數,完成後單擊立即購買。
在支付頁面完成支付後,在訂單列表頁面中會展示已購買的靈駿智算資源清單。
相關文檔
資源群組建立成功併購買計算資源後,您可以進行以下操作: