灵骏智算资源,作为阿里云PAI AI计算引擎的核心组成部分,提供了大规模且高密度的计算资源。它旨在满足高性能AI训练和计算的异构算力需求,支持DSW、DLC和EAS模块,助力您的AI开发、训练和服务部署操作。本文为您介绍如何创建资源组并购买灵骏智算资源。
功能简介
资源类型
灵骏智算类型的资源,是阿里云自主研发的新一代智能计算资源,提供:
RDMA高速网络架构
高性能通信库
高性能加速软件
GPU虚拟化的技术方案
可以更好地满足高性能算力需求。
资源组类型
阿里云PAI为您提供全托管的灵骏智算资源,您可在PAI产品控制台便捷地完成购买、使用的全流程,如果您已购买单独的灵骏硬件资源,也可将此类资源作为半托管的资源添加至PAI产品控制台,用于后续的训练任务使用。
使用限制
支持使用的地域
当前仅支持华北6(乌兰察布)和新加坡地域。
支持使用的用户
当前灵骏智算资源仅供白名单用户受限申请使用,如果您希望使用灵骏智算资源提交训练任务,您可先提交工单,申请添加灵骏智算使用白名单。
支持的任务类型
当前灵骏智算资源仅支持TensorFlow、PyTorch、ElasticBatch和MPIJob类型的训练任务。
操作账号和权限要求
阿里云主账号(推荐):使用主账号可完成所有操作,无需额外授权。
RAM用户:需要通过主账号为RAM用户授予管理资源池权限或授予AliyunPAIFullAccess权限。
重要AliyunPAIFullAccess拥有管理和操作PAI所有资源和功能的权限,请谨慎授权。建议您直接使用主账号进行操作。
依赖的云产品
灵骏智算资源在创建、购买及后续使用的过程中,依赖以下其他云产品,您在购买使用前需先了解依赖的云产品,并根据实际需要提前准备好对应的云产品。
(必选)VPC
分配灵骏智算资源时,您需绑定一个同地域的VPC,并配置交换机与安全组信息,保障灵骏智算资源与各云产品的网络是连通状态。
(按需)公网NAT网关与EIP
如果后续您需要访问公网环境,例如使用公网环境下的自定义镜像等场景,您还需开通并配置公网NAT网关的SNAT功能,绑定EIP,实现灵骏智算资源访问公网的能力。
配置公网NAT网关的SNAT功能操作详情可参见使用公网NAT网关SNAT功能访问互联网。
(按需)OSS/NAS/智算CPFS
您后续使用灵骏智算资源提交DLC任务时,需先创建数据集,当前支持使用OSS、NAS、智算CPFS类型的数据集,因此您需根据数据集的应用需要提前准备好OSS或NAS或智算CPFS资源,并创建好对应的数据集。详情请参见准备工作:准备数据集。
新建资源组并购买灵骏智算资源
新建灵骏资源组
登录并进入PAI控制台的AI计算资源 > 资源池页面。
在灵骏智算资源页签中,单击新建资源组。
在新建资源组对话框中配置以下参数,完成后单击确定。
参数
说明
类型
选择专有资源组。
资源组名称
根据界面提示设置满足规则的资源组名称。
购买灵骏智算资源
您可以按照以下操作步骤为专有资源组购买灵骏智算资源,关于灵骏智算资源的计费详情,请参见灵骏智算资源Serverless版计费说明。
在灵骏智算资源页签的资源组列表中,单击资源组名称。
在资源组详情页面右上方,单击新建订单。
在购买页面中根据实际业务需要选择节点规格、每一个订单中的节点数量和购买时长等必要参数,完成后单击立即购买。
在支付页面完成支付后,在订单列表页面中会展示已购买的灵骏智算资源列表。
相关文档
资源组创建成功并购买计算资源后,您可以进行以下操作: