交互式建模(DSW)是PAI产品的云端机器学习开发IDE,为您提供交互式编程环境。在使用DSW前,您需要创建DSW实例。本文为您介绍如何创建DSW实例。
背景信息
通过控制台创建实例适用于普通开发者,您可以通过控制台管理实例,例如,在DSW中进行模型开发的开发者。
前提条件
如果是首次使用DSW,则需要对相关资源进行访问授权,具体操作请参见云产品依赖与授权:DSW。
已准备好DSW实例运行所需的通用计算资源或灵骏智算资源。
使用通用计算资源公共资源组,您需要为DLC服务关联角色授权,关联完成后即可使用。具体操作请参见云产品依赖与授权:DLC。
使用通用计算资源专有资源组。您需要购买专有资源并分配资源配额。具体操作,请参见新建资源组并购买通用计算资源和通用计算资源配额。
使用灵骏智算资源,您需要购买灵骏智算资源并分配资源配额。具体操作,请参见新建资源组并购买灵骏智算资源和灵骏智算资源配额。
(可选)已创建完成NAS或OSS类型数据集。具体操作,请参见创建及管理数据集。
重要如果为DSW实例添加OSS或NAS类型的数据集,则需要授权PAI访问相关云产品OSS或NAS的权限,否则读取或写入数据失败。具体操作,请参见PAI访问云产品授权:OSS与NAS。
当使用公共资源组创建DSW实例时,DSW为您提供的默认云盘存储空间有限,您可以通过挂载数据集或付费扩容云盘来扩展实例存储空间。
当使用专有资源组创建DSW实例时,DSW实例则提供非持久化的本地存储,您可以通过挂载数据集来实现持久化存储。
使用限制
由于每个阿里云账号(主账号)在每个Region有2卡GPU的限制,当资源使用量超出限额时可能会出现报错。如果您需要提升限额,请提交工单联系我们。
创建实例
通过控制台创建实例
进入DSW页面。
登录PAI控制台。
在概览页面选择目标地域。
在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。
在工作空间页面的左侧导航栏选择 ,进入DSW页面。
单击创建实例。
在配置实例向导页面,配置以下关键参数。
默认为通用训练资源公共资源组,支持选择CPU规格或GPU规格。在配置实例向导页面,您可以查看并选择创建DSW实例支持使用的规格类型。关于各规格类型的指标数据的更多详细介绍,请参见实例规格族。
支持使用通用训练资源专有资源组来创建实例。如果没有可选的专有资源组,您可以单击关联资源配额,为该工作空间关联通用训练资源专有资源组。
支持使用灵骏智算资源来创建实例。如果没有可选的灵骏智算资源,您可以单击关联资源配额,为该工作空间关联灵骏智算资源。
优先级: 优先级范围为1~9 ,数值越大,优先级越高。
CPU亲和性:启用CPU亲和性,能够将容器或Pod中的进程绑定到特定的CPU核心上执行。通过这种方式,可以减少CPU缓存未命中、上下文切换等现象,从而提高CPU利用率,提升应用性能,适用于对性能敏感和实时性要求高的场景。当前仅华北2(北京)、华南1(深圳)地域支持配置该参数。
当资源配额选择公共资源组时,根据实际需求选择CPU、GPU或者免费试用的资源规则。
当资源组选择专有资源组时,根据实际需求设置GPU、CPU、GiB和优先级。
当资源配额选择公共资源组时:
系统盘:为每个按量付费实例免费赠送100 GiB云盘作为持久化存储,如果该实例停机超过15天未开机,云盘的内容将被清空。如果免费赠送的云盘不满足您的业务需求,您可以对云盘进行扩容,具体扩容价格以控制台界面为准。
警告扩容后不支持缩容,请按需操作扩容。
扩容后整块系统盘(免费+付费)后,不再受到停机15天释放的限制,但会持续产生费用。
实例删除系统盘同步销毁,删除前请确保必要数据备份。
挂载配置:由于默认提供的云盘存储空间有限,您可以单击添加并选择要挂载的数据集来扩展实例存储空间。目前支持挂载OSS、NAS和CPFS类型的数据集。如果没有可选的数据集,您可以单击创建数据集进行创建。关于如何创建数据集,详情请参见创建及管理数据集。
当资源配额选择专有资源组时:
实例自带的系统盘用于临时存储,在停止或删除实例后,存储将被清空。如果需要永久性存储,可以在数据集右侧单击添加并选择已创建的数据集进行挂载,或在挂载配置右侧单击添加并选择OSS路径进行挂载。
如果没有可选的数据集,您可以单击创建数据集进行创建。关于如何创建数据集,详情请参见创建及管理数据集。
多个数据集挂载的路径不能重复。
如果配置了CPFS类型的数据集,则需要设置网络配置,且选择的专有网络需要与CPFS一致。否则,DSW实例可能会创建失败。
当资源组选择专有资源组时,第一个数据集必须选择NAS类型数据集,且会被同时挂载到您指定的路径和DSW默认工作目录/mnt/workspace/下。
公网访问网关支持以下配置方法:
公有网关:集群中的DSW实例使用共享的公网带宽,在用户高并发时下载速度会比较慢。
专有网关:独享带宽,您可以根据需求选择不同的带宽。选择该方式后,您需要为DSW实例关联的专有网络创建公网NAT网关、绑定EIP并配置SNAT条目。具体配置方法,请参见DSW通过专有公网网关访问公网。
仅当挂载配置选择CPFS类型的数据集时,支持配置以下参数:
启用所有选项:默认为关闭,系统会禁用与CPFS类型的数据集不通的专有网络。
隐藏禁用选项:选中复选框,系统会隐藏与CPFS类型的数据集不通的专有网络。
说明如果挂载配置选择了CPFS类型的数据集,则需要配置专有网络,且选择的专有网络需要与CPFS一致。
VPC内访问:默认支持该访问方式。您可以从VPC内的其他终端(例如ECS),通过SSH远程连接DSW实例。
公网访问:您可以在支持VPC内访问的基础上,增加公网访问方式。选中公网访问,并配置以下参数,后续,您可以通过本地命令行或其他终端使用SSH远程连接到DSW实例。
NAT网关:选择为专有网络创建的公网NAT网关。
弹性公网IP:选择在公网NAT网关中已创建的弹性公网IP。
确认所选配置无问题后,单击确定。
参数 | 描述 | |
基础信息 | 实例名称 | 参考界面提示信息配置DSW实例名称。 |
资源信息 | 资源配额 | 支持选择: 说明 当选择通用训练资源专有资源组或灵骏智算资源组创建DSW实例时,还需要设置以下参数: |
资源规格 | ||
环境信息 | 镜像 | 支持选择以下镜像: |
系统盘 | 说明 | |
数据集 | 单击添加,可挂载已创建的自定义数据集,其中,OSS类型的自定义数据集支持多种挂载模式和自定义配置,公共数据集只支持只读挂载模式。 | |
挂载配置 | 单击添加,可直接挂载OSS路径,OSS支持多种挂载模式和自定义配置。 | |
工作目录 | 工作目录是JupyterLab、WebIDE的启动路径,挂载至 | |
网络信息 | 专有网络配置 | 仅当资源配额选择公共资源时,支持配置该参数。 不同场景的配置策略详情,请参见DSW网络配置。 同时配置专有网络、交换机和安全组,可以在VPC内使用DSW。您可以直接选择已经创建的专有网络进行挂载,或者单击专有网络后的创建专有网络进行创建。 |
公网访问网关 | ||
访问配置 | 启用SSH | 选择专有网络后可配置SSH。 启用后您可基于已选专有网络,使用SSH原生方式直连登录DSW实例。 若您配置了自定义镜像,请确认自定义镜像安装了sshd。 |
SSH公钥 | 打开SSH配置开关后可配置该参数。 说明 如果您需要同时支持VPC内登录和公网登录方式,您需要同时添加多个客户端的公钥。请按照回车换行的方式逐个添加公钥,最多支持添加10个公钥。 | |
SSH访问方式 | 打开SSH配置开关后可配置该参数。 | |
自定义服务 | 将实例中启动的自定义服务提供对外访问能力。具体配置,请参见自定义服务访问配置。 | |
高级信息 | 可见范围 | 可选择仅实例所有者可见或工作空间内公开可见。 |
实例所有者 | 仅工作空间管理员可修改实例所有者。 | |
实例RAM角色 | 实例RAM角色允许您将一个角色关联到DSW实例,在实例内部基于STS(Security Token Service)临时凭证访问其他云产品的API,临时凭证将周期性更新。即可以保证云账号AccessKey安全,还可以借助访问控制RAM实现精细化控制和权限管理。 实例RAM角色包括:PAI默认角色、自定义角色和不关联角色。 更多关于实例RAM角色的配置说明,请参见配置DSW实例RAM角色。 |