进入工作空间后,您可以使用PAI子产品进行AI开发。本文介绍如何快速上手并使用PAI及常用的AI开发流程,您可以结合实际情况选择。
AI开发流程
进入工作空间后,在左侧导航栏可以看到PAI的全部子产品模块。您需要根据实际开发场景进行机器学习全生命周期的开发和管理。常见的使用场景如下所示,您可以按照流程引导,使用子产品模块:
云原生开发场景
区域
描述
相关文档
①
高质量的数据集是高精度模型的基础,也是数据准备的核心目标。您可以通过数据集管理模块将本地数据、阿里云存储中的数据以及公共数据集进行注册,也可以通过扫描OSS文件夹生成索引数据集,从而统一管理PAI的相关数据,为数据标注及模型训练环节做好准备。
②
DSW是为AI开发者量身定制的云端机器学习交互式开发IDE,可以随时随地开启Notebook快速读取数据、开发算法、训练及部署模型。
③
镜像管理模块为您展示PAI提供的官方公开镜像以及自定义镜像关联功能,从而在PAI中统一管理应用的镜像。
④
云原生一站式的深度学习训练平台,提供灵活、稳定、易用和高性能的机器学习训练环境。支持多种算法框架,超大规模分布式深度学习任务的运行以及自定义算法框架。
⑤
为了方便您在提交任务时指定所需的数据集和代码仓,PAI支持添加文件系统NAS或对象存储OSS的数据集以及Git代码仓。
⑥
模型管理模块统一管理训练完成的模型,并直接对接模型在线服务(EAS)。您可以将模型直接部署为在线服务。
⑦
PAI平台的模型在线预测服务,支持异构硬件(CPU和GPU)模型加载,高吞吐低延迟,大规模复杂模型一键部署及实时弹性扩缩容。
说明目前EAS产品不支持使用DSW镜像和CPFS类型的数据集。
AI+大数据最佳实践
区域
描述
相关文档
①
使用MaxCompute存储数据,首先在DataWorks中对数据进行预处理,然后PAI引用MaxCompute表作为数据源进行模型训练。
②
Designer支持大规模分布式的传统机器学习、深度学习、强化学习训练,支持流批一体训练,该子模块封装了上百种机器学习算法,您可以拖拽式建模、自动调参,从而无编程玩转人工智能。
③
DataWorks根据配置的调度和时间属性等参数,周期调度任务。
④
任务管理支持将Designer的实验数据或自定义任务的执行信息记录到PAI提供的任务管理服务中,从而便于进行任务间的实验比较。
⑤
模型管理模块统一管理训练完成的模型,直接对接模型在线服务(EAS),您可以直接将模型部署为在线服务。
⑥
PAI平台的模型在线预测服务,支持异构硬件(CPU和GPU)模型加载,高吞吐低延迟,大规模复杂模型一键部署及实时弹性扩缩容。
说明目前EAS产品不支持使用DSW镜像和CPFS类型的数据集。