人工智慧平台PAI(Platform For AI),是阿里雲專為開發人員打造的一站式Machine Learning Platform for AI,為您提供資料標註、模型開發、模型訓練、模型部署的AI全鏈路研發服務。本文為您介紹什麼是人工智慧平台PAI。
什麼是人工智慧平台PAI
人工智慧平台PAI是阿里雲專為開發人員打造的一站式Machine Learning Platform for AI,其主要由可視化建模(Designer)、互動式建模(DSW)、分布式訓練(DLC)、模型線上服務(EAS)等核心功能模組組成,為您提供資料標註、模型開發、模型訓練、模型部署的AI全鏈路研發服務,具有支援多種開源架構、多項AI最佳化能力、靈活易用的優勢。
核心功能模組
名稱 | 描述 | 適用情境 | 樣本 |
通過拖拽的方式排布組件,可視化地構建AI工作流程,實現模型開發 | 模型代碼開發、模型訓練、工作流程開發階段,或需要定時調度工作流程 | ||
整合了Notebook、VSCode、Terminal多種開發環境的雲端IDE | 模型代碼開發和訓練階段 | ||
雲原生的AI訓練平台,能夠處理大規模的分布式深度學習任務 | 代碼開發完成後的模型訓練或代碼執行階段,需要多機器分布式執行時 | ||
用於將模型部署為線上服務,具有Auto Scaling、版本管理、資源監控功能 | 模型訓練完成需要部署為線上服務時 |
PAI完整的功能特性,請參見功能特性。
產品優勢
AI 研發全生命週期全鏈路
支援資料標註、模型開發、模型訓練、模型最佳化、模型部署以及AI營運管控,是一站式AI平台。
擁有140+種最佳化的內建演算法組件。
提供多種模式、巨量資料引擎深度結合、多架構相容、自訂鏡像等核心能力。
提供雲原生架構的AI開發、訓練、部署的產品。
支援多種開源架構
流式計算架構Flink。
基於開源版本深度最佳化的深度學習架構TensorFlow、PyTorch、Megatron和DeepSpeed。
千億級特徵樣本的大規模並行計算架構Parameter Server。
Spark、PySpark、MapReduce等業內主流開源架構。
業內領先的AI最佳化
高效能的訓練架構,稀疏訓練情境,支援數十億到數百億的稀疏特徵規模,數百億到數千億的樣本規模,上千worker的分布式增量訓練。
主流架構模型加速,使用PAI Blade提升RestNet50、Transformer+LM等十數個主流模型加速比。
多樣的產品輸出方式
公用雲支援全託管、半託管。
支援AI 高效能運算叢集和輕量化輸出產品形態。
對接DataWorks
支援SQL、UDF、UDAF、MR等多種資料處理方式,靈活性高。
支援DataWorks周期性調度,且調度任務區分生產環境和開發環境,從而實現資料安全隔離。