Platform for AI (PAI) コンソールのワークスペースの詳細ページのモジュールを使用して、AI開発を実行できます。 このトピックでは、一般的なAI開発ワークフローについて説明します。
AI開発ワークフロー
PAIのモジュールは、ワークスペースの詳細ページの左側のナビゲーションペインに表示されます。 ビジネスシナリオに基づいて、さまざまなモジュールをAI開発に使用できます。 ここでは、一般的なビジネスシナリオでモジュールを使用する方法について説明します。
クラウドネイティブ開発
モジュール
説明
参照
①
高精度モデルには、高品質のデータセットが不可欠です。 データセットを一元管理し、データのラベル付けとモデルトレーニングの準備をするために、データセット管理モジュールを使用して、パブリックデータセット、オンプレミスマシン上のデータセット、Alibaba Cloudストレージサービス内のデータセットを登録できます。 Object Storage Service (OSS) オブジェクトをスキャンして、インデックスデータセットを作成することもできます。
②
Data Science Workshop (DSW) は、機械学習のためのクラウドベースのインタラクティブな統合開発環境 (IDE) です。 DSWノートブックを使用して、データの読み取り、アルゴリズムの開発、モデルのトレーニングとデプロイを行うことができます。
③
イメージ管理モジュールを使用すると、公式のPAIイメージまたはカスタムイメージを使用して、集中的にイメージを管理できます。
④
ディープラーニングコンテナ (DLC) は、機械学習のための柔軟で安定した使いやすい高性能なトレーニング環境を提供します。 DLCは、主流およびカスタムアルゴリズムフレームワークをサポートし、超大規模な分散深層学習タスクを実行できます。
⑤
トレーニングジョブの送信時に、Apsara File Storage NAS (NAS) またはOSSに保存されているデータセットと、Gitリポジトリに保存されているコードを使用できます。
⑥
モデル管理モジュールを使用すると、トレーニング済みモデルを一元管理し、Elastic Algorithm Service (EAS) にオンラインサービスとしてモデルをデプロイできます。
⑦
EASを使用すると、CPUとGPUに同時にモデルをロードでき、低遅延で高スループットを提供し、リアルタイムの自動スケーリングをサポートします。 数回クリックするだけで、大規模で複雑なモデルをデプロイできます。
説明EASはDSWイメージまたはCPFSデータセットをサポートしません。
AIとビッグデータ
モジュール
説明
参照
①
ソースデータはMaxComputeテーブルに保存され、DataWorksで前処理された後、PAIでのモデルトレーニングに使用されます。
②
Machine Learning Designerは、ストリーミングトレーニングとバッチトレーニングを組み合わせることができ、従来の機械学習、深層学習、強化学習の大規模な分散トレーニングをサポートします。 Machine Learning Designerは、自動パラメータ調整をサポートする数百のアルゴリズムコンポーネントを提供します。 コンポーネントをドラッグして、最小限のコーディングでモデルを作成できます。
機械学習デザイナーの概要
③
DataWorksは、設定したスケジューリングパラメーターと時間プロパティに基づいてタスクをスケジュールします。
④
ジョブ管理モジュールでは、Machine Learning Designerのパイプラインデータとカスタムジョブの実行レコードを保存できます。 これにより、さまざまなパイプラインやジョブの結果を比較できます。
⑤
モデル管理モジュールを使用すると、トレーニングされたモデルを集中管理し、モデルをオンラインサービスとしてEASに展開できます。
⑥
EASを使用すると、CPUとGPUに同時にモデルをロードでき、低遅延で高スループットを提供し、リアルタイムの自動スケーリングをサポートします。 数回クリックするだけで、大規模で複雑なモデルをデプロイできます。
説明EASはDSWイメージまたはCPFSデータセットをサポートしません。