このトピックでは、Machine Learning Platform for AI (PAI) の管理、AI開発、およびモジュールに関連する用語について説明します。
管理に関連する条件
期間 | 説明 |
ワークスペース | ワークスペースはPAIの重要な概念です。 ワークスペースを使用すると、組織またはチームはコンピューティングリソースとユーザー権限を一元管理でき、AI開発のあらゆる段階でコラボレーションのためのツールと機能を提供できます。 PAIはDataWorksの上で実行されます。 したがって、PAIのワークスペースはDataWorksのワークスペースにマップされます。 デフォルトワークスペース: デフォルトワークスペースには、一般的に使用される従量課金リソースが含まれています。 これらのリソースを使用するには、デフォルトのワークスペースを有効にする必要があります。 デフォルトのワークスペースは、リソースグループなどの概念を理解する必要なく、初めてのユーザーがモデルの開発とトレーニングをすばやく開始するのに役立ちます。 |
ディープラーニングコンテナ (DLC) | DLCは、基本的なAIコンピューティングジョブ用のクラウドネイティブプラットフォームです。 DLCは、モデルトレーニングのための弾性、安定性、使いやすい、高性能の環境を提供します。 DLCは複数のアルゴリズムフレームワークを提供し、多数の深層学習ジョブを分散して実行でき、カスタムアルゴリズムフレームワークをサポートします。 DLCは、次のタイプのクラスターをサポートします。
|
リソース グループ |
|
メンバー | メンバーは、ワークスペースに参加するAlibaba CloudアカウントまたはRAM (Resource Access Management) ユーザーです。 同じワークスペースのメンバーは、AI開発パイプライン全体で共同作業するために異なる役割を引き受けることができます。 ワークスペースのメンバーを変更できるのは、ワークスペースの所有者と管理者だけです。 |
role | ロールは、メンバーと権限の間のマッピングです。 システムロールを使用するか、カスタムロールを作成できます。 システムの役割は次のとおりです。
|
依存関係 | PAIは他のAlibaba Cloudサービスに依存しています。 PAIが提供する機能を使用するには、まずこれらのAlibaba Cloudサービスを有効化し、Alibaba Cloudアカウントまたはリソース管理者ロールを使用してRAM権限付与を完了する必要があります。 有効化する必要があるAlibaba Cloudサービスには、Object Storage Service (OSS) 、Apsara File Storage NAS (NAS) 、Log Service、Container Registry、およびAPI Gatewayが含まれます。 |
AI開発に関連する用語
期間 | 説明 |
データセット | データセットは、ラベリング、モデルトレーニング、およびモデル評価で使用されます。 構造化データまたは非構造化データを使用するデータセットを作成したり、OSS、NAS、MaxComputeなどのデータストアにディレクトリをマウントしたりできます。 さらに、PAI内のデータセットのストレージ、バージョン、スキーマを一元管理できます。 |
パイプライン | パイプラインは、論理スケジューリングに基づいて接続された上流コンポーネントと下流コンポーネントで構成される有向非巡回グラフ (DAG) です。 パイプラインに対して複数の実行を送信して、PipelineRunsを生成できます。 |
PipelineDraft | PipelineDraftsは、Designerのキャンバス上の構成可能なパイプラインオブジェクトです。 PipelineDraftを編集して、複数のパイプラインを生成できます。 PipelineDraftsの実行を送信して、PipelineRunsを生成できます。 |
コンポーネント | コンポーネントは、パイプラインとPipelineDraftsで構成可能な最小単位であり、PipelineRunsで実行可能な最小単位です。 コンポーネントは、次のタイプで構成されます。
|
node | ノードは、パイプラインを形成するためにキャンバスにドラッグアンドドロップされるコンポーネントを表します。 |
スナップショット | システムがPipelineDraft内の単一のノード、PipelineDraft内の複数のノード、またはPipelineDraft全体を実行するたびに、システムはPipelineDraftの構成のスナップショットを作成します。 スナップショットには、ノード構成、ランタイムパラメータ、および実行モードが含まれます。 スナップショットは、PipelineDraftのバージョン管理と構成ロールバックで使用できます。 |
PipelineRun | PipelineRunは、パイプラインの単一の実行を表します。 Designerを使用してPipelineDraftの実行を送信するか、SDKを使用してパイプラインの実行を送信すると、PipelineRunが生成されます。 |
job | DLCジョブなどのジョブは、コンピューティングリソースを使用します。 ジョブが実行されるリソース環境はユーザーに属します。 |
run | ランは、パイプラインの単一の実行を表す。 Runは、MLflowの同じ概念と同等です。 すべての実行は実験に属する必要があります。 実行を使用して、Machine Learning Platform for AIで送信したトレーニングジョブを追跡できます。 MLflowクライアントを使用して、オンプレミスのマシンから実行を送信することもできます。 実行には複数のジョブを含めることができます。 |
モデル | モデルは、データセット、アルゴリズム、およびコードに基づいてジョブをトレーニングすることによって生成されます。 モデルを使用して予測を行うことができます。 |
プロセッサ | プロセッサは、モデルをロードし、要求を処理するためのロジックを含む、オンライン予測ロジックのパッケージである。 ほとんどの場合、プロセッサは、サービスをプロビジョニングするためにモデルファイルとともに展開されます。 プロセッサは次のタイプで構成されています。
|
service | モデルファイルは、オンライン予測ロジックと一緒にサービスとしてデプロイできます。 EASを使用すると、サービスを作成、更新、開始、停止、スケールアウト、およびスケールインできます。 |
イメージ | PAIでは、次のDockerイメージをAIアセットとして管理できます。
パイプラインでイメージを使用して、特定のジョブを完了するカスタムコンポーネントを作成できます。 イメージは、DSWインスタンスとトレーニングジョブのランタイム環境も提供します。 |
インスタンス | インスタンスは、コンピューティングリソースをプロビジョニングするための最小単位です。 インスタンスは、次のタイプで構成されます。
|
モジュールに関連する用語
期間 | 説明 |
iTAG | iTAGは、データセットラベリングの品質と効率を向上させるためにブラックボックスモデルで開発されたデータセットラベリングツールです。 |
デザイナー | Designerは、AIセクターのパイプライン設計を目的としています。 Designerは、さまざまな組み込みの機械学習アルゴリズムコンポーネントを提供します。 これらのコンポーネントをドラッグアンドドロップして、コーディングなしでモデルをトレーニングできます。 |
データ科学ワークショップ (DSW) | DSWは、クラウドでのインタラクティブなAI開発を目的とした統合開発環境 (IDE) です。 DSWは、ノートブック、VSコード、およびターミナルで構成されています。 イメージを使用して、ストレージとしてNASを使用するDSWインスタンスをデプロイできます。 |
ディープラーニングコンテナ (DLC) | 現在のワークスペースで、DLCクラスターなどのコンピューティングリソースグループにトレーニングジョブを送信できます。 トレーニングジョブを送信した後、PAIコンソールの [ジョブ] モジュールでジョブの詳細を表示できます。 |
Elastic Algorithm Service (EAS) | EASを使用すると、数回クリックするだけで、複雑なモデルを大規模なサービスとして展開できます。 EASはリアルタイムスケーリングをサポートし、洗練された監視および保守システムを提供します。 |
AI資産管理 | このモジュールでは、データセット、モデル、ソースコードリポジトリなどの主要なAIアセットを管理できます。 |
シナリオベースのソリューション | 垂直市場の問題を解決するのに役立つPAIが提供するソリューションのコレクション。 |