すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:用語

最終更新日:Sep 18, 2024

このトピックでは、Machine Learning Platform for AI (PAI) の管理、AI開発、およびモジュールに関連する用語について説明します。

管理に関連する条件

期間

説明

ワークスペース

ワークスペースはPAIの重要な概念です。 ワークスペースを使用すると、組織またはチームはコンピューティングリソースとユーザー権限を一元管理でき、AI開発のあらゆる段階でコラボレーションのためのツールと機能を提供できます。 PAIはDataWorksの上で実行されます。 したがって、PAIのワークスペースはDataWorksのワークスペースにマップされます。

デフォルトワークスペース: デフォルトワークスペースには、一般的に使用される従量課金リソースが含まれています。 これらのリソースを使用するには、デフォルトのワークスペースを有効にする必要があります。 デフォルトのワークスペースは、リソースグループなどの概念を理解する必要なく、初めてのユーザーがモデルの開発とトレーニングをすばやく開始するのに役立ちます。

ディープラーニングコンテナ (DLC)

DLCは、基本的なAIコンピューティングジョブ用のクラウドネイティブプラットフォームです。 DLCは、モデルトレーニングのための弾性、安定性、使いやすい、高性能の環境を提供します。 DLCは複数のアルゴリズムフレームワークを提供し、多数の深層学習ジョブを分散して実行でき、カスタムアルゴリズムフレームワークをサポートします。 DLCは、次のタイプのクラスターをサポートします。

  • 完全管理クラスター: 完全管理クラスターは、パブリックリソースグループまたは専用リソースグループです。 ワークスペースの管理者は、完全管理クラスターをワークスペースに関連付けて、これらのクラスターを使用できます。

  • 半管理クラスター: 半管理クラスターは、自己管理リソースグループです。 半管理クラスターは個別のダッシュボードを提供し、完全管理クラスターよりも柔軟に使用できます。

リソース グループ

  • リソースグループを作成して、目的、権限、所有権など、さまざまなディメンションでコンピューティングリソースを分類できます。 リソースグループを使用して、異なるユーザーまたはワークスペースに属するコンピューティングリソースを分離できます。

  • リソースグループとは、MaxComputeクォータグループ、DLCクラスター、Kubernetesクラスター、E-MapReduce (EMR) クラスター、Flinkクラスター、Elastic Compute Service (ECS) クラスターなど、PAIのさまざまなモジュールで使用されるすべての基本リソースを指します。

  • Alibaba Cloudアカウントまたはリソース管理者ロールを使用して、MaxCompute、EMR、またはその他のコンソールでリソースグループを購入および作成できます。 購入したリソースグループはワークスペースで使用できます。

メンバー

メンバーは、ワークスペースに参加するAlibaba CloudアカウントまたはRAM (Resource Access Management) ユーザーです。 同じワークスペースのメンバーは、AI開発パイプライン全体で共同作業するために異なる役割を引き受けることができます。 ワークスペースのメンバーを変更できるのは、ワークスペースの所有者と管理者だけです。

role

ロールは、メンバーと権限の間のマッピングです。 システムロールを使用するか、カスタムロールを作成できます。 システムの役割は次のとおりです。

  • リソース管理者: このロールには、コンピューティングリソースを購入および管理する権限があります。 ほとんどの場合、Alibaba Cloudエンタープライズアカウントがこのロールを引き受けます。 このロールによって提供される権限を管理し、ロールを割り当てるには、RAMコンソールにログインする必要があります。

  • Workspace owner: このロールには、ワークスペースのメンバーを変更し、リソースグループを参照する権限があります。 このロールは、ワークスペースを作成したユーザーに自動的に割り当てられます。

  • ワークスペース管理者: このロールには、メンバーを変更し、リソースグループを含むワークスペース内のすべてのアセットを管理する権限があります。

  • アルゴリズム開発者: このロールには、ワークスペースでモデルを開発およびトレーニングする権限があります。

  • アルゴリズムO&Mエンジニア: このロールには、ジョブの優先順位の管理、モデルの公開、およびオンラインサービスの監視を行う権限があります。

  • ラベル管理者: このロールには、インテリジェントラベリングを使用する権限があります。

  • 訪問者: このロールには、ワークスペース内のすべてのアセットに対する読み取り専用の権限があります。

依存関係

PAIは他のAlibaba Cloudサービスに依存しています。 PAIが提供する機能を使用するには、まずこれらのAlibaba Cloudサービスを有効化し、Alibaba Cloudアカウントまたはリソース管理者ロールを使用してRAM権限付与を完了する必要があります。 有効化する必要があるAlibaba Cloudサービスには、Object Storage Service (OSS) 、Apsara File Storage NAS (NAS) 、Log Service、Container Registry、およびAPI Gatewayが含まれます。

AI開発に関連する用語

期間

説明

データセット

データセットは、ラベリング、モデルトレーニング、およびモデル評価で使用されます。 構造化データまたは非構造化データを使用するデータセットを作成したり、OSS、NAS、MaxComputeなどのデータストアにディレクトリをマウントしたりできます。 さらに、PAI内のデータセットのストレージ、バージョン、スキーマを一元管理できます。

パイプライン

パイプラインは、論理スケジューリングに基づいて接続された上流コンポーネントと下流コンポーネントで構成される有向非巡回グラフ (DAG) です。 パイプラインに対して複数の実行を送信して、PipelineRunsを生成できます。

PipelineDraft

PipelineDraftsは、Designerのキャンバス上の構成可能なパイプラインオブジェクトです。 PipelineDraftを編集して、複数のパイプラインを生成できます。 PipelineDraftsの実行を送信して、PipelineRunsを生成できます。

コンポーネント

コンポーネントは、パイプラインとPipelineDraftsで構成可能な最小単位であり、PipelineRunsで実行可能な最小単位です。 コンポーネントは、次のタイプで構成されます。

  • 組み込みコンポーネント: PAIは、モデル開発パイプライン全体で使用できる組み込みコンポーネントを提供します。 これらのコンポーネントは、Alibaba Cloudのベストプラクティスに基づいて開発されており、データの前処理、モデルのトレーニング、予測の作成に使用できます。

  • カスタムコンポーネント: コードまたはイメージに基づいてカスタムコンポーネントを作成し、これらのカスタムコンポーネントをパイプラインに追加できます。

node

ノードは、パイプラインを形成するためにキャンバスにドラッグアンドドロップされるコンポーネントを表します。

スナップショット

システムがPipelineDraft内の単一のノード、PipelineDraft内の複数のノード、またはPipelineDraft全体を実行するたびに、システムはPipelineDraftの構成のスナップショットを作成します。 スナップショットには、ノード構成、ランタイムパラメータ、および実行モードが含まれます。 スナップショットは、PipelineDraftのバージョン管理と構成ロールバックで使用できます。

PipelineRun

PipelineRunは、パイプラインの単一の実行を表します。 Designerを使用してPipelineDraftの実行を送信するか、SDKを使用してパイプラインの実行を送信すると、PipelineRunが生成されます。

job

DLCジョブなどのジョブは、コンピューティングリソースを使用します。 ジョブが実行されるリソース環境はユーザーに属します。

run

ランは、パイプラインの単一の実行を表す。 Runは、MLflowの同じ概念と同等です。 すべての実行は実験に属する必要があります。 実行を使用して、Machine Learning Platform for AIで送信したトレーニングジョブを追跡できます。 MLflowクライアントを使用して、オンプレミスのマシンから実行を送信することもできます。 実行には複数のジョブを含めることができます。

モデル

モデルは、データセット、アルゴリズム、およびコードに基づいてジョブをトレーニングすることによって生成されます。 モデルを使用して予測を行うことができます。

プロセッサ

プロセッサは、モデルをロードし、要求を処理するためのロジックを含む、オンライン予測ロジックのパッケージである。 ほとんどの場合、プロセッサは、サービスをプロビジョニングするためにモデルファイルとともに展開されます。 プロセッサは次のタイプで構成されています。

  • 内蔵プロセッサ: EASは、Predictive Model Markup Language (PMML) モデルやTensorFlowモデルなどの一般的に使用されるモデルに内蔵プロセッサを提供します。

  • カスタムプロセッサ: 組み込みプロセッサがビジネス要件を満たせない場合は、プロセッサ開発標準に準拠したカスタムプロセッサを作成できます。

service

モデルファイルは、オンライン予測ロジックと一緒にサービスとしてデプロイできます。 EASを使用すると、サービスを作成、更新、開始、停止、スケールアウト、およびスケールインできます。

イメージ

PAIでは、次のDockerイメージをAIアセットとして管理できます。

  • PAIによって提供されるパブリックイメージ。

  • Data Science Workshop (DSW) に保存されるカスタムイメージ。

  • Container Registryに保存されているカスタムイメージ。

パイプラインでイメージを使用して、特定のジョブを完了するカスタムコンポーネントを作成できます。 イメージは、DSWインスタンスとトレーニングジョブのランタイム環境も提供します。

インスタンス

インスタンスは、コンピューティングリソースをプロビジョニングするための最小単位です。 インスタンスは、次のタイプで構成されます。

  • DSWインスタンス: DSWインスタンスはノートブックインスタンスです。 各DSWインスタンスは、コードの変更、デバッグの実行、またはモデルのトレーニングのための一定量のコンピューティングリソースを提供します。 インスタンスのリソース環境はユーザーに属します。

  • EASインスタンス: EASインスタンスはサービスプロセスです。 サービスごとに1つ以上のEASインスタンスをデプロイして、サービスで処理できる同時リクエストの数を増やすことができます。 インスタンスのリソース環境はユーザーに属します。

モジュールに関連する用語

期間

説明

iTAG

iTAGは、データセットラベリングの品質と効率を向上させるためにブラックボックスモデルで開発されたデータセットラベリングツールです。

デザイナー

Designerは、AIセクターのパイプライン設計を目的としています。 Designerは、さまざまな組み込みの機械学習アルゴリズムコンポーネントを提供します。 これらのコンポーネントをドラッグアンドドロップして、コーディングなしでモデルをトレーニングできます。

データ科学ワークショップ (DSW)

DSWは、クラウドでのインタラクティブなAI開発を目的とした統合開発環境 (IDE) です。 DSWは、ノートブック、VSコード、およびターミナルで構成されています。 イメージを使用して、ストレージとしてNASを使用するDSWインスタンスをデプロイできます。

ディープラーニングコンテナ (DLC)

現在のワークスペースで、DLCクラスターなどのコンピューティングリソースグループにトレーニングジョブを送信できます。 トレーニングジョブを送信した後、PAIコンソールの [ジョブ] モジュールでジョブの詳細を表示できます。

Elastic Algorithm Service (EAS)

EASを使用すると、数回クリックするだけで、複雑なモデルを大規模なサービスとして展開できます。 EASはリアルタイムスケーリングをサポートし、洗練された監視および保守システムを提供します。

AI資産管理

このモジュールでは、データセット、モデル、ソースコードリポジトリなどの主要なAIアセットを管理できます。

シナリオベースのソリューション

垂直市場の問題を解決するのに役立つPAIが提供するソリューションのコレクション。