このページは機械翻訳によるものです。内容の正確さは保証しておりません。 人力翻訳を依頼する

ワークスペースの作成と管理

更新日時2025-03-18 07:35

ワークスペースは、Platform for AI(PAI)の重要な概念です。ワークスペースを使用すると、企業やチームは計算リソースとユーザー権限を一元的に管理できます。 ワークスペースは、AI 開発者に開発ツールを提供します。これにより、さまざまなチームが AI 開発のワークフロー全体で共同作業を行い、開発者が AI 計算資産を管理できます。 このトピックでは、ワークスペースの作成、構成、および管理方法について説明します。

前提条件

PAI がアクティブ化されていること。 詳細については、「PAI をアクティブ化してデフォルトのワークスペースを作成する」をご参照ください。

制限事項

  • ワークスペースの管理者または所有者のみがワークスペース構成を変更できます。

  • イベント通知の音声通話、ショートメッセージ、およびメールによる方法は、中国 (杭州)、中国 (上海)、および中国 (ウランチャブ) リージョンでのみサポートされています。

アカウントと権限の要件

  • Alibaba Cloud アカウント: Alibaba Cloud アカウントを使用すると、追加の承認なしですべての操作を実行できます。

  • RAM ユーザー: AliyunPAIFullAccess ポリシーを RAM ユーザーにアタッチする必要があります。 AliyunPAIFullAccess を使用すると、RAM ユーザーは PAI のすべての権限を取得できます。 注意して進めてください。Alibaba Cloud アカウントを使用することをお勧めします。

ワークスペースの作成

PAI の [ワークスペースの詳細] ページに移動し、[ワークスペースの作成] をクリックして、パラメーターを構成します。

  1. 基本情報ステップの主要なパラメーターの説明:

    • [メンバーの追加]: ワークスペースにメンバーとロールを追加します。このパラメーターをスキップし、ワークスペースの作成後にメンバーとロールをワークスペースに追加することもできます。詳細については、「メンバーとロールを構成する」をご参照ください。

    • ワークスペースのデフォルト ストレージ: モデルのトレーニング中に生成される一時データとモデルを保存するために、ワークスペースのデフォルト ストレージ パスを指定することをお勧めします。これにより、データを一元管理できます。

  2. リソースの関連付けステップの主要なパラメーターの説明:

    • インテリジェントコンピューティング 灵骏 リソース: モデルの開発とトレーニング向けにパフォーマンス専有型 計算資源グループを提供します。これらのリソースは、高パフォーマンス、高効率、高 リソース 使用率という利点があります

    • 汎用計算リソース: AI 開発専用の汎用計算リソースを提供し、開発とトレーニングの効率を向上させます。詳細については、「専用のリソースグループを作成し、汎用計算リソースを購入する」をご参照ください。

    • ACS コンピューティング リソース: ディープラーニング コンテナ (DLC) または Elastic Algorithm Service (EAS) 推論がタスクまたはサービスを開始およびスケジュールするためのリソースを提供します。詳細については、「クラスタ」をご参照ください。

    • MaxCompute リソース: Machine Learning Designer の特定のアルゴリズムに CPU リソースを提供します。詳細については、「MaxCompute リソースクォータ」をご参照ください。

    • フルマネージド Flink リソース: PAI での大規模分散モデルのトレーニング用のリソースを提供します。詳細については、「Flink リソースクォータ」をご参照ください。

    AI 計算リソースの詳細については、「AI 計算リソース」をご参照ください。

  3. 情報を確認し、作成したワークスペースに移動します。

    ワークスペースの詳細ページに移動すると、左側のナビゲーションウィンドウにすべての PAI 機能が表示されます。 これらの機能を使用して、ビジネス要件に基づいて AI 開発のライフサイクル全体を管理できます。 詳細については、「AI 開発」をご参照ください。

    image

ワークスペースの管理

[ワークスペースの詳細] ページに移動し、管理するワークスペースを入力して、表示されるページの右上隅にある [ワークスペースの構成] をクリックします。

コンピューティングリソースの構成
メンバーとロールの構成
DataWorks スケジューリング設定
イベント通知の構成
ストレージパスの構成
SLS を構成する
全般設定

コンピューティングリソースを表示および関連付ける:

説明

ワークスペースに関連付けられているリソースの関連付けを解除することはできません。 関連付けられているリソースの関連付けを解除するには、アカウントマネージャーにお問い合わせください。

image

  • インテリジェントコンピューティング 灵骏 リソース: モデルの開発とトレーニングのためのパフォーマンス専有型 計算資源グループを提供します。これらのリソースは、高パフォーマンス、高効率、高 資源 利用率という利点があります

  • 汎用計算リソース: AI 開発専用の汎用計算リソースを提供し、開発とトレーニングの効率を向上させます。詳細については、「専用のリソースグループを作成し、汎用計算リソースを購入する」をご参照ください。

  • ACS コンピューティング リソース: ディープラーニング コンテナ (DLC) または Elastic Algorithm Service (EAS) 推論がタスクまたはサービスを開始およびスケジュールするためのリソースを提供します。詳細については、「クラスタ」をご参照ください。

  • MaxCompute リソース: Machine Learning Designer の特定のアルゴリズムに CPU リソースを提供します。詳細については、「MaxCompute リソースクォータ」をご参照ください。

  • フルマネージド Flink リソース: PAI での大規模分散モデルのトレーニング用リソースを提供します。詳細については、「Flink リソースクォータ」をご参照ください。

AI 計算リソースの詳細については、「AI 計算リソース」をご参照ください。

複数の RAM ユーザーがワークスペースで開発、管理、または O&M を実行する必要がある場合は、それらのユーザーをワークスペースメンバーとして追加し、メンバーに異なるロールを割り当てる必要があります。 PAI は複数のタイプのロールを提供します。 ロールと権限のマッピングを表示し、ビジネス要件に基づいてメンバーに異なるロールを割り当てることができます。

  • メンバーまたはロールの追加

    image

    ビジネス要件に基づいて、RAM ユーザーに 1 つ以上のロールを選択できます。 次の表に、サポートされているロールを示します。

    ロール

    説明

    基本ロール

    基本ロールには、次のロールが含まれます。

    • 管理者: このロールには、メンバーの変更、リソースグループの管理、およびワークスペース内のすべてのアセットの管理を行う権限があります。

    • アルゴリズム開発者: このロールには、ワークスペースでモデルを開発およびトレーニングする権限があります。

    • アルゴリズム O&M エンジニア: このロールには、ジョブの優先順位の管理、モデルの公開、およびオンラインサービスの監視を行う権限があります。

    • ラベリング管理者: このロールには、iTAG を使用する権限があります。

    • ビジター: このロールには、ワークスペース内のすべてのアセットに対する読み取り専用権限があります。

    コンピューティングリソースロール

    MaxCompute 開発者: DataWorks の開発者ロール。 このロールには、MaxCompute でデータを開発する権限があります。 このロールは、PAI から MaxCompute にジョブを送信するために使用する RAM ユーザーに割り当てることができます。

    カスタムロール

    次の図は、カスタムロールの作成方法を示しています。

    image

    権限の説明:

    • 権限なし: サービスに対する権限がありません。

    • 読み取り専用: 特定のメンバーが所有するリソースと、サービス内のすべてのメンバーに表示されるリソースを表示する権限。

    • 変更/実行: サービス内の特定のメンバーが所有するリソースを変更および管理する権限。

    • フルアクセス: サービス内のすべてのリソースに対する完全な管理権限。

  • メンバーのロールの変更

    image

    メンバーとロールの関係:

    • 各メンバーには、少なくとも 1 つのロールが割り当てられている必要があります。

    • 所有者 ロールは削除できません。 ワークスペースの作成に使用される Alibaba Cloud アカウントまたは RAM ユーザーは、自動的にワークスペースの 所有者 になります。 所有者には、ワークスペースのメンバーの変更、リソースグループの参照と管理、およびワークスペース内のすべてのアセットの管理を行う権限があります。

PAI はリソース管理とスケジューリングメカニズムを提供しており、ワークスペース管理者はビジネス要件に基づいてワークスペース内のリソースを柔軟にスケジュールできます。

image

説明

ロールドロップダウンリストの ワークスペース以外のメンバー は、管理者によってワークスペースに追加されていないが、Alibaba Cloud アカウントによって関連する RAM 権限が付与されているメンバーを指します。 ワークスペース以外のメンバーもリソースを使用し、ジョブを送信できます。 したがって、これらのメンバーに対して個別の制約を定義できます。

PAI は、ワークスペースの通知メカニズムを提供します。 通知ルールを作成して DLC ジョブとパイプラインジョブのステータスを監視したり、モデルバージョンの承認ステータスに基づいて関連イベントをトリガーしたりできます。

  1. (オプション) 通知ルールを作成するために必要な権限を付与します。

    初めて通知ルールを作成する場合は、EventBridge をアクティブ化し、AliyunServiceRoleForPAIWorkspace ロールを PAI ワークスペースにアタッチする必要があります。 手順:

    1. EventBridge をアクティブ化する

      アカウント管理を容易にするために、PAI は各ワークスペースに対して pai-system-${ワークスペース名} 形式で名前が付けられたカスタムイベントバスを自動的に作成します。 EventBridge コンソール にログインし、ワークスペースが存在するリージョンに切り替えて、カスタムイベントバスを管理できます。

    2. [今すぐ承認] をクリックして、必要な権限を付与します。

      この場合、システムはサービスロール AliyunServiceRoleForPAIWorkspace を自動的に作成します。 サービスロールの詳細については、「付録: サービスロール AliyunServiceRoleForPAIWorkspace」をご参照ください。

      image

    3. 次のコードを使用して、カスタムポリシーを作成し、ポリシーを RAM ユーザーにアタッチします。

      {
        "Statement": [{
          "Effect": "Allow",
          "Action": [
            "eventbridge:CreateEventBus",
            "eventbridge:GetEventBus",
            "eventbridge:DeleteEventBus",
            "eventbridge:ListEventBuses",
            "eventbridge:CreateRule",
            "eventbridge:GetRule",
            "eventbridge:UpdateRule",
            "eventbridge:EnableRule",
            "eventbridge:DisableRule",
            "eventbridge:DeleteRule",
            "eventbridge:ListRules",
            "eventbridge:PutEvents",
            "eventbridge:UpdateTargets",
            "eventbridge:DeleteTargets",
            "eventbridge:ListTargets"
          ],
          "Resource": "acs:eventbridge:*:*:eventbus/*"
        }],
        "Version": "1"
      }
  2. イベント通知ルールを作成します。

    image

    パラメーター

    説明

    イベントタイプ

    サポートされているイベントタイプ:

    • パイプラインジョブ: Machine Learning デザイナーのパイプラインジョブ。 イベントタイプドロップダウンリストの有効な値: ジョブの失敗とジョブの完了 (成功または失敗)。

    • DLC ジョブ: DLC ジョブ。 イベントタイプドロップダウンリストの有効な値: ジョブの進捗状況 (キューへの入力、入札の開始、実行の開始、ジョブの失敗を含む)、自動フォールトトレランス、ジョブのタイムアウト (DataWorks スケジューリング設定 でタイムアウトルールを構成する必要があります)、およびその他のイベント (ジョブのプリエンプトとジョブの手動停止を含む)。

    • モデル: AI コンピューティングアセット管理に登録されているモデル。 イベントタイプドロップダウンリストの有効な値: バージョンの承認とバージョンのステータスの変更 (承認または拒否)。 バージョンの承認を選択した場合、モデルの承認ステータスが保留から承認に変更されると、システムはイベント通知を送信します。

    イベントターゲット

    • DingTalk 通知: Webhook と署名の追加パラメーターを構成する必要があります。 詳細については、このトピックの「付録: Webhook URL とキーを取得する」セクションをご参照ください。 [接続テスト] をクリックして、構成されたコンテンツが有効かどうかを確認できます。

    • HTTPS/HTTP: このオプションは、イベントタイプをモデルに設定した場合にのみ使用できます。 URL パラメーターを指定した HTTP または HTTPS 操作の URL に設定する必要があります。 モデルバージョンのステータスが変更されると、システムは指定された HTTP または HTTPS 操作を呼び出します。 指定された操作は、仕様テンプレートに基づいて解析する必要があることに注意してください。

    • 音声通話: このオプションは、イベントタイプをパイプラインジョブまたは DLC ジョブに設定した場合にのみ使用できます。 連絡先を構成する必要があります。 連絡先がない場合は、通知を構成できます。 詳細については、「通知を構成するにはどうすればよいですか?」をご参照ください。

    • ショートメッセージ: 構成方法は音声通話と同じです。

    • メール: 構成方法は音声通話と同じです。

    重要

    デフォルトでは、単一のイベントルール内のイベントターゲットの数は 5 です。 クォータが要件を満たしていない場合は、クォータを申請できます。 要求されるイベントターゲットの数は 100 を超えないようにすることをお勧めします。 注: 音声通話、ショートメッセージ、およびメールによる方法を構成する場合、追加する連絡先ごとにクォータが使用されます。 連絡先は重複排除されずに累積されます。 たとえば、連絡先 Alice と Tony がショートメッセージによる方法に追加され、Alice と Alan がメールによる方法に追加された場合、合計クォータは 4 になります。

付録: Webhook URL とキーを取得する

  1. 目的の DingTalk グループを見つけ、次の図に示されている手順に従って、DingTalk チャットボットを追加します。

    机器人

  2. 次の図に示されている手順に従って、[ロボットの追加] ダイアログ ボックスを開きます。

    image

  3. [ロボットの追加] ダイアログボックスで、次の図に示すパラメーターを構成し、キーをコピーして、[完了] をクリックします。

    重要

    コピーしたキーを後で使用するためにコンピューターに保存します。

    添加机器人

  4. [ロボットの追加] ダイアログボックスで、Webhook URL の右側の [コピー][完了] をクリックします。

    重要

    Webhook URL を後で使用するためにコンピューターに保存します。

    添加机器人

手順 3 と 4 で取得したキーと Webhook URL は、イベント通知の構成 タブのイベントルール作成パネルにある、[追加署名] パラメーターと [webhook] パラメーターの値です。

ワークスペースのデフォルトのストレージパスを指定する必要があります。

image

  • モデルのトレーニング中に生成される一時データとモデルを保存するために、ワークスペースのデフォルトのストレージパスを指定することをお勧めします。これにより、データを一元管理できます。

  • Machine Learning Designer で [パイプラインストレージパス] も指定した場合、パイプラインの実行時には、指定された [パイプラインストレージパス] がワークスペースのデフォルトのストレージパスよりも優先されます。

現在のワークスペースの Data Science Workshop(DSW)インスタンスおよび DLC タスクで生成されたログを、カスタム分析のために Simple Log Service に送信できます。

image

パラメータ

説明

SLS プロジェクト

リソースを分離および管理するために使用される Simple Log Service のプロジェクト。プロジェクトがない場合は、プロジェクトを作成することができます。

ログストア

ログを収集、保存、およびクエリするために使用される Simple Log Service のログストア。ログストアがない場合は、ログストアを作成することができます。

SLS ストレージが必要なモジュール

サポートされているオプション:Deep Learning Containers(DLC)および Interactive Modeling(DSW)。

このタブでは、機能の有効化と無効化、および DLC タスクのノード コンテナーへのアクセス権限を制御できます。 また、このタブには、SSH を使用して DSW インスタンスに接続するためのスイッチと、インターネット経由で DSW インスタンスにアクセスするためのスイッチも用意されています。 これにより、インスタンスへのユーザー アクセスの柔軟性とセキュリティが向上します。

image

よくある質問

ワークスペースを作成するときに「名前はすでに存在します。」というエラーメッセージが表示された場合はどうすればよいですか?

ワークスペース名がすでに存在するというメッセージが表示されても、PAI コンソール ワークスペース リストにワークスペースが見つからない場合は、DataWorks コンソールに同じ名前のワークスペースがすでに存在している可能性があります。PAI と DataWorks はワークスペースを共有します。そのため、ワークスペース名が確実に一意になるように名前を変更することをお勧めします。

  • 目次 (1, M)
  • 前提条件
  • 制限事項
  • アカウントと権限の要件
  • ワークスペースの作成
  • ワークスペースの管理
  • よくある質問
  • ワークスペースを作成するときに「名前はすでに存在します。」というエラーメッセージが表示された場合はどうすればよいですか?
フィードバック
phone お問い合わせ

Chat now with Alibaba Cloud Customer Service to assist you in finding the right products and services to meet your needs.

alicare alicarealicarealicare