ワークスペースは、Platform for AI(PAI)の重要な概念です。ワークスペースを使用すると、企業やチームは計算リソースとユーザー権限を一元的に管理できます。 ワークスペースは、AI 開発者に開発ツールを提供します。これにより、さまざまなチームが AI 開発のワークフロー全体で共同作業を行い、開発者が AI 計算資産を管理できます。 このトピックでは、ワークスペースの作成、構成、および管理方法について説明します。
アカウントと権限の要件
Alibaba Cloud アカウント: Alibaba Cloud アカウントを使用すると、追加の承認なしですべての操作を実行できます。
RAM ユーザー: AliyunPAIFullAccess ポリシーを RAM ユーザーにアタッチする必要があります。 AliyunPAIFullAccess を使用すると、RAM ユーザーは PAI のすべての権限を取得できます。 注意して進めてください。Alibaba Cloud アカウントを使用することをお勧めします。
ワークスペースの作成
PAI の [ワークスペースの詳細] ページに移動し、[ワークスペースの作成] をクリックして、パラメーターを構成します。
基本情報ステップの主要なパラメーターの説明:
[メンバーの追加]: ワークスペースにメンバーとロールを追加します。このパラメーターをスキップし、ワークスペースの作成後にメンバーとロールをワークスペースに追加することもできます。詳細については、「メンバーとロールを構成する」をご参照ください。
ワークスペースのデフォルト ストレージ: モデルのトレーニング中に生成される一時データとモデルを保存するために、ワークスペースのデフォルト ストレージ パスを指定することをお勧めします。これにより、データを一元管理できます。
リソースの関連付けステップの主要なパラメーターの説明:
インテリジェントコンピューティング 灵骏 リソース: モデルの開発とトレーニング向けにパフォーマンス専有型 計算資源グループを提供します。これらのリソースは、高パフォーマンス、高効率、高 リソース 使用率という利点があります
汎用計算リソース: AI 開発専用の汎用計算リソースを提供し、開発とトレーニングの効率を向上させます。詳細については、「専用のリソースグループを作成し、汎用計算リソースを購入する」をご参照ください。
ACS コンピューティング リソース: ディープラーニング コンテナ (DLC) または Elastic Algorithm Service (EAS) 推論がタスクまたはサービスを開始およびスケジュールするためのリソースを提供します。詳細については、「クラスタ」をご参照ください。
MaxCompute リソース: Machine Learning Designer の特定のアルゴリズムに CPU リソースを提供します。詳細については、「MaxCompute リソースクォータ」をご参照ください。
フルマネージド Flink リソース: PAI での大規模分散モデルのトレーニング用のリソースを提供します。詳細については、「Flink リソースクォータ」をご参照ください。
AI 計算リソースの詳細については、「AI 計算リソース」をご参照ください。
情報を確認し、作成したワークスペースに移動します。
ワークスペースの詳細ページに移動すると、左側のナビゲーションウィンドウにすべての PAI 機能が表示されます。 これらの機能を使用して、ビジネス要件に基づいて AI 開発のライフサイクル全体を管理できます。 詳細については、「AI 開発」をご参照ください。

ワークスペースの管理
[ワークスペースの詳細] ページに移動し、管理するワークスペースを入力して、表示されるページの右上隅にある [ワークスペースの構成] をクリックします。
コンピューティングリソースの構成
メンバーとロールの構成
DataWorks スケジューリング設定
イベント通知の構成
ストレージパスの構成
SLS を構成する
全般設定
コンピューティングリソースを表示および関連付ける:
説明
ワークスペースに関連付けられているリソースの関連付けを解除することはできません。 関連付けられているリソースの関連付けを解除するには、アカウントマネージャーにお問い合わせください。

インテリジェントコンピューティング 灵骏 リソース: モデルの開発とトレーニングのためのパフォーマンス専有型 計算資源グループを提供します。これらのリソースは、高パフォーマンス、高効率、高 資源 利用率という利点があります
汎用計算リソース: AI 開発専用の汎用計算リソースを提供し、開発とトレーニングの効率を向上させます。詳細については、「専用のリソースグループを作成し、汎用計算リソースを購入する」をご参照ください。
ACS コンピューティング リソース: ディープラーニング コンテナ (DLC) または Elastic Algorithm Service (EAS) 推論がタスクまたはサービスを開始およびスケジュールするためのリソースを提供します。詳細については、「クラスタ」をご参照ください。
MaxCompute リソース: Machine Learning Designer の特定のアルゴリズムに CPU リソースを提供します。詳細については、「MaxCompute リソースクォータ」をご参照ください。
フルマネージド Flink リソース: PAI での大規模分散モデルのトレーニング用リソースを提供します。詳細については、「Flink リソースクォータ」をご参照ください。
AI 計算リソースの詳細については、「AI 計算リソース」をご参照ください。
複数の RAM ユーザーがワークスペースで開発、管理、または O&M を実行する必要がある場合は、それらのユーザーをワークスペースメンバーとして追加し、メンバーに異なるロールを割り当てる必要があります。 PAI は複数のタイプのロールを提供します。 ロールと権限のマッピングを表示し、ビジネス要件に基づいてメンバーに異なるロールを割り当てることができます。
PAI はリソース管理とスケジューリングメカニズムを提供しており、ワークスペース管理者はビジネス要件に基づいてワークスペース内のリソースを柔軟にスケジュールできます。

説明
ロールドロップダウンリストの ワークスペース以外のメンバー は、管理者によってワークスペースに追加されていないが、Alibaba Cloud アカウントによって関連する RAM 権限が付与されているメンバーを指します。 ワークスペース以外のメンバーもリソースを使用し、ジョブを送信できます。 したがって、これらのメンバーに対して個別の制約を定義できます。
PAI は、ワークスペースの通知メカニズムを提供します。 通知ルールを作成して DLC ジョブとパイプラインジョブのステータスを監視したり、モデルバージョンの承認ステータスに基づいて関連イベントをトリガーしたりできます。
(オプション) 通知ルールを作成するために必要な権限を付与します。
初めて通知ルールを作成する場合は、EventBridge をアクティブ化し、AliyunServiceRoleForPAIWorkspace ロールを PAI ワークスペースにアタッチする必要があります。 手順:
EventBridge をアクティブ化する。
アカウント管理を容易にするために、PAI は各ワークスペースに対して pai-system-${ワークスペース名} 形式で名前が付けられたカスタムイベントバスを自動的に作成します。 EventBridge コンソール にログインし、ワークスペースが存在するリージョンに切り替えて、カスタムイベントバスを管理できます。
[今すぐ承認] をクリックして、必要な権限を付与します。
この場合、システムはサービスロール AliyunServiceRoleForPAIWorkspace を自動的に作成します。 サービスロールの詳細については、「付録: サービスロール AliyunServiceRoleForPAIWorkspace」をご参照ください。

次のコードを使用して、カスタムポリシーを作成し、ポリシーを RAM ユーザーにアタッチします。
{
"Statement": [{
"Effect": "Allow",
"Action": [
"eventbridge:CreateEventBus",
"eventbridge:GetEventBus",
"eventbridge:DeleteEventBus",
"eventbridge:ListEventBuses",
"eventbridge:CreateRule",
"eventbridge:GetRule",
"eventbridge:UpdateRule",
"eventbridge:EnableRule",
"eventbridge:DisableRule",
"eventbridge:DeleteRule",
"eventbridge:ListRules",
"eventbridge:PutEvents",
"eventbridge:UpdateTargets",
"eventbridge:DeleteTargets",
"eventbridge:ListTargets"
],
"Resource": "acs:eventbridge:*:*:eventbus/*"
}],
"Version": "1"
}
イベント通知ルールを作成します。

パラメーター | 説明 |
イベントタイプ | サポートされているイベントタイプ: パイプラインジョブ: Machine Learning デザイナーのパイプラインジョブ。 イベントタイプドロップダウンリストの有効な値: ジョブの失敗とジョブの完了 (成功または失敗)。 DLC ジョブ: DLC ジョブ。 イベントタイプドロップダウンリストの有効な値: ジョブの進捗状況 (キューへの入力、入札の開始、実行の開始、ジョブの失敗を含む)、自動フォールトトレランス、ジョブのタイムアウト (DataWorks スケジューリング設定 でタイムアウトルールを構成する必要があります)、およびその他のイベント (ジョブのプリエンプトとジョブの手動停止を含む)。 モデル: AI コンピューティングアセット管理に登録されているモデル。 イベントタイプドロップダウンリストの有効な値: バージョンの承認とバージョンのステータスの変更 (承認または拒否)。 バージョンの承認を選択した場合、モデルの承認ステータスが保留から承認に変更されると、システムはイベント通知を送信します。
|
イベントターゲット | DingTalk 通知: Webhook と署名の追加パラメーターを構成する必要があります。 詳細については、このトピックの「付録: Webhook URL とキーを取得する」セクションをご参照ください。 [接続テスト] をクリックして、構成されたコンテンツが有効かどうかを確認できます。 HTTPS/HTTP: このオプションは、イベントタイプをモデルに設定した場合にのみ使用できます。 URL パラメーターを指定した HTTP または HTTPS 操作の URL に設定する必要があります。 モデルバージョンのステータスが変更されると、システムは指定された HTTP または HTTPS 操作を呼び出します。 指定された操作は、仕様テンプレートに基づいて解析する必要があることに注意してください。 音声通話: このオプションは、イベントタイプをパイプラインジョブまたは DLC ジョブに設定した場合にのみ使用できます。 連絡先を構成する必要があります。 連絡先がない場合は、通知を構成できます。 詳細については、「通知を構成するにはどうすればよいですか?」をご参照ください。 ショートメッセージ: 構成方法は音声通話と同じです。 メール: 構成方法は音声通話と同じです。
重要 デフォルトでは、単一のイベントルール内のイベントターゲットの数は 5 です。 クォータが要件を満たしていない場合は、クォータを申請できます。 要求されるイベントターゲットの数は 100 を超えないようにすることをお勧めします。 注: 音声通話、ショートメッセージ、およびメールによる方法を構成する場合、追加する連絡先ごとにクォータが使用されます。 連絡先は重複排除されずに累積されます。 たとえば、連絡先 Alice と Tony がショートメッセージによる方法に追加され、Alice と Alan がメールによる方法に追加された場合、合計クォータは 4 になります。 |
付録: Webhook URL とキーを取得する
目的の DingTalk グループを見つけ、次の図に示されている手順に従って、DingTalk チャットボットを追加します。
次の図に示されている手順に従って、[ロボットの追加] ダイアログ ボックスを開きます。
[ロボットの追加] ダイアログボックスで、次の図に示すパラメーターを構成し、キーをコピーして、[完了] をクリックします。
重要
コピーしたキーを後で使用するためにコンピューターに保存します。

[ロボットの追加] ダイアログボックスで、Webhook URL の右側の [コピー] と [完了] をクリックします。
重要
Webhook URL を後で使用するためにコンピューターに保存します。

手順 3 と 4 で取得したキーと Webhook URL は、イベント通知の構成 タブのイベントルール作成パネルにある、[追加署名] パラメーターと [webhook] パラメーターの値です。
ワークスペースのデフォルトのストレージパスを指定する必要があります。

モデルのトレーニング中に生成される一時データとモデルを保存するために、ワークスペースのデフォルトのストレージパスを指定することをお勧めします。これにより、データを一元管理できます。
Machine Learning Designer で [パイプラインストレージパス] も指定した場合、パイプラインの実行時には、指定された [パイプラインストレージパス] がワークスペースのデフォルトのストレージパスよりも優先されます。
現在のワークスペースの Data Science Workshop(DSW)インスタンスおよび DLC タスクで生成されたログを、カスタム分析のために Simple Log Service に送信できます。

パラメータ | 説明 |
SLS プロジェクト | リソースを分離および管理するために使用される Simple Log Service のプロジェクト。プロジェクトがない場合は、プロジェクトを作成することができます。 |
ログストア | ログを収集、保存、およびクエリするために使用される Simple Log Service のログストア。ログストアがない場合は、ログストアを作成することができます。 |
SLS ストレージが必要なモジュール | サポートされているオプション:Deep Learning Containers(DLC)および Interactive Modeling(DSW)。 |
このタブでは、機能の有効化と無効化、および DLC タスクのノード コンテナーへのアクセス権限を制御できます。 また、このタブには、SSH を使用して DSW インスタンスに接続するためのスイッチと、インターネット経由で DSW インスタンスにアクセスするためのスイッチも用意されています。 これにより、インスタンスへのユーザー アクセスの柔軟性とセキュリティが向上します。

よくある質問
ワークスペースを作成するときに「名前はすでに存在します。」というエラーメッセージが表示された場合はどうすればよいですか?
ワークスペース名がすでに存在するというメッセージが表示されても、PAI コンソール ワークスペース リストにワークスペースが見つからない場合は、DataWorks コンソールに同じ名前のワークスペースがすでに存在している可能性があります。PAI と DataWorks はワークスペースを共有します。そのため、ワークスペース名が確実に一意になるように名前を変更することをお勧めします。