すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:リソースクォータの管理

最終更新日:Jul 22, 2024

作成したリソースクォータを管理できます。 たとえば、リソースクォータの詳細を表示したり、リソースクォータをスケールアップおよびスケールダウンしたり、子レベルのリソースクォータを追加したりできます。

リソースクォータの詳細の表示

  • Platform for AI (PAI) コンソールの [リソースクォータ] ページに移動します。 既存のリソースクォータは、[Intelligent Computing Lingjun Resources] タブと [General Computing Resources] タブで表示できます。 image

    • リソースクォータ名、リソースクォータID、およびワークスペースIDを使用して、リソースクォータをフィルタリングできます。

    • リソースの割り当てと使用状況を監視するために、CPU、メモリ、GPUなどのリソースの合計またはスケジュールされた量に基づいてリソースクォータをソートできます。

    • [更新] アイコンをクリックすると、ステータス、スケジュールされた量、およびリソースクォータの合計量に関する更新情報を取得できます。

  • リソースクォータの詳細を表示するには、リソースクォータ名をクリックします。

    image

    • vCPU、メモリ (TiB) 、およびGPUのスケジュールされた量を含む、リソースクォータの詳細を表示できます。 リソースの合計量、現在レベルおよび子レベルのリソースの消費量を表示して、リソースの使用状況を完全に把握できます。

    • リソースクォータの詳細は、[概要][ノード][ジョブ][ユーザー][モニタリング] 、および [トポロジ] タブで表示できます。

概要

リソースクォータの詳細ページで、[概要] タブをクリックして、リソースクォータの基本情報、リソース情報、ネットワーク情報、およびリソース変更履歴を表示できます。 image

次の設定を変更できます。

  • 基本情報の更新

    アイコンをクリックしimageて、リソースクォータ名、リソースクォータが属するワークスペース、またはタグを更新します。 リソースクォータをワークスペースに関連付けた後、ワークスペースでリソースクォータを使用できます。 ワークスペースのスケジューリングセンターに移動し、ワークスペースに関連付けられているリソースクォータのリソース使用ポリシーを設定できます。 このポリシーには、リソースクォータを使用するPAIモジュール、リソースクォータの使用が許可されているロール、GPU、およびリソース仕様テンプレートが含まれます。 詳細については、「Workspaceスケジューリングセンター」をご参照ください。

  • リソース情報の更新

    • スケジューリングポリシーを変更するには、imageスケジューリングポリシーの横にあるアイコンをクリックします。 各スケジューリングポリシーの原則については、「スケジューリングポリシー」をご参照ください。

    • [Preempt Child-level Resources] 機能を有効または無効にします。 この機能を有効にすると、現在のリソースクォータで実行されるディープラーニングコンテナ (DLC) ジョブは、子レベルのリソースクォータで実行されるDLCジョブのコンピューティングリソースをプリエンプトすることができます。

  • リソース変更履歴の表示

    [リソース変更履歴] セクションでは、リソースクォータの作成、スケーリング、および削除の操作記録を表示できます。

ノード

リソースクォータの詳細ページで、[ノード] タブをクリックして、リソースクォータのノード仕様を表示できます。 image

  • ノード管理

    ノードを管理するには、ノードの [操作] 列で [スケジューリングの停止] または [ノードのクリア] をクリックします。 スケジューリングを停止すると、システムはノードへのジョブの割り当てを停止し、リソース消費を一時停止します。

  • その他の一般的な関数

    • ノードから作成されたジョブとインスタンスの合計数は、[タスク数] および [インスタンス数] 列に表示されます。 [タスク数] または [インスタンス数] 列の [詳細] をクリックして、ジョブとインスタンスの詳細を表示します。

    • ノードステータスでノードをフィルタリングするか、アイコンをクリックしてimageノードを並べ替えることができます。

仕事

リソースクォータの詳細ページで、[ジョブ] タブをクリックして、現在レベルおよび子レベルのリソースクォータを使用して作成されたジョブを表示できます。 image

[現在のリソースクォータの表示] スイッチをオンにすると、現在のリソースクォータを使用して作成されたジョブを表示できます。

ユーザー

リソースコウトのページの詳細は, ユーザーのタブをクリックできる.

image

ユーザーの定期 VCPU, メモリ, GPUのリソースを見ることができる. ユーザーが送信したジョブの総数を表示することもできます。 [タスク数] 列の [詳細] をクリックすると、ジョブの詳細が表示されます。

モニタリング

リソースコウトのページの詳細は, リソース利用とメトリックデータを見るためにモニタブをクリックできる. image

  • モニタリングディメンションを選択できます。 有効な値: クォータおよびノードディメンション。 image

  • 時間範囲を選択できます。 有効な値: image

  • デナビッドは, 各ロールで表示されるメトリックの数を設定できる: image

モニタリング指標のアラートルールを設定し、アラート通知を有効にすることができます。 リソース使用量が変動すると、アラート通知が送信されます。 詳細については、「リソースクォータのモニタリングとアラート」をご参照ください。

トポロジ

リソースクォータの詳細ページで、[トポロジ] タブをクリックして、リソースビューとタスクビューを表示できます。 各ノードのリソース使用量をリアルタイムで監視できます。 これにより、リソース割り当てポリシーを調整し、リソース使用率を改善できます。 image

意見の差別をしている.

  • リソースビューでは、現在レベルおよび子レベルのリソースクォータのvCPU、メモリ、およびGPUリソースの割り当てを詳細に表示できます。

  • タスクビューでは、現在レベルと子レベルのリソースクォータを使用して作成されたジョブの総数と、各ステータスのジョブ数を表示できます。

リソースクォータのスケールアップまたはスケールダウン

現在のジョブボリュームに基づいてリソースクォータのサイズを調整して、効果的なコスト管理を実装できます。 [リソースクォータ] ページで、管理するリソースクォータを見つけ、[操作] 列の [スケール] をクリックします。 表示されるページで、[ソース] および [仕様 /リソース] パラメーターを変更します。

  • スケールアップ: リソースクォータにリソースを追加し、リソースプール内の異なる仕様のリソースを同じリソースクォータに統合します。

  • スケールダウン: 関連するリソース仕様のノード数を減らすか、リソースクォータから特定の仕様を削除します。

子ども追加

子リソースクォータを追加して、きめ細かいリソース管理を実装し、割り当てポリシーを最適化し、リソース使用効率を向上させることができます。

[リソースクォータ] ページで、管理するリソースクォータを見つけ、[操作] 列の [新しい子レベルのリソースクォータ] をクリックして、子レベルのリソースクォータをリソースクォータに追加します。 子リソースクォータをワークスペースに関連付け、ワークスペースで子レベルのリソースクォータを使用できます。