すべてのプロダクト
Search
ドキュメントセンター

CloudMonitor:GPU モニタリング

最終更新日:May 15, 2024

CloudMonitorをGPU高速化コンピューティング最適化Elastic compute Service (ECS) インスタンスにインストールすると、CloudMonitorはGPUメトリクスを収集します。 メトリックのアラートルールを作成することもできます。 メトリックの値が指定されたアラート条件を満たす場合、アラートがトリガーされ、CloudMonitorがアラート通知を送信します。 これにより、メトリックのステータスをリアルタイムで監視できます。

前提条件

GPUメトリック

GPU、インスタンス、およびアプリケーショングループに基づいてGPUメトリックを表示できます。 次の表に、GPUメトリックを示します。

メトリック

ユニット

MetricName

寸法

(エージェント) gpu_decoder_utilization

%

gpu_decoder_utilization

userId、instanceId、およびgpuId

(エージェント) gpu_encoder_utilization

%

gpu_encoder_utilization

userId、instanceId、およびgpuId

(エージェント) gpu_gpu_temperature

°C

gpu_gpu_temperature

userId、instanceId、およびgpuId

(エージェント) gpu_gpu_usedutilization

%

gpu_gpu_usedutilization

userId、instanceId、およびgpuId

(エージェント) gpu_memory_freespace

Byte

gpu_memory_freespace

userId、instanceId、およびgpuId

(エージェント) gpu_memory_freeutilization

%

gpu_memory_freeutilization

userId、instanceId、およびgpuId

(エージェント) gpu_memory_userdspace

Byte

gpu_memory_usedspace

userId、instanceId、およびgpuId

(エージェント) gpu_memory_usedutilization

%

gpu_memory_usedutilization

userId、instanceId、およびgpuId

(エージェント) gpu_power_readings_power_draw

W

gpu_power_readings_power_draw

userId、instanceId、およびgpuId

CloudMonitorコンソールでのGPUメトリックデータの表示

  1. にログインします。CloudMonitorコンソール.

  2. 左側のナビゲーションウィンドウで、[クラウドサービスモニタリング] > [ホストモニタリング] をクリックします。

  3. [ホストモニタリング] ページで、ホスト名をクリックするか、ホストの [操作] 列で [モニタリングチャート] をクリックします。

  4. をクリックし、GPUモニタリングタブをクリックします。

    [GPUMonitor] タブで、GPUメトリックのモニタリングチャートを表示します。

    ホストのGPUメトリックを表示できます。 特定のGPUメトリクスのアラートルールを設定し、アラートを表示することもできます。 詳細については、「手順2: ホストのアラートルールの作成」および「手順3: ホストアラートの表示」をご参照ください。

参考資料