CloudMonitorをGPU高速化コンピューティング最適化Elastic compute Service (ECS) インスタンスにインストールすると、CloudMonitorはGPUメトリクスを収集します。 メトリックのアラートルールを作成することもできます。 メトリックの値が指定されたアラート条件を満たす場合、アラートがトリガーされ、CloudMonitorがアラート通知を送信します。 これにより、メトリックのステータスをリアルタイムで監視できます。
前提条件
GPU高速化コンピューティング最適化ECSインスタンスが作成されます。 必要なGPUドライバーがインスタンスにインストールされています。 詳細については、「GPU高速化エラスティックコンテナインスタンスの作成」をご参照ください。
説明GPUドライバーをインストールする前にCloudMonitorエージェントをインストールする場合は、CloudMonitorエージェントを再起動する必要があります。 CloudMonitorエージェントを再起動する方法の詳細については、C ++ のCloudMonitorエージェントを再起動するにはどうすればよいですか。
CloudMonitorエージェントがECSインスタンスにインストールされています。 詳細については、「C ++ 用CloudMonitorエージェントのインストールとアンインストール」をご参照ください。
GPUメトリック
GPU、インスタンス、およびアプリケーショングループに基づいてGPUメトリックを表示できます。 次の表に、GPUメトリックを示します。
メトリック | ユニット | MetricName | 寸法 |
(エージェント) gpu_decoder_utilization | % | gpu_decoder_utilization | userId、instanceId、およびgpuId |
(エージェント) gpu_encoder_utilization | % | gpu_encoder_utilization | userId、instanceId、およびgpuId |
(エージェント) gpu_gpu_temperature | °C | gpu_gpu_temperature | userId、instanceId、およびgpuId |
(エージェント) gpu_gpu_usedutilization | % | gpu_gpu_usedutilization | userId、instanceId、およびgpuId |
(エージェント) gpu_memory_freespace | Byte | gpu_memory_freespace | userId、instanceId、およびgpuId |
(エージェント) gpu_memory_freeutilization | % | gpu_memory_freeutilization | userId、instanceId、およびgpuId |
(エージェント) gpu_memory_userdspace | Byte | gpu_memory_usedspace | userId、instanceId、およびgpuId |
(エージェント) gpu_memory_usedutilization | % | gpu_memory_usedutilization | userId、instanceId、およびgpuId |
(エージェント) gpu_power_readings_power_draw | W | gpu_power_readings_power_draw | userId、instanceId、およびgpuId |
CloudMonitorコンソールでのGPUメトリックデータの表示
にログインします。CloudMonitorコンソール.
左側のナビゲーションウィンドウで、
をクリックします。[ホストモニタリング] ページで、ホスト名をクリックするか、ホストの [操作] 列で [モニタリングチャート] をクリックします。
をクリックし、GPUモニタリングタブをクリックします。
[GPUMonitor] タブで、GPUメトリックのモニタリングチャートを表示します。
ホストのGPUメトリックを表示できます。 特定のGPUメトリクスのアラートルールを設定し、アラートを表示することもできます。 詳細については、「手順2: ホストのアラートルールの作成」および「手順3: ホストアラートの表示」をご参照ください。