すべてのプロダクト
Search
ドキュメントセンター

Elastic GPU Service:GPUアクセラレーションインスタンスの再起動後に有効にした永続モードが有効にならず、ECCステータスまたはMIG機能の設定に失敗した場合はどうすればよいですか。

最終更新日:Sep 13, 2024

このトピックでは、nvidia-smi -pm 1コマンドを実行して有効にした永続化モード (永続化-M) が有効にならず、新しいバージョンのTeslaドライバーをインストールするGPU高速化コンピューティング最適化インスタンスを再起動した後に、elastic compute container (ECC) ステータスまたはマルチインスタンスGPU (MIG) 機能の設定に失敗する問題を解決する方法について説明します。, 535以降など。

問題の説明

Teslaドライバー535をGPUアクセラレーションコンピューティング最適化Linuxインスタンスにインストールし、nvidia-smi -pm 1コマンドを実行して永続モードを有効にします。 その結果、次の問題が発生する可能性があります。

  • GPUアクセラレーションコンピューティング最適化インスタンスを再起動すると、永続モードはオフ状態になります。これは、永続モードが無効になっていることを示します。

  • ECCステータスの設定に失敗しました。

  • MIG機能の設定に失敗しました。

原因

Teslaドライバーのバージョンがインスタンスと互換性がありません。 nvidia-smi -pm 1コマンドを実行して永続化モードを有効にし、GPU高速化コンピューティング最適化インスタンスを再起動すると、前述の問題が発生する可能性があります。

解決策

dmesgログに次の情報が含まれている場合は、NVIDIA Persistence Daemonを使用してPersistence Modeを有効にします。 詳細については、「GPU-accelerated compute-optimized LinuxインスタンスにTeslaドライバーを手動でインストールする」トピックの「ステップ2: Teslaドライバーをインストールする」セクションの「NVIDIA Persistence-Mを使用してNVIDIA Persistence Daemonを有効にする」ステップを参照してください。

NVRM: 永続モードは廃止され、将来のリリースで削除される予定です。 代わりにnvidia-persistencedを使用してください。