このトピックでは、nvidia-smi -pm 1
コマンドを実行して有効にした永続化モード (永続化-M) が有効にならず、新しいバージョンのTeslaドライバーをインストールするGPU高速化コンピューティング最適化インスタンスを再起動した後に、elastic compute container (ECC) ステータスまたはマルチインスタンスGPU (MIG) 機能の設定に失敗する問題を解決する方法について説明します。, 535以降など。
問題の説明
Teslaドライバー535をGPUアクセラレーションコンピューティング最適化Linuxインスタンスにインストールし、nvidia-smi -pm 1
コマンドを実行して永続モードを有効にします。 その結果、次の問題が発生する可能性があります。
GPUアクセラレーションコンピューティング最適化インスタンスを再起動すると、永続モードは
オフ
状態になります。これは、永続モードが無効になっていることを示します。ECCステータスの設定に失敗しました。
MIG機能の設定に失敗しました。
原因
Teslaドライバーのバージョンがインスタンスと互換性がありません。 nvidia-smi -pm 1
コマンドを実行して永続化モードを有効にし、GPU高速化コンピューティング最適化インスタンスを再起動すると、前述の問題が発生する可能性があります。
解決策
dmesgログに次の情報が含まれている場合は、NVIDIA Persistence Daemonを使用してPersistence Modeを有効にします。 詳細については、「GPU-accelerated compute-optimized LinuxインスタンスにTeslaドライバーを手動でインストールする」トピックの「ステップ2: Teslaドライバーをインストールする」セクションの「NVIDIA Persistence-Mを使用してNVIDIA Persistence Daemonを有効にする」ステップを参照してください。
NVRM: 永続モードは廃止され、将来のリリースで削除される予定です。 代わりにnvidia-persistencedを使用してください。