全部產品
Search
文件中心

Elastic GPU Service:升級Tesla或GRID驅動

更新時間:Feb 26, 2025

如果您的NVIDIA Tesla或NVIDIA GRID驅動版本已不適用於當前情境,或者您安裝了錯誤的驅動類型或版本導致GPU執行個體無法使用,您可以通過卸載當前驅動再安裝所需驅動的方式,完成Tesla或GRID驅動的升級操作。

升級NVIDIA Tesla驅動

升級Tesla驅動時,需要先卸載相應的Tesla驅動,然後再根據需要安裝的驅動類型和作業系統,重新安裝新的Tesla驅動。

  1. 卸載當前Tesla驅動。

    具體操作,請參見卸載Tesla驅動

  2. 安裝新的Tesla驅動。

升級NVIDIA GRID驅動

確認是否需要升級GRID驅動

升級GRID驅動前,請先判斷當前執行個體的GRID驅動是否需要升級,然後再根據實際情況選擇對應的升級方式。

  • Windows系統GPU虛擬化型執行個體(vgn6i-vws、vgn7i-vws、sgn7i-vws)

    • 如果執行個體的當前GRID驅動版本號碼不是474.04,則您需要將當前驅動升級到SWL驅動。

    • 如果執行個體的當前GRID驅動版本號碼是474.04,則您需要通過查看License Status判斷是否需要升級驅動。具體操作如下:

      1. 登入Windows系統GPU虛擬化型執行個體(例如vgn7i-vws)。

        具體操作,請參見通過密碼或密鑰認證登入Windows執行個體

      2. 開啟cmd,依次執行以下命令,查看當前驅動License Status。

        cd C:\Program Files\NVIDIA Corporation\NVSMI 
        nvidia-smi.exe -q | findstr License

        輸出結果如下所示,表示當前驅動的License未到期,此時您無需將當前驅動升級到SWL驅動,否則您需要將當前驅動升級到SWL驅動。具體操作,請參見通過雲助手升級GRID驅動

        vgpu-License.png

  • Windows系統GPU計算型執行個體(gn7i、gn6i、ebmgn7i、ebmgn6i)

    您可以通過查看License Status判斷是否需要升級驅動。具體操作如下:

    1. 登入Windows系統GPU計算型執行個體(例如gn7i)。

      具體操作,請參見通過密碼或密鑰認證登入Windows執行個體

    2. 開啟cmd,依次執行以下命令,查看當前驅動License Status。

      cd C:\Program Files\NVIDIA Corporation\NVSMI 
      nvidia-smi.exe -q | findstr License
      • 如果輸出結果如下圖所示,表示當前驅動的License未到期,此時您需要繼續執行下一步。

      • 如果輸出結果非下圖所示,表示當前驅動的License已到期,此時您需要將當前驅動升級到SWL驅動。具體操作,請參見通過雲助手升級GRID驅動

        vgpu-License-windows.png

    3. (可選)執行以下命令,查看License類型是否為NVIDIA RTX Virtual Workstation。

      如果當前驅動的License未到期,您需要繼續確認License類型是否為NVIDIA RTX Virtual Workstation。

      nvidia-smi.exe -q | findstr Product
      • 如果輸出結果如下圖所示,表示當前驅動License類型為NVIDIA RTX Virtual Workstation,此時您無需將當前驅動升級到SWL驅動。

      • 如果輸出結果非下圖所示,表示當前驅動License類型不是NVIDIA RTX Virtual Workstation,此時您需要將當前驅動升級到SWL驅動。具體操作,請參見通過雲助手升級GRID驅動

        vWS.png

  • Linux系統GPU虛擬化型執行個體(vgn6i-vws、vgn7i-vws、sgn7i-vws)

    • 如果執行個體已安裝的GRID驅動版本號碼不是470.161.03,則需要升級驅動。

    • 如果執行個體已安裝的GRID驅動版本號碼是470.161.03,則您需要通過查看License Status判斷是否需要升級驅動。具體操作如下:

      1. 登入Linux系統GPU虛擬化型執行個體(例如vgn7i-vws)。

        具體操作,請參見通過密碼或密鑰認證登入Linux執行個體

      2. 執行以下命令,查看當前驅動License Status。

        # nvidia-smi -q |grep -i license

        輸出結果如下所示,表示當前驅動的License未到期,此時您無需將當前驅動升級到SWL驅動,否則您需要將當前驅動升級到SWL驅動。具體操作,請參見通過雲助手升級GRID驅動

        vgpu-License-linux.png

  • Linux系統GPU計算型執行個體(gn7i、gn6i、ebmgn7i、ebmgn6i)

    因為該執行個體不需要使用GRID驅動也可以支援圖形加速功能,僅使用NVIDIA官網驅動即可,您無需將當前驅動升級到SWL驅動。

通過雲助手升級GRID驅動

升級GRID驅動(Windows)

適用執行個體

僅以下Windows GPU執行個體規格類型系列支援通過雲助手升級GRID驅動:

  • Windows系統GPU虛擬化型執行個體:vgn6i-vws、vgn7i-vws、sgn7i-vws

  • Windows系統GPU計算型執行個體:gn7i、gn6i、ebmgn7i、ebmgn6i

操作步驟

下文以一台華東1(杭州)地區的vgn6i-vws執行個體(ecs.vgn6i-m4-vws.xlarge)為例。

  1. 登入ECS管理主控台

  2. 在左側導覽列,選擇營運與監控 > 雲助手

  3. 在頁面左側頂部,選擇目標資源所在的地區。

    地區.png

  4. ECS執行個體頁簽下的執行個體列表,選擇目標執行個體,單擊對應操作欄下的執行命令

    ECS執行命令.png

  5. 通過建立並執行雲助手命令升級GRID驅動。

    1. 建立執行命令面板的命令資訊地區,完成參數配置。

      主要參數配置項如下所示,其他參數保持預設,更多資訊,請參見命令參數(控制台操作)

      重要

      參數取值必須按照下文提供的取值來設定,否則可能會導致雲助手執行失敗。

      建立命令.png

      • 命名類型:支援選擇Bat和Power Shell兩種命令類型。取值:PowerShell

      • 命令內容:編輯或者粘貼您的命令。樣本如下:

        $InstalledPlugins = $(acs-plugin-manager --list --local)
        if ($($InstalledPlugins | Select-String "grid_driver_install"))
           {
             acs-plugin-manager --remove --plugin grid_driver_install
           } 
        acs-plugin-manager --fetchTimeout 0 --exec --plugin grid_driver_install
        說明

        如果您的執行個體為Windows系統GPU計算型執行個體(例如gn7i),則雲助手命令樣本如下:

        $InstalledPlugins = $(acs-plugin-manager --list --local)
        if ($($InstalledPlugins | Select-String "gpu_grid_driver_install"))
           {
             acs-plugin-manager --remove --plugin gpu_grid_driver_install
           } 
        acs-plugin-manager --fetchTimeout 0 --exec --plugin gpu_grid_driver_install
      • 逾時時間:設定命令在執行個體中的逾時時間,當執行命令的任務逾時後,雲助手將強制終止任務進程。取值:600

        說明

        逾時時間僅支援設定為正整數,單位為秒,取值範圍:10~86,400秒(24小時),預設值為60秒。

    2. 單擊執行,通過雲助手命令升級GRID驅動。

      雲助手命令執行完成後,在執行詳情頁查看如下資訊(即舊版GRID驅動需要卸載後才能升級),表示執行個體已安裝舊版GRID驅動。

      提示.png

      您需要通過雲助手命令先卸載當前已安裝的舊版GRID驅動,然後必須重啟執行個體,再執行一次相同的雲助手命令才能繼續升級GRID驅動。具體操作如下:

      重要

      卸載或重新安裝GRID驅動大概需要5~10分鐘完成,請您耐心等待。

      1. 重啟GPU執行個體。

        具體操作,請參見重啟執行個體

      2. 再次執行相同的雲助手命令重新安裝新的GRID驅動。

        通過雲助手命令自動安裝新的GRID驅動後,您可以在執行詳情頁查看執行結果。

        重新安裝.png

  6. 驗證升級的GRID驅動是否生效。

    1. 重啟GPU執行個體。

      具體操作,請參見重啟執行個體

    2. 遠端連線GPU執行個體。

      具體操作,請參見通過密碼或密鑰認證登入Windows執行個體

    3. 在登入頁面空白處,按右鍵並開啟NVIDIA 控制台

      顯示結果如下所示,表示安裝的新GRID驅動已生效。

升級GRID驅動(Linux)

適用執行個體

僅以下Linux GPU執行個體規格類型系列支援通過雲助手升級GRID驅動:vgn6i-vws、vgn7i-vws、sgn7i-vws

操作步驟

下文以一台華東1(杭州)地區的vgn6i-vws執行個體(ecs.vgn6i-m4-vws.xlarge )為例。

  1. 登入ECS管理主控台

  2. 在左側導覽列,選擇營運與監控 > 雲助手

  3. 在頁面左側頂部,選擇目標資源所在的地區。

    地區.png

  4. ECS執行個體頁簽下的執行個體列表,選擇目標執行個體,單擊對應操作欄下的執行命令

    linux.png

  5. 建立執行命令面板的命令資訊地區,完成參數配置。

    主要參數配置項如下所示,其他參數保持預設。更多資訊,請參見命令參數(控制台操作)

    重要

    參數取值必須按照下文提供的取值來設定,否則可能會導致雲助手執行失敗。

    linux命令.png

    • 命令類型:選擇Shell

    • ②命令內容:粘貼如下命令。有關Shell命令的樣本,請參見查看執行個體系統配置

      if acs-plugin-manager --list --local | grep grid_driver_install > /dev/null 2>&1
      then
          acs-plugin-manager --remove --plugin grid_driver_install
      fi
      
      acs-plugin-manager --exec --plugin grid_driver_install
    • 逾時時間:命令執行逾時時間。當執行命令的任務逾時後,雲助手將強制終止任務進程。取值:600

      說明

      逾時時間僅支援設定為正整數,單位為秒,取值範圍:10~86,400秒(24小時)。

  6. 單擊執行,通過雲助手命令自動升級GRID驅動。

    執行完成後,您可以在執行詳情頁查看執行結果 。

    重要
    • 如果執行個體已安裝了其他版本的GRID驅動,雲助手會自動卸載目前的版本GRID驅動,並重新安裝最新的SWL GRID驅動。

    • 升級GRID驅動大概需要5~10分鐘完成,請您耐心等待。

    linux安裝成功.png

  7. 遠端連線GPU執行個體。

    具體操作,請參見通過密碼或密鑰認證登入Linux執行個體

  8. 執行以下命令,查看GRID驅動是否升級成功。

    nvidia-smi

    回顯結果顯示如下,表示已成功升級GRID驅動。