全部產品
Search
文件中心

Platform For AI:建立DSW執行個體

更新時間:Oct 17, 2024

互動式建模(DSW)是PAI產品的雲端機器學習開發IDE,為您提供互動式編程環境。在使用DSW前,您需要建立DSW執行個體。本文為您介紹如何建立DSW執行個體。

背景資訊

通過控制台建立執行個體適用於普通開發人員,您可以通過控制台管理執行個體,例如,在DSW中進行模型開發的開發人員。

前提條件

  • 如果是首次使用DSW,則需要對相關資源進行訪問授權,具體操作請參見雲產品依賴與授權:DSW

  • 已準備好DSW執行個體運行所需的通用計算資源或靈駿智算資源。

  • (可選)已建立完成NAS或OSS類型資料集。具體操作,請參見建立及管理資料集

    重要

    如果為DSW執行個體添加OSS或NAS類型的資料集,則需要授權PAI訪問相關雲產品OSS或NAS的許可權,否則讀取或寫入資料失敗。具體操作,請參見PAI訪問雲產品授權:OSS與NAS

    • 當使用公用資源群組建立DSW執行個體時,DSW為您提供的預設雲端硬碟儲存空間有限,您可以通過掛載資料集或付費擴容雲端硬碟來擴充執行個體儲存空間。

    • 當使用專有資源群組建立DSW執行個體時,DSW執行個體則提供非持久化的本機存放區,您可以通過掛載資料集來實現持久化儲存。

使用限制

由於每個阿里雲帳號(主帳號)在每個Region有2卡GPU的限制,當資源使用量超出限額時可能會出現報錯。如果您需要提升限額,請提交工單聯絡我們。

建立執行個體

通過控制台建立執行個體

  1. 進入DSW頁面。

    1. 登入PAI控制台

    2. 概覽頁面選擇目標地區。

    3. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。

    4. 在工作空間頁面的左側導覽列選擇模型開發與訓練 > 互動式建模(DSW),進入DSW頁面。

  2. 單擊建立執行個體

  3. 配置執行個體嚮導頁面,配置以下關鍵參數。

  4. 參數

    描述

    基礎資訊

    執行個體名稱

    參考介面提示資訊配置DSW執行個體名稱。

    資源資訊

    資源配額

    支援選擇:

    • 預設為通用訓練資源公用資源群組,支援選擇CPU規格GPU規格。在配置執行個體嚮導頁面,您可以查看並選擇建立DSW執行個體支援使用的規格類型。關於各規格類型的指標資料的更多詳細介紹,請參見執行個體規格類型系列

    • 支援使用通用訓練資源專有資源群組來建立執行個體。如果沒有可選的專有資源群組,您可以單擊關聯資源配額,為該工作空間關聯通用訓練資源專有資源群組。

    • 支援使用靈駿智算資源來建立執行個體。如果沒有可選的靈駿智算資源,您可以單擊關聯資源配額,為該工作空間關聯靈駿智算資源。

    說明

    當選擇通用訓練資源專有資源群組或靈駿智算資源群組建立DSW執行個體時,還需要設定以下參數:

    • 優先順序: 優先順序範圍為1~9 ,數值越大,優先順序越高。

    • CPU親和性:啟用CPU親和性,能夠將容器或Pod中的進程綁定到特定的CPU核心上執行。通過這種方式,可以減少CPU緩衝未命中、環境切換等現象,從而提高CPU利用率,提升應用效能,適用於對效能敏感和即時性要求高的情境。當前僅華北2(北京)、華南1(深圳)地區支援配置該參數。

    資源規格

    • 資源配額選擇公用資源群組時,根據實際需求選擇CPU、GPU或者免費試用的資源規則。

    • 資源群組選擇專有資源群組時,根據實際需求設定GPU、CPU、GiB和優先順序。

    環境資訊

    鏡像

    支援選擇以下鏡像:

    • 官方鏡像:預置的官方鏡像,覆蓋Python、TensorFlow和PyTorch的多個版本。

    • 自訂鏡像:支援選擇已建立的自訂鏡像。關於如何添加自訂鏡像,詳情請參見自訂鏡像

    • 鏡像地址:輸入公用可訪問的鏡像公網地址,以使用該鏡像。您也可以直接填入當前Region下ACR個人版中鏡像的公網地址。

    系統硬碟

    • 資源配額選擇公用資源群組時:

      • 系統硬碟:為每個隨用隨付執行個體免費贈送100 GiB雲端硬碟作為持久化儲存,如果該執行個體停機超過15天未開機,雲端硬碟的內容將被清空。如果免費贈送的雲端硬碟不滿足您的業務需求,您可以對雲端硬碟進行擴容,具體擴容價格以控制台介面為準。

        警告
        • 擴容後不支援縮容,請按需操作擴容。

        • 擴容後整塊系統硬碟(免費+付費)後,不再受到停機15天釋放的限制,但會持續產生費用。

        • 執行個體刪除系統硬碟同步銷毀,刪除前請確保必要資料備份。

      • 掛載配置:由於預設提供的雲端硬碟儲存空間有限,您可以單擊添加並選擇要掛載的資料集來擴充執行個體儲存空間。目前支援掛載OSS、NAS和CPFS類型的資料集。如果沒有可選的資料集,您可以單擊建立資料集進行建立。關於如何建立資料集,詳情請參見建立及管理資料集

    • 資源配額選擇專有資源群組時:

      執行個體內建的系統硬碟用於臨時儲存,在停止或刪除執行個體後,儲存將被清空。如果需要非揮發性儲存體,可以在資料集右側單擊添加並選擇已建立的資料集進行掛載,或在掛載配置右側單擊添加並選擇OSS路徑進行掛載。

      如果沒有可選的資料集,您可以單擊建立資料集進行建立。關於如何建立資料集,詳情請參見建立及管理資料集

    說明
    • 多個資料集掛載的路徑不能重複。

    • 如果配置了CPFS類型的資料集,則需要設定網路設定,且選擇的專用網路需要與CPFS一致。否則,DSW執行個體可能會建立失敗。

    • 當資源群組選擇專有資源群組時,第一個資料集必須選擇NAS類型資料集,且會被同時掛載到您指定的路徑和DSW預設工作目錄/mnt/workspace/下。

    資料集

    單擊添加,可掛載已建立的自訂資料集,其中,OSS類型的自訂資料集支援多種掛載模式和自訂配置,公用資料集只支援唯讀掛載模式。

    掛載配置

    單擊添加,可直接掛載OSS路徑,OSS支援多種掛載模式和自訂配置。

    工作目錄

    工作目錄是JupyterLab、WebIDE的啟動路徑,掛載至/mnt/workspace

    網路資訊

    專用網路配置

    僅當資源配額選擇公用資源時,支援配置該參數。

    不同情境的配置策略詳情,請參見DSW網路設定

    同時配置專用網路交換器安全性群組,可以在VPC內使用DSW。您可以直接選擇已經建立的專用網路進行掛載,或者單擊專用網路後的建立專用網路進行建立。

    公網訪問網關

    • 公網訪問網關支援以下配置方法:

      • 公有網關:叢集中的DSW執行個體使用共用的公網頻寬,在使用者高並發時下載速度會比較慢。

      • 專有網關:獨享頻寬,您可以根據需求選擇不同的頻寬。選擇該方式後,您需要為DSW執行個體關聯的專用網路建立公網NAT Gateway、綁定EIP並配置SNAT條目。具體配置方法,請參見DSW通過專有公網網關訪問公網

    • 僅當掛載配置選擇CPFS類型的資料集時,支援配置以下參數:

      • 啟用所有選項:預設為關閉,系統會禁用與CPFS類型的資料集不通的專用網路。

      • 隱藏禁用選項:選中複選框,系統會隱藏與CPFS類型的資料集不通的專用網路。

      說明

      如果掛載配置選擇了CPFS類型的資料集,則需要配置專用網路,且選擇的專用網路需要與CPFS一致。

    SSH配置

    啟用SSH

    選擇專用網路後可配置SSH。

    啟用後您可基於已選專用網路,使用SSH原生方式直連登入DSW執行個體。 若您配置了自訂鏡像,請確認自訂鏡像安裝了sshd。

    SSH公開金鑰

    開啟SSH配置開關後可配置該參數。

    說明

    如果您需要同時支援VPC內登入和公網登入方式,您需要同時添加多個用戶端的公開金鑰。請按照斷行符號換行的方式逐個添加公開金鑰,最多支援添加10個公開金鑰。

    登入方式

    開啟SSH配置開關後可配置該參數。

    • VPC內登入:預設支援該登入方式。您可以從VPC內的其他終端(例如ECS),通過SSH遠端連線DSW執行個體。

    • 公網登入:您可以在支援VPC內登入的基礎上,增加公網登入方式。選中公網登入,並配置以下參數,後續,您可以通過本地命令列或其他終端使用SSH遠端連線到DSW執行個體。

      • NAT Gateway:選擇為專用網路建立的公網NAT Gateway。

      • Elastic IP Address:選擇在公網NAT Gateway中已建立的Elastic IP Address。

    進階資訊

    可見範圍

    可選擇僅執行個體所有者可見工作空間內公開可見

    執行個體所有者

    僅工作空間管理員可修改執行個體所有者。

    執行個體RAM角色

    執行個體RAM角色允許您將一個角色關聯到DSW執行個體,在執行個體內部基於STS(Security Token Service)臨時憑證訪問其他雲產品的API,臨時憑證將周期性更新。即可以保證雲帳號AccessKey安全,還可以藉助存取控制RAM實現精細化控制和許可權管理。

    執行個體RAM角色包括:PAI預設角色自訂角色不關聯角色

    更多關於執行個體RAM角色的配置說明,請參見配置DSW執行個體RAM角色

  5. 確認所選配置無問題後,單擊確定

相關文檔

  • 建立執行個體後,您可以準備開發所需要的資料檔案。DSW支援接入多種資料來源,包括OSS、NAS和MaxCompute,詳情請參見讀寫資料;同時,還提供了資料上傳和下載功能,適用於小資料量的檔案傳輸,詳情請參見上傳與下載資料檔案

  • DSW的功能特點、使用流程、快速入門等,詳情請參見什麼是DSW

  • 關於DSW的使用案例,詳情請參見DSW使用案例匯總