全部產品
Search
文件中心

Platform For AI:建立DSW執行個體

更新時間:Dec 18, 2024

互動式建模(DSW)是PAI產品的雲端機器學習開發IDE,為您提供互動式編程環境。在使用DSW前,您需要建立DSW執行個體。本文為您介紹如何建立DSW執行個體。

背景資訊

通過控制台建立執行個體適用於普通開發人員,您可以通過控制台管理執行個體,例如,在DSW中進行模型開發的開發人員。

前提條件

  1. 許可權開通

    1. 使用主帳號開通PAI並建立工作空間。登入PAI控制台,左上方選擇開通地區,然後一鍵授權和開通產品,詳情見開通PAI並建立工作空間

    2. 操作帳號授權。當使用主帳號操作DSW執行個體時,可跳過此步。當使用RAM帳號操作時,需要進行操作帳號授權

  2. 【可選】準備專有資源群組

    在完成步驟1後,系統將為您準備好公用資源群組。當您需要使用專有資源群組時,需要購買專有資源並分配資源配額,具體操作可參見下面教程。

  3. 【可選】準備資料集

    公用資源群組和專有資源群組預設資料存放區空間有限,且無法持久化儲存,因此,當您需要擴充執行個體的儲存空間或持久化儲存資料時,可通過掛載NAS、OSS類型資料集或OSS路徑的方式實現。建立資料集,請參見建立及管理資料集

    重要
    • 公用資源群組的DSW執行個體,資料存放區在空間有限的免費雲端硬碟中,在刪除執行個體或停機超過15天后,雲端硬碟資料將被清空。

    • 專有資源群組的DSW執行個體,資料存放區在執行個體的系統硬碟中,在停止或刪除執行個體後,臨時儲存將被清空。

  4. 【可選】自訂鏡像

    DSW預置了多種類型的官方鏡像,例如PyTorch、TensorFlow、ModelScope等。如果您需要自訂鏡像來滿足特定情境下的開發需求,請參見自訂鏡像

使用限制

由於每個阿里雲帳號(主帳號)在每個Region有2卡GPU的限制,當資源使用量超出限額時可能會出現報錯。如果您需要提升限額,請提交工單聯絡我們。

建立執行個體

重要

當您使用公用資源建立執行個體後,將開始按照執行個體的服務時間長度計費,當停止或刪除執行個體後計費才會停止,詳細計費規則,請參見互動式建模(DSW)計費說明

通過控制台建立執行個體

  1. 進入DSW頁面。

    1. 登入PAI控制台

    2. 概覽頁面選擇目標地區。

    3. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。

    4. 在工作空間頁面的左側導覽列選擇模型開發與訓練 > 互動式建模(DSW),進入DSW頁面。

  2. 單擊建立執行個體

  3. 配置執行個體嚮導頁面,配置以下關鍵參數。

  4. 參數

    描述

    基礎資訊

    執行個體名稱

    參考介面提示資訊配置DSW執行個體名稱。

    資源資訊

    資源類型

    支援選擇:

    • 公用資源:目前僅支援隨用隨付模式,無法轉為訂用帳戶

    • 資源配額:可選擇通用訓練資源專有資源群組、靈駿智算資源,如果沒有可選的目標資源,請單擊關聯資源配額進行配置。

    資源類型不同,相關參數配置不同:

    • 資源類型公用資源時,需要設定以下參數:

      • 資源規格:可選擇GPU、CPU或免費試用資源。規格資訊,請參見執行個體規格類型系列

      • 競價購買:當您使用公用資源建立DSW執行個體時,您可以選用競價執行個體(搶佔式執行個體),降低運行成本。詳情請參見競價購買DSW執行個體

        當前僅華東1(杭州)、華北2(北京)、華南1(深圳)、華南3(廣州)、日本(東京)地區支援配置該參數。

    • 資源類型資源配額時,需要設定以下參數:

      • 資源配額:可選擇通用訓練資源專有資源群組、靈駿智算資源。

      • 資源規格:根據實際需求設定GPU、CPU和記憶體等。

      • 優先順序: 優先順序範圍為1~9 ,數值越大,優先順序越高。

      • CPU親和性:啟用CPU親和性,能夠將容器或Pod中的進程綁定到特定的CPU核心上執行。通過這種方式,可以減少CPU緩衝未命中、環境切換等現象,從而提高CPU利用率,提升應用效能,適用於對效能敏感和即時性要求高的情境。

        當前僅華北2(北京)、華南1(深圳)地區支援配置該參數。

    環境資訊

    鏡像

    支援選擇以下鏡像:

    • 官方鏡像:預置的官方鏡像,覆蓋Python、TensorFlow和PyTorch的多個版本。

    • 自訂鏡像:支援選擇已建立的自訂鏡像。如何添加自訂鏡像,請參見自訂鏡像

    • 鏡像地址:可輸入公用可訪問的鏡像公網地址,或者當前Region下ACR個人版中鏡像的公網地址。

    系統硬碟

    • 資源配額選擇公用資源群組時:

      每個執行個體會免費贈送100 GiB雲端硬碟作為系統硬碟,用於持久化儲存。如果執行個體停機超過15天,雲端硬碟的內容將被清空。雲端硬碟支援擴容,具體擴容價格以控制台介面為準。

    警告
    • 擴容後不支援縮容,請按需操作擴容。

    • 擴容後整塊系統硬碟(免費+付費)後,不再受到停機15天釋放的限制,但會持續產生費用。

    • 執行個體刪除系統硬碟同步銷毀,刪除前請確保必要資料備份。

    • 資源配額選擇專有資源群組時:

      使用執行個體內建的系統硬碟,並作為資料的臨時儲存,在停止或刪除執行個體後,儲存將被清空

    如果您需要非揮發性儲存體,可以配置資料集,或在掛載配置中添加OSS路徑。

    資料集

    單擊添加,可掛載已建立的自訂資料集,其中,OSS類型的自訂資料集支援多種掛載模式和自訂配置,公用資料集只支援唯讀掛載模式。

    說明
    • 多個資料集掛載的路徑不能重複。

    • 如果配置了CPFS類型的資料集,則需要設定網路設定,且選擇的專用網路需要與CPFS一致。否則,DSW執行個體可能會建立失敗。

    • 當資源群組選擇專有資源群組時,第一個資料集必須選擇NAS類型資料集,且會被同時掛載到您指定的路徑和DSW預設工作目錄/mnt/workspace/下。

    掛載配置

    單擊添加,可直接掛載OSS路徑,OSS支援多種掛載模式和自訂配置。

    工作目錄

    工作目錄是Notebook、WebIDE的啟動路徑,掛載至/mnt/workspace

    網路資訊

    專用網路配置

    僅當資源配額選擇公用資源時,支援配置該參數。

    當您想要在專用網路內使用DSW執行個體時,可配置此參數,同時配置交換器安全性群組。不同情境的配置策略詳情,請參見DSW網路設定

    公網訪問網關

    公網訪問網關支援以下配置方法:

    • 公有網關:叢集中的DSW執行個體使用共用的公網頻寬,在使用者高並發時下載速度會比較慢。

    • 專有網關:獨享頻寬,您可以根據需求選擇不同的頻寬。選擇該方式後,您需要為DSW執行個體關聯的專用網路建立公網NAT Gateway、綁定EIP並配置SNAT條目。具體配置方法,請參見DSW通過專有公網網關訪問公網

    僅當掛載配置選擇CPFS類型的資料集時,支援配置以下參數:

    • 啟用所有選項:預設為關閉,系統會禁用與CPFS類型的資料集不通的專用網路。

    • 隱藏禁用選項:選中複選框,系統會隱藏與CPFS類型的資料集不通的專用網路。

    說明

    如果掛載配置選擇了CPFS類型的資料集,則需要配置專用網路,且選擇的專用網路需要與CPFS一致。

    訪問配置

    啟用SSH

    選擇專用網路後可配置SSH。

    啟用後您可基於已選專用網路,使用SSH原生方式直連登入DSW執行個體。 若您配置了自訂鏡像,請確認自訂鏡像安裝了sshd。

    SSH公開金鑰

    開啟SSH配置開關後可配置該參數。

    說明

    如果您需要同時支援VPC內登入和公網登入方式,您需要同時添加多個用戶端的公開金鑰。請按照斷行符號換行的方式逐個添加公開金鑰,最多支援添加10個公開金鑰。

    SSH訪問方式

    開啟SSH配置開關後可配置該參數。

    • VPC內訪問:預設支援該訪問方式。您可以從VPC內的其他終端(例如ECS),通過SSH遠端連線DSW執行個體。

    • 公網訪問:選中該項,可以增加公網訪問方式。後續,您可以通過本地命令列或其他終端使用SSH遠端連線DSW執行個體。

      • NAT Gateway:選擇為專用網路建立的公網NAT Gateway。

      • Elastic IP Address:選擇在公網NAT Gateway中已建立的Elastic IP Address。

    自訂服務

    將執行個體中啟動的自訂服務提供對外訪問能力。具體配置,請參見自訂服務訪問配置

    進階資訊

    可見範圍

    可選擇僅執行個體所有者可見工作空間內公開可見

    執行個體所有者

    僅工作空間管理員可修改執行個體所有者。

    執行個體RAM角色

    當在DSW執行個體內訪問其他雲資源時,可以為執行個體關聯RAM角色,該方式基於STS臨時憑證訪問其他雲資源,無需配置長期AccessKey,有效降低密鑰泄露的風險。

    執行個體RAM角色可配置為:

    • PAI預設角色:擁有訪問PAI內部產品、MaxCompute和OSS的許可權。基於PAI預設角色簽發的臨時訪問憑證,在訪問PAI內部產品、MaxCompute表時,將擁有等同於DSW執行個體所有者的許可權;在訪問OSS時,僅能訪問當前工作空間配置的預設儲存路徑Bucket。

    • 自訂角色:當您想要定製或者更精細的許可權管理,可以配置自訂角色。

    • 不關聯角色:當您想直接通過AccessKey訪問其它雲產品時,可以選擇不關聯角色。

    更多關於執行個體RAM角色的配置說明,請參見配置DSW執行個體RAM角色

  5. 確認所選配置無問題後,單擊確定

相關文檔

  • 建立執行個體後,您可以準備開發所需要的資料檔案。DSW支援接入多種資料來源,包括OSS、NAS和MaxCompute,詳情請參見讀寫資料

  • DSW提供了資料上傳和下載功能,適用於小資料量的檔案傳輸,詳情請參見上傳與下載資料檔案

  • DSW的功能特點、使用流程、快速入門等,詳情請參見DSW概述

  • 關於DSW的使用案例,詳情請參見DSW使用案例匯總