互動式建模(DSW)是PAI產品的雲端機器學習開發IDE,為您提供互動式編程環境。在使用DSW前,您需要建立DSW執行個體。本文為您介紹如何建立DSW執行個體。
背景資訊
通過控制台建立執行個體適用於普通開發人員,您可以通過控制台管理執行個體,例如,在DSW中進行模型開發的開發人員。
前提條件
許可權開通
使用主帳號開通PAI並建立工作空間。登入PAI控制台,左上方選擇開通地區,然後一鍵授權和開通產品,詳情見開通PAI並建立工作空間。
操作帳號授權。當使用主帳號操作DSW執行個體時,可跳過此步。當使用RAM帳號操作時,需要進行操作帳號授權。
【可選】準備專有資源群組
在完成步驟1後,系統將為您準備好公用資源群組。當您需要使用專有資源群組時,需要購買專有資源並分配資源配額,具體操作可參見下面教程。
使用通用計算資源專有資源群組。請參見建立資源群組併購買通用計算資源和通用計算資源配額。
使用靈駿智算資源。請參見建立資源群組併購買靈駿智算資源和靈駿智算資源配額。
【可選】準備資料集
公用資源群組和專有資源群組預設資料存放區空間有限,且無法持久化儲存,因此,當您需要擴充執行個體的儲存空間或持久化儲存資料時,可通過掛載NAS、OSS類型資料集或OSS路徑的方式實現。建立資料集,請參見建立及管理資料集。
重要公用資源群組的DSW執行個體,資料存放區在空間有限的免費雲端硬碟中,在刪除執行個體或停機超過15天后,雲端硬碟資料將被清空。
專有資源群組的DSW執行個體,資料存放區在執行個體的系統硬碟中,在停止或刪除執行個體後,臨時儲存將被清空。
【可選】自訂鏡像
DSW預置了多種類型的官方鏡像,例如PyTorch、TensorFlow、ModelScope等。如果您需要自訂鏡像來滿足特定情境下的開發需求,請參見自訂鏡像。
使用限制
由於每個阿里雲帳號(主帳號)在每個Region有2卡GPU的限制,當資源使用量超出限額時可能會出現報錯。如果您需要提升限額,請提交工單聯絡我們。
建立執行個體
當您使用公用資源建立執行個體後,將開始按照執行個體的服務時間長度計費,當停止或刪除執行個體後計費才會停止,詳細計費規則,請參見互動式建模(DSW)計費說明。
通過控制台建立執行個體
進入DSW頁面。
登入PAI控制台。
在概覽頁面選擇目標地區。
在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。
在工作空間頁面的左側導覽列選擇 ,進入DSW頁面。
單擊建立執行個體。
在配置執行個體嚮導頁面,配置以下關鍵參數。
公用資源:目前僅支援隨用隨付模式,無法轉為訂用帳戶。
資源配額:可選擇通用訓練資源專有資源群組、靈駿智算資源,如果沒有可選的目標資源,請單擊關聯資源配額進行配置。
當資源類型為公用資源時,需要設定以下參數:
資源規格:可選擇GPU、CPU或免費試用資源。規格資訊,請參見執行個體規格類型系列。
競價購買:當您使用公用資源建立DSW執行個體時,您可以選用競價執行個體(搶佔式執行個體),降低運行成本。詳情請參見競價購買DSW執行個體。
當前僅華東1(杭州)、華北2(北京)、華南1(深圳)、華南3(廣州)、日本(東京)地區支援配置該參數。
當資源類型為資源配額時,需要設定以下參數:
資源配額:可選擇通用訓練資源專有資源群組、靈駿智算資源。
資源規格:根據實際需求設定GPU、CPU和記憶體等。
優先順序: 優先順序範圍為1~9 ,數值越大,優先順序越高。
CPU親和性:啟用CPU親和性,能夠將容器或Pod中的進程綁定到特定的CPU核心上執行。通過這種方式,可以減少CPU緩衝未命中、環境切換等現象,從而提高CPU利用率,提升應用效能,適用於對效能敏感和即時性要求高的情境。
當前僅華北2(北京)、華南1(深圳)地區支援配置該參數。
當資源配額選擇公用資源群組時:
每個執行個體會免費贈送100 GiB雲端硬碟作為系統硬碟,用於持久化儲存。如果執行個體停機超過15天,雲端硬碟的內容將被清空。雲端硬碟支援擴容,具體擴容價格以控制台介面為準。
擴容後不支援縮容,請按需操作擴容。
擴容後整塊系統硬碟(免費+付費)後,不再受到停機15天釋放的限制,但會持續產生費用。
執行個體刪除系統硬碟同步銷毀,刪除前請確保必要資料備份。
當資源配額選擇專有資源群組時:
使用執行個體內建的系統硬碟,並作為資料的臨時儲存,在停止或刪除執行個體後,儲存將被清空。
多個資料集掛載的路徑不能重複。
如果配置了CPFS類型的資料集,則需要設定網路設定,且選擇的專用網路需要與CPFS一致。否則,DSW執行個體可能會建立失敗。
當資源群組選擇專有資源群組時,第一個資料集必須選擇NAS類型資料集,且會被同時掛載到您指定的路徑和DSW預設工作目錄/mnt/workspace/下。
公有網關:叢集中的DSW執行個體使用共用的公網頻寬,在使用者高並發時下載速度會比較慢。
專有網關:獨享頻寬,您可以根據需求選擇不同的頻寬。選擇該方式後,您需要為DSW執行個體關聯的專用網路建立公網NAT Gateway、綁定EIP並配置SNAT條目。具體配置方法,請參見DSW通過專有公網網關訪問公網。
啟用所有選項:預設為關閉,系統會禁用與CPFS類型的資料集不通的專用網路。
隱藏禁用選項:選中複選框,系統會隱藏與CPFS類型的資料集不通的專用網路。
VPC內訪問:預設支援該訪問方式。您可以從VPC內的其他終端(例如ECS),通過SSH遠端連線DSW執行個體。
公網訪問:選中該項,可以增加公網訪問方式。後續,您可以通過本地命令列或其他終端使用SSH遠端連線DSW執行個體。
NAT Gateway:選擇為專用網路建立的公網NAT Gateway。
Elastic IP Address:選擇在公網NAT Gateway中已建立的Elastic IP Address。
PAI預設角色:擁有訪問PAI內部產品、MaxCompute和OSS的許可權。基於PAI預設角色簽發的臨時訪問憑證,在訪問PAI內部產品、MaxCompute表時,將擁有等同於DSW執行個體所有者的許可權;在訪問OSS時,僅能訪問當前工作空間配置的預設儲存路徑Bucket。
自訂角色:當您想要定製或者更精細的許可權管理,可以配置自訂角色。
不關聯角色:當您想直接通過AccessKey訪問其它雲產品時,可以選擇不關聯角色。
確認所選配置無問題後,單擊確定。
參數 | 描述 | |
基礎資訊 | 執行個體名稱 | 參考介面提示資訊配置DSW執行個體名稱。 |
資源資訊 | 資源類型 | 支援選擇: 資源類型不同,相關參數配置不同: |
環境資訊 | 鏡像 | 支援選擇以下鏡像: |
系統硬碟 | 警告 如果您需要非揮發性儲存體,可以配置資料集,或在掛載配置中添加OSS路徑。 | |
資料集 | 單擊添加,可掛載已建立的自訂資料集,其中,OSS類型的自訂資料集支援多種掛載模式和自訂配置,公用資料集只支援唯讀掛載模式。 說明 | |
掛載配置 | 單擊添加,可直接掛載OSS路徑,OSS支援多種掛載模式和自訂配置。 | |
工作目錄 | 工作目錄是Notebook、WebIDE的啟動路徑,掛載至 | |
網路資訊 | 專用網路配置 | 僅當資源配額選擇公用資源時,支援配置該參數。 當您想要在專用網路內使用DSW執行個體時,可配置此參數,同時配置交換器和安全性群組。不同情境的配置策略詳情,請參見DSW網路設定。 |
公網訪問網關 | 公網訪問網關支援以下配置方法: 僅當掛載配置選擇CPFS類型的資料集時,支援配置以下參數: 說明 如果掛載配置選擇了CPFS類型的資料集,則需要配置專用網路,且選擇的專用網路需要與CPFS一致。 | |
訪問配置 | 啟用SSH | 選擇專用網路後可配置SSH。 啟用後您可基於已選專用網路,使用SSH原生方式直連登入DSW執行個體。 若您配置了自訂鏡像,請確認自訂鏡像安裝了sshd。 |
SSH公開金鑰 | 開啟SSH配置開關後可配置該參數。 說明 如果您需要同時支援VPC內登入和公網登入方式,您需要同時添加多個用戶端的公開金鑰。請按照斷行符號換行的方式逐個添加公開金鑰,最多支援添加10個公開金鑰。 | |
SSH訪問方式 | 開啟SSH配置開關後可配置該參數。 | |
自訂服務 | 將執行個體中啟動的自訂服務提供對外訪問能力。具體配置,請參見自訂服務訪問配置。 | |
進階資訊 | 可見範圍 | 可選擇僅執行個體所有者可見或工作空間內公開可見。 |
執行個體所有者 | 僅工作空間管理員可修改執行個體所有者。 | |
執行個體RAM角色 | 當在DSW執行個體內訪問其他雲資源時,可以為執行個體關聯RAM角色,該方式基於STS臨時憑證訪問其他雲資源,無需配置長期AccessKey,有效降低密鑰泄露的風險。 執行個體RAM角色可配置為: 更多關於執行個體RAM角色的配置說明,請參見配置DSW執行個體RAM角色。 |