全部產品
Search
文件中心

Platform For AI:深度學習架構及開通說明

更新時間:Jul 13, 2024

阿里雲Machine Learning Platform for AI支援深度學習架構,同時提供了功能強大的GPU計算叢集。您可以使用這些架構及硬體資源來使用深度學習演算法。

前提條件

已關聯MaxCompute資源,具體操作,請參見管理工作空間

背景資訊

深度學習支援的架構套件括TensorFlow(相容開源TF1.12版本)。TensorFlow支援使用者自己編寫的Python代碼。

在使用深度學習架構訓練資料之前,需要上傳訓練的資料至阿里雲Object Storage Service中,演算法在運行時從指定的OSS目錄中讀取資料。演算法在執行時訪問同一地區下OSS中資料時不產生流量費用,訪問其它地區的OSS會產生流量費用。

說明

阿里雲機器學習目前僅在華東2(上海)華北2(北京)華東1(杭州)華南1(深圳)部署了GPU叢集。

開通深度學習

在相應工作空間內,配置GPU資源即可使用深度學習。

  1. 登入PAI控制台

  2. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。

  3. 工作空間詳情地區,單擊計算資源後的資源管理

  4. 工作空間資源配置面板,按照下圖操作指引,開啟資源配置對話方塊。image.png

  5. 資源配置對話方塊,配置GPU參數為隨用隨付,並單擊確定開啟GPU

使用深度學習架構TensorFlow

TensorFlow當前僅支援提交CPU任務,使用詳情請參見PAI-TensorFlow使用指南

如需提交GPU任務,請通過Python指令碼組件配置。