全部產品
Search
文件中心

Platform For AI:快速提交單機PyTorch遷移學習任務

更新時間:Jul 13, 2024

本文介紹如何利用DLC基於PyTorch進行離線遷移學習的訓練。

步驟一:準備資料

本文使用的資料已經預存到公開地址(下載資料),您無需進行額外的資料準備。

步驟二:準備訓練代碼和模型隱藏檔

本文使用的訓練代碼已經預存到公開地址(下載訓練代碼),您無需進行額外的代碼開發。

步驟三:建立任務

  1. 進入建立任務頁面。

    1. 登入PAI控制台

    2. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。

    3. 在工作空間頁面的左側導覽列選擇模型開發與訓練 > 分布式訓練(DLC),在分布式訓練(DLC)頁面中單擊建立任務,進入建立任務頁面。

  2. 建立任務頁面,僅配置如下參數,其他參數無需配置。

    image

    參數

    描述

    任務名稱

    填寫任務名稱,例如torch-sample

    節點鏡像

    單擊官方鏡像,並在下方的列表中選擇PyTorch鏡像。

    啟動命令

    填寫如下命令,其中包括了下載資料、下載代碼、執行訓練任務及檢查模型的步驟。

    wget https://pai-public-data.oss-cn-beijing.aliyuncs.com/hol-pytorch-transfer-cv/data.tar.gz && tar -xf ./data.tar.gz && mv ./hymenoptera_data/ ./input && mkdir output && wget https://pai-public-data.oss-cn-beijing.aliyuncs.com/hol-pytorch-transfer-cv/main.py && python main.py -i ./input -o ./output && ls ./output

    資源來源

    選擇公用資源

    架構

    選擇PyTorch

    任務資源

    • 節點數量:配置為1。

    • 資源規格:單擊image,選擇GPU規格ecs.gn6e-c12g1.3xlarge

  3. 單擊確定

    頁面自動跳轉到分布式訓練(DLC)頁面。

步驟四:查看任務詳情和日誌結果

  1. 分布式訓練(DLC)頁面,單擊任務名稱。

  2. 在任務詳情頁面,即可查看任務的基本資料資源資訊等。

  3. 在任務詳情頁面底部的執行個體地區,單擊目標執行個體操作列下的日誌,即可查看日誌結果。