全部產品
Search
文件中心

Platform For AI:使用DataWorks離線調度Designer工作流程

更新時間:Nov 09, 2024

離線調度功能是機器學習的常見情境,您需要通過離線調度功能周期性地更新模型,協助您構建模型訓練的Pipeline。PAI Designer支援與DataWorks互連,實現PAI Designer工作流程的周期性調度。本文為您介紹如何使用DataWorks實現PAI Designer工作流程的離線調度。

前提條件

已建立商務程序,具體操作,詳情請參見建立商務程序

重要

建立商務程序時選擇的工作空間,需要與Designer工作流程所在的工作空間相同。否則,在建立離線調度任務時,路徑將無法選擇已建立的商務程序。

背景資訊

  • 工作流程的所有節點都運行成功後,您可以部署整個工作流程流程至離線調度,以進行定時運行。

    說明

    在離線調度節點之前,請確保工作流程中的所有節點已成功運行,並且已開通DataWorks服務。詳情請參見建立工作空間

  • PAI-Designer工作流程與DataWorks資料開發中的Designer節點個數的比例為1∶N,您可以基於同一個PAI-Designer工作流程,在DataWorks資料開發中建立多個Designer類型的節點。

操作步驟

  1. 登入PAI控制台,並進入Designer中已建立的工作流程頁面。

    以建立心臟病預測案例為例,建立及進入工作流程頁面的操作詳情請參見心臟病預測

  2. 單擊畫布左上方的周期性調度 > 建立調度節點,跳轉到DataWorks進行離線調度,在建立節點對話方塊配置節點名稱,單擊確認

  3. 在節點的編輯頁面,從選擇PAI Designer實驗下拉式清單中選擇已建立的PAI Designer工作流程。

    如果您需要修改PAI Designer工作流程,請單擊去PAI Designer編輯,進入工作流程編輯頁面進行編輯。編輯頁面

  4. 單擊節點編輯地區右側的調度配置,配置節點的調度屬性。

    調度配置調度配置面板中,包含基礎屬性參數時間屬性資源屬性調度依賴等配置項。您可以在時間屬性地區配置調度周期,後續DataWorks會根據配置的調度周期自動調度運行節點任務。具體配置詳情請參見調度配置

  5. 單擊工具列中的儲存提交表徵圖,根據介面提示,儲存並提交節點。

    重要

    您需要設定節點的重跑屬性依賴的上遊節點才可以提交節點。

    如果您使用的是標準模式的工作空間,在提交成功後,請單擊頁面上方的任務發布,具體操作請參見發布任務

  6. 單擊頁面上方的營運中心,查看機器學習任務的運行情況和動作記錄。

    您也可以直接進行補資料、工作流程試跑等操作,詳情請參見查看並管理周期任務