離線調度功能是機器學習的常見情境,您需要通過離線調度功能周期性地更新模型,協助您構建模型訓練的Pipeline。PAI Designer支援與DataWorks互連,實現PAI Designer工作流程的周期性調度。本文為您介紹如何使用DataWorks實現PAI Designer工作流程的離線調度。
前提條件
已建立商務程序,具體操作,詳情請參見建立商務程序。
建立商務程序時選擇的工作空間,需要與Designer工作流程所在的工作空間相同。否則,在建立離線調度任務時,路徑將無法選擇已建立的商務程序。
背景資訊
工作流程的所有節點都運行成功後,您可以部署整個工作流程流程至離線調度,以進行定時運行。
說明在離線調度節點之前,請確保工作流程中的所有節點已成功運行,並且已開通DataWorks服務。詳情請參見建立工作空間。
PAI-Designer工作流程與DataWorks資料開發中的Designer節點個數的比例為1∶N,您可以基於同一個PAI-Designer工作流程,在DataWorks資料開發中建立多個Designer類型的節點。
操作步驟
登入PAI控制台,並進入Designer中已建立的工作流程頁面。
以建立心臟病預測案例為例,建立及進入工作流程頁面的操作詳情請參見心臟病預測。
單擊畫布左上方的周期性調度 > 建立調度節點,跳轉到DataWorks進行離線調度,在建立節點對話方塊配置節點名稱,單擊確認。
在節點的編輯頁面,從選擇PAI Designer實驗下拉式清單中選擇已建立的PAI Designer工作流程。
如果您需要修改PAI Designer工作流程,請單擊去PAI Designer編輯,進入工作流程編輯頁面進行編輯。
單擊節點編輯地區右側的調度配置,配置節點的調度屬性。
在調度配置面板中,包含基礎屬性、參數、時間屬性、資源屬性和調度依賴等配置項。您可以在時間屬性地區配置調度周期,後續DataWorks會根據配置的調度周期自動調度運行節點任務。具體配置詳情請參見調度配置。
單擊工具列中的和表徵圖,根據介面提示,儲存並提交節點。
重要您需要設定節點的重跑屬性和依賴的上遊節點才可以提交節點。
如果您使用的是標準模式的工作空間,在提交成功後,請單擊頁面上方的任務發布,具體操作請參見發布任務。
單擊頁面上方的營運中心,查看機器學習任務的運行情況和動作記錄。
您也可以直接進行補資料、工作流程試跑等操作,詳情請參見查看並管理周期任務。