離線調度功能是機器學習的常見情境,您需要通過離線調度功能周期性地更新模型,協助您構建模型訓練的Pipeline。PAI Designer支援與DataWorks互連,實現PAI Designer工作流程的周期性調度。本文為您介紹如何使用DataWorks實現PAI Designer工作流程的離線調度。
前提條件
已建立商務程序,具體操作,詳情請參見建立商務程序。
建立商務程序時選擇的工作空間,需要與Designer工作流程所在的工作空間相同。否則,在建立離線調度任務時,路徑將無法選擇已建立的商務程序。
背景資訊
工作流程的所有節點都運行成功後,您可以部署整個工作流程流程至離線調度,以進行定時運行。
在離線調度節點之前,請確保工作流程中的所有節點已成功運行,並且已開通DataWorks服務。詳情請參見建立工作空間。
操作步驟
登入PAI控制台,並進入Designer中已建立的工作流程頁面。
以建立心臟病預測案例為例,建立及進入工作流程頁面的操作詳情請參見心臟病預測。
在工作流程頁面,單擊周期性調度。
在部署調度對話方塊中,單擊確定,進入DataWorks資料開發頁面。
建立一個PAI Designer節點。
在建立節點對話方塊中,選擇節點類型為PAI Designer,並選擇路徑。
如果未在彈出的對話方塊中直接建立,您也可以在資料開發頁面中,將滑鼠移至上方至建立,然後單擊建立節點。
單擊確認。
在節點的編輯頁面,從選擇PAI Designer實驗下拉式清單中選擇已建立的PAI Designer工作流程。
如果您需要修改PAI Designer工作流程,請單擊去PAI Designer編輯,進入工作流程編輯頁面進行編輯。
單擊節點編輯地區右側的調度配置,配置節點的調度屬性。
在調度配置面板中,包含基礎屬性、參數、時間屬性、資源屬性和調度依賴等配置項。您可以在時間屬性地區配置調度周期,後續DataWorks會根據配置的調度周期自動調度運行節點任務。具體配置詳情請參見調度配置。
單擊工具列中的和表徵圖,根據介面提示,儲存並提交節點。
重要您需要設定節點的重跑屬性和依賴的上遊節點才可以提交節點。
如果您使用的是標準模式的工作空間,在提交成功後,請單擊頁面上方的任務發布,具體操作請參見發布任務。
單擊頁面上方的營運中心,查看機器學習任務的運行情況和動作記錄。
您也可以直接進行補資料、工作流程試跑等操作,詳情請參見查看並管理周期任務。