DataWorksタスクスケジューリングは、機械学習シナリオで広く使用されています。 DataWorksタスクスケジューリングを使用すると、DataWorksタスクを定期的に実行してモデルを更新し、モデルトレーニングパイプラインを作成できます。 DataWorksタスクを使用して、Machine Learning Designerでパイプラインを定期的にスケジュールできます。 このトピックでは、DataWorksタスクを使用してMachine Learning Designerでパイプラインを定期的にスケジュールする方法について説明します。
前提条件
ワークフローが作成されます。 詳細については、「ワークフローの作成」をご参照ください。
ワークフローが存在するワークスペースは、Machine Learning Designerパイプラインのワークスペースと同じである必要があります。 それ以外の場合、オフラインスケジューリングタスクを作成するときにワークフローにPathパラメーターを設定することはできません。
背景情報
パイプライン内のすべてのノードを実行した後、パイプラインをDataWorksにデプロイして、パイプラインを定期的に実行できます。
説明ノードをスケジュールする前に、パイプライン内のすべてのノードが実行され、DataWorksがアクティブ化されていることを確認します。 詳細については、「ワークスペースの作成」をご参照ください。
DataWorksのPAI-DesignerパイプラインとDesignerノードの比率は1:Nです。つまり、同じPAI-Designerパイプラインに基づいて、DataWorksに複数のDesignerノードを作成できます。
手順
Machine Learning Platform for AI (PAI) コンソールにログインして、Machine Learning Designerで作成したパイプラインの詳細ページに移動します。
このトピックでは、心臓病予測パイプラインを例として使用します。 パイプラインの作成方法およびパイプラインの構成タブに移動する方法の詳細については、「心臓病の予測」をご参照ください。
キャンバスの左上隅にある をクリックしてDataWorksに移動します。 ノード名を指定し、[確認] をクリックします。
ノードの編集ページで、Machine Learning Designerで作成したパイプラインをPAIデザイナーノードの選択ドロップダウンリストから選択します。
Machine Learning Designerでパイプラインを変更する場合は、[PAI Designerに移動して編集] をクリックします。
ノードの編集タブで、右側のナビゲーションウィンドウで [プロパティ] タブをクリックします。 [プロパティ] パネルで、ノードのスケジューリングプロパティを設定します。
[プロパティ] パネルには、[全般] 、[パラメーター] 、[スケジュール] 、[リソースグループ] 、および [依存関係] セクションがあります。 [スケジュール] セクションでスケジューリングサイクルを指定できます。 DataWorksは、指定したスケジューリングサイクルに基づいてパイプラインを自動的に実行します。 詳細については、「基本プロパティの設定」をご参照ください。
ツールバーのとアイコンをクリックして指示に従ってノードを保存およびコミットします。
重要ノードをコミットする前に、[プロパティ] パネルで [再実行] パラメーターと [親ノード] パラメーターを設定する必要があります。
使用するワークスペースが標準モードの場合、ノードをコミットした後、右上隅の [デプロイ] をクリックします。 詳細については、「ノードのデプロイ」をご参照ください。
操作センターをクリックして機械学習タスクのステータスと操作ログを表示します。
ノードのデータをバックフィルし、パイプラインをテストすることもできます。 詳細については、「自動トリガーノードの表示と管理」をご参照ください。