DataWorks コンソールで Data Lake Analytics ノードを作成して、オンラインの ETL プロセスを構築できます。
- Data Lake Analytics ノードは、Alibaba Cloud の Data Lake Analytics に接続するために使用されます。 詳細については、「https://www.alibabacloud.com/help/doc-detail/70378.htm」をご参照ください。
- 専用のリソースグループで Data Lake Analytics ノードを実行することを推奨します。 デフォルトのリソースグループで Data Lake Analytics ノードを実行すると、ネットワーク接続エラーが発生します。
- 現在、Data Lake Analytics ノードに対しては運用環境での接続のみ選択できます。
- DataWorks コンソールにログインします。 左側のナビゲーションウィンドウで [ワークスペース] をクリックします。 [ワークスペース] ページでノードを作成するワークスペースを確認し、[操作] 列の [データ分析] をクリックします。
- アイコンにポインターを移動し、
[ワークフロー] をクリックし、[ユーザー定義] を右クリックして、 の順にクリックすることもできます。
の順にクリックします。
- [ノードの作成] ダイアログボックスで、[ノード名] および [ロケーション] を設定し、[コミット] をクリックします。
注 ノード名は 1 文字から 128 文字にする必要があります。
- Data Lake Analytics ノードを編集します。
ノード編集ページで接続を選択し、SQL コードを編集できます。
- 接続を選択します。
ターゲットとなるノードの接続を選択します。 ドロップダウンリストで必要な接続が見つからない場合は、[接続の追加] をクリックして、データソースページで接続を作成すします。
- SQL 文を編集します。
接続を選択したら、Data Lake Analytics でサポートされている構文に基づいて SQL 文を記述できます。 SQL コードエディターでデータ操作言語 (DML) およびデータ定義言語 (DDL) の文を記述できます。
- SQL 文を保存します。
SQL 文の編集が終了したら、[保存] アイコンをクリックしてノードの設定をサーバーに保存します。
- SQL 文を実行します。
[実行] アイコンをクリックして、保存した SQL 文を実行します。
- 接続を選択します。
- ノードのスケジュールを設定します。
右側の [プロパティ] をクリックし、[スケジュール] セクションで関連パラメーターを設定します。 詳細については、「Properties」をご参照ください。
- ノードをコミットします。
スケジュール設定が完了したら、[保存] アイコンをクリックし、コードエディターの上部ツールバーにある [送信] または [コミットしてロックを解除] アイコンをクリックします。 Data Lake Analytics ノードは、開発環境にコミットされています。
- ノードをデプロイします。
詳細については、「ノードのデプロイ (Deploy a node)」をご参照ください。
- 本番環境でノードをテストします。