全部產品
Search
文件中心

DataWorks:Data Lake Analytics節點

更新時間:Nov 20, 2024

您可以在DataWorks中建立Data Lake Analytics節點,構建線上ETL資料處理流程。

背景資訊

Data Lake Analytics節點用於接入阿里雲產品Data Lake Analytics,詳情請參見什麼是Data Lake Analytics

說明

Data Lake Analytics節點支援Serverless資源群組(推薦)或舊版獨享調度資源群組執行任務。如需購買使用Serverless資源群組,詳情請參見新增和使用Serverless資源群組

使用限制

支援的地區:華東1(杭州)、華東2(上海)、華北2(北京)、華南1(深圳)、中國香港、日本(東京)、新加坡、德國(法蘭克福)、英國(倫敦)、美國(矽谷)、美國(維吉尼亞)。

操作步驟

  1. 進入資料開發頁面。

    登入DataWorks控制台,切換至目標地區後,單擊左側導覽列的資料開發與治理 > 資料開發,在下拉框中選擇對應工作空間後單擊進入資料開發

  2. 滑鼠移至上方至建立表徵圖,單擊建立節點 > 自訂 > Data Lake Analytics

    您也可以開啟相應的商務程序,按右鍵自訂,選擇建立節點 > Data Lake Analytics

  3. 建立節點對話方塊中,輸入節點名稱,並選擇路徑

  4. 單擊確認

  5. 編輯Data Lake Analytics節點。

    1. 選擇資料來源。

      選擇任務要執行的目標資料來源。如果下拉式清單中沒有需要的資料來源,請單擊右側的建立資料來源,在資料來源管理頁面建立,詳情請參見配置Data Lake Analytics(DLA)資料來源

    2. 編輯SQL語句。

      選擇相應的資料來源後,即可根據Data Lake Analytics支援的文法,編寫SQL語句。通常支援DML語句,您也可以執行DDL語句。

    3. 單擊工具列中的儲存表徵圖。

    4. 單擊工具列中的運行表徵圖,執行SQL語句。

    如果您需要修改在資料開發頁面測試時使用的任務執行資源,請單擊工具列中的進階運行表徵圖,選擇相應的Serverless資源群組。

    說明

    因為訪問專用網路環境的資料來源需要使用Serverless資源群組執行任務,所以此處必須選擇測試連通性成功的Serverless資源群組。

  6. 單擊節點編輯地區右側的調度配置,配置節點的調度屬性,詳情請參見配置基礎屬性

    配置資源屬性時,請選擇調度資源群組為已經和Data Lake Analytics網路連通的Serverless資源群組,作為周期調度時使用的資源群組。

  7. 儲存並提交節點。

    說明

    您需要設定節點的重跑屬性依賴的上遊節點,才可以提交節點。

    1. 單擊工具列中的儲存表徵圖,儲存節點。

    2. 單擊工具列中的提交表徵圖。

    3. 提交新版本對話方塊中,輸入變更描述

    4. 單擊確認

    如果您使用的是標準模式的工作空間,提交成功後,請單擊右上方的發布。具體操作請參見發布任務

  8. 任務營運,詳情請參見周期任務基本營運操作