您可以在DataWorks中建立Data Lake Analytics節點,構建線上ETL資料處理流程。
背景資訊
Data Lake Analytics節點用於接入阿里雲產品Data Lake Analytics,詳情請參見什麼是Data Lake Analytics。
Data Lake Analytics節點支援Serverless資源群組(推薦)或舊版獨享調度資源群組執行任務。如需購買使用Serverless資源群組,詳情請參見新增和使用Serverless資源群組。
使用限制
支援的地區:華東1(杭州)、華東2(上海)、華北2(北京)、華南1(深圳)、中國香港、日本(東京)、新加坡、德國(法蘭克福)、英國(倫敦)、美國(矽谷)、美國(維吉尼亞)。
操作步驟
進入資料開發頁面。
登入DataWorks控制台,切換至目標地區後,單擊左側導覽列的 ,在下拉框中選擇對應工作空間後單擊進入資料開發。
滑鼠移至上方至表徵圖,單擊 。
您也可以開啟相應的商務程序,按右鍵自訂,選擇
。在建立節點對話方塊中,輸入節點名稱,並選擇路徑。
單擊確認。
編輯Data Lake Analytics節點。
選擇資料來源。
選擇任務要執行的目標資料來源。如果下拉式清單中沒有需要的資料來源,請單擊右側的建立資料來源,在資料來源管理頁面建立,詳情請參見配置Data Lake Analytics(DLA)資料來源。
編輯SQL語句。
選擇相應的資料來源後,即可根據Data Lake Analytics支援的文法,編寫SQL語句。通常支援DML語句,您也可以執行DDL語句。
單擊工具列中的表徵圖。
單擊工具列中的表徵圖,執行SQL語句。
如果您需要修改在資料開發頁面測試時使用的任務執行資源,請單擊工具列中的表徵圖,選擇相應的Serverless資源群組。
說明因為訪問專用網路環境的資料來源需要使用Serverless資源群組執行任務,所以此處必須選擇測試連通性成功的Serverless資源群組。
單擊節點編輯地區右側的調度配置,配置節點的調度屬性,詳情請參見配置基礎屬性。
配置資源屬性時,請選擇調度資源群組為已經和Data Lake Analytics網路連通的Serverless資源群組,作為周期調度時使用的資源群組。
單擊工具列中的表徵圖,儲存節點。
單擊工具列中的表徵圖。
在提交新版本對話方塊中,輸入變更描述。
單擊確認。
任務營運,詳情請參見周期任務基本營運操作。
儲存並提交節點。
您需要設定節點的重跑屬性和依賴的上遊節點,才可以提交節點。
如果您使用的是標準模式的工作空間,提交成功後,請單擊右上方的發布。具體操作請參見發布任務。