DataWorks基於MaxCompute等引擎,提供統一的全鏈路巨量資料開發治理平台。本文為您介紹如何通過DataWorks使用MaxCompute服務。
背景資訊
DataWorks支援將計算引擎綁定至DataWorks的工作空間,綁定計算引擎後,您即可在DataWorks上建立對應引擎的計算任務,並進行周期調度。使用DataWorks串連MaxCompute有如下方式:
資料分析的SQL查詢功能:
實現編輯MaxCompute SQL、查詢資料、分析資料(試算表)、線上分享資料及下載資料等功能。SQL查詢功能詳情請參見SQL查詢。
資料開發的MaxCompute任務節點:
DataWorks將不同類型引擎任務封裝為不同節點,通過節點來定義資料開發工作單位。同時,支援使用資源、函數、以及相關邏輯處理節點開發更多複雜的任務。MaxCompute任務節點包括:ODPS SQL節點、ODPS Spark節點、PyODPS 2節點、PyODPS 3節點、ODPS Script節點、ODPS MR節點。
使用情境
資料分析使用情境
資料分析的SQL查詢功能使用情境如下:
您可以通過資料分析的SQL查詢功能查詢資料,並通過分析模式的Web Excel對查詢結果進行分析。您也可以下載查詢結果至本地,減少資料的流動,更好地保障資料安全。
MaxCompute任務節點使用情境
如果您希望周期性運行MaxCompute作業,可使用DataWorks的DataStudio開發週期性MaxCompute作業,並配置周期性調度的時間屬性、調度依賴等配置項,將作業整體提交至DataWorks的營運中心進行周期性調度。
使用說明
建立DataWorks工作空間。
詳情請參見建立並管理工作空間。
為DataWorks綁定MaxCompute引擎。
詳情請參見綁定MaxCompute引擎。
說明簡單模式工作空間支援為DataWorks工作空間綁定已有MaxCompute專案;標準模式工作空間不支援綁定已有MaxCompute專案。
(可選)為DataWorks添加MaxCompute資料來源。
DataWorks的資料來源分為引擎綁定時預設建立的引擎資料來源和在資料來源配置介面建立的自建資料來源,若要操作非引擎資料來源,請確保已建立資料來源,詳情請參見建立與管理資料來源。
通過DataWorks使用MaxCompute。