雲原生資料湖分析DLA(Data Lake Analytics)是無伺服器(Serverless)化的雲上互動式查詢分析服務,支援通過Presto和Spark引擎分析多種資料來源中的資料。快速入門旨在介紹如何開通DLA、構建資料湖、調用Presto和Spark引擎進行資料分析與計算,協助您掌握DLA的基本使用流程。
如果您是首次使用雲原生資料湖分析DLA的使用者,我們建議您先閱讀以下部分:
雲原生資料湖分析DLA入門指南(本指南)-本指南提供了有關使用雲原生資料湖分析DLA的基本流程。操作流程概覽如下:
- 開通雲原生資料湖分析服務
- 構建資料湖:您可以通過以下多種方式來構建資料湖。例如:
- 手工上傳檔案到OSS,然後通過中繼資料爬取功能建立表來構建資料湖。具體操作請參見控制台上傳檔案和OSS資料來源。
- 通過其他產品投遞檔案到OSS(如通過Action Trail控制台投遞記錄檔到OSS),然後通過中繼資料爬取功能建立表來構建資料湖。具體操作請參見建立單帳號跟蹤和OSS資料來源。
- 通過一鍵建倉和多倉合并建倉(僅支援資料庫)、即時資料湖(支援資料庫和訊息日誌)功能來構建資料湖。具體操作請參見一鍵建倉多庫合并建倉和即時資料湖。
- 串連資料來源:您也可以通過DLA直接連接其他資料來源或者OSS來進行資料分析與計算。具體操作請參見Presto引擎串連資料來源和Spark引擎串連資料來源。
- 資料分析與計算:您可以調用Serverless Presto和Spark引擎來進行資料分析與計算。具體請參見Serverless Presto和Serverless Spark。
- 資料應用:您可以通過DataWorks和DMS來調度DLA Presto和DLA Spark任務,也可以將OSS資料的查詢分析結果以BI報表形式進行展示。具體請參見快速搭建Quick BI可視化報表。