全部產品
Search
文件中心

Data Lake Analytics - Deprecated:DLA Presto CU版本快速入門

更新時間:Jul 06, 2024

本文主要教您如何快速上手阿里雲雲原生資料湖分析DLA Presto CU版本。

操作步驟

  1. 建立虛擬叢集
    與Serverless Presto掃描版不同,在CU版本下執行SQL前,必須要建立一個虛擬叢集。
    說明 建立虛擬叢集時,選項引擎選擇Presto
  2. 配置資料來源網路
    說明 如果需要串連您VPC內的資料來源(如VPC內的RDS、AnalyticDB等), 您需要配置資料來源網路,如不需要串連,忽略此步驟即可。
    1. 在配置資料來源網路前,您需要授予DLA賬戶訪問您VPC相關API的許可權,詳細操作步驟請參見配置資料來源網路
    2. 虛擬叢集管理頁面單擊詳情,進入叢集詳情頁面。tp
    3. 單擊新增資料來源網路,選擇您想要串連的資料來源對應的虛擬網路交換器Id安全性群組Idtp
      • 交換器ID可以在您VPC內資料來源的基本資料頁面擷取,以RDS為例。tp
      • 安全性群組ID可以登入VPC控制台擷取。tp
        說明 這裡安全性群組可能會有多個,選擇一個可以訪問您資料來源的安全性群組即可。
  3. 執行SQL
    在CU版本下,當您建立好虛擬叢集,首次開始執行SQL時,您會發現系統已經預設自動產生一個公用資料集。tp
    在左邊列表中選中public_dataset_xxx這個庫,並且執行SQL語句,例如:
    /*+cluster=dladw*/SELECT * FROM `nation` LIMIT 20;
    說明 cluster是您之前建立的虛擬叢集執行個體名稱。

    更多關於DLA SQL用法的詳細操作,請參見常用SQL