全部產品
Search
文件中心

:Trino以EMR叢集的方式查詢OSS-HDFS服務中的資料

更新時間:Sep 19, 2024

本文介紹Trino如何以EMR叢集的方式查詢OSS-HDFS服務中的資料。

前提條件

  • 已建立EMR-3.42.0及以上版本或EMR-5.8.0及以上版本的叢集,並在建立叢集時選擇了Trino服務。具體步驟,請參見建立叢集

  • 已開通並授權訪問OSS-HDFS服務。具體操作,請參見開通OSS-HDFS服務

操作步驟

  1. 登入EMR on ECS控制台,建立EMR叢集。

    建立EMR叢集時,確保選擇的產品版本為EMR-3.46.2及以上版本或者EMR-5.12.2及以上版本,叢集儲存根路徑選擇已開通OSS-HDFS服務的Bucket,其他參數保留預設配置。具體步驟,請參見建立叢集

  2. 查詢OSS-HDFS服務中的資料。

    1. 登入Trino控制台。

      您可以在EMR on ECS控制台叢集服務Trino配置頁簽下,擷取<trino_server_address>和<trino_server_port>。

      trino --server <Trino_server_address>:<Trino_server_port> --catalog
    2. 建立OSS中的schema。

      create schema testDB with (location='oss://<Bucket>.<Endpoint>/<schema_dir>');
    3. 使用schema。

      use testDB;
    4. 建立表。

      create table tbl (key int, val int);
    5. 往表中插入資料。

      insert into tbl values (1,666);
    6. 查詢表。

      select * from tbl;