本文介紹Trino如何以EMR叢集的方式查詢OSS-HDFS服務中的資料。
前提條件
已建立EMR-3.42.0及以上版本或EMR-5.8.0及以上版本的叢集,並在建立叢集時選擇了Trino服務。具體步驟,請參見建立叢集。
已開通並授權訪問OSS-HDFS服務。具體操作,請參見開通OSS-HDFS服務。
操作步驟
登入EMR on ECS控制台,建立EMR叢集。
建立EMR叢集時,確保選擇的產品版本為EMR-3.46.2及以上版本或者EMR-5.12.2及以上版本,叢集儲存根路徑選擇已開通OSS-HDFS服務的Bucket,其他參數保留預設配置。具體步驟,請參見建立叢集。
查詢OSS-HDFS服務中的資料。
登入Trino控制台。
您可以在EMR on ECS控制台的叢集服務的Trino的配置頁簽下,擷取<trino_server_address>和<trino_server_port>。
trino --server <Trino_server_address>:<Trino_server_port> --catalog
建立OSS中的schema。
create schema testDB with (location='oss://<Bucket>.<Endpoint>/<schema_dir>');
使用schema。
use testDB;
建立表。
create table tbl (key int, val int);
往表中插入資料。
insert into tbl values (1,666);
查詢表。
select * from tbl;