このトピックでは、E-MapReduce (EMR) クラスターでTrinoを使用して、OSS-HDFSに格納されているデータをクエリする方法について説明します。
前提条件
Trinoサービスを選択して、EMR V3.42.0以降、またはEMR V5.8.0以降のクラスターが作成されます。 詳細については、「クラスターの作成」をご参照ください。
バケットのOSS-HDFSが有効になり、OSS-HDFSに対するアクセス許可が付与されます。 OSS-HDFSを有効にする方法の詳細については、「OSS-HDFSの有効化とアクセス許可の付与」をご参照ください。
手順
E-MapReduceコンソールにログインします。 左側のナビゲーションウィンドウで、[ECS上のEMR] をクリックし、EMRクラスターを作成します。
EMRクラスターを作成するときは、Product VersionをEMR-3.46.2以降またはEMR-5.12.2以降に設定し、Root Storage Directory of clusterをOSS-HDFSが有効になっているバケットに設定してください。 他のパラメーターにはデフォルト値を使用します。 詳細については、「クラスターの作成」をご参照ください。
OSS-HDFSに保存されたクエリデータ。
Trinoサーバーにログインします。
Trinoサーバーのアドレスとポートを取得するには、次の手順を使用します。ECSのEMRページに移動し、クラスターの名前をクリックし、[サービス]> [トリノ]> [設定] をクリックします。
trino --server <Trino_server_address>:<Trino_server_port> --catalog
OSSのスキーマを作成します。
create schema testDB with (location='oss://<Bucket>.<Endpoint>/<schema_dir>');
スキーマを使用します。
use testDB;
テーブルを作成します。
create table tbl (key int, val int);
テーブルにデータを挿入します。
insert into tbl values (1,666);
テーブル内のデータを照会します。
select * from tbl;