すべてのプロダクト
Search
ドキュメントセンター

Object Storage Service:EMRクラスターでTrinoを使用してOSS-HDFSに格納されているデータを照会する

最終更新日:Sep 30, 2024

このトピックでは、E-MapReduce (EMR) クラスターでTrinoを使用して、OSS-HDFSに格納されているデータをクエリする方法について説明します。

前提条件

  • Trinoサービスを選択して、EMR V3.42.0以降、またはEMR V5.8.0以降のクラスターが作成されます。 詳細については、「クラスターの作成」をご参照ください。

  • バケットのOSS-HDFSが有効になり、OSS-HDFSに対するアクセス許可が付与されます。 OSS-HDFSを有効にする方法の詳細については、「OSS-HDFSの有効化とアクセス許可の付与」をご参照ください。

手順

  1. E-MapReduceコンソールにログインします。 左側のナビゲーションウィンドウで、[ECS上のEMR] をクリックし、EMRクラスターを作成します。

    EMRクラスターを作成するときは、Product VersionをEMR-3.46.2以降またはEMR-5.12.2以降に設定し、Root Storage Directory of clusterをOSS-HDFSが有効になっているバケットに設定してください。 他のパラメーターにはデフォルト値を使用します。 詳細については、「クラスターの作成」をご参照ください。

  2. OSS-HDFSに保存されたクエリデータ。

    1. Trinoサーバーにログインします。

      Trinoサーバーのアドレスとポートを取得するには、次の手順を使用します。ECSのEMRページに移動し、クラスターの名前をクリックし、[サービス]> [トリノ]> [設定] をクリックします。

      trino --server <Trino_server_address>:<Trino_server_port> --catalog
    2. OSSのスキーマを作成します。

      create schema testDB with (location='oss://<Bucket>.<Endpoint>/<schema_dir>');
    3. スキーマを使用します。

      use testDB;
    4. テーブルを作成します。

      create table tbl (key int, val int);
    5. テーブルにデータを挿入します。

      insert into tbl values (1,666);
    6. テーブル内のデータを照会します。

      select * from tbl;