すべてのプロダクト
Search
ドキュメントセンター

MaxCompute:非構造化データのクエリ

最終更新日:Mar 29, 2025

MaxCompute V2.0 では、外部テーブルを使用して、Object Storage Service (OSS) や Tablestore などのストレージサービスにアクセスできます。MaxCompute Studio は、非構造化データのクエリに役立つコードテンプレートを提供します。このトピックでは、MaxCompute Studio を使用して非構造化データをクエリする方法について説明します。

前提条件

以下の前提条件を満たしている必要があります。

StorageHandler、Extractor、または Outputer プログラムの作成

  1. [プロジェクト] タブの左側のナビゲーションウィンドウで、[src] > [main] > [java] を選択し、java を右クリックして、[新規] > [maxcompute Java] を選択します。

    11

  2. [名前] を構成し、[extractor][storagehandler]、または [outputer] を選択して、Enter キーを押します。

    • [名前]: 作成する MaxCompute Java クラスの名前。パッケージが作成されていない場合は、パッケージ名.クラス名 形式で名前を入力します。システムは、この形式で名前が付けられたパッケージを自動的に作成します。

    • クラスタイプとして、[extractor][storagehandler]、または [outputer] を選択します。

      説明

      ビジネス要件に基づいて、Extractor、StorageHandler、または Outputer を選択できます。

      • Extractor: 非構造化データを読み取るためのロジックのカスタム構成を可能にするクラス。

      • StorageHandler: Extractor または Outputer プログラムで定義されたロジックを実装するために使用されるクラス。

      • Outputer: 非構造化データを書き込むためのロジックのカスタム構成を可能にするクラス。

  3. クラスが作成された後、コードエディタで Java プログラムを開発します。Java テンプレートには、フレームワークコードが自動的に入力されます。要件に基づいてロジックコードをコンパイルするだけで済みます。

Extractor または Outputer プログラムのデバッグ

examples ディレクトリの単体テスト例に基づいて、テストケースを作成して Extractor または Outputer プログラムをデバッグします。示例

プログラムのパッケージ化とアップロード

プログラムをデバッグした後、プログラムを JAR パッケージに圧縮し、リソースとして MaxCompute サーバーにアップロードします。詳細については、「Java プログラムをパッケージ化し、パッケージをアップロードし、MaxCompute UDF を作成する」をご参照ください。

非構造化データのクエリ

  1. [プロジェクト] ツールウィンドウで、MaxCompute プロジェクトの下の [scripts] を右クリックし、[新規] > [maxcompute SQL スクリプト] を選択します。

    添加脚本

  2. [スクリプト名] フィールドに SQL スクリプトの名前を入力し、[maxcompute プロジェクト] ドロップダウンリストから MaxCompute プロジェクトを選択して、[OK] をクリックします。

    创建脚本

  3. コードエディタで、外部テーブルを作成するために使用する SQL 文を入力し、运行 アイコンをクリックします。

  4. MaxCompute SQL スクリプトを作成し、次のクエリ文を入力して、运行 アイコンをクリックしてデータをクエリします。

    查询

参照

例: カスタムエクストラクターを使用して OSS 外部テーブルを作成する