MaxCompute V2.0では、外部テーブルを使用してObject Storage Service (OSS) とTablestoreにアクセスできます。 MaxCompute Studioは、非構造化データのクエリに役立つコードテンプレートを提供します。 このトピックでは、MaxCompute Studioを使用して非構造化データをクエリする方法について説明します。
前提条件
MaxComputeプロジェクトが接続されています。 詳細については、「プロジェクト接続の管理」をご参照ください。
MaxCompute Javaモジュールが作成されます。 詳細については、「MaxCompute Javaモジュールの作成」をご参照ください。
StorageHandler、Extractor、またはOutputerプログラムを作成する
プロジェクトタブの左側のナビゲーションウィンドウで、 を選択します。 を選択して、javaを右クリックし、
[名前] を設定し、[Extractor] 、[StorageHandler] 、または [Outputer] を選択し、Enterキーを押します。
Name: 作成するMaxCompute Javaクラスの名前。 パッケージが作成されていない場合は、パッケージ名. クラス名形式で名前を入力します。 システムは、この形式で名前が付けられたパッケージを自動的に作成します。
クラスタイプとして、[Extractor] 、[StorageHandler] 、または [Outputer] を選択します。
説明ビジネス要件に基づいて、Extractor、StorageHandler、またはOutputerを選択できます。
Extractor: 非構造化データを読み取るためのロジックのカスタム構成を可能にするクラス。
StorageHandler: ExtractorおよびOutputerプログラムで定義されたロジックを実装するために使用されるクラス。
Outputer: 非構造化データを書き込むためのロジックのカスタム構成を可能にするクラス。
クラスが作成されたら、コードエディターでJavaプログラムを開発します。 Javaテンプレートは自動的にフレームワークコードで埋められます。 要件に基づいてロジックコードをコンパイルするだけで済みます。
ExtractorまたはOutputerプログラムのデバッグ
examplesディレクトリの単体テスト例に基づいて、ExtractorまたはOutputerプログラムをデバッグするためのテストケースを記述します。
プログラムをパッケージ化してアップロードする
プログラムをデバッグした後、プログラムをJARパッケージに圧縮し、パッケージをリソースとしてMaxComputeサーバーにアップロードします。 詳細については、「Javaプログラムのパッケージ化、パッケージのアップロード、MaxCompute UDFの作成」をご参照ください。
非構造化データの照会
プロジェクトツールウィンドウで、MaxComputeプロジェクトの下にあるスクリプトを右クリックして、 .
SQLスクリプトの名前をスクリプト名フィールドに入力して、。MaxComputeプロジェクトドロップダウンリストからMaxComputeプロジェクトを選択します、OKをクリックします。
コードエディターで、外部テーブルの作成に使用するSQLステートメントを入力し、アイコンをクリックします。
MaxCompute SQLスクリプトを作成し、次のクエリ文を入力して、アイコンを使用してデータを照会します。