すべてのプロダクト
Search
ドキュメントセンター

AnalyticDB:Kettleを使用してdata Warehouse Editionにデータをインポートする

最終更新日:Jun 11, 2024

このトピックでは、Kettleを使用してローカルデータをAnalyticDB for MySQL data Warehouse Edition (V3.0) にインポートする方法について説明します。 この例ではExcelデータが使用されています。

背景情報

Kettleは、データの収集、変換、および移行に使用される一般的なオープンソースのETL (extract-transform-load) ツールです。 Kettleは、HBaseやMongoDBなどのさまざまなリレーショナルデータベースやNoSQLデータベースだけでなく、Microsoft Office ExcelやAccessなどのニッチなデータソースもサポートしています。 Kettleは、拡張機能とプラグインを使用して、より多くのデータソースをサポートできます。

準備

  • Kettleをインストールします。

  • AnalyticDB for MySQLクラスターにデータベーステーブルを作成します。

  • KettleがインストールされているデバイスのIPアドレスをAnalyticDB for MySQLクラスターのホワイトリストに追加します。 詳細については、「ホワイトリストの設定」をご参照ください。

  • インターネット経由でAnalyticDB for MySQLクラスターに接続する場合は、クラスターのパブリックエンドポイントを申請します。 詳細については、「パブリックエンドポイントの申請またはリリース」をご参照ください。

手順

  1. Kettleを起動し、[ファイル] > [新規] > [変換] を選択して変換タスクを作成します。

  2. [ファイル] > [新規作成] > [データベース接続] を選択して、変換タスクのデータベース接続を作成します。

    パラメーター

    説明

    接続名

    接続 の名前です。 わかりやすい名前を指定することをお勧めします。

    接続タイプ

    ソースデータベースのエンジン。 [MySQL] を選択します。

    アクセス

    接続のアクセスモード。 [ネイティブ (JDBC)] を選択します。

    ホスト名

    AnalyticDB for MySQLクラスターへの接続に使用されるエンドポイント。 クラスターの接続情報は、AnalyticDB for MySQLコンソールの [クラスター情報] ページで確認できます。 詳細については、「AnalyticDB For MySQLクラスターへの接続」をご参照ください。

    データベース名

    AnalyticDB for MySQLデータベースの名前。

    ポート番号

    AnalyticDB for MySQLクラスターへの接続に使用されるポート番号。 デフォルトのポート番号は、3306 です。

    ユーザー名

    AnalyticDB for MySQLクラスターへの接続に使用されるデータベースアカウントの名前。 次のアカウントタイプのいずれかを使用できます。

    • 特権アカウント

    • 標準アカウント

    Password

    AnalyticDB for MySQLクラスターへの接続に使用されるアカウントのパスワード。

    説明

    パラメーターを設定するときに、[結果ストリーミングカーソルを使用] を選択しないでください。

  3. 上記のパラメーターを設定した後、[テスト] をクリックします。 [データベース接続テスト] ダイアログボックスで、プロンプトに従ってAnalyticDB for MySQLデータベースへの接続が成功したかどうかを確認します。 接続がテストに合格したら、[OK] をクリックします。

  4. Kettleの左側のナビゲーションウィンドウで、[コアオブジェクト] タブをクリックし、[入力] > [Excel入力] を選択します。 次に、Excel Inputをワークスペースにドラッグアンドドロップします。

  5. ワークスペースで [Excel入力] をダブルクリックします。 [Excel入力] ダイアログボックスで、[参照] および [追加] をクリックして、[選択したファイル] にExcelファイルを追加します。

    [ワークシート][コンテンツ][フィールド] などのタブでパラメーターを設定し、[プレビュー] をクリックして、指定した値が要件を満たしているかどうかを確認します。

  6. Kettleの左側のナビゲーションウィンドウで、[コアオブジェクト] タブをクリックし、[出力] > [テーブル出力] を選択します。 次に、Table Outputをワークスペースにドラッグアンドドロップします。

  7. Excel入力からテーブル出力に接続線を追加します。

  8. ワークスペースで [テーブル出力] をダブルクリックします。 [テーブル出力] ダイアログボックスで、パラメーターを設定します。

    • ターゲットスキーマ: AnalyticDB for MySQLデータベースの名前を入力します。

    • ターゲットテーブル: AnalyticDB for MySQLデータベースのテーブルの名前を入力します。

    • [データベースフィールドの指定] を選択します。

    • [インサートにバッチ更新を使用] を選択します。

    [テーブル出力] ダイアログボックスの [データベースフィールド] タブで、[フィールドの取得] および [フィールドマッピングの入力] をクリックして、Excelファイルの列をAnalyticDB for MySQLテーブルの列にマッピングします。

  9. 白い矢印をクリックして変換を実行します。 この間、操作ログと稼働状況を確認できます。

    Excelファイル内のデータをAnalyticDB for MySQLデータベースにインポートした後、AnalyticDB for MySQLを使用してデータを分析できます。