DataWorksは、Hadoop分散ファイルシステム (HDFS) データソースからデータを読み書きするためのHDFS ReaderおよびHDFS Writerを提供します。 このトピックでは、DataWorksを使用してHDFSからAnalyticDB for MySQL data Lakehouse Edition (V3.0) またはData Warehouse Edition (V3.0) にデータをインポートする方法について説明します。
前提条件
必要なデータソースが設定されます。 データ同期タスクを設定する前に、データを読み取るデータソースとデータを書き込むデータソースを設定する必要があります。 これにより、バッチ同期タスクを設定するときに、データソースを選択できます。 バッチ同期でサポートされているデータソースの種類については、「サポートされているデータソースの種類、リーダー、およびライター」をご参照ください。
説明データソースを設定する前に理解する必要がある項目については、「概要」をご参照ください。
ビジネス要件を満たすData Integration専用リソースグループが購入されました。 詳細については、「Data Integrationの排他的リソースグループの作成と使用」をご参照ください。
Data Integration専用リソースグループとデータソース間のネットワーク接続が確立されます。 詳細については、「リソースグループとデータソース間のネットワーク接続の確立」をご参照ください。
手順
ソースデータベースリーダーを設定します。 詳細については、「HDFS Reader」をご参照ください。
ターゲットデータベースライターを設定します。 詳細については、「AnalyticDB For MySQL 3.0 Writer」をご参照ください。
データ同期ジョブを設定します。 詳細については、「コードレスUIを使用したバッチ同期タスクの設定」をご参照ください。